Você está na página 1de 10

ROTEIRO DE ANÁLISE DE MODELOS DE REGRESSÃO

NÚMERO DE ELEMENTOS AMOSTRAIS


Embora a NBR traga conceitos quanto ao número mínimo de dados em função do Grau de
Fundamentação, a princípio, quanto maior o número de elementos amostrais coletados, melhor,
entretanto, há que se atentar para o fato de que estas informações sejam o mais consistente possível,
uma vez que informações de má qualidade irão “deteriorar” o modelo ocasionando distorções que
aumentarão o desvio padrão com conseqüente prejuízo em outros resultados, tais como nos resíduos
do modelo e nos intervalos de confiança, predição e de valores admissíveis.
Deve-se garantir que as características presentes no imóvel avaliando e que podem exercer influência
no valor do imóvel pertençam ao rol das variáveis utilizadas no modelo e estejam inseridas no intervalo
de características dos elementos amostrais coletados na pesquisa.
Não é incomum verificarmos modelos cujos resultados podem ser considerados adequados e podem ser
utilizados para avaliar alguns imóveis, mas que não poderiam ser utilizados para outros em função de
características presentes no imóvel avaliando e que interferem no valor, mas que não estão presentes
ou não foram devidamente tratadas no modelo utilizado.

A representatividade dos elementos amostrais que compõem o modelo em relação ao imóvel que está
sendo avaliado é fundamental para obtenção de um valor que efetivamente reflita o real valor de
mercado do imóvel. A utilização de modelos que não contém elementos amostrais representativos do
imóvel a ser avaliado é um dos erros mais comuns e mais graves verificados no uso da Inferência
Estatística.

Para detectar este tipo de erro técnico (falta de representatividade da amostra), não basta ficar restrito
à análise dos parâmetros numéricos do modelo, que podem ser muito bons inclusive, há que se analisar
se as variáveis utilizadas no modelo e as respectivas amplitudes dos valores coletados para estas
variáveis estão compatíveis com as características do imóvel avaliando.

Pode ocorrer que as variáveis do modelo não contemplem todas as características que agregam valor
ao imóvel avaliando, ou ainda, mesmo as variáveis estando presentes no modelo, não contemplarem as
características do imóvel avaliando dentro da amplitude de características da coleta efetuada, gerando
necessidade de extrapolações que, embora permitida pela Norma dentro de certos critérios, sempre
representa um risco maior de erro na atribuição do valor de mercado.

VISTORIA
É importante que todos os elementos amostrais que compõem a amostra, assim como o imóvel
avaliando, sejam vistoriados, afinal, como trabalhamos com o método comparativo, para que possamos
identificar corretamente quais são as variáveis a serem tratadas no modelo (diferenças que influenciam
no valor), há que conhecermos bem tanto os elementos amostrais quanto o avaliando para identificar
estas diferenças e escolher quais são as características mais importantes/influentes e que devam ser
traduzidas através de variáveis numéricas e utilizadas no modelo de regressões.
Mesmo ciente de que atualmente há farta disponibilidade de informação diretamente pela internet,
através dos sites que anunciam as vendas de imóveis, especialmente fotografias internas que
possibilitam obter muitas informações a respeito do imóvel no que diz respeito ao padrão e
conservação, entendemos que a vistoria ao elemento amostral deve ser realizada, se não com a
finalidade específica da vistoria interna, cujas informações talvez já foi possível obter pelo anúncio,
mas para se ter uma noção melhor do entorno do imóvel, ou seja, aspectos locais que possam interferir
no valor, principalmente em habitações multifamiliares (prédios/condomínios) ou em habitações
unifamiliares que pertençam a Conjuntos Habitacionais.

É importante conferir os dados após digitação para evitar que erros de digitação possam comprometer
a informação daqueles elementos e, por vezes, de todo o modelo. É sempre recomendável que as fontes
sejam consideradas confiáveis e sejam indicadas no laudo de avaliação para atestar a veracidade das
informações.
Em geral o Banco de Dados é alimentado em planilhas EXCEL ou banco de dados do tipo ACCESS
para, depois, serem transferidas para os softwares específicos nos quais os modelos são testados.
A maioria dos aplicativos, tais como o TS-SISREG, apresenta a possibilidade de migração direta a
partir do EXCEL o que permite evitar o retrabalho e a possibilidade de erro na transferência manual
das informações. Se a base de dados está armazenada em ACCESS, deverá ser utilizada a opção
“vínculos do Office” que transfere o conteúdo de consultas do ACCESS para uma planilha EXCEL.
No banco de Dados não há problemas em se colocar informações de tipologias diferentes desde que
sejam criados campos para que se possa fazer o filtro para selecionar os elementos amostrais
adequados para cada modelo (apartamentos, residências, terrenos, glebas, barracões industriais,
prédios comerciais, etc.);
Entretanto, quando se trata do modelo que vai ser estudado no aplicativo do tipo TS-SISREG, há que se
filtrar as informações do banco de dados e, somente depois, transferi-las para o aplicativo. Este filtro
deve garantir que os elementos amostrais retirados do Banco de Dados possibilite uma amostra
representativa do mercado em razão das características do imóvel avaliando.

CÁLCULO:
O aplicativo TS-Sisreg traz a opção do cálculo pelo Método Simplificado, embora esta opção faça com
que os cálculos sejam executados mais rápidamente, nem todas as equações possíveis são testadas.
Desta forma, caso o modelo seja muito complexo (muitas variáveis e/ou muitos elementos),
recomendamos utilizar esta opção no início do tratamento, mas tão logo o modelo comece a apresentar
resultados mais consistentes, recomendo desabilitar a opção para não correr o risco de não obter uma
equação que possa ser melhor que as fornecidas pelo Método Simplificado.
Análise cuidadosa dos resultados gerais:
- Significância dos regressores: demonstra se a variável atua efetivamente, ou não, na formação
do valor, em resumo, se exerce influência no valor que mereça ser considerada no modelo. O
ideal é obter os menores valores possíveis, quanto menor a significância, maior será a
confiança de que a variável independente analisada é importante. A Norma estabelece valores
máximos de significância para cada Grau de Fundamentação (III, II ou I), ou seja, 10%, 20% e
30%, respectivamente e esta análise é realizada utilizando-se a tabela t de student.
- Significância do modelo (F calculado): além dos regressores, o modelo também deve ser
testado e, da mesma forma que para os regressores, quanto menor for a significância do
modelo, melhor. A norma estabelece valores máximos de significância do modelo para cada
Grau de Fundamentação (III, II ou I) sendo 1%, 2% e 5% respectivamente e esta análise é
realizada através da estatística de Fischer-Snedecor.
- Coeficiente de Determinação: embora não possa ser considerado como único ponto de controle
para definir se o modelo é bom ou não, quanto maior for o coeficiente de determinação melhor,
pois indicará o grau de aderência do modelo, ou seja, menor distância entre os pontos coletados
no mercado e os pontos de projeção na equação matemática de regressão. Está diretamente
ligado com o desvio padrão, pois quanto maior for o coeficiente de determinação, menor será o
desvio padrão, melhorando os resultados do modelo, entre eles as amplitudes dos intervalos de
confiança, predição e Intervalo de valores admissíveis.
Embora o valor alto do coeficiente de determinação seja bom, também traz riscos quanto a
possibilidade de que aconteça alguns aspectos preocupantes: variação total muito grande; altos
graus de colinearidade ou multicolinearidade entre os regressores, portanto, como já dissemos,
coeficientes de determinação altos são bons desde que os demais resultados também sejam bons.
Já os coeficientes de determinação baixos podem indicar que: a) as variáveis não explicam a
variação do valor em torno da média;b) as variáveis independentes foram mal definidas e
devem ser revistas (podem estar faltando variáveis ou a(s) escala(s) está(ão) inadequada(s));c)
variação total a ser explicada é pequena (dados homogêneos - neste caso devem ser analisados
se os demais resultados da regressão são bons);
ESCOLHA DA EQUAÇÃO
a. Maior Coeficiente de Determinação Linear (com Coeficientes de Determinação Não Lineares mais
elevados);
b. Normalidade dos Resíduos com freqüência próxima a 68% (entre -1 a +1 desvios padrão); 90% (entre
-1,64 a +1,64 desvios padrão) e 95% (entre -1,96 a +1,96 desvios padrão);
c. Significâncias dos Regressores – Variáveis independentes - (ideal menor 10%; máximo: 30%);
d. Significância do Modelo – (ideal igual a 1%, máximo: 5%)
e. Não Auto-regressão na Variável Dependente;

TABELA E GRÁFICO DE RESÍDUOS DA VARIÁVEL DEPENDENTE (outlier x “ponto


influenciante”):
É importante que saibamos identificar a diferença entre outlier e ponto influenciante; o gráfico e
definição de reta de regressão abaixo pode nos auxiliar a entender melhor:

Ponto 1
Reta de regressão é aquela que busca passar o mais próximo possível de todos os pontos, ao mesmo
tempo, considerando todas as variáveis presentes nos elementos amostrais e no imóvel avaliando
que exerça interferência no valor.
Considerando o gráfico acima, fica evidente que a reta mais adequada é a reta 2, porém,
considerando “a função matemática” que fundamenta a obtenção da reta de regressão, conforme
definição acima, o software pode fazer opção pela reta 1, o que inclusive inverte o “sinal” da
equação (hipótese de crescimento) para a variável considerada, de positiva para negativa.
Neste caso, o “Ponto 1” deveria ser um outlier uma vez que ultrapassa as linhas azuis do gráfico
que definiriam os limites de +/- 2 desvios padrões a partir da média se não fosse pela presença do
“Ponto 1” que “puxa” a reta para ele e, desta maneira fica próximo da reta de regressão dada pela
reta 1 e, então, não é considerado, nesta condição, como outier, mas como podemos ver, se
caracteriza como um ponto influenciante que distorce a leitura do comportamento de mercado.
Através da análise da tabela e do gráfico de resíduos podemos identificar pontos que podem
distorcer o modelo, tais como pontos discrepantes (outliers) como também pontos influenciantes. É
importante destacar que outliers são totalmente diferentes de pontos influenciantes; os outliers são
facilmente identificáveis pelo gráfico porque situam-se na região acima de +2 desvios padrões ou
abaixo de – 2 desvios padrões; já os pontos influenciantes devem ser identificados pela Distância de
Cook (quanto este valor supera o número 1) ou por aqueles elementos que possuem Variação Total
Variação Explicada altas e variação residual baixa.

Análise dos Resíduos (Mista)


a) Coluna “Resíduo Relativo” ordenada com valores máximos aceitáveis:
- Até 30% - Ótimo; - Até 60% - Regular;
- Até 40% - Muito Bom; - Até 80% - Aceitável;
- Até 50% - Bom
Análise dos Resíduos (Linear)
b) Coluna “Variação Residual” ordenada com valores máximos aceitáveis:
Graus de % Graus de %
Liberdade Aceitável Liberdade Aceitável
5 45 30 20
10 40 35 15
15 35 40 10
20 30 45 8
25 25 50 5

a coluna Resíduo sobre DP indica a relação entre o Resíduo e o Desvio Padrão do modelo,
isto é, quantos desvios padrões o dado se distancia de sua média estimada;
valores superiores a +2 ou inferiores a -2 indicam dados excessivamente dispersos
e constituem o que tecnicamente se denomina de outliers

Heterocedasticidade (auto-regressão) pode ser observada visualmente no gráfico de


resíduos da variável dependente (y) e ocorre quando existe variação gradativa da dispersão
dos resíduos. Também é utilizada a estatística de Durbin Watson para verificar se há ou não
auto-regressão (positiva ou negativa). Não devem ser consideradas as equações que
apresentam resultado para a estatística de Durbin Watson do tipo “região não conclusiva”
ou “auto regressão positiva ou negativa”;
TESTES DAS HIPÓTESES

Indica o crescimento da variável para 10% variação em sua amplitude no ponto médio (última
coluna da tabela do teste de hipóteses);No caso das variáveis dicotômicas – a influência indicada é
a variação total;
a) Os Gráficos de crescimento Não Lineares devem apresentar consistência com a realidade de
mercado para cada hipótese (variável), conforme expectativa quando da definição da variável,
durante a criação do modelo (cor vermelha indica a inconsistência com a expectativa
formulada na criação da variável);
b) O crescimento relativo apresentado nas Dicotômicas e Dicotômicas de Grupo deve estar
compatível com a representatividade da variável no mercado (exemplo: diferença entre Oferta e
Venda deve estar dentro de patamares aceitáveis para a tipologia em estudo);
c) A relação de crescimento num grupo de Dicotômicas deve estar de acordo com a realidade que
se pretende mostrar (exemplo: Variáveis Padrão Normal e Padrão Alto relacionadas ao Padrão
Baixo não representado como variável. O crescimento das duas variáveis utilizadas deve ser
positivo, sendo de maior tamanho aquele apresentado pela variável Padrão Alto);

Um gráfico onde também se pode verificar as hipóteses de crescimento é o gráfico de variáveis


isoladas, porque além de permitir verificar a aderência dos pontos à curva de cada variável
independente (x) permite também identificar pontos que possam alterar a hipótese de crescimento,
ou seja, os pontos influenciantes já citados acima.

“t” de Student
quanto maior o “t” de Student (em módulo, maior a influência da variável no modelo;
se uma variável apresenta “t” muito maior do que as demais pode significar que essa
variável explica quase toda a variação e as demais contribuem muito pouco e, nesse caso, o
modelo pode ficar vulnerável em relação à esta variável principalmente se esta for do tipo
“qualitativa”, mais ainda se for do tipo código alocado, em função da eventual
subjetividade da escala.
COLINEARIDADES
Selecionar a Variável Dependente na Matriz de Correlações entre variáveis e Analisar com
enfoque nos seguintes parâmetros:
Nesta matriz, se a correlação entre a variável dependente e cada uma das demais variáveis mostra
valores elevados (acima de 60) melhor, mas isto não é condição necessária (Última linha - amarela) e
última coluna - azul).

Os demais valores da Matriz correspondem às correlações entre as variáveis independentes. Neste caso,
quanto mais reduzidos estes valores (abaixo de 60%), melhor. A Norma estabelece que correlações
acima de 80% devem ser investigadas.
Uma sugestão para análise, tanto para correlações isoladas como com influência, é:
Até 40% fraca
Até 60% média
Até 75% forte
Até 80% muito forte
Acima de 80% fortíssima

INTERVALO DE CONFIANÇA

− não coincide necessariamente com o campo de arbítrio que é limitado a 15%;


− pode indicar a consistência do modelo de regressão;
− intervalos amplos para 80% certeza prejudicam a precisão do trabalho;
− Embora a Norma estabeleça percentuais para classificação do Grau de Precisão do trabalho,
segue abaixo uma gradação que, particularmente, julgo mais adequado do que o que está
previsto na norma:
Parâmetros de análise:

Na linha com os números em azul da tabela, considerando a Coluna “Amplitude”:


%Total CONCEITO
Até 5% - (2,5% de cada lado) Ótimo
Até 10% - (5% de cada lado) Bom
Até 30% - (15% de cada lado) Regular
Acima de 30% Não recomendável (embora aceito pela Norma)

NORMALIDADE DOS RESÍDUOS


Um dos pressupostos da metodologia utilizada é que os resíduos estejam distribuídos segundo a
distribuição normal, cujos valores ideais estão indicados abaixo:
68% entre -1 e +1 desvios padrão da média;
90% entre -1,64 e +1,64 desvios padrão da média;
95% entre -1,96 e +1,96 desvios padrão da média
Não há necessidade de que os valores sejam exatamente iguais, mas o mais próximo possível, por
exemplo, para um modelo que não tenha outliers, a última escala da distribuição Normal será
obrigatoriamente 100%, o que permite considerar um deslocamento proporcional nas demais
escalas.

CÓDIGOS ALOCADOS
Os critérios da construção dos códigos alocados devem ser explicitados, com a descrição necessária
e suficiente de cada código adotado, de forma a permitir o claro enquadramento dos dados de
mercado e do imóvel avaliando e assegurar que todos os elementos de mesma característica estejam
agrupados no mesmo item da escala.
A escala será composta por números naturais consecutivos e em ordem crescente (1, 2, 3, ...) em
função da importância das características possíveis na formação do valor, com valor inicial igual a
1.
Não é necessário que a amostra contenha dados de mercado em cada uma das posições da escala
construída.
É vedada a extrapolação de variáveis expressas por meio de códigos alocados
Recomenda-se a utilização prévia da análise de agrupamento de dados para a construção dos
códigos alocados.

PONTOS DE MÁXIMO ou MÍNIMO

5.1 Para Valor Unitário como variável dependente, examinar Pontos de Máximo para Área

Quando utilizado Valor Total como variável dependente, examinar Pontos de Mínimo

Em qualquer dos casos, a linha azul do Gráfico deve se mostrar sempre crescente e positivo,
sem nenhuma inflexão (picos positivos ou negativos)
MICRONUMEROSIDADE

Conforme previsto em Norma (item A.2 da NBR 14.653 – parte 2):

Você também pode gostar