Você está na página 1de 51

23/10/2018

Engenharia de Avaliações:
Método comparativo direto de dados de
mercado - tratamento dos dados via
análise de regressão

Onde estamos

1. Introdução à Engenharia de Avaliações


2. Conceitos básicos
3. Métodos de avaliação
4. Metodologia científica aplicada à Engenharia de Avaliações
5. Método comparativo direto de dados de mercado
5.1 Fundamentos e etapas de desenvolvimento
5.2 Tratamento dos dados via análise de regressão

1
23/10/2018

Escopo
1. MCDDM – Tratamento dos dados
1.1 Análise de regressão
1.2 Coeficiente de correlação
1.3 Modelo de regressão linear simples
1.3.1 Método dos mínimos quadrados
1.4 Validação do modelo
1.4.1 Verificação dos pressup. básicos do modelo de regr.
1.4.2 Verificação de pontos atípicos
1.4.3 Análises de: gráficos, medidas de diagnóstico, testes e
intervalos estatísticos voltados para a qualidade do
ajustamento
1.4.4 Verificação da adequação teórica e lógica do modelo

Método comparativo direto de dados de mercado


Definição
 É aquele em que o valor do bem é estimado através da
comparação com dados de mercado assemelhados quanto às
características intrínsecas e extrínsecas.

2
23/10/2018

Método comparativo direto de dados de mercado


Aplicação
Estime o valor de mercado de um terreno com área de 1.000 m²
que está a 1,5 km do centro urbano. Os seguintes dados de
mercado (oferta) foram coletados.
PREÇO TOTAL PREÇO UNIT.
DADO ÁREA DISTÂNCIA (Km)
(R$) (R$/m²)
1 1000 0 300.000,00 300,00
2 1000 1 200.000,00 200,00
3 1000 1 150.000,00 150,00
4 1000 2 100.000,00 100,00
5 1000 3 50.000,00 50,00
6 1000 4 20.000,00 20,00
 Uma vez que as áreas são iguais, temos que o preço unitário
médio [ = 136,66 (R$/m²)], logo a estimativa do valor do terreno
avaliando é de: VI = 136,66 x 1.000 = R$ 136.660,00.

Método comparativo direto de dados de mercado


Aplicação - Análise de regressão
 A análise de regressão se ocupa do estudo da dependência de uma
variável (dependente) em relação a uma ou mais variáveis
(independentes), com vistas a estimar o valor médio (da população)
da primeira em termos dos valores conhecidos da(s) segunda(s).

PERGUNTA: Como ter uma primeira percepção acerca da relação


de dependência entre variáveis?

3
23/10/2018

Método comparativo direto de dados de mercado

 Diagrama de dispersão
Consiste na representação dos pares ordenados dos dados (x,y),
em que se observam: tendência, intensidade, dispersão, forma
funcional e pontos atípicos.

(G)

Método comparativo direto de dados de mercado


Aplicação - Análise de regressão

Preço unitário (R$/m²) X Distância (Km)


350
300
Preço unitário

250
200
150
100
50
0
0 1 2 3 4 5
Distância

 PERGUNTA: Como medir (quantitativamente) a dependência entre


as variáveis?

4
23/10/2018

Método comparativo direto de dados de mercado


Aplicação - Coeficiente de correlação

 O coeficiente de correlação linear tem por objetivo medir o grau de


associação linear entre duas variáveis.

r=
∑ ( x − x)( y − y) i i
-1 ≤ r ≤ +1
∑ ( x − x) .∑ ( y − y)
i
2
i
2

Método comparativo direto de dados de mercado


Aplicação - Coeficiente de correlação

r=
∑ ( x − x)( y − y) i i
-1 ≤ r ≤ +1 rxy =
−723,33
= −0,95
∑ ( x − x) .∑ ( y − y)
i
2
i
2
10,83 × 53.333,33

Preço unitário (R$/m²) X Distância (Km)


400
Preço unitário

300
200
100
0
0 1 2 3 4 5
Distância

O valor negativo do coeficiente de correlação (igual a -0,95) indica


uma forte correlação inversa entre preço e distância, ou seja, quanto
maior a distância ao centro urbano menor o preço unitário.
PERGUNTA: Como modelar esta dependência?

5
23/10/2018

Método comparativo direto de dados de mercado


Aplicação - Modelo de regressão linear simples

 Quando a variabilidade dos preços pode ser explicada por apenas


uma variável independente, através de uma função linear nos
parâmetros, utiliza-se o modelo de regressão linear simples.

Preço unitário (R$/m²) X Distância (Km)


350

300
A parte de imagem com identificação de relação rId6 não foi encontrada no arquiv o.

250
Preço unitário

200

150

100

50

0
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5
Distância

Método comparativo direto de dados de mercado


Aplicação - Modelo de regressão linear simples

Preço unitário (R$/m²) X Distância (Km)


350

300

250
Preço unitário

200
Yˆi = βˆ 0 + βˆ 1 . X i
150

100

50

0
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5
Distância

 PERGUNTA: O modelo de regressão linear simples deve ser


ajustado por qual curva de regressão? Em outras palavras, como
estimar os parâmetros da forma mais acurada possível?

6
23/10/2018

Método comparativo direto de dados de mercado


Aplicação - Método dos mínimos quadrados (MMQ)

 É atribuído a Carl Friedrich Gauss. Consiste em estimar os parâmetros


 , … , 
(  ) de tal forma que o somatório do quadrado das distâncias,
medidas na vertical, entre cada ponto observado e ajustado pela curva de
regressão, seja mínimo.
resíduos
do modelo
Y i = βˆ 0 + βˆ1 X i + eˆ i
Yi
Yo
eˆ 0 = Y 0 − Yˆ0

Yˆ0
Yˆi = βˆ 0 + βˆ1 X i

Xo Xi


= Y
−   |  = ∑̂ → ou  = ∑ Y
−  

Método comparativo direto de dados de mercado


Aplicação - Método dos mínimos quadrados (MMQ)

U = ∑̂ = Σ (bo + biXi - Yi)² Notação:


βˆ 0 = b 0
∂U/∂bo = 2 Σ (bo + b1.Xi - Yi).1 = 2 (Σ bo + b1 Σ Xi -Σ Yi)
βˆ1 = b1
∂U/∂b1 = 2 Σ (bo + b1.xi - yi).xi = 2(boΣ xi + b1Σ xi2 - Σyi.xi )
Igualando-se as derivadas a zero

bo . n + b1 . Σ Xi = Σ Yi

bo . Σ Xi + b1 . Σ Xi² = Σ Xi . Yi

Valores médios estimados:


 =  +  . 


7
23/10/2018

Método comparativo direto de dados de mercado


Aplicação

Voltemos aos dados coletados:

PREÇO
DISTÂNCIA PREÇO TOTAL
DADO ÁREA UNITÁRIO
(Km) (R$)
(R$/m²)
1 1000 0 300.000,00 300,00
2 1000 1 200.000,00 200,00
3 1000 1 150.000,00 150,00
4 1000 2 100.000,00 100,00
5 1000 3 50.000,00 50,00
6 1000 4 20.000,00 20,00

Estime o valor de mercado de um terreno com área de 1.000 m²


que está a 1,5 km do centro urbano.

Método comparativo direto de dados de mercado


Aplicação – Método dos mínimos quadrados
 Estimativa dos parâmetros do modelo

Dado Xi Yi Xi2 Xi Yi bo . n + b1 . Σ Xi = Σ Yi
1 0 300 0 0
2 1 200 1 200 bo . Σ Xi + b1 . Σ Xi² = Σ Xi . Yi
3 1 150 1 150
4 2 100 4 200 bo . 6 + b1 . 11 = 820
b0 . 11 + b1 . 31 = 780
5 3 50 9 150
6 4 20 16 80 bo = 259,07 b1 = -66,77
Σ 11 820 31 780
PERGUNTA: Qual a interpretação de mercado
 = 259,07 − 66,77. X

 deste modelo?

Quando Xi = 0 (centro da cidade, D=0), o consumidor paga pelo terreno, em


média, R$ 259,07 por metro quadrado de área, e para cada km que o
terreno se distancia do centro, o consumidor paga R$ 66,77 a menos por
metro quadrado de área.

8
23/10/2018

Método comparativo direto de dados de mercado


Aplicação

 Estimativa do valor de mercado do imóvel avaliando


 = 259,07 − 66,77. X

 ATENÇÃO: É permitido arredondar o


 = 259,07 − 66,77.1,5
 resultado da avaliação, desde que o
ajuste final não varie mais de 1% do
 = 158,91 '$⁄)
 valor estimado (item 7.71 – Valor de
 = 158,92 x 1000 = 158.920,00
+ mercado do bem, NBR 14653-1)

Método comparativo direto de dados de mercado


Modelo de regressão linear múltipla

 Quando mais de uma variável independente é necessária para


explicar a variabilidade dos preços, adota-se o modelo de regressão
linear múltipla.
Reg. linear simples Reg. linear múltipla
Y i = βˆ 0 + βˆ 1 . X i + eˆ i Y i = βˆ 0 + βˆ1 X 1i + K + βˆ k X ki + eˆ i

Yˆi = βˆ 0 + βˆ1 . X i Yˆi = βˆ 0 + βˆ1 X 1i + K + βˆ k X ki

P = β0 + β1 . A + β2 . D
P P

D
D A
 Todos os conceitos da regressão linear simples podem ser
generalizados para a regressão linear múltipla.

9
23/10/2018

Regressão linear múltipla


- O princípio -

19

Método comparativo direto de dados de mercado


Tratamento dos dados – tratamento científico

A heterogeneidade dos dados é tratada a partir do uso de metodologia


científica (suportada por técnicas apropriadas da Estatística), que leve à
indução de modelo validado para o comportamento do mercado.
 = 259,07 − 66,77. X



Verificação dos pressupostos


básicos do modelo
Técnicas apropriadas da

Verificação de pontos atípicos


Estatística

Validação do Análises de: medidas de


modelo diagnóstico, gráficos, testes e
intervalos estatísticos voltados
para a qualidade do ajustamento
Verificação da adequação teórica
e lógica do modelo

10
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

Medidas de
Gráficos
diagnóstico

Testes de
hipóteses

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Medidas de diagnóstico

1. Coeficiente de determinação (R)

O coeficiente de determinação (R) indica a proporção de variação do


preço em torno da média aritmética que é explicada, conjuntamente,
pelas variáveis independentes. Diz-se que a qualidade do ajustamento
é melhor quanto mais próximo de 1 se situar R.

∑ (Yˆ − Y )
2
SQR i
R = =
∑ (Y − Y )
2
SQT
i i

SQR = Soma dos quadrados explicados pela regressão


SQT = Soma dos quadrados total

11
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento
 Medidas de diagnóstico
1. Coeficiente de determinação (R)

(Yi − Y ) = (Yˆi − Y ) + (Yi − Yˆi )

∑ (Y ∑ (Yˆ ∑ (Y ∑ (Yˆ − Y )
2
i − Y )2 = i − Y )2 + i − Yˆi ) 2 SQR i
R = =
∑ (Y − Y )
2
SQT
(SQT) (SQR) (SQE) i i

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Medidas de diagnóstico

1. Coeficiente de determinação (R)

SQR 48.296
R= = = 0,91
SQT 53.333

Tem-se que cerca de 91% das variações (variabilidade) observadas


nos preços são explicadas pelo modelo.

12
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Medidas de diagnóstico
2. Desvio padrão do modelo
Entre dois modelos satisfatórios, deve-se escolher aquele de menor
variância , uma vez que fornecerá estimativas mais precisas.
n

∑ (Y − Yˆ )
2
i i
i =1
Se = k – número de variáveis independentes
n − k −1

Para o caso de uma reta:

∑ (Y − Yˆ )
2 5036,92
i i Se = = 35,49
Se = 6−2
n−2

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Medidas de diagnóstico
3. Resíduo relativo do modelo

A coluna do resíduo relativo indica o desvio relativo apresentado


pelo dado correspondente em relação à média calculada para o
mesmo, assim esta coluna não deve apresentar valores expressivos.

13
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

Medidas de
Gráficos
diagnóstico

Testes de
hipóteses

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Gráficos

1. Gráfico dos preços observados versus valores estimados pelo


modelo

> Este gráfico permite verificar com rapidez o poder de predição do


modelo. Os pontos mais distantes da diagonal (bissetriz do primeiro
quadrante) são os dados mais discrepantes.

14
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

Medidas de
Gráficos
diagnóstico

Testes de
hipóteses

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Testes de hipóteses
 Testes de hipóteses consistem em testar uma afirmação sobre
características da população, a partir de estatísticas amostrais.
 O ponto central é verificar se a diferença entre o valor alegado
de um parâmetro populacional e o valor de uma estatística amostral
pode ser razoavelmente atribuído a variabilidade amostral ou se a
discrepância é demasiadamente grande para ser encarada assim.

15
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Testes de hipóteses

 A estrutura dos testes de hipóteses consiste na definição e


avaliação da hipótese nula versus a hipótese alternativa:

• -. - Hipótese nula:
Aceita como verdadeira até haver prova estatística em contrário.

• -/ - Hipótese alternativa:
Hipótese que será aceita se os dados mostrarem evidências
suficientes para a rejeição da hipótese nula. Geralmente, é a própria
hipótese da pesquisa. Deve ser especificada em termos de
parâmetros populacionais, usando =, > ou <.

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Passos para se realizar um teste de hipóteses:

1. Definição das hipóteses (0 e 0 )


2. Especificação do nível de significância (1)
3. Identificar a distribuição amostral adequada para o teste
4. Calcular a estatística do teste
5. Tomar a decisão (regra de decisão)

32

16
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

Significância individual dos


parâmetros
TESTES DE
HIPÓTESES
Significância do modelo

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Teste de hipótese – significância individual do parâmetro


Passo 1: Definição das hipóteses
Ho : A variável  (distância) não é importante na formação do preço
H1 : A variável  (distância) é importante na formação do preço

Yi Yi
H0 H1

X ki X ki

H 0 : β1 = 0, contra
Estatisticamente, tem-se: 
H 1 : β1 ≠ 0

17
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Teste de hipótese – significância individual do parâmetro


Passo 2: Especificação do nível de significância

Em um teste de hipóteses, pelo fato da decisão ser baseada em uma


amostra ao invés de ser baseada na população inteira, há sempre a
possibilidade de tomar uma decisão equivocada:

1. Rejeitar Ho em favor de H1 quando, na verdade, Ho é verdadeira. Este


erro é denominado de erro tipo I, também conhecido por nível de
α);
significância (α

OBS.: Para o exemplo, vamos estabelecer 1 = 5%

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Teste de hipótese – significância individual do parâmetro


Passo 3: Identificar a estatística de teste e a respectiva distribuição
amostral
Demonstra-se que t*, sob a hipótese 0 , tem
βˆ j − β j
t *j = distribuição t de Student com n-k-1 graus de liberdade,
( )
s βˆ j onde n é o número de dados e k é o número de
variáveis independentes. Isto é, para o modelo de
regressão linear simples: n-2 graus de liberdade.
Estatística de
teste

1
2

1 1
2 2

18
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Teste de hipótese – significância individual do parâmetro


Passo 4: Calcular a estatística do teste

Calcula-se:

βˆ j − β j βˆ j
t *j = t calc =
( )
s βˆ j ( )
s βˆ j

1. 3(56 ) - desvio padrão correspondente ao parâmetro estimado 56 .

2
 
1 ∑  Y i − Yˆi 
S ( βˆ j ) = S e , onde Se =
∑ (x i − x)2
n − k −1

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Teste de hipótese – significância individual do parâmetro


Passo 4: Calcular a estatística do teste

βˆ j − 66 , 77
t calc = =
( )
s βˆ j s ( βˆ ) 1

1 1
s ( βˆ1 ) = S e → 35 , 49 × = 10 ,78
∑ ( x − x) i
2 10 ,83

− 66,77
t calc = = 6,19
10,78

19
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Teste de hipótese – significância individual do parâmetro


Passo 5: Tomar a decisão (regra de decisão)

* Regra de decisão
Se |9:;<: | = 9>;? , rejeita-se 0 .

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Teste de hipótese – significância individual do parâmetro


Passo 5: Tomar a decisão (regra de decisão)

Para encontrar o 9>;? , define-se o nível de significância α (no


exemplo, estabelecido em 5%) e com o número de graus de
liberdade (n–k–1), encontra-se na tabela da Distribuição t de
Student:

t tab = t (α; n-k-1)

t (0,05; 4) =

20
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de
diagnóstico, testes e intervalos estatísticos voltados para a
qualidade do ajustamento

 Teste de hipótese – significância individual do parâmetro


Passo 5: Tomar a decisão (regra de decisão)

Para encontrar o 9>;? , define-se o nível de significância α (no


exemplo, estabelecido em 5%) e com o número de graus de
liberdade (n–k–1), encontra-se na tabela da Distribuição t de
Student:

t tab = t (α; n-k-1) = t (0,05; 4) = 2,776

21
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de
diagnóstico, testes e intervalos estatísticos voltados para a
qualidade do ajustamento

 Teste de hipótese – significância individual do parâmetro


Passo 5: Tomar a decisão (regra de decisão)
* Regra de decisão βˆ j − 66 , 77
t calc = = = 6 ,19
Se |9:;<: | = 9>;? , rejeita-se 0 . ( )
s βˆ j
10 , 78

t tab = t (0,05; 6-1-1) = t (0,05; 4) = 2,776

Como tc > t ABC , concluí-se que o


parâmetro populacional
considerado é significante ao
nível de 5%. Rejeita-se 0 , ou
seja, há indícios de que a
distância ao centro urbano influi
Pergunta: Seria o parâmetro na formação dos preços ao nível
populacional significante ao nível de 1%? de confiança de 95%.

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de
diagnóstico, testes e intervalos estatísticos voltados para a
qualidade do ajustamento
 Valor-p (p-value)
Def. Estatística: É a probabilidade de que a estatística do teste tenha
valor extremo em relação ao valor observado quando a hipótese nula
é verdadeira. Em outras palavras: é o menor valor do nível de
significância para o qual rejeitamos a hipótese nula.

Considere:

• Nível de significância (α) = 1%


Valor-p = 0,00345
• Estatística de teste t* ∼ t de Student
• t ZB[Z = 6,19
• 9ABC = 4,604
• Regra de decisão:
Se |9:;<: |> 9>;? , rejeita-se 0 .

22
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de
diagnóstico, testes e intervalos estatísticos voltados para a
qualidade do ajustamento

Significância individual dos


parâmetros
TESTES DE
HIPÓTESES
Significância do modelo

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Passos para se realizar um teste de hipóteses:

1. Definição das hipóteses (0 e 0 )


2. Especificação do nível de significância (1)
3. Identificar a distribuição amostral adequada para o teste
4. Calcular a estatística do teste
5. Tomar a decisão (regra de decisão)

46

23
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Teste de hipótese – significância do modelo


Passo 1: Definição das hipóteses
> Caso geral

Ho : Nenhuma das variáveis independentes selecionadas para construção do


modelo é importante para explicar a variabilidade dos preços
H1 : Pelo menos uma das variáveis independentes escolhidas contribui
significativamente para explicar a variabilidade dos preços

Estatisticamente, tem-se:

 H 0 : β 1 = β 2 = ... = β k = 0



 H 1 : Pelo menos um β j ( j = 1,..., k )
 é diferente de zero

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Teste de hipótese – significância do modelo


> Caso da regressão linear simples
 H 0 : β 1 = 0 , contra

H 1 : β1 ≠ 0
Ho : O mercado deve ser explicado por uma reta horizontal (média dos
preços)
H1 : O mercado deve ser explicado por um reta inclinada, função da
covariável  (distância)

Yi Yi
H0 H1

X ki X ki

24
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de
diagnóstico, testes e intervalos estatísticos voltados para a
qualidade do ajustamento

 Teste de hipótese – significância do modelo


Passo 2: Especificação do nível de significância

Em um teste de hipóteses, pelo fato da decisão ser baseada em uma


amostra ao invés de ser baseada na população inteira, há sempre a
possibilidade de tomarmos uma decisão equivocada:

1. Rejeitar Ho em favor de H1 quando, na verdade, Ho é verdadeira. Este


erro é denominado de erro tipo I, também conhecido por nível de
α);
significância (α

OBS.: Para o exemplo, vamos estabelecer ] = /%

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de
diagnóstico, testes e intervalos estatísticos voltados para a
qualidade do ajustamento

 Teste de hipótese – significância do modelo


Passo 3: Identificar a estatística de teste e a respectiva distribuição
amostral
Demonstra-se que ^ ∗ , sob a hipótese 0` , tem
Vexp distribuição de Snedecor com k graus de liberdade no
F* =
Vnexp numerador e (n-k-1) no denominador. Isto é, para o
modelo de regressão linear simples: 1 grau de
liberdade no numerado e n-2 no denominador.
Estatística de
teste

25
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de
diagnóstico, testes e intervalos estatísticos voltados para a
qualidade do ajustamento

 Teste de hipótese – significância do modelo


Passo 4: Calcular a estatística do teste

Calcula-se:
∑(Yˆ −Y ) × n − k −1
2
* Vexp i
F = Fcalc =
∑(Y −Yˆ ) K
Vnexp 2
i i
 Tabela de ANOVA
Variação Soma dos Graus de Variância
Quadrados Liberdade
( )
2
Explicada (
$ −Y
SQR = ∑ Y i ) k 2
V exp = ∑ Yˆi − Y /k
(Modelo)

Não
Explicada (
SQE = ∑ Y i − Yˆi ) 2 n-k-1 Vn exp = ∑ Yi − Yˆ( )
2
/(n-k-1)
(Erro)
Total SQT = ∑(Yi −Y )2 n-1 Vtot = ∑(Yi − Y ) 2 /(n-1)

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de
diagnóstico, testes e intervalos estatísticos voltados para a
qualidade do ajustamento
 Tabela de ANOVA
Variação Soma dos Graus de Variância
Quadrados Liberdade
( )
2
Explicada (
$ −Y
SQR = ∑ Y i ) k 2
V exp = ∑ Yˆi − Y /k
(Modelo)

Não
Explicada (
SQE = ∑ Y i − Yˆi ) 2 n-k-1 Vn exp = ∑ Yi − Yˆ ( ) 2
/(n-k-1)
(Erro)
Total SQT = ∑(Yi −Y )2 n-1 Vtot = ∑(Yi − Y ) 2 /(n-1)
Variação Soma dos Graus de Variância Fc
Quadrados Liberdade
Explicada 48296,41 1 48296,41 38,35
(Modelo)

Não 5036,92 4 1259,23


Explicada
(Erro)
Total 53333,33 5

26
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de
diagnóstico, testes e intervalos estatísticos voltados para a
qualidade do ajustamento

 Teste de hipótese – significância do modelo


Passo 4: Calcular a estatística do teste

∑(Yˆ −Y ) × n − k −1
2
Vexp i
*
F = Fcalc = = 38,35
∑(Y −Yˆ ) K
Vnexp 2
i i

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Teste de hipótese – significância do modelo


Passo 5: Tomar a decisão (regra de decisão)

* Regra de decisão
Se ^:;<: = ^>;? , rejeita-se 0 .

27
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de
diagnóstico, testes e intervalos estatísticos voltados para a
qualidade do ajustamento

 Teste de hipótese – significância do modelo


Passo 5: Tomar a decisão (regra de decisão)

Para encontrar o ^>;? , define-se o nível de significância α (no


exemplo, estabelecido em 1%) e com com k graus de liberdade no
numerador e (n-k-1) no denominador, encontra-se na tabela da
Distribuição F de Snedecor:

F tab = F (α;
a ; a )

F (0,01;1; 4) =

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de
diagnóstico, testes e intervalos estatísticos voltados para a
qualidade do ajustamento

28
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de
diagnóstico, testes e intervalos estatísticos voltados para a
qualidade do ajustamento

 Teste de hipótese – significância do modelo


Passo 5: Tomar a decisão (regra de decisão)

Para encontrar o ^>;? , define-se o nível de significância α (no


exemplo, estabelecido em 1%) e com com k graus de liberdade no
numerador e (n-k-1) no denominador, encontra-se na tabela da
Distribuição F de Snedecor:

F tab = F (α; = F (0,01;1; 4) = 21,2


a ; a )

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de
diagnóstico, testes e intervalos estatísticos voltados para a
qualidade do ajustamento
 Teste de hipótese – significância do modelo
* Regra de decisão ∑ (Yˆ − Y )
2
Vexp i n − k −1
Fc = → Fc = ×
∑ (Y − Yˆ )
2
Se ^:;<: = ^>;? , rejeita-se 0 . Vnexp i i
K

Fc = 38,35

F tab = F (α ; 1 ; 4) = 21,2

Como Fc > Ftab, o modelo é


significante ao nível de 1%.
Rejeita-se 0 , ou seja, há indícios
de que é preferível trabalhar com
o modelo de regressão proposto
Pergunta: Seria o modelo
a utilizar a média dos preços.
significante ao nível de 0,5%?
P-valor = F de significação

29
23/10/2018

Método comparativo direto de dados de mercado


Tratamento dos dados – tratamento científico
A heterogeneidade dos dados é tratada a partir do uso de metodologia
científica (suportada por técnicas apropriadas da Estatística), que leve à
indução de modelo validado para o comportamento do mercado.
 = 259,07 − 66,77. X



Verificação dos pressupostos


básicos do modelo

normativas da NBR 14653


Técnicas apropriadas da
Estatística e diretrizes
Verificação de pontos atípicos
Validação do Análises de: gráficos, medidas de
modelo diagnóstico, testes e intervalos
estatísticos voltados para a
qualidade do ajustamento
Verificação da adequação teórica
e lógica do modelo

Método comparativo direto de dados de mercado


Validação do modelo – verificação dos pressupostos do modelo

 Hipóteses básicas do modelo de regressão linear

1. Os erros são variáveis aleatórias com distribuição normal.

Erros
aleatórios
Y i = βˆ 0 + βˆ 1 X i + eˆ i ou
Yi resíduos
Yo do modelo
eˆ 0 = Y 0 − Yˆ0
Yˆi = βˆ 0 + βˆ1 X i

Yˆ0

Xo Xi

30
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – verificação dos pressupostos do modelo
 Normalidade
 Distribuição normal
Uma variável aleatória contínua X tem distribuição normal com média
µ e variância b  , se sua função de densidade é dada por:

( x − µ )2
1 −
2σ 2
f ( x) = e , x∈R
σ 2π

Notação : X ~ N ( µ , σ 2 ).

Método comparativo direto de dados de mercado


Validação do modelo – verificação dos pressupostos do modelo

 Normalidade
 Distribuição normal

P (µ − σ ≤ X ≤ µ + σ ) ≅ 0 , 68
P ( µ − 1 , 64 σ ≤ X ≤ µ + 1 , 64 σ ) ≅ 0 , 90
P ( µ − 1 , 96 σ ≤ X ≤ µ + 1 , 96 σ ) ≅ 0 , 95

31
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – verificação dos pressupostos do modelo

 Normalidade

 Verificação

> A partir da comparação da frequência relativa dos resíduos


amostrais padronizados nos intervalos [-1; +1], [-1,64; +1,64], [-1,96;
+1,96], com as probabilidades da distribuição normal padrão nos
mesmos intervalos, ou seja, 68%, 90% e 95%.

Método comparativo direto de dados de mercado


Validação do modelo – verificação dos pressupostos do modelo

 Hipóteses básicas do modelo de regressão linear

1. Os erros são variáveis aleatórias com distribuição normal;


2. Os erros são variáveis aleatórias com valor esperado nulo e
variância constante (homocedasticidade), isto é, c  = 0 e
Var  = b  , respectivamente.

32
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – verificação dos pressupostos do modelo

 Homoscedasticidade
 Verificação
> A partir da análise gráfica dos resíduos padronizados versus valores
ajustados pelo modelo de regressão. Os pontos devem estar
distribuídos aleatoriamente em torno de uma reta horizontal que
passa na origem, sem nenhum padrão definido.

ei ei
O O
<

<
Yi Yi
Modelo homoscedástico Modelo heteroscedástico
( variância constante ) ( variância não constante )

Método comparativo direto de dados de mercado


Validação do modelo – verificação dos pressupostos do modelo

 Hipóteses básicas do modelo de regressão linear

1. Os erros são variáveis aleatórias com distribuição normal;


2. Os erros são variáveis aleatórias com valor esperado nulo e variância
constante, isto é, E (ε i) = 0 e Var (ε i) = σ2, respectivamente;
3. Os erros não são correlacionados, isto é, são independentes sob a
condição de normalidade.
> O conceito de independência dos resíduos está ligado à independência
dos dados de mercado.

33
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – verificação dos pressupostos do modelo

 Autocorrelação

 Verificação
A partir da análise gráfica dos resíduos padronizados versus valores
ajustados pelo modelo de regressão, que deve apresentar pontos
dispersos aleatoriamente, sem nenhum padrão definido.

ei ei
O O
<

<
Yi Yi
Ausência de autocorrelação Indícios de autocorrelação
( variância não constante )

Método comparativo direto de dados de mercado


Validação do modelo – verificação dos pressupostos do modelo

 Hipóteses básicas do modelo de regressão linear

1. Os erros são variáveis aleatórias com distribuição normal;


2. Os erros são variáveis aleatórias com valor esperado nulo e variância
constante, isto é, E (ε i) = 0 e Var (ε i) = σ2, respectivamente;
3. Os erros não são correlacionados, isto é, são independentes sob a
condição de normalidade;
4. Não deve existir nenhuma relação exata entre quaisquer variáveis
independentes: colinearidade ou multicolinearidade (somente aplicável na
regressão linear múltipla).

34
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Colinearidade ou multicolinearidade

 Colinearidade ou multicolinearidade

 Trata-se de um forte dependência linear entre duas


(colinearidade) ou mais (multicolinearidade) variáveis
independentes que pode provocar degenerações no modelo e limitar
sua utilização.

> Deve-se analisar a matriz das correlações, que espelha as


dependências lineares de primeira ordem entre as variáveis
explicativas consideras no modelo.

> NBR 14653-2, Anexo A, item A.2.1.5.2: atenção especial para


resultados superiores a 0,80.

> NBR 14653-2, Anexo A, item A.2.1.5.4: Nos casos em que o imóvel
avaliando segue os padrões estruturais do modelo, a existência de
multicolinearidade pode ser negligenciada.

Método comparativo direto de dados de mercado


Validação do modelo – verificação dos pressupostos do modelo

 Hipóteses básicas do modelo de regressão linear

1. Os erros são variáveis aleatórias com distribuição normal;


2. Os erros são variáveis aleatórias com valor esperado nulo e variância
constante, isto é, E (ε i) = 0 e Var (ε i) = σ2, respectivamente;
3. Os erros não são correlacionados, isto é, são independentes sob a
condição de normalidade;
4. Não deve existir nenhuma relação exata entre quaisquer variáveis
independentes: colinearidade ou multicolinearidade (somente aplicável na
regressão linear múltipla).

 Hipótese complementar: (i) A relação entre a variável explicada e cada


variável explicativa é linear nos parâmetros.

 = 259,07 − 66,77. X



35
23/10/2018

Método comparativo direto de dados de mercado


Tratamento dos dados – tratamento científico

A heterogeneidade dos dados é tratada a partir do uso de metodologia


científica (suportada por técnicas apropriadas da Estatística), que leve à
indução de modelo validado para o comportamento do mercado.
 = 259,07 − 66,77. X


Verificação dos pressupostos
básicos do modelo

Técnicas apropriadas da
Verificação de pontos atípicos

Estatística
Validação do Análises de: gráficos, medidas de
modelo diagnóstico, testes e intervalos
estatísticos voltados para a
qualidade do ajustamento
Verificação da adequação teórica
e lógica do modelo

Método comparativo direto de dados de mercado


Verificação de pontos atípicos

 É importante verificar se há presença de pontos atípicos (outliers e


pontos influenciantes).

Pergunta: o que é um outlier? Pergunta: o que é um ponto


influenciante?
Yi Yi

Xi Xi
Outlier é um ponto atípico, Ponto influenciante é um ponto
identificado como estranho à atípico que, quando retirado da
massa de dados. amostra, altera significativamente os
parâmetros estimados ou a
estrutura do modelo.

36
23/10/2018

Método comparativo direto de dados de mercado


Verificação de pontos atípicos

 Outliers

 Verificação
A partir da análise do gráfico dos resíduos padronizados versus
valores ajustados.

ei*
OUTLIER
+2

<
0 Yi
- OUTLIER
2

Método comparativo direto de dados de mercado


Tratamento dos dados – tratamento científico

A heterogeneidade dos dados é tratada a partir do uso de metodologia


científica (suportada por técnicas apropriadas da Estatística), que leve à
indução de modelo validado para o comportamento do mercado.
 = 259,07 − 66,77. X


Verificação dos pressupostos
básicos do modelo
Técnicas apropriadas da

Verificação de pontos atípicos


Estatística

Validação do Análises de: gráficos, medidas de


modelo diagnóstico, testes e intervalos
estatísticos voltados para a
qualidade do ajustamento
Verificação da adequação teórica
e lógica do modelo

37
23/10/2018

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Verificação da adequação teórica e lógica do modelo

1. Teste da equação (função estimativa): analisar a influência de


cada variável independente no resultado da equação é fundamental
para comprovação das hipóteses formuladas no estudo científico:

- Coerência e análise dos sinais dos parâmetros (todas as variáveis


independentes);
- Testes de sensibilidade. Projeções de valores.

Método comparativo direto de dados de mercado


Validação do modelo – Análises de: gráficos, medidas de diagnóstico,
testes e intervalos estatísticos voltados para a qualidade do
ajustamento

 Verificação da adequação teórica e lógica do modelo

2. Análise da coluna de valores estimados: não deve apresentar sinal


negativo para nenhum dos dados.

Preços Valores Resíduo


observados estimados relativo
300 259,08 14%
200 192,31 4%
150 192,31 -28%
100 125,54 -26%
50 58,77 -18%
20 -8,00 140%

38
23/10/2018

Onde estamos

1. Introdução à Engenharia de Avaliações


2. Conceitos básicos
3. Métodos de avaliação
4. Metodologia científica aplicada à Engenharia de Avaliações
5. Método comparativo direto de dados de mercado
5.1 Fundamentos e etapas de desenvolvimento
5.2 Tratamento dos dados via análise de regressão

77

Escopo
1. MCDDM – Tratamento dos dados
1.1 Análise de regressão
1.2 Coeficiente de correlação
1.3 Modelo de regressão linear simples
1.3.1 Método dos mínimos quadrados
1.4 Validação do modelo
1.4.1 Verificação dos pressup. básicos do modelo de regr.
1.4.2 Verificação de pontos atípicos
1.4.3 Análises de: gráficos, medidas de diagnóstico, testes e
intervalos estatísticos voltados para a qualidade do
ajustamento
1.4.4 Verificação da adequação teórica e lógica do modelo

78

39
23/10/2018

Método comparativo direto de dados de


mercado: tópicos especiais

79

Método comparativo direto de dados de mercado


Tópicos especiais

Codificação de variáveis qualitativas

Tópicos especiais Transformação de variáveis

Modelo de regressão linear múltipla

40
23/10/2018

Método comparativo direto de dados de mercado


Tópicos especiais – Codificação de variáveis qualitativas

 Variáveis binárias, dicotômicas ou dummies.

Variáveis que assumem apenas duas posições: sim ou não, presença


ou ausência de determinado atributo, tais como: oferta ou transação,
bairro comercial ou residencial, terreno próprio ou de marinha etc.

 Neste casos, atribui-se geralmente 0 (zero) para a variável na


situação que apesenta menor valor e 1 (um) para a situação oposta.

> Esquina ou meio?


> Oferta ou transação?

Método comparativo direto de dados de mercado


Tópicos especiais – Codificação de variáveis qualitativas

 Código alocado

 Escala lógica ordenada para diferenciar as características


qualitativas dos imóveis. A escala será composta por números
naturais consecutivos em ordem crescente (1, 2, 3...), em função da
importância das características possíveis na formação do valor, com
valor inicial igual a 1.
Variável: padrão de acabamento
PADRÃO BAIXO NORMAL ALTO
PESOS 1 2 3

41
23/10/2018

Método comparativo direto de dados de mercado


Tópicos especiais – Codificação de variáveis qualitativas

 NBR 14653-2, Anexo A, item A.2:


para evitar a micronumerosidade, o número mínimo de dados
efetivamente utilizados (n) no modelo deve obedecer aos seguintes
critérios, com respeito ao número de variáveis independentes (k):
n ≥ 3 (k + 1)
para n ≤ 30, ni ≥ 3
para 30 < n ≤ 100, ni ≥ 10% n
para n > 100, ni ≥ 10
onde
ni é o número de dados de mesma característica, no caso de utilização
de variáveis dicotômicas e variáveis qualitativas expressas por
códigos alocados ou códigos ajustados.

Método comparativo direto de dados de mercado


Tópicos especiais – Codificação de variáveis qualitativas

 Variável proxy

Variável utilizada para substituir outra de difícil mensuração e que se


presume guardar com ela relação de pertinência, obtida por meio de
indicadores publicados ou inferidos em outros estudos de mercado.
Exemplo:

> Para expressar localização, pode-se utilizar a renda média do chefe


de família, o IDH, o PIB per capita etc.

42
23/10/2018

Método comparativo direto de dados de mercado


Tópicos especiais – Codificação de variáveis qualitativas

 Variável proxy

> Proxy de localização a partir da renda média do chefe de família:

Dado Bairro Proxy - Renda Média


1 Aflitos 8.822,27
2 Aflitos 8.822,27
3 Aflitos 8.822,27
4 Jaqueira 11.339,79
5 Espinheiro 7.299,96
6 Espinheiro 7.299,96
7 Espinheiro 7.299,96
8 Graças 9.481,84
9 Graças 9.481,84
10 Parnamirim 10.712,79

> OBS: Tabela obtida no site do IBGE.

Método comparativo direto de dados de mercado


Tópicos especiais

Codificação de variáveis qualitativas

Tópicos especiais Transformação de variáveis

Modelo de regressão linear múltipla

43
23/10/2018

Introdução à Engenharia de Avaliações:


Modelos Via Transformação

 Falta de Linearidade.
 Variância não constante para o erro.

Yi e i

X ki  i

Introdução à Engenharia de Avaliações: Modelos Via


Transformação – Exponencial

Y Y

X X
Z= Ln (Y) Z= Ln (Y)

X X

44
23/10/2018

Introdução à Engenharia de Avaliações: Modelos Via


Transformação – Exponencial

Z= Ln (Y) Z= Ln (Y)

X X
Z = a+ b. X

Ln (Y) = a + b . X A função exponencial fornece a taxa de variação


de y em relação a x, indicada por (eb -1)
eLn(Y) = e(a+b.X)
Y = ea . eb.X

Introdução à Engenharia de Avaliações: Modelos Via


Transformação – Função Hiperbólica

Y Z= 1
Y

X X

Z = a+ b. X

1 = a + b. X
Y

Y= 1
a + b. X

45
23/10/2018

Introdução à Engenharia de Avaliações: Modelos Via


Transformação – Potência

Y Y

X X
Y

Introdução à Engenharia de Avaliações: Modelos Via


Transformação – Potência

Z = Ln (Y); K = Ln (X)

Z = a+ b. K

Ln (Y) = a + b . Ln (X)

eLn(Y) = ea + b.Ln (X)


Y = ea . eb . Ln (X)

Y = ea . eLn (X) . b
Y = ea . Xb

Obs.: b indica a elasticidade de Y em relação a X, ou seja, e = (dy/y) / (dx/x)

46
23/10/2018

Análise de Regressão Aplicada à


Engenharia de Avaliações com Uso do Excel
(Exercício)

Método comparativo direto de dados de mercado


Tópicos especiais

Codificação de variáveis qualitativas

Tópicos especiais Transformação de variáveis

Modelo de regressão linear múltipla

47
23/10/2018

Método comparativo direto de dados de mercado


Tópicos especiais – Modelo de regressão linear múltipla

 Quando mais de uma variável independente é necessária para


explicar a variabilidade dos preços, adota-se o modelo de regressão
linear múltipla.
Reg. linear simples Reg. linear múltipla
Y i = βˆ 0 + βˆ 1 . X i + eˆ i Y i = βˆ 0 + βˆ1 X 1i + K + βˆ k X ki + eˆ i

Yˆi = βˆ 0 + βˆ1 . X i Yˆi = βˆ 0 + βˆ1 X 1i + K + βˆ k X ki

P = β0 + β1 . A + β2 . D
P P

D
D A
 Todos os conceitos da regressão linear simples podem ser
generalizados para a regressão linear múltipla.

Método comparativo direto de dados de mercado


Validação do modelo – verificação dos pressupostos do modelo

 Hipóteses básicas do modelo de regressão linear

1. Os erros são variáveis aleatórias com distribuição normal;


2. Os erros são variáveis aleatórias com valor esperado nulo e variância
constante, isto é, E (ε i) = 0 e Var (ε i) = σ2, respectivamente;
3. Os erros não são correlacionados, isto é, são independentes sob a
condição de normalidade;
4. Não deve existir nenhuma relação exata entre quaisquer variáveis
independentes: colinearidade ou multicolinearidade (somente aplicável na
regressão linear múltipla).

 Hipótese complementar: (i) A relação entre a variável explicada e cada


variável explicativa é linear nos parâmetros.

 = 259,07 − 66,77. X



48
23/10/2018

Regressão linear múltipla


Exemplos no Excel

97

49
23/10/2018

Codificação de variáveis qualitativas


Exemplo no Excel

99

Análise de Regressão Aplicada à


Engenharia de Avaliações com Uso do Excel
(Exercício final)

50
23/10/2018

Método comparativo direto de dados de mercado


Engenharia de avaliações com uso do Excel

 Exercício 02
Estimar o valor de mercado de um lote com área de 365,00 m². A
pesquisa realizada obteve informações sobre sete lotes localizados na
mesma via, próximos uns dos outros, com o mesmo coeficiente de
aproveitamento, as mesmas características de infraestrutura urbana,
topografias semelhantes e frentes idênticas (todas com 15,00 m).

DAD0 ÁREA PREÇO UNITÁRIO (R$/m²)


1 450,00 100,00
2 420,00 102,00
3 360,00 106,00
4 380,00 104,00
5 500,00 97,00
6 400,00 103,00
7 550,00 95,00

51

Você também pode gostar