Você está na página 1de 20

UNIVERSIDADE FEDERAL DE MINAS GERAIS

DEPARTAMENTODE ENGENHARIA DE MATERIAIS E CONSTRUO


AVALIAO DE BENS URBANOS POR METODOLGIA CIENTFICA

Anlise de modelo por regresso linear

Aluno: Pedro Curvello da Costa Nemer

Belo Horizonte,MG
Junho
2015

ndice de tabelas
Tabela 1:Quadro de pesquisa correlacionando a rea do terreno com seu valor unitrio. 3
Tabela 2:Quadro de pesquisa modificado......................................................................4
Tabela 3:Tabela referentes aos resultados da regresso linear.......................................6
Tabela 4:Correlao entre as variveis anlisadas segundo valor de r............................7
Tabela 5:Tabela ANOVA................................................................................................ 8
Tabela 6:Tabela ANOVA preenchida............................................................................... 8
Tabela 7:Tabela para calculo das Xi Xmed e (Xi - Xmed)..............................................9
Tabela 8: Distribuio F de SNEDCOR.........................................................................15
Tabela 9:Distribuio t de Student..............................................................................16

ndice de ilustraes
Figura 1:Anlise dos dados por disperso....................................................................4
Figura 2:Modelo de anlise por regresso linear............................................................5
Figura 3:Anlise do modelo por regresso linear...........................................................7
Figura 4:Anlise do modelo atraves dos intervalos de confiana..................................10
Figura 5:Grafico rea do terreno X Residuos...............................................................11
Figura 6:Grfico Residuo X Valor estimado.................................................................12
Figura 7: Grafico (e/s) x Yest....................................................................................... 13

Sumrio
1.

Anlise por regresso linear simples:.....................................................................5

2.

Coeficientes de Determinao e Correlao:...........................................................8


2.1.

Coeficiente de correlao:...............................................................................8

2.2.

Coeficiente de Determinao:..........................................................................9

3.

Anlise de varincia:............................................................................................ 10

4.

Intervalo de Confiana:........................................................................................ 10

5.

Multicolinearidade:.............................................................................................. 13

A.

Anexo: Distribuio F de SNEDCOR..................................................................17

B.

Anexo: Distribuio t de Student.......................................................................18

1. Anlise por regresso linear simples:


Com o objetivo de avaliar um terreno urbano foi realizada pesquisa de mercado e
coletadas informaes relativas a dez lotes de comparao, obtendo-se preos
unitrios e reas correspondentes dos lotes pesquisados.
A tabela a seguir mostra os dados obtidos:
Tabela 1:Quadro de pesquisa correlacionando a rea do terreno com seu valor unitrio

QUADRO DE PESQUISA
Reg. N
Valor
rea do
Unitrio
Terreno
1
2
3
4
5
6
7
8
9
10
Avaliado
Soma
Mdia

600
520
610
480
550
520
380
420
570
630

450
500
420
580
600
680
800
720
620
300
450

Utilizando como base os valores obtidos na pesquisa foi elaborada uma nova tabela
com intuito de realizarmos uma analise por meio de regresso linear simples, e assim
obter um valor unitrio para o terreno avaliado em questo.

Anlise dos dados por disperso


700
600
500
400
Valor unitrio

300
200
100
0
100

200

300

400

500

600

700

800

900

rea do terreno (m)

Figura 1:Anlise dos dados por disperso

Tabela 2:Quadro de pesquisa modificado.

QUADRO DE PESQUISA
Reg. N

Valor Unitrio
Y

rea do
Terreno X

xy

600

450

270000

202500

520

500

260000

250000

610

420

256200

176400

480

580

278400

336400

550

600

330000

360000

520

680

353600

462400

380

800

304000

640000

420

720

302400

518400

570

620

353400

384400

10

630

300

189000

90000

Avaliado
Soma

450
5280

5670

202500
2897000

3420500

Mdia

528

567

289700

342050

Com os valores obtidos no quadro acima realizaremos as operaes necessrias para


o clculo dos parmetros a e b.

Y =an+b X
XY =a X + b X

Y =an+b X

5280=10 a+ 5670b

XY =a X + b X
96760=205610 b
Como

a=528567 b

Y est . =583,0601624

a=528567 b

2897000=( 528567 b ) 5670+3420500 b

logo

b=0,4706 .

ento

Y est . =794,830020,4706 X
Para X = 450

logo

a=794,83002

Regresso linear
700
f(x) = - 0.47x + 794.83
R = 0.75

600
500
400
Valor unitrio

300
200
100
0
200

300

400

500

600

rea do terreno (m)

Figura 2:Modelo de anlise por regresso linear

700

800

900

2. Coeficientes de Determinao e Correlao:


Afim de explicarmos melhor o comportamento da regresso linear sero calculados os
coeficientes de determinao e correlao segundo os seguintes mtodos
Variao explicada = VE = (Yest. - )
Variao no explicada = VNE = (Y - Yest.)
Variao total = VT = VE + VNE
Coeficiente de determinao = r = VE / VT
Coeficiente de correlao r
Para otimizar o clculo foi elaborada a seguinte tabela.
Tabela 3:Tabela referentes aos resultados da regresso linear.

Reg.
N

Yest.

Yest.

600

583,06
02

55,060
2

520

610

559,53
02
597,17
82

31,530
2
69,178
2

480

521,88
22

550

512,47
02

520

474,82
22

6,1178
15,529
8
53,177
8

380

418,35
02

420

455,99
82

9
10

570
630

503,05
82
653,65

109,65
72,001
8
24,941
8
125,65

YYest.
(Resid
uo)
16,939
8
39,530
2
12,821
8
41,882
2

Resid
uo (%)

(Yest. )

(Y Yest.)

2,8233

3031,6
26

286,956
82

7,6019
6
2,1019
34

994,15
35
4785,6
23

1562,63
67
164,398
56

8,7254
6

37,427
48

1754,11
87

6,8236

241,17
47

1408,48
59

45,177
8
38,350
2
35,998
2

8,6880
38

2827,8
78

2041,03
36

10,092
2

12023,
08

1470,73
78

8,571

5184,2
59

1295,87
04

66,941
8
-

11,744
18
3,754

622,09
34
15787,

4481,20
46
559,331

37,529
8

Mdia
Soma
VE
VNE
VT
r
r

02
528

02

5280
45535,
29
15024,
78
60560,
06
0,7519
03
0,8671
23

23,650
2

97

96

45535,
29

15024,7
75

2.1. Coeficiente de correlao:


O grau de relao entre as variveis expresso por r ou coeficiente de correlao varia
de -1 e 1, sendo o modulo desse valor o responsvel por definir o quanto as variveis
esto associadas segundo o quadro a seguir.

Tabela 4:Correlao entre as variveis anlisadas segundo valor de r.

Como no estudo efetuado o grau de correlao foi de aproximadamente 0,87, podemos


afirmar que o tamanho do terreno esta fortemente associado com o seu valor unitrio, e
pela inclinao apresentada pela regresso linear, possvel inferir que r < 0.
2.2. Coeficiente de Determinao:
Representado por r obtido por meio da diviso da variao explicada de Y pela
variao total de Y, variando de 0 a1, representa a percentagem de valor que
explicada pela equao ajustada pela regresso.

Modelo por regresso linear


700
600
500

630

610
600
570
f(x) = - 0.47x + 794.83550
520
520
R = 0.75
480
420

400
Valor unitrio

380

300
200
100
0
200

300

400

500

600

rea do terreno (m)

Figura 3:Anlise do modelo por regresso linear

700

800

900

Como pde ser observado anteriormente a regresso linear traduz o comportamento


da anlise obtida com representatividade de aproximadamente 75%, porm podemos
observar na figura 3 que para os pontos 6 e 9 houve um aumento da variao no
explicada, tornando o modelo pouco representativo para os tamanhos de terreno entre
620m e 680m.
3. Anlise de varincia:
Forma de testas a no existncia de regresso, atravs do clculo da significncia do
modelo () que revela o nvel de incerteza do ajuste, complementarmente com sua
confiabilidade (100 - ).
Pela NBR 14653-2 o modelo inferido dever apresentar significncia mxima de 1%,
representando uma confiabilidade mnima de 99%.
A analise de varincia foi elaborada a seguir segundo a tabela ANOVA.
Tabela 5:Tabela ANOVA.

Tabela 6:Tabela ANOVA preenchida.

Fonte de
variao
Explicada (VE)
No explicada
(VNE)
Total (VT)

Valores
45535,28
71
15024,77
51
60560,06
21

Graus de
Liberdade
1
8

Valores
Mdios
45535,2870
6
1878,09688
2

Fcal. de
SNECOR
24,2454409
5

A seguir compara-se o valo Fcal.com o valor de Ftab. extrado da tabela de SNEDCOR


para = 1% que se encontra em anexo.
Logo a partir da tabela 8 de distribuio F de SNEDCOR obtemos que F tab = 11,26.
Como Fcal. > Ftab temos que a regresso existe com significncia mxima de 1%.
4. Intervalo de Confiana:

A NBR 14653-2 exige que se determine um intervalo de confiana de 80% em torno do


valor central da estimativa sendo ele determinado por.

Y =Y est + t . s . ( 1/n ) + ( d20 / d 2i )

1 /2

Sendo:
Yest: valor estimado de Y pela regresso
t: Coeficinete de Studente para n-k-1 graus de liberdade, em anexo.
s: Erro padro da regresso =

[ ( Y Y

1 /2

est

2
) /( nk 1 ) ]

k: Numero de variveis independentes.


d0: Desvio do valor da varivel desejada em relao a mdia x med
di: Desvio de x em torno de sua mdia xmed
A seguir ser calculado o intervalo de confiana segundo as equaes acima.
Tabela 7:Tabela para calculo das Xi Xmed e (Xi - Xmed)

N
1
2
3
4
5
6
7
8
9
10
Soma
Mdia

REA
(X)
450
500
420
580
600
680
800
720
620
300
5670
567

Xi Xmed
-117
-67
-147
13
33
113
233
153
53
-267
0

(Xi Xmed)
13689
4489
21609
169
1089
12769
54289
23409
2809
71289
205610

O clculo para o erro padro pode ser simplificado pela

s=

((

15024,775
8

))

V NE /( nk 1)

, logo

consequentemente s = 43,337

Para = 20% e grau de liberdade igual a 8 temos pela tabela 9 que t = 1,397.
Como xmed = 567, para um x = 450, temos que di = 205610 e d0 = 450 567 = -117

Logo:
Y =583,06 + 1,397.43,337 . [ 0,1+ ( 117 /205610 ) ]

Y =583,06 + 24,71

1 /2

L .=607,77
Linf . =558,35

Assim temos que o intervalo de confiana de 80% varia entre 558,35 e 607,77.
Como forma de avaliarmos o comportamento da anlise foi determinado o intervalo de
confiana para todos os pontos avaliados e assim foi possvel a obteno dos limites
superiores e inferiores para toda a anlise como apresentado a seguir.

Modelo por regresso linear com limites sup. e inf. para = 20%
800
700
600

630

610600
f(x) = - 0.47x + 794.83
520
R = 0.75

500
Valor unitrio

570
550
480

520
420

400

380

300
200
100
0
200

300

400

500

600

700

800

900

rea do terreno (m)

Figura 4:Anlise do modelo atraves dos intervalos de confiana

Podemos observar que no ocorreu uma variao muito grande, na obteno do


intervalo de confiana de 80%, muito porque a regresso em si j nos fornecia uma
representatividade de 75%, porm a regresso linear mesmo com este intervalo de
confiana, ainda pouco representativa quando avaliamos o intervalo entre os pontos
9 e 6 referente as reas de terreno variando de 620m a 680m, logo uma anlise
detalhada de ser efetuada sobre os pontos em questo afim de avaliar sua significncia
e representatividade no modelo em questo.
5. Multicolinearidade:
A existncia de relao exata entre as variveis pode invalidar os resultados
alcanados.
A seguir podemos observar a ordenao dos resduos em relao as variveis
independentes afim de avaliarmos se existe dependncia direta entre elas.

Multicolinearidade
800
720
680
620

600

580
500

450

420

rea do terreno (X)


300

-40

-30

-20

-10

10

20

30

Residuos

Figura 5:Grafico rea do terreno X Residuos.


Como pode ser observado na figura 5, no foi observada nenhuma indicao de
dependncia entre os parmetros correlacionados, portanto podemos descartar a
multicolineridade neste modelo.
6. Homocedasticidade:
Afim de avaliarmos se existe varincia constante no modelo adotado, faremos a anlise
do grfico Resduo X Yest.

Anlise de Homecedasticidade
150

126.94
114

100
50.47
50
1.65
Residuos

28.12
16.94
7.53

-50

-63.06
-94.82

-100

-117.18

-150
Valor estimado (Yest.)

Figura 6:Grfico Residuo X Valor estimado.

Como observado na figura 6, no observada nenhuma distribuio ordenada em


relao a reta horizontal representada pela media dos resduos obtidos, logo podemos
inferir que o modelo possui homecedasticidade.
7. Outliers:
Outliers so dados que possuem comportamento muito diferente do restante das
amostras, podem ocorrer por meio de erros nos levantamentos de dados, ou por
incluso de dados no representativos para o modelo em questo, logo so pontos
prejudiciais ao modelo e no devem ser usados na avaliao.

Anlise de outliers
4
2.93
2.63

3
2

1.16
0.65
0.39
0.17
0.04

1
Erros padronixados (e/s)
0
-1

-1.46
-2.19

-2

-2.7

-3
Valores estimados (Yest.)

Figura 7: Grafico (e/s) x Yest.

Os outliers podem ser indeficados atravs da analise do grfico representado na


figura7, so considerados outliers os pontos com erro padronizado com mdulo maior
que 2, logo podemos analisar que o modelo possui uma grande quantidade de outliers,
o ponto 9, acabou realmente se mostrando um ponto prejudicial para o modelo em
questo, porm dos 10 avaliados observamos que pelo menos 4 possuem
comportamento muito divergente aos demais, assim podemos concluir que a analise
por regresso linear no cria um modelo com base solida, aos dados fornecidos pois
40% dos dados fornecidos no podem se utilizados na formao do modelo, logo
sugere-se que seja feita a anlise por outro modelo de calculo afim de obtermos
resultados mais representativos.
8. Coeficiente de Determinao Ajustado:
Calculado atravs da seguinte expresso:
Rajus. =1 (1R ) .

n1
nk1

Rajus. Busca aumentar o poder de explicao do modelo sendo pois leva em


considerao o numero de graus de liberdade perdidos a cada parmetro estimado.
Rajus. =1 (10,7519 ) .

101
=0,7209
1011

Como pode ser observado o coeficiente determinao ajustado para o modelo obtido
de aproximadamente 72%, logo seria aconselhvel buscar um modelo com melhor com
melhor representatividade em relao a amostra, ou como analisado anteriormente se
os pontos 5, 8, 9 e 10 continuarem a apresentar o comportamento distoante dos
demais, podemos retiralos da amostra e realizar novamente a anlise do modelo por
regresso linear, afim de melhorar nosso modelo.

A. Anexo: Distribuio F de SNEDCOR.


Tabela 8: Distribuio F de SNEDCOR.

A.
B. Anexo: Distribuio t de Student.
Tabela 9:Distribuio t de Student