Escolar Documentos
Profissional Documentos
Cultura Documentos
Notas de Aula
Universidade de So Paulo
Faculdade de Arquitetura e Urbanismo 2
Estatstica Aplicada
Modelos de Regresso
Diagrama de Disperso
Ao se plotar num grfico cartesiano os pares de informao referente a cada observao obtemos
uma nuvem de pontos definidos pelas coordenadas x e y de cada ponto. Essa nuvem, por sua
vez, definir um eixo ou direo que caracterizar o padro de relacionamento entre X e Y. A
regresso ser linear se observada uma tendncia ou eixo linear na nuvem de pontos cartesianos.
A relao entre as variveis ser direta (ou positiva) quando os valores de Y aumentarem em
decorrncia da elevao dos valores de X . Ser inversa (ou negativa) quando os valores de Y
variarem inversamente em relao aos de X. A figura 1 mostra o diagrama de disperso
referente as variveis X e Y. O diagrama mostra uma relao direta entre as variveis, ou seja: o
crescimento de Y est diretamente ligado ao crescimento de X.
Universidade de So Paulo
Faculdade de Arquitetura e Urbanismo 3
Estatstica Aplicada
Figura 1
x y
____________
30 430
21 335
35 520
42 490
37 470
20 210
8 195
17 270
35 400
25 480
Figura 2
x y x.y x2 Projeo
30 430 12.900 900 409,21
21 335 7.035 441 321,57
35 520 18.200 1.225 457,91
42 490 20.580 1.764 526,07
37 470 17.390 1.369 477,38
20 210 4.200 400 311,83
8 195 1.560 64 194,98
17 270 4.590 289 282,62
35 400 14.000 1.225 457,91
25 480 12.000 625 360,52
Somas 270 3.800 112.455 8.302
b= 9,7381
a= 117,0702 Y = 117,07 + 9,74 x
Universidade de So Paulo
Faculdade de Arquitetura e Urbanismo 5
Estatstica Aplicada
o mtodo de computao matemtica pelo qual se define a curva de regresso. Esse mtodo
definir uma reta que minimizar a soma das distncias ao quadrado entre os pontos plotados (X,
Y) e a reta (X,Y). Pelo mtodo dos mnimos quadrados calculam-se os parmetros a e b da
reta que minimiza estas distncias ou as diferenas (ou o erro) entre Y e Y. Esta reta chamada
de curva de regresso.
Para que a soma dos quadrados dos erros tenha um valor mnimo, devem-se aplicar os conceitos
de clculo diferencial com derivadas parciais. Como as incgnitas do problema so os
coeficientes "a" e "b" estrutura-se um sistema de duas equaes. Assim aplicando os conceitos
acima referidos monta-se o sistema de equaes normais que permitir extrair os valores de a e
b,
e
------ = - 2 (Y- a - bX)
a
- 2 Y + 2 a + 2 bX
Y = a + bX
Y+bX
(7) a = ------------------ N tamanho da amostra
N
N XY - X. Y
(9) b = ---------------------------
a X2 - X2
Universidade de So Paulo
Faculdade de Arquitetura e Urbanismo 6
Estatstica Aplicada
A reta de regresso que se obtm atravs do mtodo dos mnimos quadrados apenas uma
aproximao da realidade, ela um modo til para indicar a tendncia dos dados. Mas at que
ponto a reta de regresso obtida til para avaliar a realidade? Duas medidas podem indicar o
quanto til ou aproximado da realidade a reta:
erro padro da estimativa;
coeficiente de determinao
O erro padro da estimativa Se mede o desvio mdio entre os valores reais de Y e os valores
estimados Y. Ele informa de modo aproximado a extenso do erro entre os valores obtidos das
estimativas e os valores de Y fornecidos pela amostra. Se medido na unidade de Y. O que se
busca conseguir o menor valor possvel de Se.
Pode-se interpretar o Se como um desvio padro dos resduos, pois assumindo que estes resduos
so "normalmente distribudos", pode-se dizer ento que 68% dos pontos (plotados) encontram-
se dentro de 1 desvio padro:
-1 Se 1;
-2 Se 2.
(Y Y)2
Se2 = ----------------------- =
N-2
(Y Y)2
Se = N2
Ao se ajustar a reta se espera que ela explique o conjunto de dados coletados. Se os dados
estivem todos contidos numa reta teremos uma reta de regresso coincidente com os dados
Universidade de So Paulo
Faculdade de Arquitetura e Urbanismo 7
Estatstica Aplicada
levantados. Nesse caso a somatria dos desvios ao quadrado ser zero e, o ajuste da reta ser
completo. A reta de regresso explica perfeitamente a relao entre X e Y.
O erro padro existir sempre que o poder de explicao da reta no for completo. O valor do
erro significa ento que existem outros fatores que interferem no comportamento de Y alm da
varivel X.
Coeficiente de Determinao
Ao se analisar a reta de regresso observamos que os pontos (xi, yi) esto distribudos acima e
abaixo da mesma. Na Figura 3 relacionamos cada ponto (Y), com o seu valor estimado (Y - a
reta de regresso) e com o valor mdio de Y (Y* -reta paralela ao eixo X). Como podemos
observar a diferena entre o valor de Y e o valor de Y* (valor mdio de Y) o desvio total do
ponto em relao a sua mdia.
(Y Y*)2
A diferena entre o valor de um ponto Y (xi, yi) e seu valor estimado Y' (xi,yi) isto a
distancia entre o ponto Y e a reta de regresso, chamada de Variao No Explicada pela reta
de regresso. Isto :
(Y Y)2
(Y Y*)2
Figura 3
yi Y
Variao no Explicada
Y
yi
Variao Explicada
Y*
y*
Y= a+ bX
xi
Conclui-se que:
Variao
x y Projeo Explicada No explicada Total
30 430 409,21 853,48 432,04 2.500
21 335 321,57 3.413,93 180,33 2.025
35 520 457,91 6.069,21 3.855,77 19.600
42 490 526,07 21.337,07 1.301,20 12.100
37 470 477,38 9.483,14 54,49 8.100
20 210 311,83 4.646,74 10.369,96 28.900
8 195 194,98 34.234,14 0,00 34.225
17 270 282,62 9.483,14 159,23 12.100
35 400 457,91 6.069,21 3.353,01 400
25 480 360,52 379,33 14.274,58 10.000
Mdia y 380 Soma 95.969,39 33.980,61 129.950
b 9,74
a 117,07 Coeficiente de Determinao 0,7385
F observado 22,5939
Universidade de So Paulo
Faculdade de Arquitetura e Urbanismo 9
Estatstica Aplicada
Coeficiente de Correlao
Portanto,
-1 r +1
Resumindo:
-1 r +1
Cov (X,Y)
rX,Y = onde,
X Y
S2b Sb
Sb = S2b = ------------------ = ---------------------
(n-1) x Var (x) (n-1) x Var (x)