Escolar Documentos
Profissional Documentos
Cultura Documentos
(a) uma varivel (X) pode ser medida acuradamente e seu valor escolhido
pelo experimentador. Por exemplo, a dose de uma droga a ser ministrada
no animal. Esta varivel a varivel independente. A outra varivel (Y),
dita varivel dependente ou resposta, est sujeita a erro experimental, e
seu valor depende do valor escolhido para a varivel independente. Assim,
a resposta (reao, Y) uma varivel dependente da varivel independente
dose (X). Este o caso da Regresso.
Quantidade Y2
Tempo (X) hidrolizada (Y) X .Y X2
2 3,5 7,0 4,0 12,3
3 5,7 17,1 9,0 32,5
5 9,9 49,5 25,0 98,0
8 16,3 130,4 64,0 265,7
10 19,3 193,0 100,0 372,5
12 25,7 308,4 144,0 660,5
14 28,2 394,8 196,0 795,2
15 32,6 489,0 225,0 1062,8
Total 69 141,2 1589,2 767,0 3299,5
1
anestsico local
Y 35
30
25
20
15
10
0
0 5 10 15 20
X
yx
E( y / x ) x ,
b
( x x)(y y )
i i a
y bx
(x x) i
2
Cov( X, Y ) [ ( x i x )( y i y )] / n 1
b
s 2X [ ( x i x ) 2 ] / n 1
( x i )( y i )
( x i x )( y i y) x i y i
n
( x i ) 2
(x i x ) 2 x i2
n
x y 69.141,2
xy n
1589,2
8 371,35
b Y .X 2,16
( x ) 2 (69) 2
171,88
x n
2
767
8
141,2 69
a y bx ( 2,16 ) 17,65 (2,16 . 8,63) = - 0,98
8 8
Portanto, a equao de regresso linear :
ou, como a y bx e y y bx bx ,
Y 35 y 2,1606 x 0,985
30
25
20
15
10
0
0 5 10 15 20
X
y a bx
b
)b
a + bx a + bx + b
)b
1
a
x x+1
Observaes:
(1) A regresso de y em x, E( y / x ) 0,98 2,16.x i , representa, no caso do
exemplo, a reta de regresso da quantidade de procaina hidrolizada sobre
o tempo. Ou seja, E(y/x) nada mais do que a mdia da distribuio de
todas as quantidades de procaina hidrolizada em um dado tempo (x).
2 [ ( x i x )( ( y i y)] 2
( y i y)
(x i x)
2 , cuja estimativa,
s 2 2
n2
(3) H situaes nas quais X tambm aparece como uma varivel aleatria.
Nesses casos, pode ser que estejamos tambm interessados na regresso de
X em Y. Tm-se:
b X .Y
( x x )( y y)
x i x b X.Y ( y i y) , onde
( y y) 2
X 0,08 0,15 0,08 0,05 0,08 0,11 0,08 0,10 0,06 0,05
Y 0,07 0,12 0,06 0,04 0,06 0,09 0,06 0,08 0,05 0,04
0,12
0,1
0,08
y 0,8054 0,0002
0,06
r 2 0,9849
0,04
0,02
0
0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0,16 0,18
3. Correlao
Definio: Sejam x1, x2, ..., xn; y1, y2, ..., yn os valores observados de X e Y,
respectivamente. Chama-se coeficiente de correlao (amostral) entre X e
Y, o nmero dado por:
r
Cov( X, Y )
( y y )( x x) / n 1
i i
(y y )(x x)
i i
Var ( X).Var ( Y ) (x x) . (y y )
i
2
i
2
(x x) (y y )
i
2
i
2
n1 n1
Uma frmula equivalente de clculo de r, de fcil manuseio, :
x i y i ( x i y i ) / n x i y i nx y
r
[ x i2 ( x i ) 2 / n ][ y i2 ( y i ) 2 / n ] ( x i2 nx 2 )( y i2 ny 2 )
Propriedades
Y X sobre Y
Y Y X sobre Y
Y sobre X
Y sobre X
Y
X X X
r =1 0<r<1 r=0
(a) (b) (c)
Y Y
Y sobre X
Y sobre X
X sobre Y X
X sobre Y X
-1 < r < 0 X r = -1
(d) (e)
X
Figura 7. Relao parablica entre X e Y, onde: r = 0.
s 2Y s 2Y / X
r2
s 2Y
n
2
( y i y i )
onde: a variao dos valores de Y que ainda
s 2Y / X i 1
n2
permanece, depois de se levar em conta a relao linear entre Y e X (devido
ao fato que nem todos os pontos esto sobre a reta de regresso), que
parte no explicada pela regresso; e (s 2Y s 2Y / X ) a variao em Y
explicada pela regresso. Note que s 2Y / X envolve a soma dos desvios
elevados ao quadrado das observaes reais (y i) dos valores ajustados (
n
y i ), isto , e i2 , a qual a quantidade minimizada ao se ajustar a linha de
i 1
mnimos quadrados (veja Figura 8).
O coeficiente de determinao , portanto, uma medida descritiva da
qualidade do ajustamento obtido pela equao de regresso estimada.
particularmente importante quando usado para fazer previses e ser
tanto mais til quanto mais prximo de um (1,0) estiver o seu valor. Se
r2 = 1, todos os dados na amostra situam-se na linha de mnimos quadrados;
se r2 = 0, no h uma relao linear entre X e Y.
Para o exemplo apresentado na Tabela 1, pode-se mostrar que
r2 = (0,997)2 = 0,994. Esse valor implica em uma relao linear forte entre
o tempo e a quantidade de procaina hidrolizada; em particular 99,4 % da
variabilidade entre os valores observados de procaina hidrolizada
explicada pela relao linear entre essa varivel e o tempo. O restante
1 0,994 = 0,006 (0,6 %) da variao no explicada por essa relao.
sY sX
b Y .X r b X .Y r
sX sY
Y Y b 1 (X X ) ou Y Y b 1 (X X )
s
Como b 1 b Y.X r s
Y
sY s
Y Y r (X X ) ou y r Y x (1)
sX sX
X Y
Correlao e causa
importante salientar que o coeficiente de correlao define apenas o
sentido da variao conjunta das variveis. A observao que duas variveis
tendem variar simultaneamente em uma direo ou em direes contrrias,
onde os dados provavelmente indicariam uma correlao, positiva ou
negativa, alta, no implicaria necessariamente na presena de uma relao
de causa e efeito entre elas. Assim, na Figura 9, nota-se que existe uma
correlao negativa entre o consumo de protenas e o coeficiente de
natalidade. Entretanto, isto no implica em afirmar que um aumento no
consumo de protenas determina reduo da fertilidade. Portanto, uma
correlao observada pode ser falsa (correlao espria), isto , pode ser
devido a uma terceira e desconhecida varivel causal.
Exemplo de correlao
X 29 32 28 23 28 34 27 24 27 20
Y 219 262 202 138 190 215 188 164 185 150
x y 272.1913
xy 53202
r n 10
2 2 2 2
( x nx )( y ny ) (7552 10.27,2 2 )(377.743 10.191,3 2 )
r = 0,87
b b
,
Var (b) Var (b)
[ ( x i x )( y i y)] 2
(y i y) 2
onde: (x i x) 2
.
var (b) n2
(x i x) 2
( y i ) 2
(y i y)
2
y i2
n
(371,35) 2
807,24
171,88
6 0,82
Var (b) 0,0048
171,88 171,88
b 2,16 0
t obs 31,30
Var (b) 0,0048
= 5% gl = n - 2 = 6 tc (0,05; 6) = 2,447
0,87 10 2 2,46
t obs 5,02
1 (0,87) 2 0,49
Como tobs > tc, a hiptese nula rejeitada ao nvel de significncia de 1%.
Portanto, h evidncia de que as variveis X e Y so correlacionadas.
b r n2
var(b) 1 r2