Escolar Documentos
Profissional Documentos
Cultura Documentos
Aula 08
Sumrio
1
Regresso ................................................................................................................................. 8
2.1
2.2
2.3
Predio ........................................................................................................................... 22
2.4
2.5
2.6
2.7
2.7.1
6. Gabarito .................................................................................................................................. 41
7. Resoluo dos Exerccios de Fixao ........................................................................... 42
1
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Caro aluno,
Tudo bem com voc? Na aula de hoje, volto a abordar o assunto da regresso
linear, que foi introduzido na aula 4, dada a importncia desse tpico para a
prova. A prxima aula aprofundar o mesmo assunto. Sei que a aula 4 foi
indigesta, e por isso que retomamos o estudo da regresso, que ficou um
tanto quanto perdida entre os diversos tpicos que foram ensinados na aula
4. Vamos aula de hoje?
Covarincia e Correlao
X- Altura (cm)
Y - Peso (kg)
1
2
3
4
5
6
7
8
174
161
171
181
182
165
155
168
74
68
63
92
80
73
61
64
2
9
10
176
175
90
81
95
90
85
80
75
70
65
60
55
150
155
160
165
170
175
180
185
3
www.pontodosconcursos.com.br | Prof. Alexandre Lima
-1
-2
-3
-4
-3
-2
-1
4
www.pontodosconcursos.com.br | Prof. Alexandre Lima
(1)
s xy =
1 n
( xi x )( yi y )
n 1 i=1
(2)
r=
s xy
sx s y
s x2 =
1
1
n
n
n 2
( xi x ) 2 =
x2
x
i =1 i
i =1
n 1
n 1
n 1
(4)
s y2 =
1
1
n
n
n 2
( yi y ) 2 =
y2
y
i =1 i
i =1
n 1
n 1
n 1
(5)
r=
i =1
i =1
( xi x )( yi y )
( xi x ) 2
i =1
( yi y ) 2
S xy
S xx S yy
5
( x )( y ).
(6)
S xy = i =1 xi yi
1
n
(7)
1
S xx = i=1 x
n
( x )
(8)
1
S yy = i =1 y
n
( y )
2
i
2
i
i =1
i =1
i =1 i
i =1
CORRELAO NO CAUSALIDADE
Para as crianas, o tamanho do vocabulrio est correlacionado intensamente
com o tamanho do p. Entretanto, a aprendizagem de novas palavras no faz
6
www.pontodosconcursos.com.br | Prof. Alexandre Lima
inferior a 0,8.
Resoluo
Aprendemos que o coeficiente de correlao dado por
r=
i =1
i =1
Mdia de X: x =
( xi x )( yi y )
( xi x ) 2
i =1
( yi y ) 2
S xy
S xx S yy
1 n
1+ 2 + 3 + 4 + 5
x =
= 3,0
i =1 i
n
5
7
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Mdia de Y: y =
1 n
2 +1+ 4 + 3 + 7
y =
= 3,4
i =1 i
5
n
-2
-1
yi y
-1,4
-2,4
0,6
-0,4
3,6
( xi x )( yi y )
2,8
2,4
-0,4
7,2
( xi x ) 2
1,96
5,76
0,36
0,16
12,96
i =1
( yi y ) 2
i =1
( xi x )( yi y ) = 12,0
i =1
i =1
( xi x ) 2 = 1,0
( yi y ) 2 = 21,20
Logo
r=
12,0
= 0,8242
10 21,20
Regresso
2.1
r
= ma
8
www.pontodosconcursos.com.br | Prof. Alexandre Lima
r
r
em que Fi denota a i-sima fora que age num corpo, m a massa e a a
acelerao. Note que a frmula acima no contm um termo de
perturbao ou erro aleatrio, sendo, portanto, de carter no
probabilstico, isto , determinista. Outros exemplos de relaes fsicas
deterministas so as duas leis de Kirchhoff dos circuitos eltricos (lei das
malhas e lei dos ns), as quatro equaes de Maxwell do eletromagnetismo e a
lei do gs de Boyle.
Regresso versus Causao
A anlise de regresso ocupa-se do estudo da dependncia de uma varivel, a
varivel dependente, em relao a uma ou mais variveis, as variveis
explicativas (ou independentes), com o objetivo de estimar e/ou prever a
mdia (da populao) ou o valor mdio da dependente em termos dos valores
conhecidos ou fixos (em amostragem repetitiva) das explicativas.
Considere o experimento aleatrio hipottico ilustrado pela prxima figura, em
que a varivel explicativa a estatura do pai (em metros) e a varivel
dependente a estatura do filho (em metros). Essa figura mostra trs
distribuies da estatura do filho correspondentes a valores fixos de estatura
do pai (1,70 m, 1,80 m e 1,90 m). Note que a uma dada altura do pai
corresponde uma populao (distribuio) com cinco possveis estaturas para o
filho. A reta de regresso na figura (linha tracejada) sugere que a estatura
mdia do filho tende a aumentar quando aumenta a estatura do pai.
Portanto, a regresso linear permite que o valor mdio da varivel dependente
(estatura do filho) seja estimado por meio dos valores observados das
estaturas dos pais (varivel explicativa).
2.2
2.15
2.1
2.05
2
1.95
1.9
1.85
1.8
1.75
1.6
1.65
1.7
1.75
1.8
1.85
1.9
1.95
E (Y | x) = yfY | X ( y | x)dy,
2500
3000
3500
4000
4500
i = 1, 2, ..., n
11
www.pontodosconcursos.com.br | Prof. Alexandre Lima
E(Y|x) = + x
em que , o intercepto, representa o ponto onde a reta corta o eixo das
ordenadas, e , o coeficiente angular, representa o quanto varia a mdia de Y
para um aumento de uma unidade da varivel X. A funo E(Y|x)
chamada Funo de Regresso Populacional (FRP).
Teremos ento o problema da regresso linear simples. O termo simples
significa que apenas duas variveis esto envolvidas.
2.2
(9)
yi = E (Y | xi ) + i = + X + i ,
i = 1,2,...n
12
www.pontodosconcursos.com.br | Prof. Alexandre Lima
x1
x2
y = a + bx
i2 = 0
a i
i2 = 0 .
b i
2 ( yi a bxi ) = 0 ,
i
(14)
2 xi ( yi a bxi ) = 0
i
(15)
n
n
y
na
b
xi
=
+
i
i =1
i =1
n
n
n
xi yi = a xi + b xi2
i =1
i =1
i =1
14
www.pontodosconcursos.com.br | Prof. Alexandre Lima
S xy
b=
S xx
a = y bx
(16)
1
0,5
2
0,6
3
0,9
4
0,8
5
1,2
6
1,5
7
1,7
8
2,0
xi
yi
x i yi
x 2i
y 2i
1
2
3
4
5
6
7
8
xi = 36
0,5
0,6
0,9
0,8
1,2
1,5
1,7
2,0
yi = 9,2
0,5
1,2
2,7
3,2
6,0
9,0
11,9
16,0
xi yi = 50,5
1
4
9
16
25
36
49
64
x i2 = 204
0,25
0,36
0,81
0,64
1,44
2,25
2,89
4,00
y i2 = 12,64
Vimos que
S xy = i =1 xi yi
n
1
n
( x )( y )
S xx = i=1 xi2
n
i =1
1
n
i =1
( x )
n
i =1 i
S xy
b=
S xx
a = y bx
S xy = 50,5
36 9,2
= 9,1
8
36 2
= 42
8
S xx = 204
Logo,
9,1
b = 42 0,217
9,2
36
a = y bx =
0,217 = 0,174
8
8
y = 0,174 + 0,217 x .
Para o clculo do coeficiente de correlao, necessrio usar os valores da
coluna yi2 da Tabela dada:
1
S yy = i =1 y
n
n
2
i
S yy = 12,64
r=
S xy
S xx S yy
( y )
i =1
9,2 2
2,06
8
9,1
0,98
42 2,06
1.5
0.5
0
0
16
www.pontodosconcursos.com.br | Prof. Alexandre Lima
II.
III.
IV.
2.
3.
4.
(ortogonalidade) (**)
cov( i , j ) = cov(Yi , Y j ) = 0
5.
a varivel x no aleatria.
17
www.pontodosconcursos.com.br | Prof. Alexandre Lima
6.
~ N (0, 2 )
se Y tem distribuio normal e vice-versa.
(*) Diz-se que h heterocedasticidade caso a varincia do erro aleatrio no
seja constante.
(**) A covarincia nula implica que os termos de erro so no correlacionados.
Exemplo (Analista da SUSEP/Aturia/2010/ESAF). A partir de uma
amostra aleatria (X1,Y1), (X2,Y2),..., (X20,Y20) foram obtidas as estaststicas:
mdias X = 12,5 e Y = 19, varincias amostrais s x2 = 30 e s 2y = 54 e
covarincia Sxy = 36.
Qual a reta de regresso estimada de Y em X?
(A) Yi = 19 + 0,667 X i
(B) Yi = 12,5 + 1,2 X i
(C) Yi = 4 + 1,2 X i
(D) Yi = 19 + 1,2 X i
(E) Yi = 80 + 22,8 X i
Resoluo
Primeiramente, lembre que as somas de quadrados so dadas por (*)
1
n
1
S xx = i =1 ( X i X ) = i =1 X
n
S xy = i =1 ( X i X )(Yi Y ) = i =1 X iYi
n
2
i
S yy = i =1 (Yi Y ) 2 = i =1Yi 2
n
1
n
n
i =1
n
i =1
Xi
)( Y )
Xi
i =1 i
( Y )
n
i =1 i
A reta a estimar
Yi = a + bX i ,
em que o parmetro b (estimativa da declividade) dado por
b=
S xy
i =1
S xx
( X i X )(Yi Y )
i=1 ( X i X ) 2
n
i =1
b=
( X i X )(Yi Y )
n
i=1 ( X i X ) 2
n
s xy
s x2
36
= 1,2
30
e
a = 19 1,2 12,5 = 4,0 .
19
www.pontodosconcursos.com.br | Prof. Alexandre Lima
25
Yi = 2.000
= 235.000
i =1
i =1
25
25
X i = 500
2
i
= 20.000
i =1
i =1
25
X Y
i i
= 65.000
i =1
y = a + bx
Pede-se os valores de a e b, respectivamente.
2
1
500 2
= 10000
S xx = xi xi = 20000
n i
25
i
S xy = xi yi
i
1
500 2000
= 25000
xi yi = 65000
n i i
25
Logo,
b=
S xy
S xx
25000
= 2,5
10000
20
www.pontodosconcursos.com.br | Prof. Alexandre Lima
2000
500
(2,5)
= 30
25
25
= 39,0
t =1
(A) e4,58
(B) e4,56
(C) e4,44
(D) e4,32
(E) e4,20
Resoluo
Dados: b = = 0,12 , 1998 + t = 2009 t = 11.
Y = a + bt = a + (0,12 11) = a + 1,32
a = Y bT
Y =
T =
1 10
39,0
Yt =
= 3,9
10 t =1
10
1 + 2 + 3 + ... + 10
= 5,5
10
Logo,
Y = 3,24 + 1,32 = 4,56
GABARITO: B
2.3
Predio
Prevemos que uma casa com rensa mensal de $ 1.000 gaste $ 360 com
alimentao.
Uma observao com relao terminologia: y a varivel resposta e x a
varivel preditora.
Yi = 0 + 1X2i + 2X3i + i
em que 0, 1 e 2 so os parmetros do modelo e denota o termo de erro
aleatrio. Esse um modelo com dois regressores (X2 e X3). Estudaremos o
Modelo de RLM na prxima aula.
So vlidas para o modelo de RLM as observaes relacionadas ao significado
do termo linear no modelo de RLS vistas na seo anterior.
Coeficiente de Determinao
y i = y bx + bxi .
i =1
i =1
i =1
( y i y ) 2 = ( y bx + bxi y ) 2 = b 2 ( xi x ) 2 .
Usando (7) e (8) (frmulas de S xx e S yy , respectivamente) e (16) (frmula do
coeficiente b), temos
n
(18)
( y
y ) = b S xx = bS xy =
2
i =1
S xy2
S xx
( y
i =1
(y
i =1
i =1
i =1
2
y i ) 2 = ( yi y + bx bxi ) 2 = [( yi y ) b( xi x )] =
= ( yi y ) 2 2b( yi y )( xi x ) + b 2 ( xi x ) 2 .
i =1
(19)
(y
y i ) 2 = S yy bS xy .
i =1
(y
Substituindo (18) e
y ) 2 = S yy em (19), obtemos
i =1
(20)
i =1
i =1
i =1
( yi y ) 2 = ( yi y i ) 2 + ( y i y ) 2 .
25
www.pontodosconcursos.com.br | Prof. Alexandre Lima
SQE = ( yi y i ) 2
i =1
residual) e
explicada).
variao total = variao residual +variao explicada
SQE SQR
+
SQT SQT
SQR bS xy
.
=
SQT
S yy
Substituindo b =
(24)
S xy
S xx
em (23) obtemos
S xy2
SQR S xy S xy
=
=
= R2
SQT S xx S yy S xx S yy
ou
(25)
R2 = 1
SQE
.
SQT
( X i X ) 2 = 414
i =1
11
(Yi Y ) 2 = 359
i =1
11
(X
X )Yi = 345
i =1
R2 =
S xy
SQR
=
SQT S xx S yy
Temos que
11
(X
i =1
11
(Y
X ) 2 = 414 = S xx
Y ) 2 = 359 = S yy
i =1
11
11
i =1
i =1
11
11
11
11
11
11
X i Yi
i =1
i =1
i =1
i =1
i =1
i =1
11
=S XY
Logo,
R2 =
345 345
R 2 0,80
414 359
i,
10
10
S 3 = Yi Ci = 1.100
S 2 = Yi = 100
S1 = Ci = 90
i =1
i =1
i =1
10
S 4 = Yi 2 = 1.250
i =1
10
S 5 = Ci2 = 1.010
i =1
28
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Ento,
(A) o coeficiente de explicao (R2) correspondente igual a 64%.
(B) utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados,
tem-se que, em um ano, caso a renda disponvel seja igual a 15 bilhes de
dlares, o consumo ser igual a 13 bilhes de dlares.
(C) obtendo para um determinado ano uma previso para o consumo de 10
bilhes de dlares, significa que a renda disponvel considerada foi de 12,5
bilhes de dlares.
(D) o valor da estimativa encontrado para o parmetro igual a 0,4.
(E) o valor da estimativa encontrado para o parmetro igual a 10.
Resoluo
Ateno: a varivel independente
dependente C (consumo).
(renda
disponvel)
(y
y )(ci c )
i =1
r=
Cov(Y , C )
=
DP (Y ) DP (C )
n 1
1
n 1
(y
i =1
y ) 2 (ci c ) 2
S yc
S yy S cc
i =1
1
90 100
y i ci = 1.100
= 200
i i
n
10
29
www.pontodosconcursos.com.br | Prof. Alexandre Lima
1
100 2
2
1
.
250
y
=
= 250
i i
n
10
1
90 2
2
S cc = i ci2 i ci = 1.010
= 200
n
10
S yc2
2002
2
R =
=
= 0,8 0,64 FALSA
S yy S cc 250 200
S yy = i yi2
S
B) b = = yc = 200 / 250 = 0,8
S yy
90
100
a = = c by =
0,8
= 9 8 =1
10
10
Logo,
C = 1 + 0,8 y C = 1 + 0,8 15 = 1 + 12 = 13 (em bilhes de dlares) VERDADEIRA
30
www.pontodosconcursos.com.br | Prof. Alexandre Lima
b=
x y
x
i
2
i
S xy
S xx
( x x )( y y )
(x x)
i
e = (y
2
i
e = y
2
i
2
i
b 2 xi2
31
www.pontodosconcursos.com.br | Prof. Alexandre Lima
2.7.1
Vimos que SQE = ei2 = yi2 b 2 xi2 quando a regresso passa pela origem.
Como R 2 = 1 SQE / SQT , temos que
y
=1
2
i
b 2 x i2
SQT
y
=1
2
i
b 2 x i2
Syy
y b x
=1
y ( y ) /n
2
i
2
i
2
i
de Y.
Na figura,
33
www.pontodosconcursos.com.br | Prof. Alexandre Lima
r vezes o valor de x
em unidades padro
ou
y = rx
r = 0,7
Y Y = r X X
r Y
Y = X + Y X
Inclinao =
2 = r Y
X
Intercepto =
1 = Y 2 X
34
Intercepto =
1 = Y Inclinao X
y = rx
Faa X = X . Ento
Estimativa de Y = inclinao x X + ( Y inclinao x X ) = Y
Portanto, a linha de regresso passa pelo ponto das mdias ( X , Y ) .
35
www.pontodosconcursos.com.br | Prof. Alexandre Lima
1 n
( xi x )( yi y )
n 1 i=1
S xy
- Coeficiente de correlao: r = xy =
x y
S xx S yy
- Covarincia: s xy = xy =
- Somas de Quadrados:
S xy = i =1 xi yi
n
1
n
( x )( y )
n
i =1
i =1
1
S xx = i=1 x
n
( x )
1
S yy = i =1 y
n
( y )
2
i
2
i
i =1 i
i =1
r Y
S xy
S xx
s xy
s x2
residual) e
n
explicada).
variao total = variao residual +variao explicada
S2
SQR
SQE
=1
= xy
Coeficiente de determinao: R 2 =
SQT
SQT S xx S yy
R2 = r 2
x y
b=
x
i
2
i
, var(b) =
2
i
e
=
2
i
n 1
y
=1
2
i
b 2 xi2
SQT
y
=1
2
i
b 2 xi2
S yy
y b x
=1
y ( y ) / n
2
i
2
i
2
i
R2 r 2
37
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Exerccios de Fixao
11,60
2,40
11,40
2,80
0,53
Com
relao
respeito
ao
40
www.pontodosconcursos.com.br | Prof. Alexandre Lima
6.
Gabarito
1C
2E
3C
4C
5C
6C
7E
8C
9E
10 B
11 A
12 C
13 C
14 E
15 C
41
www.pontodosconcursos.com.br | Prof. Alexandre Lima
7.
42
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Resoluo
A literatura no reconhece a existncia dessa terminologia chamada "ponto de
inflexo" na regresso linear. Item errado. Sem maiores comentrios.
GABARITO: E
(ANAC rea 7/Cespe-UnB/2012/Adaptada) A respeito de modelos de
regresso e coeficientes de correlao, julgue os itens que se seguem.
3. A esperana condicional E(Y|X = k) = 0 + 1k3 +2 cos(k) representa um
modelo de regresso linear mltipla.
Resoluo
Um modelo de regresso que contenha mais de um regressor denominado
modelo de Regresso Linear Mltipla (RLM).
Por exemplo, suponha que a quantidade demandada (varivel dependente Y)
de um produto dependa do preo do produto (regressor X2) e da renda do
comprador (regressor X3). Um modelo de RLM que pode descrever essa relao
GABARITO: C
4. Em um modelo linear simples, se o coeficiente de determinao for 0,81, o
desvio padro da varivel resposta for 1/3 do desvio padro da varivel
explicativa e a inclinao da reta de regresso for negativa, o coeficiente
estimado de inclinao dessa reta ser -0,30.
Resoluo
Dados: R2 = 0,81, sY = sX/3, b = -0,3 (coeficiente estimado de inclinao da
reta de regresso).
Sabemos que R2 = r2. Ento, | r |= R 2 = 0,81 = 0,9 .
r=
s xy
sx s y
s xy
sx sx / 3
3s xy
s x2
3 | s xy |
0,9 =
| s xy |
s
2
x
s x2
3 | s xy |
s x2
=| b |= 0,3
(lembre da frmula b =
s xy
s x2
11,60
44
www.pontodosconcursos.com.br | Prof. Alexandre Lima
2,40
11,40
2,80
0,53
X = 11,60
s x = X = 2,40
Y = 11,40
s y = Y = 2,80
r = 0,53
S
s
b = xy = xy2
S xx sx
45
www.pontodosconcursos.com.br | Prof. Alexandre Lima
s xy
sx s y
= 0,53
s
0,53 2,40 2,80
b = xy2 =
0,62
sx
2,40 2,40
Item correto.
(*) A covarincia amostral entre X e Y s vezes denotada por XY .
GABARITO: C
6. A estimativa de mnimos quadrados do coeficiente a superior a 4.
Resoluo
Estimativa de mnimos quadrados do coeficiente a :
a = Y bX = 11,40 0,62 11,60 4,21 superior a 4
Item correto.
GABARITO: C
7. O valor da estatstica R2 superior a 0,30.
Resoluo
Relao entre R2 (coeficiente de determinao) e r (coeficiente de correlao):
R2 = r 2
Logo,
R 2 = r 2 = 0,532 0,28 inferior a 0,30
Item errado.
GABARITO: E
46
www.pontodosconcursos.com.br | Prof. Alexandre Lima
s xy
sx s y
= 0,53
Item certo.
GABARITO: C
(Papiloscopista
PF/Cespe-UnB/2012/Adaptada)
estatstica, julgue o prximo item.
Com
relao
x2 = 4 y2 y2 =
r=
x2
4
y =
x
2
xy
5
= 0,8
= 0,8 x2 = 12,5 a varincia de X no igual a 2
x y
x x / 2
Item errado.
GABARITO: E
10. (Analista Judicirio TJ-RO/Cespe-UnB/2012) Com
modelo de regresso linear simples, assinale a opo correta.
respeito
ao
47
www.pontodosconcursos.com.br | Prof. Alexandre Lima
E ( y | x )
= tan( )
x
= b =
xy
x2
como
r=
xy
xy = r x y
x y
ento
48
www.pontodosconcursos.com.br | Prof. Alexandre Lima
r x y
= r x 2 y
2
x
x
1
= 1 = y
b
Opo incorreta.
(E) Opo incorreta, pois o parmetro de inclinao da reta igual tangente
do ngulo formado entre a reta e o eixo Ox.
GABARITO: B
11. (Analista Judicirio TJ-RO/Cespe-UnB/2012) Um analista estudou o
pagamento dos valores Y (em R$ mil) das custas processuais em aes
trabalhistas. Com base em uma amostra aleatria simples de processos
judiciais, ele concluiu que a varivel Y se relaciona linearmente com o valor da
causa X (em R$ mil), conforme uma reta ajustada pelo mtodo de mnimos
quadrados ordinrios na forma Y = 0,1 X + 200. A mdia populacional e a
amostral da varivel X foram, respectivamente, iguais a R$ 100 mil e R$ 90
mil.
Nesse caso, correto afirmar que a estimativa de regresso para a mdia
populacional de Y foi igual a
(A) R$ 210 mil.
49
www.pontodosconcursos.com.br | Prof. Alexandre Lima
GABARITO: A
(INMETR0Cincias
Econmicas/Cespe-UnB/2009/Adaptada)
Um
estudo acerca da renda domiciliar e do consumo mensal de energia eltrica de
domiclio mostrou que h uma relao linear entre ambos na forma Y = a + bX +
, em que Y a renda domiciliar, em reais, X o consumo mensal de energia
eltrica, em kWh, do domiclio correspondente, a e b so os coeficientes do
modelo, a serem estimados pelo mtodo dos mnimos quadrados ordinrios, e
representa um erro aleatrio com mdia zero e desvio padro . A partir de
uma amostra de 401 domiclios, observou-se que o desvio padro amostral de
Y foi igual a R$ 500,00, o desvio padro amostral de X foi igual a 100 kWh e
que a correlao linear entre Y e X foi igual a 0,6.
50
www.pontodosconcursos.com.br | Prof. Alexandre Lima
500
= 3,0 > 2,5
b = r Y = 0,6
100
X
GABARITO: C
14. Para a obteno das estimativas de mnimos quadradosdos coeficientes do
modelo, necessrio que o erro aleatrio siga uma distribuio normal.
Resoluo
Para a obteno das estimativas de mnimos quadrados dos coeficientes do
modelo, no necessrio que o erro aleatrio siga uma distribuio
normal.
Relembremos as premissas do modelo de regresso:
RS1. O valor de cada Yi, para cada valor de Xi, i = 1, 2, ..., n, Yi = 1 + 2 X i + i . O
modelo de RLS linear nos parmetros.
RS2. O valor mdio do erro aleatrio
51
www.pontodosconcursos.com.br | Prof. Alexandre Lima
Y = (Y bX ) + r Y
X
Alexandre Lima
alexandre@pontodosconcursos.com.br
53
www.pontodosconcursos.com.br | Prof. Alexandre Lima