Escolar Documentos
Profissional Documentos
Cultura Documentos
Aula 22
18
25
16
14 20
12
15
y
y
10
8 10
6
5
4
2 0
0 0 2 4 6 8 10
0 2 4 6 8 10
30
x
18
x
16
25
14
r = +1
12
10
20
r = -1
Ausência
y
15
y
8
10
6
4
5
2
0
0 2 4 6 8 10
de relação 0
0 2 4
x
6 8 10
x
60
50
r 0,80
40
30
r -0,80
y
20
10
0
0 2 4 6 8 10
x
r0
Voltando ao Exemplo
O departamento de RH de uma empresa deseja avaliar a
eficácia dos testes aplicados para a seleção de
funcionários. Para tanto, foi sorteada uma amostra de 50
funcionários e observou-se, para cada um, a nota média
nos testes de criatividade, raciocínio mecânico, raciocínio
abstrato e habilidade matemática (notas de 0 a 26). Após
3 meses da contratação, foi calculado um escore que
indica o seu desempenho profissional (0 a 120).
rXY 0,76
Objetivo
Dado X = x,
Y = E(Y | X = x) + ,
em que
- é uma v.a.
E(Y|x) como uma função linear de x,
onde para todo x a distribuição de Y é centrada sobre E(Y|x)
y
fY|x(y)
.
E(Y|x) = 1 + 2x
.
x1 x2
Regressão Linear Simples
Em outras palavras, estamos supondo que, para um
dado valor da variável explicativa X, os valores da
variável resposta Y seguem uma certa distribuição de
probabilidades
fY|x(y),
centrada em
1 + 2x.
Regressão Linear Simples
Isso equivale a afirmar que, para cada X, o desvio (ou
erro)
i = yi – (1 + 2xi),
Característica
individual
Característica
populacional (erro)
y4 ˆ {
. ŷ ˆ1 ˆ2 x
4
y3 } ˆ3
.
y2 ˆ {
. Abuso
de
2 notação
y1 .} ˆ1
x1 x2 x3 x4 x
Estimação dos parâmetros do modelo
Idéia!
Quanto menor for o erro quadrático total (i2),
melhor será a estimativa. Isso nos sugere
procurar a estimativa que torne mínima essa
soma de quadrados. Matematicamente, o
problema passa a ser o de encontrar os valores
de 1 e 2 que minimizem a função
n n
S 1 , 2 yi 1 2 xi
2 2
i
i 1 i 1
Método dos Mínimos Quadrados
S ( 1 ; 2 ) 0 e S ( 1 ; 2 ) 0
1 2
Método dos Mínimos Quadrados
yˆ ˆ1 ˆ 2 x,
em que ˆ1 e ˆ2 minimizam S e é aquela que,
dentre todas as possíveis retas, minimiza a
soma dos quadrados das distâncias
verticais dos pontos (xi, yi) à reta, também
chamada de “melhor” reta.
Método dos Mínimos Quadrados
n n
S 1 , 2 yi 1 2 xi
2 2
i
i 1 i 1
Derivando...
n
S 1 , 2 2 yi 1 2 xi
1 i 1
n
S 1 , 2 2 yi 1 2 xi xi
2 i 1
Método dos Mínimos Quadrados
Igualando a zero a derivada em relação ao
parâmetro 1, vem que:
S 1 , 2 0
1
n
2 yi ˆ1 ˆ2 xi 0
i 1
n n n n n
i 1 2 i i 1 2 xi
y
i 1
ˆ ˆ x
i 1
y nˆ ˆ
i 1 i 1 i 1
Método dos Mínimos Quadrados
y ˆ1 ˆ2 x
Assim,
ˆ1 y ˆ2 x
Método dos Mínimos Quadrados
Igualando a zero a derivada em relação ao
parâmetro 2, vem que:
S 1 , 2 0
2
n
2 yi ˆ1 ˆ2 xi xi 0
i 1
n n n
xi yi 1 xi 2 xi 0
i 1
ˆ ˆ
i 1
2
i 1
Método dos Mínimos Quadrados
Substituindo, na igualdade anterior, o
resultado encontrado para o estimador do
parâmetro 1, obtemos, para 2, o seguinte
estimador:
ˆ2 (x x)(y y) n x y x y
i i i i i i SXY
2 rXY
SY
(x x) n x x
2 2
i
2
i i
SX SX
Método dos Mínimos Quadrados
Exercício
desempenho 1 2 nota
Voltando ao Exemplo
Resolução
100
80
60
40
20
00
0,00 5,00 10,00 15,00 20,00 25,00 30,00
Nota média
Interpretação das Estimativas dos Parâmetros
Parâmetros
1 – é o intercepto;
E(Y|x)
β2
x
Interpretação das Estimativas dos Parâmetros
Observação
Perguntas
Objetivo
Coeficiente de determinação
(ou de explicação) – R2
Medida de qualidade do ajuste do modelo
y - y : erro ao se prever
y pela média geral
ˆ1 ˆ2 x
y y - ŷ : erro ao se prever
y pelo valor estimado
ŷ para E(Y|X)
y
ŷ - y : “ganho” ao se
prever y pelo valor
estimado para E(Y|X)
em comparação ao se
prever y pela média
geral
Medida de qualidade do ajuste do modelo
n 2
ˆ1 ˆ2 x
SQT y
i 1
i - y
y
2
SQR yi - y
ˆi
n
ŷ
i 1
y
2
SQE y
ˆ i - y
n
i 1
100
SQE
80 R 2
0,5808
60 SQT
40
20
00
0,00 5,00 10,00 15,00 20,00 25,00 30,00
Nota média
2 2
y ˆ i 1925,3
n n
SQT y i - y 4.593,1 SQR i -y
i 1 i 1
n 2
R2 = 0,58
Conclusão
Parece que a nota média obtida nos testes de
admissão é relevante para a explicação do
desempenho dos funcionários, uma vez que tal
regressor explica mais da metade das
variações da variável resposta.
Coeficiente de determinação: R2
Exercício
SQE S 2
S XY
R
2
XY
̂ 2
SQT S xx SYY SYY