Você está na página 1de 53

Conhecimentos Especficos Mtodos Quantitativos Anatel

Aula 08 Regresso Simples


Prof. Alexandre Lima

Aula 08

Sumrio
1

Medidas sobre Dados Bivariados ..................................................................................... 2


1.1

Covarincia e Correlao ............................................................................................ 2

Regresso ................................................................................................................................. 8
2.1

A Natureza da Anlise de Regresso ..................................................................... 8

2.2

Regresso Linear Simples: Especificao e Estimao ................................ 12

2.3

Predio ........................................................................................................................... 22

2.4

O Significado do Termo Linear no Modelo de RLS ......................................... 23

2.5

A Noo de Modelo de Regresso Linear Mltipla .......................................... 23

2.6

Coeficiente de Determinao .................................................................................. 24

2.7

Regresso sem o Intercepto ................................................................................... 30

2.7.1

Coeficiente de Determinao da Regresso sem o Intercepto ...................................... 32

Uma Outra Maneira de Estimar a Reta de Regresso........................................... 32

O Mnimo que Voc Precisa Saber ................................................................................ 36

Exerccios de Fixao ......................................................................................................... 38

6. Gabarito .................................................................................................................................. 41
7. Resoluo dos Exerccios de Fixao ........................................................................... 42

1
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Caro aluno,
Tudo bem com voc? Na aula de hoje, volto a abordar o assunto da regresso
linear, que foi introduzido na aula 4, dada a importncia desse tpico para a
prova. A prxima aula aprofundar o mesmo assunto. Sei que a aula 4 foi
indigesta, e por isso que retomamos o estudo da regresso, que ficou um
tanto quanto perdida entre os diversos tpicos que foram ensinados na aula
4. Vamos aula de hoje?

Medidas sobre Dados Bivariados

Imagine o caso de um pesquisador que coleta dados para determinar a


natureza de uma relao entre duas grandezas. Por exemplo, um qumico pode
executar uma reao vrias vezes a fim de estudar a relao entre a
concentrao de um certo catalisador e a velocidade da reao Cada vez que a
reao executada, a concentrao X e a velocidade Y so registrados.
Portanto, o experimento gera um conjunto de pares (x1,y1), (x2,y2), ..., (xn,yn), em
que n o nmero de vezes que a reao foi ensaiada. Os dados que consistem
em pares ordenados so denominados dados bivariados. Em muitos casos,
os pares ordenados gerados em um experimento tendem a se concentrar em
torno de uma linha reta quando plotados em um grfico. Em tais situaes, a
principal questo determinar a proximidade da relao das duas grandezas
entre si. As medidas estatsticas mais usadas para mensurar a proximidade da
associao entre duas variveis so a covarincia e o coeficiente de
correlao.
1.1

Covarincia e Correlao

Seja uma amostra de dez pessoas adultas, do sexo masculino, e sejam a


altura (cm) e o peso (kg) dessas pessoas denotadas por X e Y,
respectivamente. Para cada elemento da amostra, temos um par ordenado
(x,y). Teremos ento n = 10 pares de valores das duas grandezas, que podero
ser representadas em um diagrama cartesiano bidimensional denominado
diagrama de disperso.
Tabela
Pessoa

X- Altura (cm)

Y - Peso (kg)

1
2
3
4
5
6
7
8

174
161
171
181
182
165
155
168

74
68
63
92
80
73
61
64
2

www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

9
10

176
175

90
81

Suponha que tenham sido obtidos os valores apresentados na tabela acima. O


diagrama de disperso correspondente o da prxima figura. A vantagem do
diagrama de disperso est em que, muitas vezes, sua simples observao j
nos d uma boa idia da associao existente entre as duas variveis, ou seja,
sobre a tendncia de variao conjunta que apresentam.

95
90
85
80
75
70
65
60
55
150

155

160

165

170

175

180

185

Observando o diagrama de disperso acima com ateno, constatamos que


existe, para maiores valores de X (altura), uma tendncia a obtermos maiores
valores de Y (peso) e vice-versa. Quando isso ocorre, diz-se que h
correlao linear positiva entre X e Y.
Entretanto, tambm podemos ter casos em que o diagrama de disperso
apresenta o aspecto da figura que se segue, indicando que, para maiores
valores de X, a tendncia observarem-se menores valores de Y e vice-versa.
Diz-se que nesse caso a correlao negativa. Por exemplo, a renda per
capita de pases e o ndice de analfabetismo so variveis negativamente
correlacionadas.

3
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

claro que tambm pode ocorrer o caso em que as variveis so no


correlacionadas. Neste caso, o aspecto do diagrama de disperso o da
prxima figura.
4

-1

-2

-3
-4

-3

-2

-1

Vimos que o sinal da correlao indica a tendncia da variao conjunta entre


as grandezas. Alm disso, devemos considerar tambm a intensidade ou o
grau da correlao. A correlao linear (em valor absoluto) entre X e Y na
figura em que a correlao negativa mais intensa do que a da figura em
que a correlao positiva, pois os pontos da primeira apresentam uma
tendncia mais acentuada de se colocarem segundo uma reta do que os da
ltima.
A covarincia uma medida da intensidade e do sinal da correlao
linear entre duas variveis. Suponha que tenhamos uma coleo de n pares
ordenados (x,y). Ento a covarincia dada pela estatstica (*)

4
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

(1)

s xy =

1 n
( xi x )( yi y )
n 1 i=1

em que x a mdia amostral de X, y a mdia amostral de Y, e ( xi x ) e


( yi y ) correspondem aos desvios dos xs e ys, respectivamente. Note que a
covarincia amostral entre X e Y tambm comumente denotada por xy .
(*) Na definio (1), estamos considerando implicitamente que os dados se
referem a uma amostra. Caso esses dados representassem toda uma
populao, a diviso deveria ser feita por n e no por n1.
Observe que a covarincia depende das unidades de medida das variveis X e
Y. Percebe-se mais claramente o significado da covariao dividindo-se a
covarincia entre X e Y por seus respectivos desvios padro amostrais sx e sy
(*). A razo resultante conhecida como coeficiente de correlao (**)
entre X e Y, dado por

(2)

r=

s xy
sx s y

(*) Tambm comum usar a notao x e y para os desvios padro


amostrais de X e Y, respectivamente.
(**) Ou coeficiente de correlao linear de Pearson.
em que
(3)

s x2 =

1
1
n
n
n 2
( xi x ) 2 =
x2
x

i =1 i
i =1
n 1
n 1
n 1

(4)

s y2 =

1
1
n
n
n 2
( yi y ) 2 =
y2
y

i =1 i
i =1
n 1
n 1
n 1

Podemos reescrever (2) na forma de soma de quadrados,

(5)

r=

i =1

i =1

( xi x )( yi y )

( xi x ) 2

i =1

( yi y ) 2

S xy
S xx S yy
5

www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

em que S xy = i=1 ( xi x )( yi y ) , S xx = i=1 ( xi x ) 2 e S yy = i =1 ( yi y ) 2 .


n

A representao abreviada dos somatrios de (5) por meio de S xy ,


S xx e S yy bastante til para resolver alguns exerccios. Pode-se mostrar que

( x )( y ).

(6)

S xy = i =1 xi yi

1
n

(7)

1
S xx = i=1 x
n

( x )

(8)

1
S yy = i =1 y
n

( y )

2
i

2
i

i =1

i =1

i =1 i

i =1

O COEFICIENTE DE CORRELAO ADIMENSIONAL


O coeficiente de correlao tem as importantes propriedades de ser
adimensional e de variar entre -1 e 1, o que no ocorre com a covarincia.
A vantagem de ser adimensional est no fato de seu valor no ser afetado
pelas unidades adotadas. Por outro lado, o fato de termos 1 r 1 faz com
que um dado valor de r seja facilmente interpretado. Note que r = -1
corresponde ao caso de correlao linear negativa perfeita e r = 1 corresponde
ao caso de correlao linear positiva perfeita.
O coeficiente de correlao para os dados da tabela de alturas e pesos de
aproximadamente 0,771 (voc pode conferir este resultado com uma
calculadora ou com algum programa de computador). O valor aproximado do
coeficiente de correlao para os dados da figura em que a correlao
negativa -0,985. O coeficiente de correlao para os dados da figura em que
aparentemente no h correlao entre X e Y igual a 0,016. Este ltimo
resultado indica que no h qualquer associao linear entre as variveis X e Y
(neste caso a covarincia tambm dar prxima de zero). Quanto maior o
valor absoluto (ou mdulo) |r|, melhor a associao linear entre os valores.

CORRELAO NO CAUSALIDADE
Para as crianas, o tamanho do vocabulrio est correlacionado intensamente
com o tamanho do p. Entretanto, a aprendizagem de novas palavras no faz
6
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

com que o p cresa, nem o crescimento do p faz com que o vocabulrio


aumente. H um terceiro fator, a idade, que est correlacionada com o
tamanho do sapato e com o vocabulrio. As crianas mais velhas tendem a ter
um sapato maior e um vocabulrio maior, e isso resulta em uma correlao
positiva entre vocabulrio e tamanho do sapato. Deste modo, um alto valor do
coeficiente de correlao, embora estatisticamente significativo, pode no
implicar qualquer relao de causa e efeito, mas simplesmente a tendncia de
variao conjunta das grandezas em questo.

A CORRELAO MEDE APENAS A RELAO LINEAR


O coeficiente de correlao mede apenas a relao linear entre X e Y. Quando
a correlao nula, ou seja, se r = 0, no h associao linear entre X e Y.
Mas pode existir uma relao no linear. Por exemplo, sejam X e Y
relacionados pela equao
X 2 + Y 2 =1,

que descreve uma circunferncia centrada em (0,0) e de raio 1. O coeficiente


de correlao nulo neste caso. Contudo, existe uma relao no linear
entre X e Y, pois os pares ordenados (x,y) esto localizados sobre o crculo de
raio unitrio centrado em (0,0).
Exemplo. Julgue o item a seguir.
O coeficiente de correlao para o conjunto de dados.
x

inferior a 0,8.
Resoluo
Aprendemos que o coeficiente de correlao dado por

r=

i =1

i =1

Mdia de X: x =

( xi x )( yi y )

( xi x ) 2

i =1

( yi y ) 2

S xy
S xx S yy

1 n
1+ 2 + 3 + 4 + 5
x =
= 3,0

i =1 i
n
5
7
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Mdia de Y: y =

1 n
2 +1+ 4 + 3 + 7
y =
= 3,4

i =1 i
5
n

Tabela para clculo do coeficiente de correlao:


xi x

-2

-1

yi y

-1,4

-2,4

0,6

-0,4

3,6

( xi x )( yi y )

2,8

2,4

-0,4

7,2

( xi x ) 2

1,96

5,76

0,36

0,16

12,96

i =1

( yi y ) 2

i =1

( xi x )( yi y ) = 12,0

i =1

i =1

( xi x ) 2 = 1,0

( yi y ) 2 = 21,20

Logo

r=

12,0
= 0,8242
10 21,20

Item errado, pois r > 0,8 .


GABARITO: E

Regresso

2.1

A Natureza da Anlise de Regresso

Na anlise de regresso simples, estamos interessados na dependncia


estatstica entre as variveis X e Y. No podemos confundir a dependncia
estatstica com o conceito de dependncia determinista ou funcional. Por
exemplo, a Segunda Lei de Newton da Fsica clssica (lei determinista) afirma
que
A resultante das foras que agem num corpo igual ao produto de sua massa
pela acelerao adquirida.
Ou seja, Newton postulou que h uma dependncia determinista entre fora e
acelerao, dada pela frmula
r

r
= ma

8
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

r
r
em que Fi denota a i-sima fora que age num corpo, m a massa e a a
acelerao. Note que a frmula acima no contm um termo de
perturbao ou erro aleatrio, sendo, portanto, de carter no
probabilstico, isto , determinista. Outros exemplos de relaes fsicas
deterministas so as duas leis de Kirchhoff dos circuitos eltricos (lei das
malhas e lei dos ns), as quatro equaes de Maxwell do eletromagnetismo e a
lei do gs de Boyle.
Regresso versus Causao
A anlise de regresso ocupa-se do estudo da dependncia de uma varivel, a
varivel dependente, em relao a uma ou mais variveis, as variveis
explicativas (ou independentes), com o objetivo de estimar e/ou prever a
mdia (da populao) ou o valor mdio da dependente em termos dos valores
conhecidos ou fixos (em amostragem repetitiva) das explicativas.
Considere o experimento aleatrio hipottico ilustrado pela prxima figura, em
que a varivel explicativa a estatura do pai (em metros) e a varivel
dependente a estatura do filho (em metros). Essa figura mostra trs
distribuies da estatura do filho correspondentes a valores fixos de estatura
do pai (1,70 m, 1,80 m e 1,90 m). Note que a uma dada altura do pai
corresponde uma populao (distribuio) com cinco possveis estaturas para o
filho. A reta de regresso na figura (linha tracejada) sugere que a estatura
mdia do filho tende a aumentar quando aumenta a estatura do pai.
Portanto, a regresso linear permite que o valor mdio da varivel dependente
(estatura do filho) seja estimado por meio dos valores observados das
estaturas dos pais (varivel explicativa).
2.2
2.15
2.1
2.05
2
1.95
1.9
1.85
1.8
1.75
1.6

1.65

1.7

1.75

1.8

1.85

1.9

1.95

A regresso no implica necessariamente causalidade ou causao.


Uma relao estatstica, por mais forte que seja, no pode estabelecer uma
relao de causa e efeito; a causao deve vir de fora da estatstica, de outra
teoria.
9
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Por exemplo, considere um agrnomo que esteja interessado em estudar a


dependncia da colheita de soja em relao chuva. Consideramos que a
colheita de soja dependente da precipitao de chuva por uma questo de
bom senso (e esta considerao no estatstica!). Mas a estatstica no teria
nada contra o fato do agrnomo estabelecer que a relao de dependncia
inversa, ou seja, que a precipitao de chuva depende do rendimento da
colheita de soja, apesar disso ser um evidente absurdo.
Uma relao estatstica, por si s, no pode logicamente implicar causalidade.
Para atribuir causalidade, deve-se recorrer a consideraes tericas. Deste
modo, podemos afirmar que o consumo depende da renda real com base na
teoria econmica.
Ideias Fundamentais
Aprendemos que a anlise de correlao tem como objetivo medir a
intensidade ou grau de associao linear entre duas variveis aleatrias. Por
exemplo, podemos estar interessados em determinar a correlao existente
entre o hbito de fumar e a incidncia de cncer no pulmo, entre as notas das
provas de fsica e matemtica do exame vestibular, etc. Por outro lado, na
anlise de regresso estamos interessados em estimar o valor mdio
de uma varivel aleatria (suponha Y) com base nos valores fixos de
outra varivel (admita que X seja a varivel explanatria), ou seja, o
objetivo da anlise de regresso estimar a esperana condicional de Y, dado
que X = x

E (Y | x) = yfY | X ( y | x)dy,

em que fY | X ( y | x ) denota a distribuio condicional de Y dado X, E (Y | x ) uma


funo de x, isto , E (Y | x ) = s ( x) , e denominada curva de regresso de Y
sobre x. Na realidade, E (Y | x ) o valor da varivel aleatria E (Y | X ) .
H na anlise de regresso uma assimetria na maneira como as variveis
dependente e explanatria so tratadas. Supe-se que a varivel
dependente seja estocstica (ou aleatria) e que as variveis
explicativas tenham valores fixados, isto , sejam no estocsticas.
O problema da regresso consiste em determinar a relao funcional entre as
variveis dependente e explicativa. Assim, se os pares ordenados (x,y) se
apresentarem como na figura a seguir, admitiremos existir um relacionamento
funcional entre os valores de y e x, responsvel pelo aspecto do diagrama e
que explica grande parte da variao de y com x. Esse relacionamento
10
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

funcional corresponderia linha existente na figura, que seria a linha de


regresso, que pode no ser uma reta, como no caso indicado pela figura.
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
2000

2500

3000

3500

4000

4500

Uma parcela da variao, contudo, permanece em geral sem ser explicada, e


ser atribuda ao acaso. Observe, na figura acima, que os valores de y flutuam
aleatoriamente em torna da linha de regresso estimada (essa linha deve ser
calculada por meio de algum mtodo estatstico). Essa flutuao ou variao
em torno da linha de regresso devida existncia de uma variao aleatria
adicional, que chamaremos de variao residual. A funo de regresso,
portanto, nos d o valor mdio de uma das variveis em funo do valor
observado da outra, isto , E(Y|x).
Portanto, uma estratgia conveniente de anlise supor que cada observao
seja formada por duas partes:
observao = previsvel + aleatrio
ou
yi = E[Yi|xi] + i,

i = 1, 2, ..., n

em que E[Yi|xi] representa a parte previsvel e i denota a parte aleatria.


O problema da regresso simplificado quando sabemos de antemo qual a
relao funcional ou modelo entre as variveis. Um problema bastante
estudado em Estatstica a questo da seleo ou identificao do modelo (
uma reta? um polinmio de grau 2?). Mas este estudo est fora do escopo
deste curso. No estudo que se segue, admitiremos que a forma da linha
de regresso seja uma reta, em que a curva de regresso da forma

11
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

E(Y|x) = + x
em que , o intercepto, representa o ponto onde a reta corta o eixo das
ordenadas, e , o coeficiente angular, representa o quanto varia a mdia de Y
para um aumento de uma unidade da varivel X. A funo E(Y|x)
chamada Funo de Regresso Populacional (FRP).
Teremos ento o problema da regresso linear simples. O termo simples
significa que apenas duas variveis esto envolvidas.
2.2

Regresso Linear Simples: Especificao e Estimao

Seja Y a varivel dependente e X a varivel suposta sem erro, ou seja, no


aleatria. A regresso linear simples pressupe que seja adotado o modelo

(9)

yi = E (Y | xi ) + i = + X + i ,

i = 1,2,...n

em que o intercepto, a declividade e i denota a componente


aleatria da variao de Y.
razovel supor que a varivel aleatria ( i ) tenha mdia nula, a fim de que
toda a variao explicada de Y fique em torno da reta de regresso. Isso
implica que a reta de regresso fornece a mdia de Y para cada valor de x
considerado, como j mencionamos.
Uma outra suposio bsica que pode ser adotada a de que a variao
residual da varivel Y seja independente de x. Ou seja, usualmente
admite-se que a variao de Y em torno da linha terica de regresso pode ser
descrita por um desvio padro residual que independe do ponto em
considerao.
Por fim, admitiremos que a variao de Y em torno da linha terica de
regresso se d segundo distribuies normais independentes, para
qualquer valor de x; o que implica dizer que as variaes residuais em
relao reta de regresso so independentes e normalmente distribudas
(vide figura a seguir).

12
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

x1

x2

Nota: o professor est ciente do fato de que os resduos do modelo ajustado


nem sempre seguem uma distribuio normal. Contudo, o importante ter em
mente que as variaes residuais em relao reta de regresso so
independentes e normalmente distribudas por hiptese. Isto no implica dizer
que os resduos, de fato, sejam normalmente distribudos. Acredite: h muitos
dados empricos que violam a hiptese de normalidade!
Suponhamos que a reta estimativa de (9) seja
(10)

y = a + bx

em que y denota os valores dados pela reta estimativa, a a estimativa do


parmetro , e b , tambm denominado coeficiente de regresso linear, a
estimativa do parmetro . A reta estimativa tambm denominada
Funo de Regresso Amostral (FRA).
Existem diversos mtodos de estimao da reta de regresso. Podemos at
mesmo estimar a reta visualmente. O mtodo de ajuste visual consiste em
traar diretamente a reta, com auxlio de uma rgua, no diagrama de
disperso, procurando fazer, da melhor forma possvel, com que essa reta
passe por entre os pontos. Esse procedimento, por ser subjetivo, somente ser
razovel se a correlao linear for muito forte, caso contrrio levar a
resultados pobres.
Por outro lado, o ajuste pode ser feito pelo mtodo dos mnimos
quadrados, segundo o qual a reta a ser adotada dever ser aquela que torna
mnima a soma dos quadrados das distncias da reta aos pontos experimentais
(em que a distncia igual ao erro aleatrio no ponto em considerao como
ilustrado pela prxima figura). Ou seja, devemos procurar a reta para a qual
n
se consiga minimizar a soma dos quadrados dos resduos i = 1 e i2 (note
que a figura usa a notao i = ei para o resduo). A idia central desse
13
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

procedimento simplesmente a de minimizar a variao residual em torno da


reta estimativa.

Tendo em vista a expresso (10), devemos, portanto, impor a condio


(11)

min i2 = min ( yi y i ) 2 = min ( yi a bxi ) 2 .


i

Demonstra-se que os parmetros a e b que minimizam (11) sero aqueles que


anulam as derivadas parciais de (11)
(12)

i2 = 0
a i

i2 = 0 .
b i

No difcil chegar s expresses


(13)

2 ( yi a bxi ) = 0 ,
i

(14)

2 xi ( yi a bxi ) = 0
i

as quais fornecem o seguinte sistema de duas equaes a duas incgnitas:

(15)

n
n

y
na
b
xi
=
+

i
i =1
i =1
n
n
n
xi yi = a xi + b xi2
i =1
i =1
i =1

14
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Os pontos (x,y) fornecem os elementos para a montagem de (15), cuja


soluo forneceria os coeficientes a e b. Entretanto, mais fcil considerar de
uma vez a soluo analtica do sistema, segundo a qual

S xy

b=

S xx
a = y bx

(16)

Exemplo. Determine a equao da reta para os pontos


x
Y

1
0,5

2
0,6

3
0,9

4
0,8

5
1,2

6
1,5

7
1,7

8
2,0

utilizando o mtodo dos mnimos quadrados. Trace a reta no diagrama de


disperso e calcule o coeficiente de correlao linear. A Tabela abaixo contm
os valores necessrios para a determinao dos parmetros da reta.

xi

yi

x i yi

x 2i

y 2i

1
2
3
4
5
6
7
8
xi = 36

0,5
0,6
0,9
0,8
1,2
1,5
1,7
2,0
yi = 9,2

0,5
1,2
2,7
3,2
6,0
9,0
11,9
16,0
xi yi = 50,5

1
4
9
16
25
36
49
64
x i2 = 204

0,25
0,36
0,81
0,64
1,44
2,25
2,89
4,00
y i2 = 12,64

Vimos que
S xy = i =1 xi yi
n

1
n

( x )( y )

S xx = i=1 xi2
n

i =1

1
n

i =1

( x )
n

i =1 i

S xy

b=

S xx
a = y bx

Fazendo os clculos, temos que


15
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

S xy = 50,5

36 9,2
= 9,1
8
36 2
= 42
8

S xx = 204

Logo,

9,1

b = 42 0,217

9,2
36
a = y bx =
0,217 = 0,174
8
8

A equao da reta de mnimos quadrados, ilustrada na figura a seguir,

y = 0,174 + 0,217 x .
Para o clculo do coeficiente de correlao, necessrio usar os valores da
coluna yi2 da Tabela dada:
1
S yy = i =1 y
n
n

2
i

S yy = 12,64

r=

S xy
S xx S yy

( y )

i =1

9,2 2
2,06
8

9,1
0,98
42 2,06

1.5

0.5

0
0

16
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

O alto valor do coeficiente de correlao linear de Pearson justifica o traado


da reta de regresso.
Pressupostos do Modelo de Regresso Linear Simples
Comentamos anteriormente alguns dos pressupostos (ou hipteses bsicas) do
modelo de regresso:
I.

o erro aleatrio tem mdia nula;

II.

a reta de regresso fornece a mdia de Y para cada valor de x


considerado;

III.

a variao residual de Y constante com x e

IV.

a variao de Y em torno da linha terica de regresso se d segundo


distribuies normais independentes, para qualquer valor de x, o que
implica dizer que as variaes residuais em relao reta de regresso
so independentes e normalmente distribudas.

usual formular as hipteses do modelo de regresso em termos do erro


aleatrio :
1.

o valor de y para cada valor de x dado por


Y = + X +

2.

o valor mdio do erro aleatrio


E ( | x) = 0

pois admitimos que


E (Y | x ) = + x

3.

a varincia do erro aleatrio constante (homocedasticidade) (*)


var( ) = 2 = var(Y )

4.

a covarincia entre qualquer par de erros aleatrios i e j , i j , nula

(ortogonalidade) (**)
cov( i , j ) = cov(Yi , Y j ) = 0

5.

a varivel x no aleatria.
17
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

6.

A varivel tm distribuio normal

~ N (0, 2 )
se Y tem distribuio normal e vice-versa.
(*) Diz-se que h heterocedasticidade caso a varincia do erro aleatrio no
seja constante.
(**) A covarincia nula implica que os termos de erro so no correlacionados.
Exemplo (Analista da SUSEP/Aturia/2010/ESAF). A partir de uma
amostra aleatria (X1,Y1), (X2,Y2),..., (X20,Y20) foram obtidas as estaststicas:
mdias X = 12,5 e Y = 19, varincias amostrais s x2 = 30 e s 2y = 54 e
covarincia Sxy = 36.
Qual a reta de regresso estimada de Y em X?
(A) Yi = 19 + 0,667 X i
(B) Yi = 12,5 + 1,2 X i
(C) Yi = 4 + 1,2 X i
(D) Yi = 19 + 1,2 X i
(E) Yi = 80 + 22,8 X i
Resoluo
Primeiramente, lembre que as somas de quadrados so dadas por (*)
1
n

1
S xx = i =1 ( X i X ) = i =1 X
n

S xy = i =1 ( X i X )(Yi Y ) = i =1 X iYi
n

2
i

S yy = i =1 (Yi Y ) 2 = i =1Yi 2
n

1
n

n
i =1

n
i =1

Xi

)( Y )

Xi

i =1 i

( Y )
n

i =1 i

(*) As frmulas das somas de quadrados foram reescritas com letras


maisculas (a saber X i , X , Yi , Y ) com o intuito de harmonizar a notao adotada
no curso com a notao usada pela banca no problema.
18
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

A reta a estimar

Yi = a + bX i ,
em que o parmetro b (estimativa da declividade) dado por

b=

S xy

i =1

S xx

( X i X )(Yi Y )

i=1 ( X i X ) 2
n

e o parmetro a (estimativa do intercepto) por


a = Y bX .

Observe que estamos usando uma notao diferente do enunciado: a


quantidade Sxy definida acima no a covarincia entre X e Y.
Podemos calcular b adaptando a frmula dada acima:

i =1

b=

( X i X )(Yi Y )

n
i=1 ( X i X ) 2
n

s xy
s x2

Ou seja, b pode ser calculado, de forma alternativa, pela razo entre a


covarincia amostral sxy (estamos usando uma notao diferente da do
enunciado, mas que est coerente com a vista no texto!) e a varincia
amostral s x2 . Logo,
b=

36
= 1,2
30

e
a = 19 1,2 12,5 = 4,0 .

Deste modo, a reta de regresso estimada de Y em X Yi = 4 + 1,2 X i .


GABARITO: C

19
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Exemplo (DECEA/Cesgranrio/2009). Um pesquisador estudou a relao


entre o tempo, medido em segundos, que um inspetor leva para reagir a um
estmulo visual (Y) e a idade (X), medida em anos completos. Os dados de 25
inspetores foram coletados e obtidas as seguintes informaes:
25

25

Yi = 2.000

= 235.000

i =1

i =1

25

25

X i = 500

2
i

= 20.000

i =1

i =1

25

X Y

i i

= 65.000

i =1

As estimativas dos mnimos quadrados, para o coeficiente linear e a inclinao


da reta, respectivamente, so:
(A) 80 e 3,25
(B) 50 e 2,85
(C) 30 e 2,50
(D) 20 e 4,0
(E) 10 e 3,62
Resoluo
O modelo de regresso linear simples

y = a + bx
Pede-se os valores de a e b, respectivamente.
2

1
500 2
= 10000
S xx = xi xi = 20000
n i
25
i

S xy = xi yi
i

1
500 2000
= 25000
xi yi = 65000
n i i
25

Logo,
b=

S xy
S xx

25000
= 2,5
10000

20
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

em que b a inclinao da reta ajustada. Como a nica opo em que a


inclinao 2,50 o item (C), na prova j marcaramos essa opo sem
continuar os clculos.
No obstante, calcularemos o coeficiente linear (ou intercepto).
a = y bx =

2000
500
(2,5)
= 30
25
25

Assim, encontramos a reta ajustada y = 30 + 2,5 x .


GABARITO: C
Exemplo (ICMS-SP/FCC/2009). O grfico abaixo demonstra a evoluo da
receita tributria anual no estado de So Paulo desde 1999, com os valores
arrecadados em bilhes de reais.

Para estimar a receita tributria em um determinado ano com base no


comportamento sugerido pelo grfico, adotou-se o modelo Yt = + t + t; t =
1, 2, 3, ..., sendo Yt = ln(RTt), em que RTt a receita tributria no ano
(1998+t) em bilhes de reais e ln o logaritmo neperiano (ln e = 1). , so
parmetros desconhecidos e t o erro aleatrio com as respectivas hipteses
consideradas para o modelo de regresso linear simples. Utilizando o mtodo
dos mnimos quadrados, com base nas observaes de 1999 a 2008, obteve-se
para a estimativa de o valor de 0,12, sabendo-se que:
10

= 39,0

t =1

A previso da receita tributria para 2009, em bilhes de reais, em funo da


equao obtida pelo mtodo dos mnimos quadrados igual a
21
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

(A) e4,58
(B) e4,56
(C) e4,44
(D) e4,32
(E) e4,20
Resoluo
Dados: b = = 0,12 , 1998 + t = 2009 t = 11.
Y = a + bt = a + (0,12 11) = a + 1,32
a = Y bT

Y =

T =

1 10
39,0
Yt =
= 3,9

10 t =1
10

1 + 2 + 3 + ... + 10
= 5,5
10

a = 3,9 0,12 5,5 = 3,24

Logo,
Y = 3,24 + 1,32 = 4,56

Yt = ln RT RTestimada = eYt = e 4,56

GABARITO: B
2.3

Predio

Suponha que a relao entre as variveis econmicas renda mensal familiar


(x) e a despesa mensal com alimentao (y) em uma cidade brasileira, ambas
em reais, seja dada pelo equao estimada
y i = 40 + 0,32 xi

Podemos usar a equao acima para fins de predio ou previso. Por


exemplo, qual seria a despesa mensal com alimentao de uma famlia com
renda mensal de R$ 1.000?
22
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Essa previso feita usando-se x = 1.000 na equao acima:


y i = 40 + 0,32 1.000 = 40 + 320 = $360

Prevemos que uma casa com rensa mensal de $ 1.000 gaste $ 360 com
alimentao.
Uma observao com relao terminologia: y a varivel resposta e x a
varivel preditora.

O objetivo da anlise de regresso simples prever o valor mdio de


uma varivel com base nos valores fixados de outra varivel.
2.4

O Significado do Termo Linear no Modelo de RLS

O modelo de RLS mais flexvel do que possa parecer em uma anlise


preliminar, porque as variveis X e Y podem estar relacionadas a
transformaes envolvendo logaritmos, quadrados, cubos ou inversos das
variveis bsicas. Assim, o modelo de RLS pode ser aplicado a relaes
no lineares entre variveis. Por exemplo, admita que a equao de
demanda que relaciona a quantidade vendida (qt) com o preo (pt) seja
ln(qt) = + .ln(pt) + t ,
em que ln(.) denota o logaritmo neperiano. Essa equao pode ser escrita na
forma mais familiar yt = + xt + t , em que yt = ln(qt ) e xt = ln( pt ) . O modelo
acima linear nos parmetros, mas no linear em relao s
variveis bsicas qt e pt, porque os parmetros e no sofrem qualquer
tipo de transformao. O modelo yt = + xt + t linear nas variveis x e y.

O termo linear no modelo de RLS no significa que


necessariamente exista uma relao linear entre as variveis, mas um modelo
em que pelo menos os parmetros esto presentes em forma linear. Ou seja, o
modelo pode ser linear nos parmetros, mas no necessariamente linear
nas variveis.
2.5

A Noo de Modelo de Regresso Linear Mltipla

Um modelo de regresso que contenha mais de um regressor denominado


modelo de Regresso Linear Mltipla (RLM).
23
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Por exemplo, suponha que a quantidade demandada (varivel dependente Y)


de um produto dependa do preo do produto (regressor X2) e da renda do
comprador (regressor X3). Um modelo de RLM que pode descrever essa relao

Yi = 0 + 1X2i + 2X3i + i
em que 0, 1 e 2 so os parmetros do modelo e denota o termo de erro
aleatrio. Esse um modelo com dois regressores (X2 e X3). Estudaremos o
Modelo de RLM na prxima aula.
So vlidas para o modelo de RLM as observaes relacionadas ao significado
do termo linear no modelo de RLS vistas na seo anterior.

O termo linear no modelo de RLM no significa que


necessariamente exista uma relao linear entre as variveis, mas um modelo
em que pelo menos os parmetros esto presentes em forma linear. Ou seja, o
modelo pode ser linear nos parmetros, mas no necessariamente linear
nas variveis.
2.6

Coeficiente de Determinao

De (10) e (16) resulta que


(17)

y i = y bx + bxi .

Se considerarmos a mdia y de todos os valores yi e tomarmos as diferenas


entre os valores yi e y , teremos
n

i =1

i =1

i =1

( y i y ) 2 = ( y bx + bxi y ) 2 = b 2 ( xi x ) 2 .
Usando (7) e (8) (frmulas de S xx e S yy , respectivamente) e (16) (frmula do
coeficiente b), temos
n

(18)

( y

y ) = b S xx = bS xy =
2

i =1

S xy2
S xx

em que a soma de quadrados

( y

y ) 2 calculada com base nos desvios da

i =1

reta de mnimos quadrados em relao horizontal y , como ilustrado pela


abaixo.
24
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Considerando as diferenas residuais, podemos escrever


n

(y

i =1

i =1

i =1

2
y i ) 2 = ( yi y + bx bxi ) 2 = [( yi y ) b( xi x )] =

= ( yi y ) 2 2b( yi y )( xi x ) + b 2 ( xi x ) 2 .
i =1

Distribuindo o somatrio acima e usando (16) (frmula de a), chega-se


expresso
n

(19)

(y

y i ) 2 = S yy bS xy .

i =1

(y

Substituindo (18) e

y ) 2 = S yy em (19), obtemos

i =1

(20)

i =1

i =1

i =1

( yi y ) 2 = ( yi y i ) 2 + ( y i y ) 2 .

usual escrever (20) usando a notao


(21) SQT = SQE + SQR,
em que

25
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

SQT = S yy = ( yi y ) 2 a soma dos quadrados total (variao total),


i =1

SQE = ( yi y i ) 2

a soma dos quadrados dos erros (variao

i =1

residual) e

SQR = ( y i y ) 2 a soma dos quadrados da regresso (variao


i =1

explicada).
variao total = variao residual +variao explicada

A soma de quadrados SQT mede a variao total de Y independentemente de


X, a soma de quadrados SQE mede a variao residual e a soma de
quadrados SQR mede o desvio da reta de mnimos quadrados em relao
mdia y ( a variao explicada pela reta de regresso).
Dividindo ambos os membros da equao (21) por SQT, temos
(22) 1 =

SQE SQR
+
SQT SQT

Podemos querer saber quanto representa proporcionalmente a parcela da


variao total de Y que explicada pela reta de regresso, ou seja, quanto
vale a razo SQR/SQT. Utilizando (18), podemos escrever
(23)

SQR bS xy
.
=
SQT
S yy

Substituindo b =

(24)

S xy
S xx

em (23) obtemos

S xy2
SQR S xy S xy
=

=
= R2
SQT S xx S yy S xx S yy

ou
(25)

R2 = 1

SQE
.
SQT

A frmula (24) indica que o coeficiente R2 de uma regresso linear simples


exprime a porcentagem da variao total de Y (SQT) que explicada
pela reta de regresso ajustada. Essa grandeza chamada coeficiente de
26
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

determinao (1-R2 o coeficiente de indeterminao). O R2 quantifica o


grau de ajuste de um conjunto de dados reta de regresso estimada.
Quanto mais prximo de 1 estiver R2 melhor ter sido nosso trabalho para
explicar a variao em y, com y = a + bx , e maior ser a capacidade de
previso de nosso modelo sobre todas as observaes amostrais.

O coeficiente R2 mede a percentagem da variao na varivel


dependente Y explicada pela variao na varivel explicativa X.

A frmula (24) indica que h uma relao interessante entre o coeficiente de


determinao R 2 e o coeficiente de correlao r
r2 = R2
Ou seja, o quadrado do coeficiente de correlao amostral algebricamente
igual ao coeficiente de determinao. Intuitivamente, essa relao tem
sentido: r2 est entre 0 e 1 e mede a fora da associao linear entre X e Y.
Essa interpretao no se afasta muito da de R2: a proporo da variao de Y,
em torno de sua mdia, explicada por X dentro do modelo de regresso.
Exemplo (APOFP-SP/ESAF/2009). Uma amostra aleatria simples (X1,Y1),
(X2,Y2), ..., (Xn,Yn) de duas variveis aleatrias X e Y forneceu as seguintes
quantidades:
11

( X i X ) 2 = 414
i =1

11

(Yi Y ) 2 = 359
i =1

11

(X

X )Yi = 345

i =1

Calcule o valor mais prximo do coeficiente de determinao da regresso


linear de Y em X.
(A) 0,85
(B) 0,83
(C) 0,80
(D) 0,88
(E) 0,92
Resoluo
Vimos que
27
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima
2

R2 =

S xy
SQR
=
SQT S xx S yy

Temos que
11

(X
i =1
11

(Y

X ) 2 = 414 = S xx
Y ) 2 = 359 = S yy

i =1

11

11

i =1

i =1

11

11

11

11

11

11

X i Yi

i =1

i =1

i =1

i =1

i =1

i =1

11

345 = ( X i X )Yi = X iYi XYi = X iYi X Yi = X iYi

=S XY

Logo,
R2 =

345 345
R 2 0,80
414 359

O valor mais prximo 0,80 (C).


GABARITO: C
Exemplo (ICMS-SP/FCC/2006). Em um determinado pas, deseja-se
determinar a relao entre a renda disponvel (Y), em bilhes de dlares, e o
consumo (C), tambm em bilhes de dlares. Foi utilizado o modelo linear
simples Ci = + Yi +

i,

em que Ci o consumo no ano i, Yi o valor da

renda disponvel no ano i e i o erro aleatrio com as respectivas hipteses


para a regresso linear simples. e so parmetros desconhecidos, cujas
estimativas foram obtidas atravs do mtodo dos mnimos quadrados. Para
obteno desta relao considerou-se ainda as seguintes informaes colhidas
atravs da observao nos ltimos 10 anos:
10

10

10

S 3 = Yi Ci = 1.100

S 2 = Yi = 100

S1 = Ci = 90

i =1

i =1

i =1

10

S 4 = Yi 2 = 1.250
i =1

10

S 5 = Ci2 = 1.010
i =1

Para o clculo do coeficiente de correlao de Pearson (R), usou-se a frmula:


Cov (Y , C )
R=
em que Cov (Y , C ) a covarincia de Y e C, DP(Y) o desvioDP (Y ) DP (C )
padro de Y e DP(C) o desvio-padro de C.

28
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Ento,
(A) o coeficiente de explicao (R2) correspondente igual a 64%.
(B) utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados,
tem-se que, em um ano, caso a renda disponvel seja igual a 15 bilhes de
dlares, o consumo ser igual a 13 bilhes de dlares.
(C) obtendo para um determinado ano uma previso para o consumo de 10
bilhes de dlares, significa que a renda disponvel considerada foi de 12,5
bilhes de dlares.
(D) o valor da estimativa encontrado para o parmetro igual a 0,4.
(E) o valor da estimativa encontrado para o parmetro igual a 10.
Resoluo
Ateno: a varivel independente
dependente C (consumo).

(renda

disponvel)

Seja um conjunto de n pares ordenados (y1,c1), (y2,c2), ..., (yn,cn) das


variveis Y e C. Vimos que
n

(y

y )(ci c )

i =1

r=

Cov(Y , C )
=
DP (Y ) DP (C )

n 1
1
n 1

(y
i =1

y ) 2 (ci c ) 2

S yc
S yy S cc

i =1

Essa quantidade denominada coeficiente de correlao quando Y e C so


tratadas como variveis aleatrias. O quadrado da mesma quantidade
chamado coeficiente de determinao. No contexto da regresso linear
simples, uma das variveis considerada determinstica ou no estocstica (na
questo, a varivel independente ou explicativa Y) e a outra (a varivel
dependente C) considerada aleatria.
O problema da regresso consiste em determinar a relao funcional entre as
variveis dependente e explicativa.
A funo de regresso C = a + by nos d o valor mdio de uma das variveis ( C
) em funo do valor observado da outra ( y ), isto , E[C|y] = C .
Anlise das alternativas:
A) S yc = i yi c i

1
90 100
y i ci = 1.100
= 200

i i
n
10
29
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

1
100 2
2
1
.
250
y
=

= 250
i i
n
10
1
90 2
2
S cc = i ci2 i ci = 1.010
= 200
n
10
S yc2
2002
2
R =
=
= 0,8 0,64 FALSA
S yy S cc 250 200
S yy = i yi2

S
B) b = = yc = 200 / 250 = 0,8
S yy
90
100
a = = c by =
0,8
= 9 8 =1
10
10

Logo,
C = 1 + 0,8 y C = 1 + 0,8 15 = 1 + 12 = 13 (em bilhes de dlares) VERDADEIRA

C) FALSA (vide item B).


D) FALSA (vide item B).
E) FALSA (vide item B).
GABARITO: B
2.7

Regresso sem o Intercepto

Em certas situaes da vida prtica, sabemos que a reta de regresso dos


dados deve passar pela origem. Considere, por exemplo, um estudante de
engenharia eltrica que est fazendo o levantamento experimental da famosa
Lei de Ohm, dada por V = RI, em que R o valor de uma resistncia, V a
tenso aplicada em um resistor e I a corrente que atravessa o resistor. Note
que a equao V = RI passa pela origem do grfico da tenso (eixo vertical)
versus corrente (eixo horizontal). O valor da resistncia d a declividade da
reta.
A regresso sem o intercepto tambm chamada regresso sem termo
constante ou regresso que passa pela origem. Neste caso nosso modelo
passa a ser
Y = X +

e a condio imposta passa a ser

30
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

min ei2 = min ( yi y i ) 2 = min ( yi bxi ) 2


i

em que ei = i denota o resduo.


Aplicando ento o mtodo de mnimos quadrados, obtemos a seguinte frmula
para b (*)
(26)

b=

x y
x
i

2
i

(*) a prova pode ser encontrada no apndice do captulo 6 da referncia


GUJARATI, Damodar N. Econometria Bsica, 3 Edio. So Paulo: Pearson

Makron Books, 2000.


interessante comparar a frmula acima com a que se obtem quando o termo
de intercepto est includo no modelo:
b=

S xy
S xx

( x x )( y y )
(x x)
i

A diferena entre as duas frmulas evidente: no modelo com intercepto


usamos somas de quadrados e produtos cruzados (isto , produtos entre X e
Y) ajustados em relao mdia.
Aprendemos, quando estudamos o modelo de regresso linear com intercepto,
que 2 = ei2 = SQE = SQT SQR. Vimos que SQR = b2Sxx = b2 ( xi x ) 2 , por
conseguinte

e = (y
2
i

y ) 2 b 2 ( xi x ) 2 (regresso com intercepto).

Para o modelo com intercepto zero, pode-se mostrar analogamente que

e = y
2
i

2
i

b 2 xi2

Note que as somas dos quadrados de Y e X no so ajustadas pela


mdia na frmula acima.
Se o exerccio no mencionar qual o modelo, sempre resolva a questo
usando o modelo com intercepto.

31
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Coeficiente de Determinao da Regresso sem o Intercepto

2.7.1

Vimos que SQE = ei2 = yi2 b 2 xi2 quando a regresso passa pela origem.
Como R 2 = 1 SQE / SQT , temos que

y
=1

2
i

b 2 x i2
SQT

y
=1

2
i

b 2 x i2
Syy

y b x
=1
y ( y ) /n
2
i

2
i

2
i

A frmula acima indica que no podemos assumir a igualdade entre o


coeficiente de determinao e o coeficiente de correlao linear

quando a regresso passa pela origem.

regresso sem intercepto: R 2 r 2

Uma Outra Maneira de Estimar a Reta de Regresso

Nesta seo, mostrarei como voc poder calcular os coeficientes da reta de


regresso usando um conjunto alternativo de frmulas. Eu percebi, ao longo
dos anos, que essas frmulas ajudam bastante a resolver questes de
regresso propostas pelo CESPE. Ento vamos l.
O objetivo da anlise de regresso estimar (ou prever) o valor mdio da
varivel dependente com base nos valores fixados das variveis explicativas
(veja a prxima figura), ou seja, d-me o valor de X e te darei o valor

de Y.

Fig.: Como estimar a linha de regresso?


32
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Na figura,

a linha verde a reta de regresso a ser estimada;

os pontos azuis so os valores observados para Y para valores fixos de X;

a bola de futebol americano indica que a distribuio conjunta de X e Y


normal, ou seja, a distribuio do diagrama de disperso uma normal
bivariada.

Introduzirei um modo maceteado de calcular os parmetros da reta de


regresso linear. Se voc aprender esse mtodo, posso lhe assegurar que voc
nunca mais ter dificuldade para calcular o intercepto e a inclinao da reta de
regresso, uma vez que voc ter aprendido um mtodo que lhe permitir
deduzir rapidamente as frmulas.
Antes de mais nada, considere o diagrama de disperso das variveis
padronizadas x e y, em que x = ( X X ) / X e y = (Y Y ) / Y . A figura abaixo
mostra um plot em que a reta de regresso estimada (linha marrom) tem
inclinao menor que 1, de modo que o ngulo da linha de regresso com o
eixo horizontal menor que 45o (a linha vermelha indica a reta com inclinao
unitria) Os valores dos eixos horizontal e vertical so adimensionais, pois os
valores foram padronizados. Fato matemtico: a inclinao da reta de
regresso igual ao valor do coeficiente de correlao r.

Fig.: Estimao da reta de regresso de dados com X e Y expressos em


unidades padro.

33
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Equao da reta de regresso:


estimativa de y em
unidades padro

r vezes o valor de x
em unidades padro

ou

y = rx

em que r denota o coeficiente de correlao.


Exemplo:

Alturas (X): X = 170 cm, DP(X) = 5 cm

Pesos (Y): Y = 70 kg, DP(Y) = 5 kg

r = 0,7

Estimativa do peso do indivduo ( Y ) que tem 180 cm de altura:

180 cm em unidades padro = (180 170 ) / 5 = 2 un. padro

Estimativa do peso em unidades padro = y = rx = 0,7 2 = 1, 4 un. padro

Estimativa do peso em kg = Y = Y + ( y Y ) = 70 + 1,4 5 = 77 kg

Reescrevendo a equao da reta estimada em unidades padro, obtemos

Y Y = r X X

Rearrumando: estimativa de Y = inclinao . X + intercepto

r Y

Y = X + Y X

Inclinao =

2 = r Y
X

Intercepto =

1 = Y 2 X
34

www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Intercepto =

1 = Y Inclinao X

Voc notou que conseguimos deduzir as frmulas dos coeficientes do modelo


de RLS sem muito esforo? O segredo saber que a reta estimativa em
unidades padro dada por

y = rx
Faa X = X . Ento
Estimativa de Y = inclinao x X + ( Y inclinao x X ) = Y
Portanto, a linha de regresso passa pelo ponto das mdias ( X , Y ) .

35
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

O Mnimo que Voc Precisa Saber

1 n
( xi x )( yi y )
n 1 i=1

S xy
- Coeficiente de correlao: r = xy =
x y
S xx S yy

- Covarincia: s xy = xy =

- Somas de Quadrados:
S xy = i =1 xi yi
n

1
n

( x )( y )
n

i =1

i =1

1
S xx = i=1 x
n

( x )

1
S yy = i =1 y
n

( y )

2
i

2
i

i =1 i

i =1

- O COEFICIENTE DE CORRELAO ADIMENSIONAL


- CORRELAO NO CAUSALIDADE
- A CORRELAO MEDE APENAS A RELAO LINEAR
- Modelo de Regresso Linear Simples:
Y = + X + ,
em que o intercepto, a declividade e denota a componente
aleatria da variao de Y ( uma varivel aleatria).
y = a + bx (reta estimativa),
em que y denota os valores dados pela reta estimativa, a a estimativa
do parmetro , e b a estimativa do parmetro .
A linha de regresso passa pelo ponto das mdias ( X , Y ) .
b=

r Y

S xy
S xx

s xy
s x2

= cov.amostral/(desvio padro amostral de X)2

a = y bx = mdia de Y menos (declividade x mdia de X)


SQT = SQE + SQR
36
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima
n

SQT = S yy = ( yi y ) 2 a soma dos quadrados total (variao total),


i =1

SQE = ( yi y i ) 2 a soma dos quadrados dos erros (variao


i =1

residual) e
n

SQR = ( y i y ) 2 a soma dos quadrados da regresso (variao


i =1

explicada).
variao total = variao residual +variao explicada
S2
SQR
SQE
=1
= xy
Coeficiente de determinao: R 2 =
SQT
SQT S xx S yy
R2 = r 2

- Regresso sem o intercepto: Y = X + :

x y
b=
x
i

2
i

, var(b) =

2
i

e
=

2
i

n 1

SQE = ei2 = yi2 b 2 xi2


R

y
=1

2
i

b 2 xi2
SQT

y
=1

2
i

b 2 xi2
S yy

y b x
=1
y ( y ) / n
2
i

2
i

2
i

R2 r 2

37
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Exerccios de Fixao

(ANAC rea 4/Cespe-UnB/2012/Adaptada) Em relao aos modelos de


regresso, julgue os prximos itens.
1. O modelo de regresso Yi = 0 + 1exp(Xi) + i, i ~ N(0, 2) um modelo
linear simples.
2. O grfico abaixo mostra o consumo de combustvel de aviao (em gales)
por milha nutica voada e o ajuste de uma reta a todos os pontos mostrados
via regresso linear. Sabendo-se que uma primeira regresso linear foi
realizada utilizando-se apenas os pontos com preenchimento e que a incluso
do ponto sem preenchimento levou a um considervel deslocamento dessa
reta, ento correto afirmar que esse ponto denomina-se ponto de inflexo.

(ANAC rea 7/Cespe-UnB/2012/Adaptada) A respeito de modelos de


regresso e coeficientes de correlao, julgue os itens que se seguem.
3. A esperana condicional E(Y|X = k) = 0 + 1k3 +2 cos(k) representa um
modelo de regresso linear mltipla.
4. Em um modelo linear simples, se o coeficiente de determinao for 0,81, o
desvio padro da varivel resposta for 1/3 do desvio padro da varivel
explicativa e a inclinao da reta de regresso for negativa, o coeficiente
estimado de inclinao dessa reta ser -0,30.
(Analista Judicirio TRT17/CESPE-UnB/2009/adaptada) Um estudo
estatstico foi realizado para avaliar a relao entre o logaritmo do valor pago
em um processo judicial de natureza trabalhista (Y) e o correspondente
logaritmo do valor da causa (X). Para o estudo, foram selecionados ao acaso
301 processos judiciais trabalhistas. Observando-se o par de valores (Xk,Yk) do
k-simo processo, k = 1, 2, ..., 301, foram obtidos os resultados apresentados
na tabela a seguir.
38
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

mdia amostral de X (em ln R$)

11,60

desvio padro amostral de X (em ln R$)


mdia amostral de Y (em ln R$)

2,40
11,40

desvio padro amostral de Y (em ln R$)

2,80

correlao linear de Pearson entre X e Y

0,53

A partir dessas informaes, julgue os prximos itens, considerando um


modelo de regresso linear simples na forma Yk = a + bX k + ek , em que a e b so
os coeficientes do modelo, {ek } representa uma sequncia independente de
erros aleatrios normais com mdia zero e varincia 2 .
5. A estimativa de mnimos quadrados para o coeficiente b superior a 0,5 e
inferior a 0,7.
6. A estimativa de mnimos quadrados do coeficiente a superior a 4.
7. O valor da estatstica R2 superior a 0,30.
8. A covarincia entre X e Y maior que 3.
(Papiloscopista
PF/Cespe-UnB/2012/Adaptada)
estatstica, julgue o prximo item.

Com

relao

9. Considere que a covarincia e a correlao linear entre as variveis X e Y


sejam, respectivamente, iguais a 5 e 0,8. Suponha tambm que a varincia de
X seja igual a quatro vezes a varincia de Y. Nesse caso, correto afirmar que
a varincia de X igual a 2.
10. (Analista Judicirio TJ-RO/Cespe-UnB/2012) Com
modelo de regresso linear simples, assinale a opo correta.

respeito

ao

(A) O parmetro de inclinao da reta igual tangente do ngulo formado


entre a reta e o eixo Oy.
(B) A inclinao da reta proporcional correlao entre a varivel resposta e
a varivel preditora.
(C) Se o modelo linear estiver bem ajustado, a correlao entre o resduo do
modelo e a varivel resposta deve estar prxima de -1.
(D) Se o intercepto do modelo for nulo, a varivel resposta assume o valor
zero quando a varivel preditora for igual ao inverso da inclinao da reta.
(E) O parmetro de inclinao da reta igual ao cosseno do ngulo formado
entre a reta e o eixo Ox.
39
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

11. (Analista Judicirio TJ-RO/Cespe-UnB/2012) Um analista estudou o


pagamento dos valores Y (em R$ mil) das custas processuais em aes
trabalhistas. Com base em uma amostra aleatria simples de processos
judiciais, ele concluiu que a varivel Y se relaciona linearmente com o valor da
causa X (em R$ mil), conforme uma reta ajustada pelo mtodo de mnimos
quadrados ordinrios na forma Y = 0,1 X + 200. A mdia populacional e a
amostral da varivel X foram, respectivamente, iguais a R$ 100 mil e R$ 90
mil.
Nesse caso, correto afirmar que a estimativa de regresso para a mdia
populacional de Y foi igual a
(A) R$ 210 mil.
(B) R$ 211 mil.
(C) R$ 212 mil.
(D) R$ 208 mil.
(E) R$ 209 mil
(INMETR0Cincias
Econmicas/Cespe-UnB/2009/Adaptada)
Um
estudo acerca da renda domiciliar e do consumo mensal de energia eltrica de
domiclio mostrou que h uma relao linear entre ambos na forma Y = a + bX +
, em que Y a renda domiciliar, em reais, X o consumo mensal de energia
eltrica, em kWh, do domiclio correspondente, a e b so os coeficientes do
modelo, a serem estimados pelo mtodo dos mnimos quadrados ordinrios, e
representa um erro aleatrio com mdia zero e desvio padro . A partir de
uma amostra de 401 domiclios, observou-se que o desvio padro amostral de
Y foi igual a R$ 500,00, o desvio padro amostral de X foi igual a 100 kWh e
que a correlao linear entre Y e X foi igual a 0,6.
Com base nas informaes apresentadas, julgue os itens seguintes.
12. O coeficiente de determinao do modelo ajustado (R2) inferior a 40%.
13. A estimativa do coeficiente angular b superior a 2,5.
14. Para a obteno das estimativas de mnimos quadradosdos coeficientes do
modelo, necessrio que o erro aleatrio siga uma distribuio normal.
15. Se a e b so os coeficientes estimados pelo mtodo dos mnimos
quadrados ordinrios, se Y e X so as mdias amostrais de Y e de X,
respectivamente, ento Y = a + bX .

40
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

6.

Gabarito

1C
2E
3C
4C
5C
6C
7E
8C
9E
10 B
11 A
12 C
13 C
14 E
15 C

41
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

7.

Resoluo dos Exerccios de Fixao

(ANAC rea 4/Cespe-UnB/2012/Adaptada) Em relao aos modelos de


regresso, julgue os prximos itens.
1. O modelo de regresso Yi = 0 + 1exp(Xi) + i, i ~ N(0, 2) um modelo
linear simples.
Resoluo
preciso esclarecer o significado do termo "linear".
Linearidade nas Variveis
O primeiro significado de linearidade que a esperana condicional de Y dado
x uma funo linear de x, como por exemplo, no modelo
E(Y|x) = + x
em que a curva de regresso em funo de x uma reta.
Linearidade nos Parmetros
A segunda interpretao de linearidade que a esperana condicional de Y
dado x uma funo linear dos parmetros e ; isso pode ou no ser linear
na varivel X. Nesta interpretao,
E(Y|x) = + .exp(x)
um modelo de regresso linear simples.
De acordo com a segunda interpretao, o modelo de regresso Yi = 0 +
1exp(Xi) + i, i ~ N(0, 2) um modelo linear simples nos parmetros. Item
certo.
GABARITO: C
2. O grfico abaixo mostra o consumo de combustvel de aviao (em gales)
por milha nutica voada e o ajuste de uma reta a todos os pontos mostrados
via regresso linear. Sabendo-se que uma primeira regresso linear foi
realizada utilizando-se apenas os pontos com preenchimento e que a incluso
do ponto sem preenchimento levou a um considervel deslocamento dessa
reta, ento correto afirmar que esse ponto denomina-se ponto de inflexo.

42
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Resoluo
A literatura no reconhece a existncia dessa terminologia chamada "ponto de
inflexo" na regresso linear. Item errado. Sem maiores comentrios.
GABARITO: E
(ANAC rea 7/Cespe-UnB/2012/Adaptada) A respeito de modelos de
regresso e coeficientes de correlao, julgue os itens que se seguem.
3. A esperana condicional E(Y|X = k) = 0 + 1k3 +2 cos(k) representa um
modelo de regresso linear mltipla.
Resoluo
Um modelo de regresso que contenha mais de um regressor denominado
modelo de Regresso Linear Mltipla (RLM).
Por exemplo, suponha que a quantidade demandada (varivel dependente Y)
de um produto dependa do preo do produto (regressor X2) e da renda do
comprador (regressor X3). Um modelo de RLM que pode descrever essa relao

Yi = 0 + 1X2i + 2X3i + i = 0 + 1k3 +2cos(k) + i


em que 0, 1 e 2 so os parmetros do modelo e denota o termo de erro
aleatrio. Esse um modelo com dois regressores (X2 e X3). O termo linear
usado porque o modelo acima uma funo linear dos parmetros
desconhecidos 0, 1 e 2.
Deste modo, a esperana condicional E(Y|X = k) = 0 + 1k3 +2cos(k)
representa um modelo de regresso linear (nos parmetros) mltipla, haja
vista os parmetros 0, 1 e 2. Item certo.
43
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

GABARITO: C
4. Em um modelo linear simples, se o coeficiente de determinao for 0,81, o
desvio padro da varivel resposta for 1/3 do desvio padro da varivel
explicativa e a inclinao da reta de regresso for negativa, o coeficiente
estimado de inclinao dessa reta ser -0,30.
Resoluo
Dados: R2 = 0,81, sY = sX/3, b = -0,3 (coeficiente estimado de inclinao da
reta de regresso).
Sabemos que R2 = r2. Ento, | r |= R 2 = 0,81 = 0,9 .
r=

s xy
sx s y

s xy
sx sx / 3

3s xy
s x2

O valor absoluto do coeficiente de correlao


| r |=

3 | s xy |

0,9 =

| s xy |
s

2
x

s x2

(pois a varincia uma quantidade positiva)

3 | s xy |
s x2
=| b |= 0,3

(lembre da frmula b =

s xy
s x2

O mdulo do coeficiente estimado de inclinao da reta 0,3. Como a


inclinao da reta de regresso negativa, ento b = -0,3. Item certo.
GABARITO: C
(Analista Judicirio TRT17/CESPE-UnB/2009/adaptada) Um estudo
estatstico foi realizado para avaliar a relao entre o logaritmo do valor pago
em um processo judicial de natureza trabalhista (Y) e o correspondente
logaritmo do valor da causa (X). Para o estudo, foram selecionados ao acaso
301 processos judiciais trabalhistas. Observando-se o par de valores (Xk,Yk) do
k-simo processo, k = 1, 2, ..., 301, foram obtidos os resultados apresentados
na tabela a seguir.
mdia amostral de X (em ln R$)

11,60

44
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima
desvio padro amostral de X (em ln R$)
mdia amostral de Y (em ln R$)

2,40
11,40

desvio padro amostral de Y (em ln R$)

2,80

correlao linear de Pearson entre X e Y

0,53

A partir dessas informaes, julgue os prximos itens, considerando um


modelo de regresso linear simples na forma Yk = a + bX k + ek , em que a e b so
os coeficientes do modelo, {ek } representa uma sequncia independente de
erros aleatrios normais com mdia zero e varincia 2 .
5. A estimativa de mnimos quadrados para o coeficiente b superior a 0,5 e
inferior a 0,7.
Resoluo
Dados:

X = 11,60
s x = X = 2,40

Y = 11,40
s y = Y = 2,80

r = 0,53

Modelo de Regresso Linear Simples:


Yk = a + bX k + k

em que a o intercepto, b a declividade e {ek } representa uma sequncia


independente de erros aleatrios normais com mdia zero e varincia 2 .
Reta estimativa: E (Yk | X k ) = Yk = a + bX k , em que Yk denota os valores dados pela
reta estimativa, a a estimativa do coeficiente a , e b a estimativa do
coeficiente b .
Frmula para clculo da estimativa b :

S
s
b = xy = xy2
S xx sx

45
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

em que s xy denota a covarincia amostral (*) e s x2 o desvio padro amostral


de X.
r=

s xy
sx s y

= 0,53

sxy = 0,53 2,40 2,80

s
0,53 2,40 2,80
b = xy2 =
0,62
sx
2,40 2,40
Item correto.
(*) A covarincia amostral entre X e Y s vezes denotada por XY .
GABARITO: C
6. A estimativa de mnimos quadrados do coeficiente a superior a 4.
Resoluo
Estimativa de mnimos quadrados do coeficiente a :
a = Y bX = 11,40 0,62 11,60 4,21 superior a 4

Item correto.
GABARITO: C
7. O valor da estatstica R2 superior a 0,30.
Resoluo
Relao entre R2 (coeficiente de determinao) e r (coeficiente de correlao):
R2 = r 2

Logo,
R 2 = r 2 = 0,532 0,28 inferior a 0,30

Item errado.
GABARITO: E
46
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

8. A covarincia entre X e Y maior que 3.


Resoluo
Dados: r = 0,53 , s x = 2,40 , e s y = 2,80 .
Clculo da covarincia (amostral) entre X e Y:
r=

s xy
sx s y

= 0,53

s xy = 0,53 s x s y s xy = 0,53 2,40 2,80 = 3,56 maior que 3

Item certo.
GABARITO: C
(Papiloscopista
PF/Cespe-UnB/2012/Adaptada)
estatstica, julgue o prximo item.

Com

relao

9. Considere que a covarincia e a correlao linear entre as variveis X e Y


sejam, respectivamente, iguais a 5 e 0,8. Suponha tambm que a varincia de
X seja igual a quatro vezes a varincia de Y. Nesse caso, correto afirmar que
a varincia de X igual a 2.
Resoluo
Dados: xy = 5 , r = 0,8 , x2 = 4 y2 .

x2 = 4 y2 y2 =
r=

x2
4

y =

x
2

xy
5
= 0,8
= 0,8 x2 = 12,5 a varincia de X no igual a 2
x y
x x / 2

Item errado.
GABARITO: E
10. (Analista Judicirio TJ-RO/Cespe-UnB/2012) Com
modelo de regresso linear simples, assinale a opo correta.

respeito

ao

47
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

(A) O parmetro de inclinao da reta igual tangente do ngulo formado


entre a reta e o eixo Oy.
(B) A inclinao da reta proporcional correlao entre a varivel resposta e
a varivel preditora.
(C) Se o modelo linear estiver bem ajustado, a correlao entre o resduo do
modelo e a varivel resposta deve estar prxima de -1.
(D) Se o intercepto do modelo for nulo, a varivel resposta assume o valor
zero quando a varivel preditora for igual ao inverso da inclinao da reta.
(E) O parmetro de inclinao da reta igual ao cosseno do ngulo formado
entre a reta e o eixo Ox.
Resoluo
Anlise das opes
(A) A afirmativa correta seria: o parmetro de inclinao da reta igual
tangente do ngulo formado entre a reta e o eixo Ox. Segue a justificativa.
Seja o modelo de RLS
y = + x + ,
em que o intercepto, a declividade (coeficiente angular ou parmetro
de inclinao) da reta de regresso e denota a componente aleatria da
variao de y. O parmetro de inclinao da reta representa a variao em
E(y|x) para uma variao de 1 unidade em x. Algebricamente,

E ( y | x )
= tan( )
x

em que denota o ngulo formado entre a reta de regresso e o eixo Ox.


(B) A estimativa do parmetro de inclinao da reta dada por

= b =

xy
x2

como
r=

xy
xy = r x y
x y

ento
48
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

r x y

= r x 2 y
2
x
x

e, conclui-se que a inclinao da reta proporcional varivel r, que


representa a correlao entre a varivel resposta (y) e a varivel preditora (x).
Opo correta.
(C) O resduo ( ei ) corresponde diferena entre o valor observado da varivel
dependente ( yi ) e seu respectivo valor estimado ( y i ), ou seja,
ei = yi y i = yi a bxi . No correto afirmar que se o modelo linear estiver bem
ajustado, a correlao entre o resduo do modelo e a varivel resposta deve
estar prxima de -1, pois sabe-se que a correlao entre o resduo do modelo
() e a varivel resposta (y) nula.
(D) Se o intercepto do modelo for nulo, a reta de regresso
E ( y | x ) = y = x .

Neste caso, a varivel resposta ( y ) assume o valor unitrio quando a varivel


preditora (x) for igual ao inverso da inclinao da reta:

1
= 1 = y
b

Opo incorreta.
(E) Opo incorreta, pois o parmetro de inclinao da reta igual tangente
do ngulo formado entre a reta e o eixo Ox.
GABARITO: B
11. (Analista Judicirio TJ-RO/Cespe-UnB/2012) Um analista estudou o
pagamento dos valores Y (em R$ mil) das custas processuais em aes
trabalhistas. Com base em uma amostra aleatria simples de processos
judiciais, ele concluiu que a varivel Y se relaciona linearmente com o valor da
causa X (em R$ mil), conforme uma reta ajustada pelo mtodo de mnimos
quadrados ordinrios na forma Y = 0,1 X + 200. A mdia populacional e a
amostral da varivel X foram, respectivamente, iguais a R$ 100 mil e R$ 90
mil.
Nesse caso, correto afirmar que a estimativa de regresso para a mdia
populacional de Y foi igual a
(A) R$ 210 mil.
49
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

(B) R$ 211 mil.


(C) R$ 212 mil.
(D) R$ 208 mil.
(E) R$ 209 mil
Resoluo
Modelo de RLS:
Y = + X +

Apliquemos o operador expectncia em ambos os lados da equao acima:


E (Y ) = E ( + X + ) = E ( ) + E ( X ) + E ( ) = + E ( X ) + 0 = + E ( X )

pois, E ( ) = (o valor esperado de uma constante igual a prpria constante)


e E ( ) = 0 (a mdia dos resduos nula).
De acordo com o enunciado, a reta estimada
E (Y | x ) = + x = 200 + 0,1x = 200 e = 0,1

Como a mdia populacional foi dada e vale E ( X ) = X = 100 (em R$ mil),


temos que a mdia populacional de Y dada por

Y = E (Y ) = + E ( X ) = 200 + 0,1 100 = 200 + 10 = 210 (em R$ mil)


Nota: a estimativa de regresso para a mdia amostral de Y ( Y ) dada por
Y = + X = 200 + 0,1 90 = 209 (em R$ mil)

GABARITO: A
(INMETR0Cincias
Econmicas/Cespe-UnB/2009/Adaptada)
Um
estudo acerca da renda domiciliar e do consumo mensal de energia eltrica de
domiclio mostrou que h uma relao linear entre ambos na forma Y = a + bX +
, em que Y a renda domiciliar, em reais, X o consumo mensal de energia
eltrica, em kWh, do domiclio correspondente, a e b so os coeficientes do
modelo, a serem estimados pelo mtodo dos mnimos quadrados ordinrios, e
representa um erro aleatrio com mdia zero e desvio padro . A partir de
uma amostra de 401 domiclios, observou-se que o desvio padro amostral de
Y foi igual a R$ 500,00, o desvio padro amostral de X foi igual a 100 kWh e
que a correlao linear entre Y e X foi igual a 0,6.
50
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Com base nas informaes apresentadas, julgue os itens seguintes.


12. O coeficiente de determinao do modelo ajustado (R2) inferior a 40%.
Resoluo
Regresso com intercepto:
R2 = r2 = 0,62 = 0,36 < 0,40,
em que r denota o coeficiente de correlao. Item certo.
GABARITO: C
13. A estimativa do coeficiente angular b superior a 2,5.
Resoluo
Estimativa do coeficiente angular b:

500
= 3,0 > 2,5
b = r Y = 0,6
100
X
GABARITO: C
14. Para a obteno das estimativas de mnimos quadradosdos coeficientes do
modelo, necessrio que o erro aleatrio siga uma distribuio normal.
Resoluo
Para a obteno das estimativas de mnimos quadrados dos coeficientes do
modelo, no necessrio que o erro aleatrio siga uma distribuio
normal.
Relembremos as premissas do modelo de regresso:
RS1. O valor de cada Yi, para cada valor de Xi, i = 1, 2, ..., n, Yi = 1 + 2 X i + i . O
modelo de RLS linear nos parmetros.
RS2. O valor mdio do erro aleatrio

E ( i ) = 0 , pois admite-se que

E (Yi | X i ) = 1 + 2 X i (Funo de Regresso Populacional - FRP).

51
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

RS3. A varincia do erro aleatrio constante, Var(i) = 2. Esta a hiptese


de homocedasticidade (vide a prxima figura). Alm disso, Var(i) = Var(Yi),
pois Yi e i diferem apenas por uma constante, o que no altera a varincia.
Nota: a violao desta hiptese denominada heterocedasticidade (vide a
prxima figura), que ocorre quando os erros no tm a mesma varincia.
RS4. A covarincia entre qualquer par de erros aleatrios, i e j ,
nula: Cov(i, j) = Cov(Yi,Yj) = 0
Nota: ocorre violao desta hiptese quando os erros esto correlacionados
entre si.
RS5. A varivel X no aleatria e deve tomar pelo menos dois valores
distintos (variabilidade nos valores de X).
RS6. Os valores do erro aleatrio se distribuem normalmente em torno de
sua mdia, ~ N(0, 2), se os valores de Y se distribuem normalmente, e viceversa. Esta hiptese opcional. O modelo dito gaussiano quando ela
adotada.
GABARITO: E
15. Se a e b so os coeficientes estimados pelo mtodo dos mnimos
quadrados ordinrios, se Y e X so as mdias amostrais de Y e de X,
respectivamente, ento Y = a + bX .
Resoluo
A linha de regresso passa pelo ponto das mdias ( X , Y ) . Item correto.
Nota: a linha de regresso dada por


Y = (Y bX ) + r Y
X

em que b = r Y a estimativa do coeficiente angular e a = Y bX estimativa


X
do intercepto. Faa X = X . Ento, Y = Y .
GABARITO: C
At a prxima aula. Bom estudo!
52
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 08 Regresso Simples
Prof. Alexandre Lima

Alexandre Lima
alexandre@pontodosconcursos.com.br

53
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Você também pode gostar