Você está na página 1de 21

ACADEMIA DO CONCURSO

CORRELAÇÃO
01- O coeficiente de correlação linear entre as variáveis X e Y
da tabela abaixo vale:
X Y
CORRELAÇÃO E 2
4
6
8
REGRESSÃO 6
8
10
12
10 14
EXERCÍCIOS a. 0,5 b. 1,0 c. -1,0 d. -0,5 e. 0

Y=X+4!
rXY = 1.0 !
SEM CONTA ! ⇒ OLHOU...E VIU!
GABARITO - B
Os pontos estão perfeitamente alinhados sobre uma reta !

02- O coeficiente de correlação linear entre X e Y é r. 03- Se as variáveis aleatórias X e Y são tais que
Se Y = 4 - 2X então: Y = 2X, o coeficiente de correlação linear entre X e Y
vale:
a. r = 1 b 0 < r < 1. c. r = 0 d. -1 < r < 0 e. r = -1
a. r = 1 b. r = 0 c. r = -1 d. 0 < r < 1 e. -1< r < 0

Y = 4 - 2X Y = 2X

rXY = -1.0 ! rXY = 1 !

SEM CONTA ! ⇒ OLHOU...E VIU! SEM CONTA ! ⇒ OLHOU...E VIU!

Os pontos estão perfeitamente alinhados sobre uma reta !

GABARITO - E GABARITO - A

04-(AGU-ESTATÍSTICO-2006/NCE) As notas de cinco alunos em 5 5 5 5 5


português (X) e em matemática (Y) foram observadas e os ∑x i = 20 ∑y i = 30 ∑x 2
i = 90 ∑y 2
i = 220 ∑x y i i = 109
seguintes resultados foram obtidos: i =1 i =1 i =1 i =1 i =1

5 5 5 5 5

∑x i = 20 ∑y i = 30 ∑x 2
i = 90 ∑y 2
i = 220 ∑x y i i = 109 r=
S X ,Y
i =1 i =1 i =1 i =1 i =1 S X × SY
O coeficiente de correlação entre essas notas é
aproximadamente igual a: Para calcular a correlação precisamos:
(A) - 0,55 COEFICIENTE DE CORRELAÇÃO ENTRE X E Y COVARIÂNCIA ⇒ SXY
(B) - 0,2 S X ,Y
(C) - 0,05 r= DESVIO PADRÃO (SX) DE X ⇒ precisa da Variância de X
(D) 0,3 S X × SY
DESVIO PADRÃO (SY) DE Y ⇒ precisa da Variância de Y
(E) 0,5 Para calcular a correlação precisamos:
COVARIÂNCIA ⇒ SXY MÉDIA DE X
DESVIO PADRÃO DE X (Variância de X) MÉDIA DE Y
DESVIO PADRÃO DE Y (Variância de Y)
MÉDIA DE X
MÉDIA DE Y

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 1 MANUEL
ACADEMIA DO CONCURSO

5 5 5 5 5 5 5 5 5 5

∑x i = 20 ∑y i = 30 ∑x 2
i = 90 ∑y 2
i = 220 ∑x y
i =1
i i = 109 ∑x i = 20 ∑y i = 30 ∑x 2
i = 90 ∑y 2
i = 220 ∑x y
i =1
i i = 109
i =1 i =1 i =1 i =1 i =1 i =1 i =1 i =1

PRIMEIRO PASSO ⇒ CALCULAR A MÉDIA DE X TERCEIRO PASSO ⇒ CALCULAR A MÉDIA DE Y


Obs. n=5 observações 5
5
∑y
∑x
i
i =1 30 Y =6
i
20 Y = = =6
X= i =1
= =4 X =4 n 5
n 5
QUARTO PASSO ⇒ CALCULAR A VARIÂNCIA DE Y
SEGUNDO PASSO ⇒ CALCULAR A VARIÂNCIA DE X 5
5

∑ xi2 ∑y 2
i
220 2
90 2 S X2 = 2 S = 2 i =1
− y2 = − 6 = 44 − 36 = 8 SY2 = 8
S X2 = i =1
− x2 = − 4 = 18 − 16 = 2 Y
n 5
n 5
Média dos quadrados menos o quadrado da média !
Média dos quadrados menos o quadrado da média !

5 5 5 5 5 5 5 5 5 5

∑x i = 20 ∑y i = 30 ∑x 2
i = 90 ∑y 2
i = 220 ∑x y
i =1
i i = 109 ∑x i = 20 ∑y i = 30 ∑x 2
i = 90 ∑y 2
i = 220 ∑x y
i =1
i i = 109
i =1 i =1 i =1 i =1 i =1 i =1 i =1 i =1

S X ,Y
r= X =4 Y =6
X =4 S X2 = 2 S X = 2
S X × SY S X ,Y = −2,2
Y =6 SY2 = 8 SY = 8
QUINTO PASSO ⇒ CALCULAR A COVARIÂNCIA ENTRE X E Y
FINALMENTE....
S X ,Y =
∑ XY − XY ⇒ MÉDIA DO PRODUTO MENOS S X ,Y
O PRODUTO DAS MÉDIAS r=
n
S X × SY
MÉDIA DO PRODUTO − 2,2 − 2,2 − 2,2 − 2,2
PRODUTO DAS MÉDIAS r= = = = = −0,55
2× 8 16 16 4
109 S X ,Y = −2,2
S X ,Y = − 4 × 6 = −2,2 r = −0,55 GABARITO - A
5

05-(BC-ANALISTA-2002/ESAF) Considere duas variáveis PROPRIEDADES DA VARIÂNCIA


aleatórias X e Y. Sejam 45 e 65 as médias de X e de Y,
respectivamente. Sejam 4 e 16 as variâncias de X e Y
VARIÂNCIA DA SOMA DE VARIÁVEIS ALEATÓRIAS
respectivamente e 3 a covariância entre essas variáveis.
Assinale a opção que dá a variância da diferença X-Y. Var(X+Y) = Var(X) + Var(Y) + 2×Cov(X,Y)
a) 26
b) 20 Onde Cov(X,Y) é a COVARIÂNCIA entre X e Y !
c) 23
d) 14 Var ( X + Y ) = Var ( X ) + Var (Y ) + 2 × Cov( X , Y )
e) Não é possível calcular a variância de X-Y com a informação
dada

CovX ,Y =
∑ XY − XY ⇒ MÉDIA DO PRODUTO MENOS
O PRODUTO DAS MÉDIAS
n
Obs. COVARIÂNCIA será visto no Módulo de Correlação e Regressão!

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 2 MANUEL
ACADEMIA DO CONCURSO

PROPRIEDADES DA VARIÂNCIA TEMOS


VARIÂNCIA DA SOMA DE VARIÁVEIS ALEATÓRIAS X = 45 S X2 = 4
Y = 65 SY2 = 16
2 2 2
S ( X +Y ) = S + S + 2 S XY
X Y S X ,Y = 3

S(2X −Y ) = S X2 + SY2 − 2 S XY S (2X −Y ) = S X2 + SY2 − 2 S XY

∑ XY − XY S (2X −Y ) = 4 + 16 − 2 × 3
S X ,Y = ⇒ COVARIÂNCIA ENTRE X e Y!
n S (2X −Y ) = 20 − 6
COVARIÂNCIA ENTRE X e Y = MÉDIA DO PRODUTO
MENOS...O PRODUTO DAS MÉDIAS ! S (2X −Y ) = 14
GABARITO - D

06-(IBGE-ANALISTA CENSITÁRIO-2000/NCE) Se X é uma 07-(MP-RO-ESTATÍSTICO-2005/CESGRANRIO) Analise as


variável aleatória e Y = 5 - 2X, então o coeficiente de correlação afirmativas a seguir, a respeito do coeficiente de correlação
linear entre X e Y é igual a: linear de Pearson entre duas variáveis positivas X e Y.
a. 2,5 I - é positivo;
b. 1,0 II- não se altera quando adicionamos uma constante positiva
c. 0 aos valores de X;
d. -0,4 III- não se altera quando multiplicamos por uma constante
e. -1,0 positiva os valores de X.
Está(ão) correta(s) a(s) afirmativa(s):
Y = 5 - 2X (A) II somente
(B) I e II somente
rXY = -1,0 ! (C) I e III somente
(D) II e III somente
SEM CONTA ! ⇒ OLHOU...E VIU!
(E) I, II e III.
Os pontos estão perfeitamente alinhados sobre uma reta !
GABARITO - E

S X ,Y COEFICIENTE DE CORRELAÇÃO = COVARIÂNCIA


S X ,Y COEFICIENTE DE CORRELAÇÃO = COVARIÂNCIA
r= DIVIDIDO PELO PRODUTO DOS DESVIOS !
r= DIVIDIDO PELO PRODUTO DOS DESVIOS !
S X × SY S X × SY
I - é positivo;
FALSO ⇒ VARIA ENTRE -1 E 1 ! III- não se altera quando multiplicamos por uma constante

II- não se altera quando adicionamos uma constante positiva positiva os valores de X.

aos valores de X; Vejamos

Vejamos ⇒ S(CX,Y) = cS(X,Y) ⇒ a covariância fica multiplicada por c.

⇒ S(X+C,Y) = S(X,Y) ⇒ a COVARIÂNCIA entre X e Y não se altera ⇒ S(CX) = cS(X) = o Desvio Padrão de Xfica multiplicada por c.

quando somamos uma constante a X!


S CX ,Y c × S X ,Y S X ,Y
⇒ S(X+C) = S(X) = o DESVIO PADRÃO de X não se altera quando r= = =
S CX × SY c × S X × SY S X × SY
somamos uma constante.
VERDADEIRO! VERDADEIRO GABARITO - D

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 3 MANUEL
ACADEMIA DO CONCURSO

08-(MP-RO-ESTATÍSTICO-2005/CESGRANRIO). 09-(IBGE-ANALISTA CENSITÁRIO-2000/NCE) Sejam X e Y


variáveis aleatórias discretas com função de probabilidade
Se var(X) = 3, var(Y) = 2 e cov(X,Y) = 1, então var(X-Y) é igual a: conjunta dada pela seguinte tabela de dupla entrada:
(A) 1 Y
var(X) = 3
(B) 3 X -1 1
(C) 4 var(Y) = 2 0 0,1 0,2
(D) 5 1 0,3 0,1
cov(X,Y) = 1
(E) 6 2 0,2 0,1

Var(X-Y) = Var(X) + Var(Y) - 2×Cov(X,Y) A covariância entre X e Y vale:


a. -0,3
Var(X-Y) = 3 + 2 - 2×1 b. -0,2
c. 0,1
Var(X-Y) = 3 d. 0,5
e. 1,0
OLHOU...E VIU! GABARITO - B

S X ,Y =
∑ XY − XY ⇒ COVARIÂNCIA ENTRE X e Y! Y
n X -1 1
0 0,1 0,2 0,3
COVARIÂNCIA = MÉDIA DO PRODUTO MENOS...O
1 0,3 0,1 0,4 PROBABILIDADES MARGINAIS DE X
PRODUTO DAS MÉDIAS !
2 0,2 0,1 0,3
0,6 0,4 1,0 X = 0 × 0,3 + 1× 0,4 + 2 × 0,3
Y
X -1 1 X = 0 + 0,4 + 0,6 X = 1,0
0 0,1 0,2 PROBABILIDADES PRECISAVA FAZER A CONTA ?
1 0,3 0,1 MARGINAIS DE Y
2 0,2 0,1
Y = −1× 0,6 + 1× 0,4 Y = −0,2
PARA ACHAR A COVARIÂNCIA PRECISAMOS CALCULAR:
MÉDIA DE X
MÉDIA DE Y
MÉDIA DO PRODUTO DE X POR Y

10-(MPU-ANALISTA DOCUMENTAÇÃO-2004/ESAF) Considere


Y
CÁLCULO DA COVARIÂNCIA a distribuição conjunta abaixo de duas variáveis aleatórias
X -1 1 discretas X e Y. Assinale a opção que dá o valor da covariância
0 0,1 0,2 0,3
1 0,3 0,1 0,4
S X ,Y =
∑ XY − XY entre X e Y.

2 0,2 0,1 0,3 n X/Y Y1 Y2


0,6 0,4 1,0 X1 0,25 0,25
X2 0,25 0,25
S X ,Y = 0 × −1× 0,1 + 1× −1× 0,3 + 2 × −1× 0,2
a) -6,40
0 × 1× 0,2 + 1×1× 0,1 + 2 ×1× 0,1 b) -0,87
c) -0,05
−1× (−0,2)
d) 0,00
S X ,Y = −0,3 − 0,4 + 0,1 + 0,2 + 0,2 e) 0,25

S X ,Y = −0,7 + 0,5
GABARITO - B
S X ,Y = −0,2

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 4 MANUEL
ACADEMIA DO CONCURSO

X/Y Y1 Y2 11-(MP-RO-ESTATÍSTICO-2005/CESGRANRIO) O vetor


Sxy = 0 ! aleatório (X,Y) tem distribuição conjunta com matriz de
X1 0,25 0,25 0,5 variâncias-covariâncias. Assinale a opção que dá o valor do
X2 0,25 0,25 0,5 OLHOU...E VIU! coeficiente de correlação entre X e Y.
0,5 0,5
1,0 0,5 
VARIÁVEIS INDEPENDENTES ⇒ COV = 0 !  
 0,5 4,0 
COV = 0 ! ⇒ ≠ VARIÁVEIS INDEPENDENTES !
a) 0,85
P (Y 1) = 0,5 b) 0,25
c) 0,65
P (Y 1 ∩ X 1) 0,25 P (Y 1 | X 1) = 0,5 d) 0,95
P (Y 1 | X 1) = = = 0,5
P ( X 1) 0,5 e) 0,75
P (Y 1) = P (Y 1 | X 1)
GABARITO - D

12-PREFEITURA MANAUS ESTATÍSTICO 2004 CESGRANRIO


1,0 0,5  ⇐ MATRIZ DE VARIÂNCIAS-COVARIÂNCIAS A tabela a seguir mostra os valores de duas variáveis X e Y,
  notas em Matemática e em Português, dos alunos de uma
 0,5 4,0  turma de 8 alunos.

X Y Aluno 1 2 3 4 5 6 7 8
X 1,0 0,5 QUANTO VALE A VARIÂNCIA DE X (SX2) ? X 10 9 6 8 7 5 4 3
Y 0,5 4,0 QUANTO VALE A VARIÂNCIA DE Y (SY2) ? Y 1 2 6 4 5 7 8 10
O Coeficiente de Correlação Linear de Pearson entre X e Y:
QUANTO VALE A COVARIÂNCIA ENTRE X E Y (SXY) ? (A) vale 1
SX2 = 1,0 SX = 1,0 S X ,Y 0,5 (B) está compreendido entre 0 e 1
r= r= r = 0,25 (C) vale 0
SY2 = 4,0 SY = 2,0 S X × SY 1× 2
(D) está compreendido entre –1 e 0
SXY = 0,5 FEROZ ! (E) vale –1

GABARITO - B

Aluno 1 2 3 4 5 6 7 8 13-PREFEITURAMANAUS-ESTATÍSTICO-2004/CESGRANRIO
X 10 9 6 8 7 5 4 3 Se Var(X)=3, Var(Y)=2 e Cov(X,Y) = 1, então Var(2X-Y) é igual a:
Y 1 2 6 4 5 7 8 10
(A) 2
12
(B) 6 Var(X)=3
Aluno X Y
10 1 10 1 (C) 8 Var(Y)=2
2 9 2 (D) 10
8
3 6 6 (E) 12 Cov(X,Y) = 1
6 4 8 4
4
5 7 5 Var(X-Y) = Var(X) + Var(Y) - 2×Cov(X,Y)
6 5 7
2 7 4 8 Var(2X-Y) = Var(2X) + Var(Y) - 2×Cov(2X,Y)
8 3 10
0
0 2 4 6 8 10 12 Var(2X-Y) = 22Var(X) + Var(Y) - 2×2Cov(X,Y)
Coeficiente de Correlação Linear = ???? r =? Var(2X-Y) = 4×3 + 2 - 4×1
r = Está compreendi do entre − 1 e 0 ! Var(2X-Y) = 10
GABARITO - D GABARITO - D
Obs. Cov(2X,Y)=2Cov(X,Y)

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 5 MANUEL
ACADEMIA DO CONCURSO

14-(ELETROBRÁS-ESTATÍSTICO-2002/NCE) A tabela de dupla valores de x CÁLCULO DA COVARIÂNCIA


entrada a seguir apresenta a função de probabilidade conjunta 1 2 3
de duas variáveis aleatórias discretas X e Y. Por exemplo, valores 0 0,1 0,3 0,2 0,6 PROBABILIDADES MARGINAIS DE Y
P[X=2;Y=0]=0,3. de y 1 0,2 0,1 0,1 0,4
0,3 0,4 0,3 Y = 0 × 0,6 + 1× 0,4
valores de x
1 2 3 Y = 0,4
valores 0 0,1 0,3 0,2 0,6 PROBABILIDADES
de y 1 0,2 0,1 0,1 0,4 MARGINAIS DE X
0,3 0,4 0,3 X = 1× 0,3 + 2 × 0,4 + 3 × 0,3 X = 2
PRECISAVA FAZER A CONTA ?
A covariância entre X e Y é igual a:
(A) -0,2 S X ,Y = 0 ×1× 0,1 + 0 × 2 × 0,3 + 0 × 3 × 0,2
(B) -0,1
(C) 0
1× 1× 0,2 + 1× 2 × 0,1 + 1× 3 × 0,1 − 0,4 × 2
(D) 0,1 S X ,Y = 0 + 0 + 0 + 0,2 + 0,2 + 0,3 − 0,8
(E) 0,2
S X ,Y = −0,1
GABARITO - B

15-(FINEP-ANALISTA-2006/NCE) O trabalho desenvolvido por X\Y -2 -1 4 5


uma pesquisadora envolve duas variáveis aleatórias. Uma delas, 1 0,1 0,2 0,0 0,3 0,6 X = 1× 0,6 + 2 × 0,4
variável X, pode assumir os valores 1 e 2. A outra, variável Y, 2 0,2 0,1 0,1 0,0 0,4
pode assumir os valores –2, –1, 4 e 5. A distribuição conjunta 0,3 0,3 0,1 0,3 1,0
X = 1,4
destas variáveis aparece abaixo.
X\Y -2 -1 4 5 Y = −2 × 0,3 − 1× 0,3 + 4 × 0,1 + 5 × 0,3
1 0,1 0,2 0,0 0,3 0,6
2 0,2 0,1 0,1 0,0 0,4
Y = −0,6 − 0,3 + 0,4 + 1,5 Y = 1,0
0,3 0,3 0,1 0,3 1,0 S X ,Y = 1× −2 × 0,1 + 1× −1× 0,2 + 1× 4 × 0,0 + 1× 5 × 0,3
A média de Y e a covariância entre X e Y são respectivamente: 2 × −2 × 0,2 + 2 × −1× 0,1 + 2 × 4 × 0,1 + 2 × 5 × 0,0
(A) 1; 1,2;
(B) 1,5; 0,8; − 1,4 ×1,0
(C) 0,8; - 0,3;
(D) 1; - 0,5; S X ,Y = −0,2 − 0,2 + 0 + 1,5 − 0,8 − 0,2 + 0,8 + 0 − 1,4
(E) 1; 0,3
S X ,Y = −2,8 + 2,3 S X ,Y = −0,5
GABARITO - D

16-(SEFAZ-AFTE-MS-2006/FGV) Analise as afirmativas a seguir, I. Se X e Y são independentes, então Cov(X;Y) = 0


a respeito de duas variáveis aleatórias X e Y. (X,Y) INDEPENDENTES ⇒ Cov(X,Y) = 0
I. Se X e Y são independentes, então Cov(X;Y) = 0. VERDADEIRO
II. Se Cov(X;Y) = 0, então X e Y são independentes.
II. Se Cov(X;Y) = 0, então X e Y são independentes.
III. Se X e Y são independentes, então E(XY) = E(X).E(Y).
FALSO
IV. Se E(XY) = E(X).E(Y), então X e Y são independentes.
Cov(X,Y) é uma medida de relação LINEAR entre X e Y
Está(ão) correta(s) a(s) afirmativa(s):
Cov(X,Y) pode ser ZERO, mas Y = X2.
Está(ão) correta(s) a(s) afirmativa(s):
(A) I, somente. III. Se X e Y são independentes, então E(XY) = E(X).E(Y).
(B) I e III, somente. Se X e Y são independentes então Cov(X,Y) = 0.
(C) I e IV, somente.
(D) II e IV, somente. Mas ⇒ Cov (X,Y) = E(XY) - E(X).E(Y)
(E) I, II, III e IV. Logo E(XY) - E(X).E(Y) = 0 ⇒ E(XY) = E(X).E(Y) !
VERDADEIRO
Obs. E(XY) = ∑XY/n E(X) = ∑X/n E(Y) = ∑Y/n

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 6 MANUEL
ACADEMIA DO CONCURSO

17-(SEAD-AM-ESTATÍSTICO-2005/CESGRANRIO) Se var(X)=4,
IV. Se E(XY) = E(X).E(Y), então X e Y são independentes. var(Y)=2 e cov(X,Y)= -1, então var(2X-Y) é igual a:
Se E(XY) = E(X).E(Y) ⇒ Cov(X,Y) = 0 ! (A) 10 var(X)=4
Mas Cov(X,Y) = 0 não significa (X,Y) INDEPENDENTES ! (B) 12
(C) 18 var(Y)=2
FALSO (D) 22 cov(X,Y)= -1
(E) 24
Var(X-Y) = Var(X) + Var(Y) - 2×Cov(X,Y)
Var(2X-Y) = Var(2X) + Var(Y) - 2×Cov(2X,Y)
Var(2X-Y) = 22Var(X) + Var(Y) - 2×2Cov(X,Y)
Var(2X-Y) = 4×4 + 2 - 4×-1
Var(2X-Y) = 16 + 2 + 4
GABARITO - B Var(2X-Y) = 22 GABARITO - D

18-(SEAD-AM-ESTATÍSTICO-2005/CESGRANRIO) Se Y = 1-X, 19- (IBGE- ANALISTA MÉTODOS QUANTITATIVOS-2002/NCE)


o Coeficiente de Correlação Linear de Pearson entre as X e Y são duas variáveis aleatórias com variâncias 144 e 64
variáveis X e Y: respectivamente. Assinale o item que NÃO indica um valor
possível para a covariância entre X e Y:
(A) é igual a -1.
(B) está compreendido entre -1 e 0. (A) 87,5
(C) é igual a 0. (B) 18,7
(D) está compreendido entre 0 e 1 (C) 0
(E) é igual a 1. (D) – 0,3
(E) – 100
Y = 1 − X ⇒ r = −1 S X2 = 144 S X = 12 S X ,Y
r= r ⇒ [-1 ; 1]
SY2 = 64 SY = 8 S X × SY
Yˆ = 1 − X ⇒ r = ????
r = está compreendido entre - 1 e 0! S X ,Y S S X ,Y
r= = X ,Y r= ⇒ |SXY| ≤ 96
12 × 8 96 96
GABARITO - A GABARITO - E

20-(SESPA-ESTATÍSTICO-2006/NCE) O diagrama de
dispersão entre duas variáveis X e Y é: Qual o sinal da COVARIÂNCIA ?

Dos valores a seguir, o que melhor representa o coeficiente de


correlação linear amostral associado a esse diagrama é:
Dos valores a seguir, o que melhor representa o coeficiente de
correlação linear amostral associado a esse diagrama é: (A) 0,80 S X ,Y SX ≥ 0 O sinal da CORRELAÇÃO é o
(B) 0,35 r=
(A) 0,80 (C) - 0,42 S X × SY mesmo sinal da COVARIÂNCIA !
(D) - 0,78
SY ≥ 0
(B) 0,35 PODE SER C) D) ou E) ?
(E) - 1,0
(C) - 0,42
(D) - 0,78 OLHOU... E VIU!
(E) - 1,0
GABARITO - A

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 7 MANUEL
ACADEMIA DO CONCURSO

21-(SMA-RIO/RJ-TÉCNICO CONTROLE INTERNO/99) Duas 22-(TRF-1RF-ESTATÍSTICO-2001/FCC) Sejam X e Y variáveis


variáveis aleatórias X e Y têm coeficiente de correlação 0,80. O aleatórias com coeficiente de correlação ρ. Se Z = X/2 + 3 e
coeficiente de correlação entre as variáveis (3+X) e 4Y é: W = -Y+2 os coeficientes de correlação de Z e W e de W e Y
a. 0,80 são dados, respectivamente, por:
b. 0,70 rXY = 0,80
S X ,Y
rXY =
c. 0,50 S X × SY (A) -ρ/2 e -1
d. 0,30
e. 0,20 (B) -ρ/2 e 1
(C) -ρ e -1
S ( 3+ X )( 4Y ) = 4 S ( XY )
(D) ρ e -1
S ( 3+ X ) = S X (E) ρ e 1
S 4Y = 4 SY
4 S XY S XY
r( 3+ X , 4Y ) = = = rXY r(3+ X , 4Y ) = 0,80
S X × 4 SY S X × S Y
GABARITO - A

Z=
X
+3 W = −Y + 2 rXY = ρ rZW = ? rWY = ? PROPRIEDADE DA VARIÂNCIA
2
S S X2 = 16 SX = 4
− XY Y = 2X
rZW = r X = 2 = − S XY = − ρ
SX SY2 = 2 2 S X2 SY2 = 4 × 16
× SY S X S Y SY2 = 64
( + 3 )( −Y + 2 )
2 SY = 8
rZW = − ρ 2
Y = −2 X
W = −Y + 2 rWY = −1 SY2 = ( −2) 2 S X2 SY2 = 4 × 16 SY2 = 64 SY = 8
2 2
OBSERVAÇÃO ⇒ S −X =S X S− X = S X
Var(-X) = Var(X) !
LOGO... S 22X = S −22 X
Multiplicar uma variável por (-1) não altera a Variância e nem o OU SEJA!
2
S CX = S −2CX
Desvio Padrão!
GABARITO - C

23-(ATRFB-2006/ESAF) O coeficiente de correlação entre duas MESMO SEM PRECISAR VAMOS CALCULAR rZY
variáveis Y e X é igual a + 0,8. Considere, agora, a variável Z
definida como: Z = 0,2 − 0,5 X. O coeficiente de correlação
rXY = 0,8 Z = 0,2 − 0,5 X rZY = ?
entre as variáveis Z e X, e o coeficiente de correlação entre as
variáveis Z e Y serão iguais, respectivamente, a: S ( 0, 2−0 ,5 X )(Y ) = −0,5 S ( XY ) PROPRIEDADE DA COVARIÂNCIA !

a) – 1,0; – 0,8 O QUE É PEDIDO?


b) + 1,0; + 0,8 S ( 0, 2−0, 5 X ) = 0,5 S ( X ) PROPRIEDADE DA VAR E DO DP!

c) – 0,5; – 0,8 rZX = ? rZY = ?


d) – 0,5; + 0,8 S −2 X = S X2 S− X = S X
e) – 0,2; – 0,4
− 0,5 S XY − S XY
O QUE SABEMOS ? rZY = r( 0, 2− 0,5 X ,Y ) = = = − rXY
0,5 S X SY S X × SY
rXY = 0,8
OLHOU E VIU !
Z = 0,2 − 0,5 X rZX = −1 SEM CONTA ! rZY = − rXY
GABARITO...
rZY = −0,8
GABARITO - A GABARITO - A

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 8 MANUEL
ACADEMIA DO CONCURSO

24-(ATRFB-2006/ESAF) Para 5 pares de observações das ∑ x = ∑ y =15 ∑ x = ∑ y 2 2


=55 ∑ xy = 39 n=5
variáveis X e Y obteve-se os seguintes resultados:

∑ x = ∑ y =15 X=
15
5
=3 Y =
15
5
=3

∑ x = ∑ y =55
2 2
S X2 =
55 2
− 3 = 11 − 9 = 2 S X2 = 2 SX = 2
5
∑ xy = 39 SY2 =
55 2
− 3 = 11 − 9 = 2 SY2 = 2 SY = 2
Sabendo-se que esses 5 pares de observações constituem a 5
totalidade da distribuição conjunta populacional dessas duas
variáveis, o valor do coeficiente de correlação entre X e Y é igual a 39 39 −6
a) + 1,000
S XY = − 3× 3 = −9 =
5 5 5
b) + 0,709
c) + 0,390 S X ,Y −6/5 −6/5
r= r= = = −0,6 r = −0,6
d) - 0,975 S X × SY 2× 2 2
e) - 0,600
GABARITO - E

25-(BACEN-ANALISTA-2005/FCC) Sejam X e Y duas variáveis (A) E(2X + 5) = 4E(X)


aleatórias e E(2X + 5) = 2E(X) + 5
I. E(X) e E(Y) as expectâncias de X e Y, respectivamente; FALSO
II. Var(X) e Var(Y) as variâncias de X e Y, respectivamente; (B) se E(XY) = E(X) . E(Y), então X e Y são independentes.
III. Cov(X,Y) a covariância de X e Y. E(XY) = E(X).E(Y) ⇒ COV(X,Y) = 0 ! Cov(X,Y)=E(XY)-E(X).E(Y)
Tem-se, em qualquer situação, COV(X,Y) = 0 NÃO implica que X e Y são independentes!
FALSO
(A) E(2X + 5) = 4E(X) (C) Var(X + 10) = Var(X) + 10
(B) se E(XY) = E(X) . E(Y), então X e Y são independentes. Var(X + 10) = Var(X)
FALSO
(C) Var(X + 10) = Var(X) + 10
(D) E(X) . E(Y) = E(XY) – Cov(X,Y)
(D) E(X) . E(Y) = E(XY) – Cov(X,Y) Cov(X,Y) = E(XY) - E(X).E(Y)
(E) Cov(X,Y) = Var(X) . Var(Y) VERDADEIRO
(E) Cov(X,Y) = Var(X) . Var(Y)
Cov(X,Y) = E(XY) - E(X).E(Y)
FALSO
GABARITO - D

26-(AFRF-2005/ESAF) Para uma amostra de dez casais S X ,Y


residentes em um mesmo bairro, registraram se os seguintes r= PRECISAMOS DA COVARIÂNCIA E DOS DESVIOS PADRÕES
S X × SY
salários mensais (em salários mínimos):

10
∑ ∑
10 10
Yi = 221 Y 2 = 5069 i =1
X iYi = 3940
i =1 i =1

∑ ∑
10 10
i =1
X i = 171 i =1
X 2 = 3171 n = 10
Sabe-se ainda que:
2

10
∑ ∑ 3171  171 
10 10
Yi = 221 Y 2 = 5069 X iYi = 3940
i =1 i =1 i =1 S X2 = −  S X2 = 24,69 S X ≅ 4,97
10  10 
∑ ∑
10 10 2
X i = 171 X = 3171 2
i =1 i =1
5069  221  SY2 = 18,49 SY ≅ 4,31
Assinale a opção cujo valor corresponda à correlação entre os SY2 = − 
10  10 
salários dos homens e os salários das mulheres.
a) 0,72 3940
b) 0,75
S XY = − 22,1× 17,1 S XY = 16,09
c) 0,68
10
d) 0,81 S X ,Y
e) 0,78
16,09 r ≅ 0,75
r= r= ≅ 0,75
S X × SY 4,97 × 4,31 GABARITO - B

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 9 MANUEL
ACADEMIA DO CONCURSO

RAIZ QUADRADA 27- (ICMS-RJ-2010) Duas variáveis aleatórias x e y têm


S X2 = 24,69 coeficiente de correlação linear igual a 0,8. Se w e z são tais
que w = 2x - 3 e z = 4 - 2y então o coeficiente de correlação
entre w e z será igual a:
24,69 + 25 49,69 (A) -0,8
24,69 = = ≅ 4,969 S X ≅ 4,97 (B) -0,64
2×5 10 (C) 0,36
(D) 0,64
(E) 0,8
SY2 = 18,49 rWZ = ?
O QUE É PEDIDO?

18,49 + 16 34,49 O QUE SABEMOS ?


18,49 = = ≅ 4,311 SY ≅ 4,31
2× 4 8 rXY = 0,8 W = 2X −3 Z = 4 − 2Y

rWZ = ?

O QUE SABEMOS ? 28- (ICMS-RJ-2008) Sejam X, Y e Z três variáveis com


correlações de Pearson expressas pela matriz abaixo:
rXY = 0,8 W = 2 X − 3 Z = 4 − 2Y
X Y Z
X 1,000
rWZ = r( 2 X −3, 4− 2Y ) Y
Z
0,800
0,000
1,000
-0,500 1,000

2 × −2 × S XY Pode-se, então, afirmar que:


r( 2 X −3, 4− 2Y ) = (A) X e Z são independentes.
(B) a correlação parcial entre X e Y, após a correção para Z, é
2 S X × 2 SY negativa.
(C) o coeficiente de determinação da regressão de Y em X é maior
− 4 S XY − S XY do que 60%.
r( 2 X −3, 4− 2Y ) = = = − rXY (D) a correlação entre V = a + b.X e W = c + d.Z, com a ≠ 0, c ≠ 0,
4 S X × SY S X × S Y b > 0 e d < 0 é negativa.
(E) a covariância entre X e Y e igual a 0,64.
rWZ = − rXY rWZ = −0,8
GABARITO - A

MATRIZ DE CORRELAÇÃO MATRIZ DE CORRELAÇÃO


X Y Z X Y Z É SIMÉTRICA!
É SIMÉTRICA!
X 1,00 X 1,000
rXX = 1,0 rXY = 0,80 rXX = 1,0 rXY = 0,80
Y 0,80 1,00 Y 0,800 1,000
Z 0,00 -0,50 1,00 rXZ = 0,00 rZY = −0,50 Z 0,000 -0,500 1,000 rXZ = 0,00 rZY = −0,50
Pode-se, então, afirmar que:
Pode-se, então, afirmar que:
(C) o coeficiente de determinação da regressão de Y em X é maior
(A) X e Z são independentes. do que 60%.
rXZ = 0,00 ⇒ Cov(X,Z) = 0 VERDADEIRO!
Mas, Cov(x,z) = 0 não significa que são independentes !
COEFICIENTE DE DETERMINAÇÃO (r2) ⇒ é o quadrado do
No entanto, se são independentes Cov(x,z) = 0!
coeficiente de correlação.
FALSO !
2 2
(B) a correlação parcial entre X e Y, após a correção para Z, é
rXY = (0,80) 2 = 0,64 rXY = 0,64 = 64% > 60%
negativa. COEFICIENTE DE DETERMINAÇÃO ⇒ significa o quanto da
rXY = 0,80 ⇒ POSITIVA ! variável dependente (Y) é explicada pela variável independente (X).
FALSO ! Nesse exemplo X explica 64% da variação de Y. Os 36% restantes
são devidos a fatores aleatórios (não mensuráveis pelo modelo!).

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 10 MANUEL
ACADEMIA DO CONCURSO

X Y Z MATRIZ DE CORRELAÇÃO MATRIZ DE CORRELAÇÃO


É SIMÉTRICA! X Y Z É SIMÉTRICA!
X 1,000
X 1,000
Y 0,800 1,000 rXX = 1,0 rXY = 0,80 rXX = 1,0 rXY = 0,80
Y 0,800 1,000
Z 0,000 -0,500 1,000 rXZ = 0,00 rZY = −0,50 Z 0,000 -0,500 1,000 rXZ = 0,00 rZY = −0,50
Pode-se, então, afirmar que:
Pode-se, então, afirmar que:
(D) a correlação entre V = a + b.X e W = c + d.Z, com a ≠ 0, c ≠ 0,
b > 0 e d < 0 é negativa. (E) a covariância entre X e Y e igual a 0,64.

V = a + b.X W = c + d.Z b>0 ; d<0 S X ,Y


rXY =
S ( a + bX ,c + dZ ) S X × SY
rVW = r(a + bX , c + dZ) = -S(X,Z) porque d<0 !
S ( a + bX ) × S ( c + dZ ) S X ,Y = rXY × S X × SY rXY = 0,80
S ( bX ,dZ ) bdS ( X , Z ) − S( X , Z ) S X ,Y = 0,80 × S X × SY
rVW = = = = − rXZ ⇒ rVW = − rXZ
S ( bX ) × S ( dZ ) bS X × dS Z SX × SZ Não conhecemos os valores de SX e SY!
Como rXZ = 0,00 ⇒ rVW = 0,00 FALSO FALSO
GABARITO - C

CORRELAÇÃO PARCIAL ⇒ é uma medida da correlação REGRESSÃO


entre duas variáveis quando se exclui o efeito, sobre estas, de
uma terceira variável. 29- Sabendo-se que: ∑X = 10; ∑Y = 36; ∑XY = 100;
∑X2 =30 e n = 4, a reta de regressão para esses valores será:
rXY − rXZ rYZ CORRELAÇÃO PARCIAL ENTRE
rXY . Z = X E Y EXCLUINDO Z ! a. Y = -4X + 2
2
1 − rXZ × 1 − rYZ2 b. Y = -4X – 2
c. Y = 2X + 4
d. Y = 4X + 2
ANALOGIA ⇒ DERIVADA PARCIAL
e. Y = -2X - 4
f ( x, y, z ) f ( x , y , z ) = 4 x + 6 y + 10 z
Yˆ = a + bX
∂f ∂f ∂f
=4 =6 = 10 S XY PRECISAMOS CALCULAR A COVARIÂNCIA ENTRE X E Y E A
∂x ∂y ∂z b= VARIÂNCIA DE X!
S X2
 ∂ f ∂ f ∂f 
∇ f =  , ,  ∇f = (4,6,10 ) VETOR DE GRADIENTE !
 ∂x ∂ y ∂z  a = Y − bX

∑X = 10; ∑Y = 36; ∑XY = 100; ∑X2 =30 n=4 30- Dada a tabela abaixo, estimar a reta de regressão:

X Y
CÁLCULO DA VARIÂNCIA DE X
1 1
Yˆ = a + bX n=5

∑x
2
2
30  10  2 2 S XY
S X2 =
i
− x2 S X2 = −  S X2 = 1,25
n 4 4 3 4
b=
S X2
CÁLCULO DA COVARIÂNCIA 4 5
5 8
S X ,Y =
∑ XY − XY S X ,Y =
100 10 36
− × S X ,Y = 2,5 a = Y − bX
n 4 4 4
a. Y = -1,1 + 1,7X
S 2,5
b = XY b= b=2 b. Y = -1,7 + 1,1X
S X2 1,25 c. Y = -1,1 - 1,7X
36 10 d. Y = -1,7 - 1,7X
a = Y − bX a= − 2× a=4
4 4
Yˆ = a + bX Yˆ = 4 + 2 X GABARITO - C

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 11 MANUEL
ACADEMIA DO CONCURSO

X Y X2 Y2 XY 55  15 
2
2 O enunciado seguinte deverá ser usado para responder as
S X2 = −   S X = 11 − 9 S X = 2
2

1 1 1 1 1 questões de 31 a 37.
5 5 A reta de mínimos quadrados para um conjunto de pontos é .
2 2 4 4 4
12 S X ,Y = ∑
XY yˆ = 3 + 2 x
3 4 9 16 − XY
4 5 16 25 20 n 31- Em relação a covariância pode-se afirmar que:
77 15 20 S = 3,4 a. é positiva pois o coeficiente angular é negativo
5 8 25 64 40 S
X ,Y = − × X ,Y b. é positiva pois o coeficiente angular é positivo
15 20 55 110 77 5 5 5 c. é negativa pois o coeficiente angular é negativo
S XY 3,4 d. é negativa pois o coeficiente angular é positivo
b= b= b = 1,7 e. é igual a zero pois o coeficiente angular é nulo
S X2 2 Coeficiente Linear ⇒ a
20 15 Yˆ = a + bX Coeficiente Angular ⇒ b
a = Y − bX a= − 1,7 × a = − 1,1
5 5 yˆ = 3 + 2 x a = 3 b = 2
Yˆ = a + bX Yˆ = −1,1 + 1,7 X GABARITO - A b=
S XY
⇒ S XY > 0 Obs. S X2 ≥ 0
S X2 GABARITO - B

32- Em relação ao coeficiente de correlação da reta do exercício 33- O coeficiente angular da reta vale:
anterior pode-se afirmar que: a. 3 b. -2 c. 0 d. 2
a. r = 1 b. r = -1 c. 0 < r < 1 d. -1 < r < 0
yˆ = 3 + 2 x a =3 b=2
yˆ = 3 + 2 x a =3 b=2
Coeficiente Linear ⇒ a
S X ,Y S Coeficiente Angular ⇒ b GABARITO - D
r= b = 2 b = XY ⇒ S XY > 0 pois S ≥ 0 2
X
S X × SY S X2
Como SX ≥ 0 e SY ≥ 0 o sinal de r é o mesmo sinal de SXY! 34- O coeficiente linear (intercept) da reta vale:
a. 2 b. 0 c. 3 d. -3
Logo ⇒ 0 < r < 1

GABARITO - C

GABARITO - C

35- O valor estimado de y para x = -1,5 é:


Ŷ Yˆ = a + bX • a. 0 b. 3 c. 2 d. -1,5


• ⇒ Y OBSERVADO • •
• • • yˆ = 3 + 2 x yˆ = 3 + 2 × (−1,5) yˆ = 3 − 3 yˆ = 0
• • •
• • • GABARITO - A

• • • •
• • 36- A reta corta o eixo dos x no ponto:

• • • • • a. 3 b. -1,5 c. 1,5 d. 2
• • yˆ = 3 + 2 x x = −1,5
• • • yˆ = 0 0 = 3 + 2 x 2 x = −3
a a ⇒ COEFICIENTE LINEAR (INTERCEPT) PRECISAVA FAZER A CONTA ?
θ GABARITO - B
X 37- O valor estimado yˆ = 1 corresponde a um valor da variável
independente de:
b ⇒ COEFICIENTE ANGULAR = tg(θ
θ) a. 1 b. -2 c. -1 d. 0
yˆ = 1 1 = 3+ 2x 2x = 1− 3 2 x = −2 x = −1
RETA DE REGRESSÃO
GABARITO - C

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 12 MANUEL
ACADEMIA DO CONCURSO

38- (ACE-ESAF) A tabela abaixo exibe o consumo de 39- (ACE-ESAF) O coeficiente de correlação do exercício
determinado item no período de 1999 a 2007. anterior é 0,98. Este resultado significa que a previsão:
Ano Consumo Sabendo-se que os valores dos parâmetros para a. pode ser efetuada com relativa margem de segurança, pois o
1999 1
a reta ajustada são a = - 0,57 e b = 1,27, e que as valor de r está muito próximo de 1
2000 2
condições de mercado permanecem inalteradas, a b. não pode ser efetuada, dado que o valor de r está distante de
2001 4
2002 4 previsão de consumo para 2008 será: 100
2003 5 a. 37,53 c. não pode ser efetuada, pois este resultado expressa uma
2004 7 b. 13,27
c. 12,13
Yˆ = a + bX relação linear
2005 8 d. pode ser efetuada, dada a importante significância deste
d. 46,61 a = - 0,57
2006 9 resultado
e. 14,79 b = 1,2
2007 12
e. não pode ser efetuada, dado que o valor de r não pode ser
Yˆ = −0,57 + 1,27 X X = ???? menor do que 1
X = 10
r varia entre -1 e 1
Yˆ = −0,57 + 1,27 × 10 Yˆ = −0,57 + 12,7
r = 0,98 ⇒ forte correlação positiva !
Yˆ = 12,13
Obs. É uma REGRESSÃO contra o TEMPO(X) ! GABARITO - C GABARITO - D

40- (BACEN) Das afirmações: I. O coeficiente de determinação (R2) mede o quanto da variação
I. O coeficiente de determinação (R2) mede o quanto da variação da variável independente, é explicada pela variável dependente.
da variável independente, é explicada pela variável dependente.
II. O coeficiente de determinação é um real no intervalo [0,1]. Yˆ = a + bX
III. A qualidade do ajuste de um modelo é medida pelo
COEFICIENTE DE DETERMINAÇÃO
coeficiente de variação entre as variáveis dependente e
independente. ⇒ r2 varia entre 0 e 1 ⇒ [ 0 ≤ r2 ≤ 1]
IV. O método dos mínimos quadrados consiste em minimizar a
⇒ Mede o quanto da variação da variável DEPENDENTE (Y) é
soma dos quadrados dos desvios entre os valores observados e
os valores estimados, pelo modelo ajustado. explicada pela variável INDEPENDENTE (X).
V. O processo de determinação dos parâmetros de uma reta de
⇒ FALSO
regressão é chamado de ajustamento.
a. Todas são corretas II- O coeficiente de determinação é um real no intervalo [0,1]
b. Todas são incorretas VERDADEIRO
c. II e III são incorretas
d. I, II e V são corretas
e. II, IV e V são corretas

III. A qualidade do ajuste de um modelo é medida pelo 41- (AFPS-ESAF) Assinale a alternativa incorreta:
coeficiente de variação entre as variáveis dependente e
independente. a. Se a covariância entre duas variáveis é negativa, então a
Coeficiente de Variação é uma medida de dispersão! correlação linear entre essas variáveis será também negativa.
FALSO
b. O valor do coeficiente angular no modelo linear de regressão
IV. O método dos mínimos quadrados consiste em minimizar a
soma dos quadrados dos desvios entre os valores observados e é equivalente a tangente do ângulo que a reta de regressão
os valores estimados, pelo modelo ajustado. forma com o eixo dos X.
Yˆ = α + βX e (desvio) = (Y − Yˆ ) c. Um valor nulo para o coeficiente linear, significa que a
min ∑ ê 2 min ∑ (Y − Yˆ ) 2 min ∑ [Y − (α + β X )]
2
covariância linear entre a variável dependente e a variável
min ∑ [Y − α − βX ]
2
independente é zero.
VERDADEIRO d. A correlação linear perfeita ocorre quando os pontos
V. O processo de determinação dos parâmetros de uma reta de observados estão perfeitamente alinhados sobre uma reta.
regressão é chamado de ajustamento.
VERDADEIRO GABARITO - E

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 13 MANUEL
ACADEMIA DO CONCURSO

41- (AFPS-ESAF) Assinale a alternativa incorreta: 41- (AFPS-ESAF) Assinale a alternativa incorreta:
c. Um valor nulo para o coeficiente linear, significa que a
a. Se a covariância entre duas variáveis é negativa, então a
covariância linear entre a variável dependente e a variável
correlação linear entre essas variáveis será também negativa.
independente é zero.
S X ,Y
r= Yˆ = a + bX a = 0 ⇒ Yˆ = bX
S X × SY
Coeficiente Linear ⇒ a
Como SX ≥ 0 e SY ≥ 0 o sinal de r é o mesmo sinal de SXY! Coeficiente Angular ⇒ b
a = 0 ⇒ a reta de regressão passa pela origem!
b. O valor do coeficiente angular no modelo linear de regressão
é equivalente a tangente do ângulo que a reta de regressão INCORRETA
forma com o eixo dos X.
d. A correlação linear perfeita ocorre quando os pontos
Yˆ = a + bX observados estão perfeitamente alinhados sobre uma reta.

b = tg (θ )
GABARITO - C

42- (ACE-ESAF) A tabela abaixo exibe o consumo de determinado item no período de


1999 a 2007.
∑ t
X
t
= 4 5 9 , 4 ;
∑ t
Y
t
= 5 9 ;
∑ t
(X
t
− M
x
) 2 = 0 , 4 4 4 ;
∑ t
(Y
t
− M
y
) 2 = 1 6 0 0 , 9

a ) yˆ i = 0,57 + 1,27 xi
Ano-X Consumo-Y Para obter-se um modelo de regressão
1999 1 linear do consumo contra o tempo são
b) yˆ i = −0,57 + 1,27 xi
2000 2
fornecidas as seguintes informações: c ) yˆ i = −0,78 + 1,27 x i
2001 4
2002
2003
4
5
∑ X = 45 ∑ ( X − X ) = 60
i i i i
2

d ) yˆ i = −0,57 + 1,37 xi
∑ Y = 52 ∑ (Y −Y ) = 99,56
2
2004 7 i
i i i
2005 8 e ) yˆ i = 0,57 + 2,78 x i
2006
2007
9
12
∑ (X − X )(Y − Y ) = 76
i i i

Assinale a opção que representa a equação da reta de mínimos quadrados

ajustada: yˆ i = aˆ + bˆ.xi + ε i onde aˆ e bˆ são parâmetros desconhecidos e εi


são não correlacionados e provenientes de distribuições com média zero e
variância constante σ2.

∑ t
X
t
=
∑ X = 45 ∑ ( X − X ) = 60 ∑ Y
4 5 9 , 4 ;
∑ t
Y
t
= 5 9 ;
∑ t
(X
t
− M
x
) 2 =
i
0 , 4 4 4 ;
∑ t
(Y
t
− M
y
) 2 = 1 6 0 0 , 9
i i i
2
i i = 52 ∑ (Y − Y )
i i
2
= 99,56
∑ t
X
t
=
∑ X = 45 ∑ ( X − X ) = 60 ∑ Y
4 5 9 , 4 ;
∑ t
Y
t
= 5 9 ;
∑ t
(X
t
− M
x
) 2 =
i
0 , 4 4 4 ;
∑ t
(Y
t
− M
y
) 2 = 1 6 0 0 , 9
i i i
2
i i = 52 ∑ (Y − Y )
i i
2
= 99,56

∑ (X − X )(Y − Y ) = 76 i i i ∑ (X − X )(Y − Y ) = 76 n=9


i i i

S XY S XY
Yˆ = a + bX b=
S X2
a = Y − bX Yˆ = a + bX b=
S X2
a = Y − bX

S X ,Y =
∑ XY − XY COVARIÂNCIA S X2 =
∑x i
2

− x2 VARIÂNCIA ∑ (X − X )× (Y − Y ) S XY =
76
S XY = 8, 44
n S XY = 9
n n
E AGORA ?
∑ (X − X )
2
60 S X2 = 6,67
S X2 = S X2 =
S XY =
∑ (X − X )× (Y − Y ) ⇒ MÉDIA DO PRODUTO DOS DESVIOS n 9
n 8,44 52 45
b= b = 1,27 a= − 1, 27 × a = − 0,57
6,67 9 9
∑ (X − X )
2
2 ⇒ MÉDIA DO QUADRADO DOS DESVIOS
S X =
n Yˆ = −0,57 + 1,27 X GABARITO - B

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 14 MANUEL
ACADEMIA DO CONCURSO

43- (ACE-ESAF) Assinale a opção que representa o valor do S X ,Y


coeficiente de correlação linear entre as variáveis X e Y da r= S XY = 8,44 S X2 = 6,67
questão anterior. S X × SY
a. 0,964
b. 0,903 S X ,Y
∑Y i i = 52 ∑ (Y − Y )
i i
2
= 99,56
c. 0,892 r=
∑ (Y − Y )
2
S X × SY 99 ,56
d. 0,983 SY2 = SY2 = SY2 = 11,062
e. 0,912 n 9

S XY = 8, 44 S X2 = 6,67
S X ,Y 8,44 8,44
r= r= r=
S X × SY 6,67 × 11,062
∑i Yi = 52 ∑ (Y − Y )
i i
2
= 99,56
73,78

PRECISAMOS CALCULAR 8,44


r= r = 0,983
DESVIO PADRÃO DE X ⇒ JÁ TEMOS A VARIÂNCIA DE X 8,59
DESVIO PADRÃO DE Y ⇒ PRECISAMOS DA VARIÂNCIA DE Y GABARITO - D
73,78 + 81 154,78
73,78 = = = 8,59
2×9 18

(AFRF-ESAF) Para efeito das duas questões 44 e 45, considere X Y X2 Y2 XY S X ,Y n=6


r=
a seguinte tabela que apresenta valores referentes às variáveis 1 5 1 25 5 S X × SY
x e y porventura relacionadas. Valores das variáveis X e Y 2 7 4 49 14 2
relacionadas 3 12 9 144 36 S 2 = 91 −  21  S X2 ≅ 2,92 S X ≅ 1,71
X
4 13 16 169 52 6  6 
X Y X2 Y2 XY 44- Marque a opção que representa 5 18 25 324 90 2
1 5 1 25 5 o coeficiente de correlação linear 6 20 36 400 120 SY2 =
1111  75  SY2 ≅ 28,92 SY ≅ 5,38
− 
2 7 4 49 14 entre as variáveis X e Y. ∑ 21 75 91 1111 317 6  6 
3 12 9 144 36
4 13 16 169 52
5 18 25 324 90 S X ,Y =
∑ XY − XY S X ,Y =
317  21 75 
− ×  S X ,Y ≅ 9,08
6 20 36 400 120 n 6 6 6
∑ 21 75 91 1111 317
S X ,Y 9,08 r = 0,989
a. 0,900 r= r=
b. 0,926 S X × SY 1,71 × 5,38
c. 0,947
d. 0,967
e. 0,989

45-(AFRF-96/ESAF) Marque a opção que representa a equação 46-(AFRF-98/ESAF) O logaritmo neperiano (ln) de um índice de
. ˆ i = aˆ + bˆxi
da reta ajustante de mínimos c.quadrados y produção Y está associado ao logaritmo neperiano de um índice
a ) yˆ i = 1,601 + 3,114 x i de insumos Q através da relação linear: ln(Y) = α + β ln(Q) + e.
Para uma amostra de 100 observações envolvendo dados de
b) yˆ i = 1,643 + 3,482 x i
produção e quantidade, encontraram-se como estimadores de α
c ) yˆ i = 1,685 + 3,271xi e β as quantidades 1 e 2, respectivamente.
d ) yˆ i = 1,713 + 2,992 xi Assinale a opção correta.
e ) yˆ i = 1,726 + 2,864 x i a) A variação logarítmica esperada na produção por unidade de
variação em Q será de ln(2).
9,08 S XY b) A variação esperada no logaritmo do produto Y por unidade de
b= b= b = 3,114 variação no logaritmo de Q depende de Q e quando Q=exp(2) vale 4.
2,92 S X2
c) A variação esperada no logaritmo do produto Y por unidade de
75 21 variação no logaritmo de Q não depende de Q e é constante igual 2.
a = Y − bX a= − 3,114 × d) A variação esperada em ln(Y) por unidade de variação em ln(Q) não
6 6 está definida.
e) A variação esperada no logaritmo do produto Y por unidade de
a = 1,601 GABARITO - A variação no logaritmo de Q depende de Q e quando Q=exp(2) vale 5.

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 15 MANUEL
ACADEMIA DO CONCURSO

Y = ÍNDICE PRODUÇÃO Y = ÍNDICE PRODUÇÃO


Q = ÍNDICE INSUMO
ln(Y) = α + β ln(Q) + e Q = ÍNDICE INSUMO
ln(Y) = α + β ln(Q) + e

α=1 α=1
ln(Y) = 1 + 2 ln(Q) ln(Y) = 1 + 2 ln(Q)
β=2 β=2

a) A variação logarítmica esperada na produção por unidade de b) A variação esperada no logaritmo do produto Y por unidade
variação em Q será de ln(2). de variação no logaritmo de Q depende de Q e quando
Q=exp(2) vale 4.
ln(Y) = 1 + 2 ln(Q) ln(Y) = 1 + 2 ln(Q)
d ln Y d ln Y
=2 ⇒ Variação esperada de Y por unidade de variação no = 2 ⇒ A variação esperada no logaritmo do produto Y por unidade
d ln Q logaritmo de Q vale 2 ! d ln Q de variação no logaritmo de Q é CONSTANTE igual a 2.

FALSO FALSO
Obs. ex = exp(x)
Obs. ex = exp(x)
n ∞
 1 1
e = BASE DO LOGARITMO NEPERIANO e = lim  1 +  e=∑
 n n = 0 n!
n → ∞

Y = ÍNDICE PRODUÇÃO Y = ÍNDICE PRODUÇÃO


Q = ÍNDICE INSUMO
ln(Y) = α + β ln(Q) + e Q = ÍNDICE INSUMO
ln(Y) = α + β ln(Q) + e

α=1 α=1
ln(Y) = 1 + 2 ln(Q) ln(Y) = 1 + 2 ln(Q)
β=2 β=2
c) A variação esperada no logaritmo do produto Y por unidade d) A variação esperada em ln(Y) por unidade de variação em
de variação no logaritmo de Q não depende de Q e é constante ln(Q) não está definida.
igual 2.
ln(Y) = 1 + 2 ln(Q) ln(Y) = 1 + 2 ln(Q)
d ln Y d ln Y
= 2 ⇒ A variação esperada no logaritmo do produto Y por unidade =2 ⇒ Variação esperada de Y por unidade de variação no
d ln Q de variação no logaritmo de Q é CONSTANTE igual a 2. d ln Q logaritmo de Q ESTÁ DEFINIDA e vale 2 !

VERDADEIRO FALSO

Obs. ex = exp(x) Obs. ex = exp(x)

Y = ÍNDICE PRODUÇÃO
ln(Y) = α + β ln(Q) + e DERIVADA ⇒ MEDE VARIAÇÃO !
Q = ÍNDICE INSUMO
α=1 DERIVADA DO ESPAÇO EM RELAÇÃO AO TEMPO
ln(Y) = 1 + 2 ln(Q) ⇒ VELOCIDADE !
β=2
e) A variação esperada no logaritmo do produto Y por unidade DERIVADA DA VELOCIDADE ESPAÇO EM
de variação no logaritmo de Q depende de Q e quando RELAÇÃO AO TEMPO
Q=exp(2) vale 5.
⇒ ACELERAÇÃO !
ln(Y) = 1 + 2 ln(Q)
DERIVADA DO PREÇO DE UMA CESTA DE
d ln Y PRODUTOS EM RELAÇÃO AO TEMPO
= 2 ⇒ A variação esperada no logaritmo do produto Y por unidade
d ln Q de variação no logaritmo de Q é CONSTANTE igual a 2. ⇒ INFLAÇÃO !
FALSO

Obs. ex = exp(x)
GABARITO - C

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 16 MANUEL
ACADEMIA DO CONCURSO

MATEMATICAMENTE 47-(ACE-98/ESAF) Uma empresa tem interesse em estudar o


DERIVADA DE ALGUMAS FUNÇÕES BÁSICAS
efeito dos gastos com propaganda X (em R$ 10.000,00) no
f ( x) = c f '( x) = 0 c - constante
volume de vendas Y (em R$ 10.000,00). Não há sazonalidade
f ( x) = 2 x + 8 f '( x) = 2 f ' ⇒ Derivada de f aparente na evolução de Y e o modelo linear Yt=α+βXt+ε
representa uma aproximação plausível para o ajuste dos
f ( x) = x 2 f '( x) = 2 x
dados da tabela abaixo. Tais dados representam pares de
f ( x) = 5 x 2
f ' ( x ) = 10 x observações (Xt , Yt) ao longo de 10 meses escolhidos ao

1 acaso. Na equação do modelo linear α e β são parâmetros


f ( x ) = ln( x ) f ' ( x) =
x desconhecidos e εt são não correlacionados e provenientes de
f ( x) = e x
f ' ( x) = e x
distribuições com média zero e variância constante σ2.

Mês X Y Pretende-se utilizar a técnica de mínimos quadrados para


∑ ∑ (X
2
t X t = 9, 4 − M x ) = 0,444 n = 10
1 1,2 101 estimar os parâmetros do modelo linear. Com este fim
t t

2 0,8 92 calcularam-se as quantidades seguintes:


∑ Y = 959 ∑ (Y − M ) = 1600 ,9
2
t t t t y
3 1,0 110
∑ ∑
2
t ( X t − M x ) = 0, 444
4
5
1,3
0,7
120
90
t X t = 9, 4
∑ t ( X t − M x )(Yt − M y ) = 23 ,34
6
7
0,8
1,0
82
93

t Yt = 959 t Yt − M y
2
∑ (
= 1600 ,9 ) Yt = α + βXt + ε t β=
S XY α = Y − βX
S X2
8 0,6 75 ∑ (
t X t − M x Y t − M y = 23 ,34)( )
9 0,9 91 ∑ (X − X )
2
S X2 =
∑ (X − M ) x
2
S X2 =
0,444 S X2 = 0,0444
10 1,1 105 S X2 = n 10
n
Nestas expressões Mx representa a média aritmética dos valores Xt e My a
média aritmética dos valores Yt. Assinale a opção que corresponde à
S XY =
∑ (X − X )× (Y − Y ) S XY =
∑ ( X − M )× (Y − M )
x y S XY =
23,34
estimativa do aumento esperado no nível de vendas (em R$ 10.000,00) n n 10
decorrente do aumento de R$ 10.000,00 de gastos com publicidade.
a. 60,31 S XY = 2,334
b. 53,43
c. 51,26
d. 52,57
e. 57,00

∑ ∑ (X Nestas expressões Mx representa a média aritmética dos valores


2
t X t = 9, 4 t t − M x ) = 0,444 n = 10
Xt e My a média aritmética dos valores Yt. Assinale a opção que
∑ Y = 959 ∑ (Y − M ) = 1600 ,9
2
t t t t y corresponde à estimativa do aumento esperado no nível de
vendas (em R$ 10.000,00) decorrente do aumento de
∑ t ( X t − M x )(Yt − M y ) = 23 ,34 R$ 10.000,00 de gastos com publicidade.
Yt = α + βXt + ε t S XY α = Y − βX
β= Yt = 46,49+ 52,57Xt Obs. X está medido em R$ 10.000,00
S X2
S X2 = 0,0444 S XY O QUE ESTÁ SENDO PEDIDO ?
β= β = COVARIÂNCIA / VAR(X)
O AUMENTO EM Y DECORRENTE DO AUMENTO DE
S XY = 2,334 S X2
R$ 10.000,00 EM X, OU SEJA DE UMA UNIDADE DE X !
2,334 CONCEITUALMENTE É A DERIVADA DE Y EM RELAÇÃO A X!
β= β = 52,57
0,0444 Yt = 46,49 + 52,57Xt dY
959 9,4 = 52 ,57
α = Y − βX α= − 52 ,57 × α = 46 , 49 dX
10 10 Yt = α + βXt + εt
Yt = 46,49 + 52,57Xt dY
= β ⇒ Não precisava calcular o α
dX GABARITO - D

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 17 MANUEL
ACADEMIA DO CONCURSO

48-(ELETROBRÁS-ESTATÍSTICO-2002/NCE) Para verificar a Resíduos


adequação do modelo de regressão utilizado, o gráfico a seguir,
dos resíduos contra os valores ajustados, foi observado:

Valores
Ajustados

Teria que ser assim!

Essa configuração indica que:


(A) o modelo utilizado é adequado, com um coeficiente de determinação elevado;
(B) a variância não é constante, embora oscile numa faixa definida de valores;
Essa configuração indica que: (C) existe uma auto correlação positiva que, entretanto fica atenuada com o passar
(A) o modelo utilizado é adequado, com um coeficiente de determinação elevado; do tempo;
(B) a variância não é constante, embora oscile numa faixa definida de valores; (D) é necessária a inclusão de termos extras no modelo ou uma transformação da
(C) existe uma auto correlação positiva que, entretanto fica atenuada com o passar variável dependente;
do tempo; (E) a suposição de normalidade dos resíduos não se verifica.
(D) é necessária a inclusão de termos extras no modelo ou uma transformação da
variável dependente;
(E) a suposição de normalidade dos resíduos não se verifica.
GABARITO - D

10 10 10
49-(ICMS-SP-2006/FCC) Em um determinado país, deseja-se determinar a relação
entre a renda disponível (Y), em bilhões de dólares, e o consumo (C), também em
S1 = ∑ C i = 90 S 2 = ∑ Yi = 100 S 3 = ∑ Yi C i = 1 .100
i =1 i =1 i =1
bilhões de dólares. Foi utilizado o modelo linear simples Ci = α + βYi + εi, em que Ci é o 10 10
consumo no ano i, Yi é o valor da renda disponível no ano i e εi o erro aleatório com as S 4 = ∑ Yi 2 = 1 .250 S 5 = ∑ C i2 = 1 .010 n = 10
respectivas hipóteses para a regressão linear simples. α e β são parâmetros i =1 i =1
desconhecidos, cujas estimativas foram obtidas através do método dos mínimos
quadrados. Para obtenção desta relação considerou-se ainda as seguintes C = α + β Y + e ⇒ RENDA(Y) EXPLICA O CONSUMO (C)
informações colhidas através da observação nos últimos 10 anos:
10 1100 90 100 S CY = 110 − 90 S CY = 20
S1 = ∑ C i = 90
10
S 2 = ∑ Y i = 100
10
S 3 = ∑ Y i C i = 1 .100 S CY = − ×
i =1 i =1 i =1
10 10 10
10 10 2
S 4 = ∑ Yi 2 = 1 .250 S 5 = ∑ C i2 = 1.010 1250  100  S Y2 = 125 − 100 S Y2 = 25
i =1 i =1 S Y2 = − 
Para o cálculo do coeficiente de correlação de Pearson (R), usou-se a 10  10 
fórmula: em que Cov(Y,C) é a covariância de Y e C, DP(Y) é o S 20 4
desvio padrão de Y e DP(C) é o desvio padrão de C. Então, β = CY2 β = β = β = 0 ,8
(A) o coeficiente de explicação (R2) correspondente é igual a 64%. SY 25 5
(B) utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se
que, em um ano, caso a renda disponível seja igual a 15 bilhões de dólares, o α = C − βY
consumo será igual a 13 bilhões de dólares.
α = 9 − 0,8 × 10 α = 1
(C) obtendo para um determinado ano uma previsão para o consumo de 10 bilhões de
dólares, significa que a renda disponível considerada foi de 12,5 bilhões de dólares. C = 1 + 0,8Y ⇒ MODELO AJUSTADO !
(D) o valor da estimativa encontrado para o parâmetro β é igual a 0,4.
(E) o valor da estimativa encontrado para o parâmetro α é igual a 10.

Cov (Y , C ) (A) o coeficiente de explicação (R2) correspondente é igual a 64%.


r= S CY = 20 S Y2 = 25 SY = 5 r2 = 0,80
DP (Y ) DP (C ) FALSO
2 (B) utilizando a equação da reta obtida pelo método dos mínimos quadrados,
1010  90  S C2 = 101 − 81 S C2 = 20 S C ≅ 4,5 tem-se que, em um ano, caso a renda disponível seja igual a 15 bilhões de
S C2 = − 
10  10  dólares, o consumo será igual a 13 bilhões de dólares.
20 + 16 36
20 = = = 4,5 C = 1 + 0,8Y
2×4 8 Y = 15
20 20 C = 1 + 0,8×15
r= = r ≅ 0,89 C = 1 + 12
5 × 4,5 22,5
C = 13
VERDADEIRO
r 2 ≅ 0,80 (C) obtendo para um determinado ano uma previsão para o consumo de 10 bilhões
de dólares, significa que a renda disponível considerada foi de 12,5 bilhões de dólares.
C = 1 + 0,8Y
Y = 12,5
C = 1 + 0,8×12,5
C = 1 + 10
C = 11
FALSO

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 18 MANUEL
ACADEMIA DO CONCURSO

50-(AFPS-2002/ESAF) Uma empresa presta serviços de


(D) o valor da estimativa encontrado para o parâmetro β é igual a 0,4.
manutenção de eletrodomésticos em domicílio. Para cada um de
β = 0,8 18 atendimentos coletou o tempo gasto em minutos (y) com a
FALSO manutenção e o número de máquinas servidas (x). Postula-se
que o modelo linear Yi = α + βXi + εi seja adequado, onde α e β
(E) o valor da estimativa encontrado para o parâmetro α é igual a 10. são parâmetros desconhecidos e os εi são componentes de erro
α=1 não diretamente observáveis, não correlacionados, com média
nula e variância σ2 desconhecida. As estimativas de mínimos
FALSO quadrados dos parâmetros do modelo linear são dadas por:
αˆ = 10, βˆ = 2 e σ 2 = 4
A estimativa do aumento esperado de tempo por máquina
adicional servida por chamada é de
a) 2 minutos
b) 10 minutos
c) 12 minutos
d) 5 minutos
GABARITO - B e) 6 minutos

Y ⇒ TEMPO GASTO NA MANUTENÇÃO A estimativa do aumento esperado de tempo (Y) por máquina
adicional servida (X) por chamada é de
X ⇒ NÚMERO DE MÁQUINAS (SERVIDAS) ATENDIDAS
Yi = α + β X
Yi = α + βXi + εi ⇒ MODELO LINEAR ADOTADO!
dY
EXISTE CORRELAÇÃO ENTRE X E Y ? Yi = 10 + 2 X =2
dX
EXEMPLO
QUAL O SINAL DA CORRELAÇÃO ?
SE FOREM 5 MÁQUINAS (X=5) SE FOREM 6 MÁQUINAS (X=6) (+1)
PARÂMETROS DO MODELO Y = 10 + 2X Y = 10 + 2X
Y = 10 + 2×5 Y = 10 + 2×6
αˆ = 10 βˆ = 2 σ2 =4 Y = 10 + 10 + 2 min Y = 10 + 12
Y = 20 min Y = 22 min
Yi = α + β X Yi = 10 + 2 X
QUANDO PASSAMOS DE 5 MÁQUINAS(X) PARA 6 MÁQUINAS(X) O ACRÉSCIMO
QUAL PARÂMETRO INDICA O SINAL DA CORRELAÇÃO ? NO TEMPO (Y) FOI DE 2 MINUTOS ! ⇒ 2 MIN POR MÁQUINA ADICIONAL !

S X ,Y SE X PASSAR DE 5 PARA 9 MÁQUINAS O ACRÉSCIMO NO TEMPO SERÁ


S XY
β= , se β > 0 ⇒ S XY > 0 S X ,Y > 0 ⇒ r = >0 DE: 2 × 4 = 8 min!
S X2 S X × SY
Obs. (9 - 5) = 4 ⇒ Adicional de máquinas !
GABARITO - A

Y-Tempo de Manutenção
51-(AFPS-2002/ESAF) Para o modelo de regressão linear y = α + βx + ε
35
onde y é a variável resposta, x a variável independente, α e β são
30

28
30 parâmetros desconhecidos e ε é uma componente de erro aleatória com
25
26

20
24 média zero. Assinale a opção que corresponde à interpretação do
22
20
15
18 parâmetro α.
16 Y
14
10 12
10 +2 Yi = 10 + 2 X a) É o valor predito de y, dado que x = 0, desde que esse valor de x
5

0
seja compatível com o conjunto de observações da variável exógena.
0 1 2 3 4 5 6 7 8 9 10

+1 X - Número de Máquinas b) Mede a variação esperada em y por unidade de variação na


variável exógena.
dY
Yi = 10 + 2 X =2 c) É o valor esperado de y, quando se padroniza a variável exógena.
dX
d) Mede a variação da reta de regressão.
e) Mede o coeficiente angular da reta de regressão.

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 19 MANUEL
ACADEMIA DO CONCURSO

MODELO LINEAR DE REGRESSÃO Assinale a opção que corresponde à interpretação do parâmetro α.


b) Mede a variação esperada em y por unidade de variação na
Yi = α + βX + ε i variável exógena.
Yi = α + β X + ε i dY

DEPENDENTE INDEPENDENTE dX
ENDÓGENA EXÓGENA FALSO
Assinale a opção que corresponde à interpretação do parâmetro α. c) É o valor esperado de y, quando se padroniza a variável
a) É o valor predito de y, dado que x = 0, desde que esse valor de x seja exógena.
compatível com o conjunto de observações da variável exógena. FALSO
dY
Yi = α + β X X = 0 ⇒ Yi = α d) Mede a variação da reta de regressão. =β
dX
VERDADEIRO FALSO
e) Mede o coeficiente angular da reta de regressão.
Y = α + βX
EXÓGENO ⇒ Aquilo que é de origem externa. Produzido por fatores externos a um
objeto, processo ou fenômeno.
α ⇒ COEFICIENTE LINEAR
ENDÓGENO ⇒ é aquele que parte do interior para o exterior. β ⇒ COEFICIENTE ANGULAR GABARITO - A

52-(MP-ENAP-2006/ESAF) Com o objetivo de estimar-se o ∑ X = 15 X =3 ∑X 2


= 55 n=5
modelo Y = α + βX, foi retirada uma amostra com cinco pares de
observações (X,Y), obtendo-se os seguintes resultados: ∑ Y = 40 Y =8 ∑Y 2
= 360 ∑ XY = 140
S
∑ X = 15 X =3 ∑X 2
= 55 Yi = α + β X i β = XY2 α = Y − βX
SX
∑ Y = 40 Y =8 ∑Y 2
= 360 ∑ XY = 140
140 S XY = 4
S XY = − 3× 8 S XY = 28 − 24
Desse modo, 5
a) Y = - 2 - 2X 55 S X2 = 2
b) Y = 2 - 2X S X2 = − 32 S X2 = 11 − 9
5
c) Y = 2X
S XY 4
d) Y = 2 + 2X β= β= β =2
e) Y = - 2 + 2X S X2 2

α = Y − βX α = 8 − 2×3 α = 2
Yi = 2 + 2 X i
GABARITO - D

53-PETROBRÁS-ECONOMISTAJR-2005/CESGRANRIO) 54-(AGENTE FISCAL-SEFAZ-PI-2001/ESAF) Um investigador toma


uma amostra de 10 carregamentos levados a efeito em caminhões de
Heterocedasticidade refere-se à situação onde a variância dos
uma firma de transporte. Para cada carregamento (i) anota a distância
erros é:
percorrida pelo caminhão em 1.000 Km (xi) e o tempo de entrega do
(A) constante e igual a 1 carregamento em dias (yi). Neste contexto postula que o modelo de
(B) constante regressão linear yi=α+βxi+εi se ajusta a suas observações, onde α e β
(C) variável são parâmetros desconhecidos e os εi são componentes estocásticas
(D) variável entre 0 e 1 (resíduos) não diretamente observáveis, não correlacionadas, com
(E) infinita sempre média zero e variância σ2>0 .Foram encontradas as estatísticas
seguintes no ajuste do modelo de regressão linear:
HETEROCEDASTICIDADE ⇒ a variância dos erros é
∑i xi = 8 ∑i xi2 = 12 ∑i xi yi = 26 ∑i yi = 29 ∑i yi2 = 100
VARIÁVEL ! Assinale a opção que corresponde à estimativa do aumento esperado no
tempo de entrega decorrente da adição de 1.000 Km na distância percorrida.
HOMOCEDASTICIDADE ⇒ a variância dos erros é
a) 0,5 dias
CONSTANTE! b) 1,0 dias
c) 3,0 dias
d) 5,0 dias
GABARITO - C e) 4,5 dias

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 20 MANUEL
ACADEMIA DO CONCURSO

55- (AFRF-2009) Na análise de regressão linear simples, as


∑i xi = 8 ∑i xi2 = 12 ∑i xi yi = 26 ∑i yi = 29 ∑i yi2 = 100 n = 10
estimativas α̂ e β̂ dos parâmetros α e β da reta de regressão
Yi = α + β X i S XY podem ser obtidas pelo método de Mínimos Quadrados. Nesse
β= α = Y − βX
S X2 caso, os valores dessas estimativas são obtidos através de uma
26 8 29 amostra de n pares de valores Xi Yi com (i =1, 2,....,n), obtendo
S XY = − × S XY = 2,6 − 2,32 S XY = 0,28 se: Yˆi = αˆ + βˆX onde Yˆi é a estimativa de Y . Para cada par de
10 10 10 valores Xi Yi com (i =1, 2,...,n) pode-se estabelecer o desvio ou
2
12  8  resíduo aqui denotado por ei − entre a reta de regressão Yi e sua
S X2 = −  S X2 = 1, 2 − 0,64 S X2 = 0,56 estimativa Yˆi . Sabe-se que o Método de Mínimos Quadrados
10  10 
consiste em adotar como estimativas dos parâmetros α e β os
S 0,28 β = 0,5 valores que minimizam a soma dos quadrados dos desvios (ei).
β = XY2 β=
SX 0,56 Desse modo, o Método de Mínimos Quadrados consiste em
dY minimizar a expressão dada por:
Yi = α + 0,5 X i = 0,5 GABARITO - A
dX

α = Y − βX α = 2,9 − 0,5 × 0,8 α = 2 ,5


Yi = 2,5 + 0,5 X i

2
Y ⇒ Observado
n
[
a ) ∑ Yi − (αˆ − βˆ . X i ) ] Yˆ ⇒ Estimado ⇒ Yˆ = αˆ + βˆX
i =1

n 2 e = (Y − Yˆ ) ⇒ RESÍDUOS (Desvios)
b) ∑ [(Y − αˆ − βˆ.X )] i i n n
i =1
∑ê i
2
(
= ∑ Yi − Yˆi )
2
MÍNIMOS QUADRADOS ⇒ MINIMIZAR A SOMA DOS
QUADRADOS DOS RESÍDUOS !
n 2 i =1 i =1
c) ∑ [Y − (α − β . X i )] n n

∑ (Y − Yˆ ) = ∑ [Y )]
i
i =1

n 2
i i
2
i (
− αˆ + βˆX i
2

∑ [Y ] i =1 i =1
− Yˆi
2 2
d) i
n n

∑ [Y − (αˆ + βˆX )] = ∑ [Y − αˆ − βˆX ]


i =1 2 2
n i i i i
∑ [Y ]
2
e) i − (α − β . X i ) 2 i =1 i =1
i =1

n 2

a) ∑ [Y
i =1
i − (αˆ − βˆ . X i ) ] ERRADO
Veja o mundo num grão de areia,
n 2

∑ [Y ]
n 2

b) ∑ [(Y − αˆ − βˆ.X )]
i =1
i i
CERTO b)
i =1
i − αˆ − βˆ . X i )
veja o céu em um campo florido,
NA PROVA ESTAVA ASSIM !

c)
n

∑ [Y i − (α − β . X i )]
2
ERRADO GABARITO - ANULADA ! guarde o infinito na palma da mão,
i =1

n 2
e a eternidade em uma hora de vida!
d) ∑ [Yi =1
2
i − Yˆi
2
] ERRADO

∑ [Y ] ERRADO
2
e) i − (α − β . X i ) 2
i =1
William Blake
1757 - Londres /1827 - Londres
GABARITO - B

ESTATÍSTICA
EXERCÍCIOS_CORRELAÇÃO_REGRESSÃO 21 MANUEL

Você também pode gostar