Você está na página 1de 99

Aula 19

Estatística p/ Polícia Federal (Agente)


Com Videoaulas - 2020 - Pré-Edital
(Preparação de A a Z)

Autor:
Guilherme Neves
Aula 19

14 de Setembro de 2020
Guilherme Neves
Aula 19

Sumário
1. Correlação Linear .................................................................................................................................... 3
2. Regressão Linear ................................................................................................................................... 22
2.1. Reta que passa pela origem ........................................................................................................... 30
3. Análise de Variância da Regressão ........................................................................................................ 31
Lista de Questões de Concursos sem Comentários ..................................................................................... 38
Gabarito sem comentário ............................................................................................................................. 53
Lista de Questões de Concursos com Comentários ..................................................................................... 54
Exercícios sobre Correlação ..................................................................................................................... 54
Exercícios sobre Regressão Linear ................................
............................................................................ 65
Exercícios sobre Análise de Variância da Regressão ................................................................................ 86
Considerações Finais .................................................................................................................................... 98

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 1


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Para tirar dúvidas e ter acesso a dicas e conteúdos gratuitos, acesse minhas redes
sociais:

Instagram - @profguilhermeneves

https://www.instagram.com/profguilhermeneves

Canal do YouTube – Prof. Guilherme Neves

https://youtu.be/gqab047D9l4

E-mail: profguilhermeneves@gmail.com

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 2


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

1. CORRELAÇÃO LINEAR

Imagine que realizamos uma pesquisa com 25 alunos do Estratégia. Para cada um desses alunos
anotamos a sua altura em centímetros e a sua massa em quilogramas.

Aluno Altura (cm) Massa (kg)


1 158 55
2 156 52
3 177 74
4 159 57
5 164 64
6 158 59
7 184 91
8 177 85
9 168 66
10 160 52
11 173 68
12 154 51
13 172 83
14 174 69
15 173 70
16 168 75
17 155 47
18 155 55
19 181 87
20 167 64
21 164 62
22 163 63
23 166 63
24 170 69
25 171 67

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 3


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Esses são os nossos dados brutos. Fica difícil analisar a relação entre altura e massa apenas com
essa tabela. Uma ideia é colocar esses dados em um gráfico. No eixo x vamos colocar as alturas
em centímetros e no eixo y vamos colocar a massa em kg.

Esse gráfico é denominado “diagrama de dispersão”.

O gráfico dá a impressão que “existe” uma reta acompanhando o conjunto de pontos.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 4


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Quando isso ocorre, dizemos que as variáveis estão correlacionadas, ou seja, existe uma
correlação linear entre as variáveis.

Nesta aula, vamos aprender a medir esse grau de correlação, em outras palavras, queremos
determinar se existe uma relação linear entre duas variáveis X e Y.

Se existir a relação linear entre as variáveis, frequentemente se deseja saber qual é a função que
mostra como Y varia aproximadamente em função de X. Esse é o objeto de estudo da Regressão
Linear.

Agora, vamos focar apenas na correlação.

É claro que o diagrama de dispersão ajuda muito em determinar se existe ou não uma relação
linear entre as variáveis, mas vamos aprender um método numérico para medir o grau dessa
relação.

Por exemplo, poderíamos ter o seguinte diagrama de dispersão:

Veja que a relação linear neste caso não existe (ou é muito fraca).

O Coeficiente de Correlação Linear de Pearson serve justamente para medir a força da relação
linear entre as duas variáveis.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 5


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

∑[(𝑋' − 𝑋) ) ∙ (𝑌' − 𝑌))]


𝑟=
.∑(𝑋' − 𝑋))/ ∙ ∑(𝑌' − 𝑌))/

Da mesma forma que é possível manipular os somatórios para obter uma forma alternativa para o
cálculo da variância (lembra daquela historinha de “Média dos quadrados menos o quadrado da
média”?), também é possível manipular os somatórios da fórmula acima para obter formas
alternativas de cálculo bem úteis nas questões. Assim, é importante que você decore a fórmula a
seguir:

0[(𝑋' − 𝑋)) ∙ (𝑌' − 𝑌) )] = 0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌)

Veja que a fórmula do lado esquerdo nos força a calcular os desvios 𝑋' − 𝑋) e 𝑌' − 𝑌). A fórmula do
lado direito é mais simples. Na fórmula acima, 𝑛 representa o número de pontos, ou seja, o
número de pares ordenados.

Essa é apenas uma outra forma de calcular o numerador do coeficiente de correlação. Daqui a
pouquinho vou fazer um exemplo numérico para que você possa entender como aplicar essas
fórmulas.

Se, na fórmula acima, você substituir 𝑌 por 𝑋, obteremos:

0[(𝑋' − 𝑋) ) ∙ (𝑋' − 𝑋) )] = 0(𝑋' ∙ 𝑋' ) − 𝑛 ∙ 𝑋) ∙ 𝑋)

Ou seja,

0(𝑋' − 𝑋))/ = 0 𝑋'/ − 𝑛 ∙ (𝑋))/

Substituindo X por Y, obtemos:

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 6


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

0(𝑌' − 𝑌))/ = 0 𝑌'/ − 𝑛 ∙ (𝑌) )/

Essas duas fórmulas são fórmulas alternativas para o cálculo dos termos do denominador do
coeficiente de correlação.

Pois bem. Demonstra-se que o coeficiente de correlação de Pearson é sempre um número que
pertence ao intervalo real [−1,1], ou seja:

−1 ≤ 𝑟 ≤ 1

Quando Y tende a crescer quando X cresce, o valor de 𝑟 é positivo. Dizemos que as variáveis
estão positivamente correlacionadas.

Quando Y tende a decrescer quando X cresce, o valor de 𝑟 é negativo. Dizemos que as variáveis
estão negativamente correlacionadas.

Quanto mais próximo de 1 ou de -1 for o coeficiente de correlação, mais forte será a correlação.

Se a correlação for perfeita, ou seja, se todos os pontos estiverem sobre uma mesma reta, o valor
de r será exatamente 1 (se a correlação for positiva) ou será exatamente -1 (se for uma correlação
negativa).

Observe novamente o nosso exemplo inicial.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 7


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

O Excel indica que o coeficiente de correlação entre essas variáveis é 0,9293355. Veja que temos
uma correlação positiva forte (o coeficiente de correlação é positivo e próximo de 1).

Se a correlação é positiva e todos os pontos estão sobre uma mesma reta, o coeficiente de
correlação será exatamente igual a 1. Observe o diagrama de dispersão a seguir.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 8


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

No exemplo acima, temos:

𝑟=1

Se a correlação é negativa, ou seja, se Y decresce quando X cresce, o coeficiente de correlação é


negativo. Observe o exemplo a seguir.

O Excel indica que o coeficiente de correlação nesse caso é -0,9836038. Veja que os dados estão
praticamente em cima de uma reta. Como a correlação é negativa e forte, o coeficiente de
correlação foi bem próximo de −1.

Se a correlação fosse negativa e os pontos estivessem todos sobre a mesma reta, o coeficiente
seria exatamente −1.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 9


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

No exemplo acima, temos:

𝑟 = −1

Observe agora o seguinte diagrama de dispersão.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 10


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Não existe uma relação linear entre essas variáveis. Assim, o coeficiente de correlação será 0 (ou
um número muito próximo de 0). De fato, o Excel indica que o coeficiente de correlação do
diagrama de dispersão acima é -0,0205218.

É importante notar que o coeficiente de correlação calcula a “força” da relação linear


entre as variáveis. Se o coeficiente é zero ou bem próximo de zero, então não existe
relação linear entre as variáveis. Entretanto, é possível que as variáveis sigam um outro
modelo matemático (polinomial, trigonométrico, logarítmico, exponencial, etc).

Uma forte correlação não significa causalidade. A correlação mede a relação linear
entre duas variáveis, mas não significa que a variação de uma cause a variação da
outra. Por exemplo, existe uma correlação entre o consumo de cerveja e o número de
ataques de tubarão. Com o aumento da temperatura no verão, mais pessoas vão à
praia e consomem mais cerveja. Com isso, aumenta também o número de ataques de
tubarão. Dessa forma, o aumento de temperatura no verão é a causa comum aos dois
aumentos.

É possível ainda que dois eventos tenham uma forte correlação mesmo sem
causalidade nem causa em comum. Simplesmente por acaso. São as chamadas
“correlações espúrias”.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 11


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Complementando o quadro acima. Verifique o site http://www.tylervigen.com/spurious-


correlations . Lá, existem diversos exemplos esdrúxulos de eventos que são correlacionados, mas
que não tem o menor sentido (correlações espúrias). Por exemplo, o gasto dos EUA em Ciência,
Espaço e Tecnologia e o número de suicídios por enforcamento, estrangulamento ou
sufocamento ao longo dos anos tem uma correlação de 0,9979.

A taxa de divórcios no estado americano do Maine correlaciona com o consumo per capita de
Margarina (r = 0,9925).

Agora que estamos entendidos quanto à interpretação do coeficiente de correlação, vamos


aprender a aplicar a fórmula.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 12


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Normalmente, a questão já vai indicar valores dos somatórios para que você simplesmente
aplique a fórmula. De qualquer forma, vamos criar aqui uma tabelinha com apenas 4 pares
ordenados para calcular o coeficiente de correlação pelas duas fórmulas.

X Y
1 3
3 6
4 5
8 10

Vamos primeiro aplicar a fórmula do jeito que mostrei inicialmente.

∑[(𝑋' − 𝑋) ) ∙ (𝑌' − 𝑌))]


𝑟=
.∑(𝑋' − 𝑋))/ ∙ ∑(𝑌' − 𝑌))/

Precisamos calcular as médias de X e de Y.

1+3+4+8
𝑋) = =4
4

3 + 6 + 5 + 10
𝑌) = =6
4

Vamos agora calcular os desvios de X em relação à sua média e também os desvios de Y em


relação à sua média.

X Y >
𝑿𝒊 − 𝑿 𝒀𝒊 − 𝒀
1 3 1 − 4 = −3 3 − 6 = −3
3 6 3 − 4 = −1 6−6=0
4 5 4−4=0 5 − 6 = −1
8 10 8−4=4 10 − 6 = 4

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 13


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Vou limpar a tabela deixando apenas os resultados, ok?

X Y >
𝑿𝒊 − 𝑿 𝒀𝒊 − 𝒀
1 3 −3 −3
3 6 −1 0
4 5 0 −1
8 10 4 4

Para calcular o numerador do coeficiente de correlação, precisamos multiplicar os desvios de X


pelos desvios de Y.

Para calcular o denominador, precisamos calcular os quadrados dos desvios.

X Y >
𝑿𝒊 − 𝑿 𝒀𝒊 − 𝒀 > ) ∙ (𝒀𝒊 − 𝒀
(𝑿𝒊 − 𝑿 >) > )𝟐
(𝑿𝒊 − 𝑿 > )𝟐
(𝒀𝒊 − 𝒀
1 3 −3 −3 (−3) ∙ (−3) = 9 (−3)/ = 9 (−3)/ = 9
3 6 −1 0 −1 ∙ 0 = 0 (−1)/ = 1 0/ = 0
4 5 0 −1 0 ∙ (−1) = 0 0/ = 0 (−1)/ = 1
8 10 4 4 4 ∙ 4 = 16 4/ = 16 4/ = 16

Vou limpar a tabela deixando apenas os resultados.

X Y >
𝑿𝒊 − 𝑿 𝒀𝒊 − 𝒀 > ) ∙ (𝒀𝒊 − 𝒀
(𝑿𝒊 − 𝑿 >) > )𝟐
(𝑿𝒊 − 𝑿 > )𝟐
(𝒀𝒊 − 𝒀
1 3 −3 −3 9 9 9
3 6 −1 0 0 1 0
4 5 0 −1 0 0 1
8 10 4 4 16 16 16

Agora podemos calcular os somatórios da fórmula.

0[(𝑋' − 𝑋) ) ∙ (𝑌' − 𝑌))] = 9 + 0 + 0 + 16 = 25

0(𝑋' − 𝑋) )/ = 9 + 1 + 0 + 16 = 26

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 14


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

0(𝑌' − 𝑌))/ = 9 + 0 + 1 + 16 = 26

Agora é só aplicar a fórmula do coeficiente de correlação.

∑[(𝑋' − 𝑋) ) ∙ (𝑌' − 𝑌))]


𝑟=
.∑(𝑋' − 𝑋))/ ∙ ∑(𝑌' − 𝑌))/

25 25 25
𝑟= = =
√26 ∙ 26 √26/ 26

𝑟 ≅ 0,9615

Temos uma correlação positiva forte (coeficiente bem próximo de 1). De fato, observe o
diagrama de dispersão com a respectiva reta de regressão.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 15


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Vamos agora calcular o mesmo coeficiente utilizando as fórmulas alternativas dos somatórios.

Eis a fórmula do coeficiente:

∑[(𝑋' − 𝑋) ) ∙ (𝑌' − 𝑌))]


𝑟=
.∑(𝑋' − 𝑋))/ ∙ ∑(𝑌' − 𝑌))/

O numerador pode ser calculado da seguinte forma:

0[(𝑋' − 𝑋)) ∙ (𝑌' − 𝑌) )] = 0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌)

O denominador pode ser calculado com as seguintes fórmulas:

0(𝑋' − 𝑋))/ = 0 𝑋'/ − 𝑛 ∙ (𝑋))/

0(𝑌' − 𝑌))/ = 0 𝑌'/ − 𝑛 ∙ (𝑌) )/

Observe que esses dois últimos resultados podem ser obtidos através do primeiro

0[(𝑋' − 𝑋)) ∙ (𝑌' − 𝑌) )] = 0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌)

Para tanto, basta substituir X por Y e depois Y por X.

Voltemos à nossa tabela original.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 16


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

X Y
1 3
3 6
4 5
8 10

Já calculamos a média de X e a média de Y.

1+3+4+8
𝑋) = =4
4

3 + 6 + 5 + 10
𝑌) = =6
4

Precisamos de 3 colunas: 𝑋𝑌, 𝑋 / e 𝑌 / .

X Y 𝑿∙𝒀 𝑿𝟐 𝒀𝟐
1 3 1×3=3 1/ = 1 3/ = 9
3 6 3 × 6 = 18 3/ = 9 6/ = 36
4 5 4 × 5 = 20 4/ = 16 5/ = 25
8 10 8 × 10 = 80 8/ = 64 10/ = 100

Vamos limpar a tabela deixando apenas os resultados.

X Y 𝑿∙𝒀 𝑿𝟐 𝒀𝟐
1 3 3 1 9
3 6 18 9 36
4 5 20 16 25
8 10 80 64 100

Como são 4 pares ordenados, então 𝑛 = 4.

Vamos calcular os somatórios das colunas construídas.

0(𝑋' ∙ 𝑌' ) = 3 + 18 + 20 + 80 = 121

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 17


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

0 𝑋'/ = 1 + 9 + 16 + 64 = 90

0 𝑌'/ = 9 + 36 + 25 + 100 = 170

Agora estamos prontos para aplicar nas fórmulas.

O somatório do numerador do coeficiente de correlação é:

0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌) = 121 − 4 ∙ 4 ∙ 6 = 25

Os somatórios do denominador são:

0 𝑋'/ − 𝑛 ∙ (𝑋))/ = 90 − 4 ∙ 4/ = 26

0 𝑌'/ − 𝑛 ∙ (𝑌))/ = 170 − 4 ∙ 6/ = 26

Assim, o coeficiente de correlação é:

∑[(𝑋' − 𝑋) ) ∙ (𝑌' − 𝑌))]


𝑟=
.∑(𝑋' − 𝑋))/ ∙ ∑(𝑌' − 𝑌))/

25 25 25
𝑟= = =
√26 ∙ 26 √26/ 26

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 18


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Mesmo resultado obtido anteriormente.

Quando estudamos as medidas de posição e as medidas de variabilidade, sempre comentamos


o que ocorre com essas medidas quando transformamos a variável.

Por exemplo, quando adicionamos uma constante a todos os valores, à média será adicionada
essa constante, mas a variância não será alterada.

Daí surge a pergunta: o que ocorre com o coeficiente de correlação quando transformamos a
variável?

• Se adicionarmos (ou subtrairmos) constantes às variáveis, o coeficiente de correlação não


mudará.
• Quando multiplicamos (ou dividimos) as variáveis por constantes, o coeficiente de
correlação pode não ser alterado ou pode simplesmente trocar de sinal. Se as constantes
tiverem o mesmo sinal (ambas positivas ou ambas negativas), o coeficiente de correlação
não será alterado. Se as constantes tiverem sinais contrários (uma positiva e a outra
negativa), o coeficiente de correlação trocará de sinal.

Tomemos como exemplo a tabela a seguir:

X Y
1 3
3 6
4 5
8 10

Já vimos que o coeficiente de correlação é 25/26.

25
𝑟(𝑋, 𝑌) =
26

Vamos adicionar 5 unidades à variável X e 4 unidades à variável Y.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 19


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

X+4 Y+5
5 8
7 11
8 10
12 15

Como adicionamos constantes às variáveis, o coeficiente de correlação continuará sendo 25/26.

25
𝑟(𝑋 + 4, 𝑌 + 5) =
26

Vamos agora multiplicar a variável X por 3 e a variável Y por 4.

3X 4Y
3 12
9 24
12 20
24 40

Como multiplicamos as variáveis por constantes de mesmo sinal (3 e 4 são positivos), então o
coeficiente de correlação continua sendo 25/26.

25
𝑟(3𝑋, 4𝑌) =
26

Vamos agora multiplicar X por -2 e Y por -3.

-2X -3Y
-2 -9
-6 -18
-8 -15
-16 -30

Como multiplicamos as variáveis por constantes de mesmo sinal (-2 e -3 são negativos), então o
coeficiente de correlação continua sendo 25/26.

25
𝑟(−2𝑋, −3𝑌) =
26

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 20


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Finalmente, vamos multiplicar X por -2 e Y por 3 (uma constante é positiva e a outra é negativa).

-2X 3Y
-2 9
-6 18
-8 15
-16 30

Como as constantes que foram usadas para multiplicar as variáveis possuem sinais contrários,
então o coeficiente de correlação terá seu sinal trocado.

25
𝑟(−2𝑋, 3𝑌) = −
26

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 21


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

2. REGRESSÃO LINEAR

A correlação linear nos diz se existe uma relação linear entre duas variáveis 𝑋 e 𝑌. Agora estamos
interessados em calcular a expressão matemática que relaciona 𝑌 em função de 𝑋.

Assim, vamos partir do pressuposto de que há uma relação linear entre 𝑋 e 𝑌.

A Matemática Básica nos ensina que a equação de uma reta pode ser escrita como

𝑦 = 𝑝 + 𝑚𝑥

O coeficiente 𝑝 é o coeficiente linear da reta (indica onde a reta corta o eixo 𝑦) e o coeficiente 𝑚
é chamado de taxa de variação (ou coeficiente angular da reta). O coeficiente 𝑚 indica se a
função é crescente (𝑚 > 0), decrescente (𝑚 < 0) ou constante (𝑚 = 0).

O coeficiente 𝑚 é a taxa de variação (também conhecido como “coeficiente angular” da reta). Se


a reta passa pelos pontos (𝑥O , 𝑦O ) e (𝑥/ , 𝑦/ ), então a taxa de variação é dada por:

Δ𝑦 𝑦/ − 𝑦O
𝑚= =
Δ𝑥 𝑥/ − 𝑥O

O coeficiente 𝑏 é o termo independente e indica o ponto em que a reta corta o eixo 𝑦.

Observe o seguinte exemplo.

Vamos determinar a equação da reta AB na figura acima. A reta passa pelos pontos (1,5) e (3,9).

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 22


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Vamos calcular a taxa de variação. A taxa de variação é o quociente entre a variação de y e a


variação de x.

Δ𝑦 9 − 5 4
𝑚= = = =2
Δ𝑥 3 − 1 2

Assim, a equação da reta 𝑦 = 𝑚𝑥 + 𝑝 fica 𝑦 = 2𝑥 + 𝑝.

Precisamos calcular o valor de 𝑝. Podemos usar indistintamente um dos pontos (1,5) ou (3,9).

Vamos utilizar o segundo ponto, por exemplo (o resultado dá o mesmo independente do ponto
que você escolher).

O ponto (3,9) indica que 𝑦 = 9 para 𝑥 = 3. Vamos substituir na equação 𝑦 = 2𝑥 + 𝑝.

9=2∙3+𝑝

9=6+𝑝

𝑝=3

Logo, a equação da reta é 𝑦 = 2𝑥 + 3.

Como 𝑝 = 3, então a reta corta o eixo 𝑦 no ponto 𝐶(0,3). Observe.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 23


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Voltemos à regressão linear simples.

O modelo estatístico de uma regressão linear simples entre 𝑋 e 𝑌 é dado por:

𝑌' = 𝛼 + 𝛽𝑋' + 𝑢'

Com 𝑖 = 1, 2, 3, … , 𝑛.

Nesse modelo, a expressão 𝛼 + 𝛽𝑋' é o componente de 𝑌' que varia linearmente com 𝑋' ,
enquanto que 𝑢' é o componente aleatório de 𝑌' (também chamado de erro ou desvio). Em
outras palavras, 𝑢' é a variável aleatória que descreve o erro cometido quando tentamos
aproximar a relação entre 𝑋 e 𝑌 por uma reta.

Nesse modelo, dizemos que 𝑋' é a variável explanatória (ou independente) e 𝑌' é a variável
dependente.

A variável dependente Y é a variável que desejamos prever ou explicar. É também chamada de


variável resposta.

A variável independente X é também chamada de variável explicativa.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 24


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Para desenvolver esse modelo, temos algumas pressuposições acerca da variável aleatória 𝑢'
(erro ou desvio) quais sejam:

i) 𝐸(𝑢' ) = 0

ii) 𝑉𝑎𝑟(𝑢' ) = 𝜎 /

iii) 𝑐𝑜𝑣_𝑢' , 𝑢` a = 0 para 𝑖 ≠ 𝑗

A primeira suposição diz que a média do erro é zero para 𝑖 = 1, 2, … , 𝑛. Essa suposição é bem
óbvia: se o erro em média não fosse zero, o modelo escolhido não estaria adequado.

A segunda suposição diz que a variância de 𝑢' é constante para 𝑖 = 1, 2, … , 𝑛. O fato de a


variância do erro ser constante é denominado homocedasticia. Esse é o postulado da
homocedasticidade. Quando isso não ocorre, ou seja, quando o modelo apresenta variâncias
diferentes para o erro, dizemos que ocorre heterocedasticia.

A terceira hipótese diz que os erros não estão correlacionados, ou seja, estamos supondo que os
erros 𝑢' são variáveis aleatórias independentes. Dizemos que ocorre “autocorrelação” quando os
erros não são independentes.

Pois bem, vamos supor que não temos acesso aos dados populacionais. Assim, queremos obter
estimadores para os parâmetros 𝛼 e 𝛽 do modelo 𝑌' = 𝛼 + 𝛽𝑋' + 𝑢' .

O método usual para a obtenção dos estimadores de 𝛼 e 𝛽 é denominado método de mínimos


quadrados.

Suponha que temos uma amostra de 𝑛 pares de valores observados de 𝑋 e 𝑌. Sejam 𝑎 e 𝑏 as


estimativas de 𝛼 e 𝛽, respectivamente.

A reta de regressão estimada é:

𝑌d = 𝑎 + 𝑏𝑋'

É claro que estaremos cometendo erros (desvios) entre os valores observados e os respectivos
valores estimados de 𝑌.

O desvio é, portanto, a diferença entre o valor observado e o valor estimado.

gf
𝑒 = 𝑌' − 𝑌

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 25


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

O método dos mínimos quadrados é aquele que determina as estimativas 𝑎 e 𝑏 dos parâmetros
minimizando a soma dos quadrados dos desvios.

Por esse método, o valor de 𝑏 é dado por:

∑(𝑋' − 𝑋)((𝑌' − 𝑌)
𝑏= /
∑_𝑋' − 𝑋a

Depois de obtido o valor de 𝑏, podemos calcular o valor de 𝑎 substituindo o valor de 𝑏 na


equação

𝑌 = 𝑎 + 𝑏𝑋

Isso porque a reta calculada passa pelo ponto (𝑋, 𝑌), ou seja, a reta calculada passa pelos pontos
médios das variáveis X e Y.

É possível manipular os somatórios da fórmula acima para obter formas alternativas de cálculo
bem úteis nas questões. Assim, é importante que você decore a fórmula a seguir:

0[(𝑋' − 𝑋)) ∙ (𝑌' − 𝑌) )] = 0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌)

Veja que a fórmula do lado esquerdo nos força a calcular os desvios 𝑋' − 𝑋) e 𝑌' − 𝑌). A fórmula do
lado direito é mais simples. Na fórmula acima, 𝑛 representa o número de pontos, ou seja, o
número de pares ordenados.

Essa é apenas uma outra forma de calcular o numerador do coeficiente 𝑏.

Se, na fórmula acima, você substituir 𝑌 por 𝑋, obteremos:

0[(𝑋' − 𝑋) ) ∙ (𝑋' − 𝑋) )] = 0(𝑋' ∙ 𝑋' ) − 𝑛 ∙ 𝑋) ∙ 𝑋)

Ou seja,

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 26


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

0(𝑋' − 𝑋))/ = 0 𝑋'/ − 𝑛 ∙ (𝑋))/

(CESPE 2018/STM)

Considerando que 𝒀 g seja uma variável resposta ajustada por um modelo de regressão em função
de uma variável explicativa 𝑿, que 𝒙𝟏 , … , 𝒙𝒏 representem as réplicas de 𝑿 e que 𝜶 g sejam as
le𝜷
estimativas dos parâmetros do modelo, julgue os itens a seguir.

I. No método de mínimos quadrados, a condição de estimativas não viesadas significa que os


erros terão variância positiva.

II. Em um modelo linear 𝑌d = 𝛼n + 𝛽o 𝑋, com coeficientes obtidos pelo método dos mínimos
quadrados ordinários, sendo 𝛼n > 0, a média dos valores estimados de 𝑌 é igual à média dos
valores de 𝑋 multiplicados por 𝛽o .

III. Em um modelo linear 𝑌d = 𝛼n + 𝛽o 𝑋, a hipótese de homoscedastiscidade significa que a variância


dos erros deve ser constante, e o valor esperado dos erros deve ser zero.

IV. No modelo linear 𝑌 = 𝑎 + 𝛽𝑋 + 𝑒, considere que para cada valor 𝑥' de 𝑋 corresponda a um
erro 𝑒' , que é uma variável aleatória. Nessa situação a hipótese de erros não autocorrelacionados
implica que 𝑐𝑜𝑣_𝑒' , 𝑒` a = 0, para 𝑖 ≠ 𝑗.

Comentário

O item I está errado. Dizer que um estimador é não viesado é o mesmo que dizer que a sua
esperança é igual ao parâmetro populacional.

Vimos que 𝑌 = 𝑎 + 𝑏𝑋. Utilizando a notação da questão, temos que 𝑌 = 𝛼n + 𝛽o 𝑋. Logo, o item II
está errado (faltou adicionar 𝛼n).

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 27


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

O item III está errado, pois a homocedasticidade significa apenas que a variância dos erros é
constante (a segunda parte, valor esperado dos erros é zero, tem nada a ver com a
homocedasticidade).

O item IV está correto. É a terceira hipótese do nosso modelo.

Gabarito: Errado, errado, errado, certo.

(CESPE 2018/ABIN)

Ao avaliar o efeito das variações de uma grandeza X sobre outra grandeza Y por meio de uma
regressão linear da forma 𝒀 g=𝜶l+𝜷 g 𝑿, um analista, usando o método dos mínimos quadrados,
encontrou, a partir de 20 amostras, os seguintes somatórios (calculados sobre os vinte valores de
cada variável): ∑𝑿 = 𝟑𝟎𝟎, ∑𝒀 = 𝟒𝟎𝟎, ∑𝑿𝟐 = 𝟔. 𝟎𝟎𝟎, ∑𝒀𝟐 = 𝟏𝟐. 𝟖𝟎𝟎 𝒆 ∑(𝑿𝒀) = 𝟖. 𝟒𝟎𝟎

A partir desses resultados, julgue os itens a seguir.

I. 𝛽o < 0.

II. Para 𝑋 = 10, a estimativa de Y é 𝑌d = 12.

Comentário

Comecemos calculando as médias de 𝑋 e 𝑌.

∑𝑋 300
𝑋= = = 15
𝑛 20

∑𝑌 400
𝑌= = = 20
𝑛 20

O coeficiente 𝛽o é dado por

∑(𝑋' − 𝑋)((𝑌' − 𝑌)
𝛽o = /
∑_𝑋' − 𝑋a

Vimos que o numerador e o denominador podem ser calculados de outra forma.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 28


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

0[(𝑋' − 𝑋)) ∙ (𝑌' − 𝑌) )] = 0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌)

= 8.400 − 20 × 15 × 20

= 2.400

0(𝑋' − 𝑋))/ = 0 𝑋'/ − 𝑛 ∙ (𝑋))/

= 6.000 − 20 × 15/

= 1.500

Assim, temos:

2.400
𝛽o = >0
1.500

Logo, o item I está errado.

/.wxx
Já encontramos o valor de 𝛽o = O.yxx = 1,6.

Vamos agora calcular o valor de 𝛼n.

𝑌 = 𝛼n + 𝛽o 𝑋

20 = 𝛼n + 1,6 × 15

𝛼n = −4

Assim, a reta modelo é dada por

𝑌d = −4 + 1,6𝑋

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 29


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Substituindo X por 10, temos:

𝑌d = −4 + 1,6 × 10 = 12

O item II está certo.

Gabarito: Errado, certo

2.1. Reta que passa pela origem

Em algumas situações, o modelo teórico requer que a reta de regressão passe pela origem, ou
seja, 𝛼 = 0.

Neste caso, o modelo de regressão fica:

𝑌' = 𝛽𝑋' + 𝜀'

O estimador de 𝛽, nesse caso, pelo método dos mínimos quadrados fica:

∑𝑋𝑌
𝛽o =
∑𝑋 /

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 30


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

3. ANÁLISE DE VARIÂNCIA DA REGRESSÃO

Mais uma vez: é importante que você lembre as seguintes transformações dos somatórios que
vimos anteriormente:

0[(𝑋' − 𝑋)) ∙ (𝑌' − 𝑌) )] = 0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌)

0(𝑋' − 𝑋) )/ = 0 𝑋'/ − 𝑛 ∙ (𝑋))/

0(𝑌' − 𝑌))/ = 0 𝑌'/ − 𝑛 ∙ (𝑌))/

Para que possamos entender profundamente o que o coeficiente de correlação mede, vamos
entender três medidas de desvio na regressão.

O desvio total de Y, _𝑌' − 𝑌a, é o desvio de cada valor de 𝑌' em relação à média 𝑌.

Assim, podemos definir a soma dos quadrados total:

/
𝑆𝑄𝑇 = 0_𝑌' − 𝑌a

Esse desvio total pode ser desmembrado em desvios explicáveis (SQM, soma dos quadrados do
modelo de regressão) e não explicáveis (SQR, soma dos quadrados dos resíduos).

𝑆𝑄𝑇 = 𝑆𝑄𝑀 + 𝑆𝑄𝑅

Em outras palavras,

𝑉𝑎𝑟𝑖𝑎çã𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑌 𝑉𝑎𝑟𝑖𝑎çã𝑜 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 𝑉𝑎𝑟𝑖𝑎çã𝑜 𝑛ã𝑜 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎


€ ˆ=‰ Š+‰ Š
𝑒𝑚 𝑡𝑜𝑟𝑛𝑜 𝑑𝑎 𝑠𝑢𝑎 𝑚é𝑑𝑖𝑎 𝑝𝑒𝑙𝑜 𝑚𝑜𝑑𝑒𝑙𝑜 𝑝𝑒𝑙𝑜 𝑚𝑜𝑑𝑒𝑙𝑜

O desvio explicável é a parte do desvio total que é explicada pelo modelo de regressão, ou seja,
é a diferença entre o valor que o modelo de regressão prevê 𝑌 gf e o valor de médio 𝑌. Assim,
podemos definir a soma dos quadrados do modelo de regressão

/
gf − 𝑌a
𝑆𝑄𝑀 = 0_𝑌

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 31


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

É possível demonstrar que

𝑆𝑄𝑀 = 𝑏 ∙ ∑[(𝑋' − 𝑋))(𝑌' − 𝑌))] .

Outra fórmula que podemos utilizar para calcular 𝑆𝑄𝑀 é

𝑆𝑄𝑀 = 𝑏 / ∙ ∑(𝑋' − 𝑋))/ .

Cuidado com a notação. Alguns livros e questões de provas indicam a soma acima pelo símbolo
𝑆𝑄𝑅, em que R é significa regressão. É importante que você saiba diferenciar, pois outras provas
utilizam SQR para representar a soma dos quadrados dos resíduos (erros), assim como estou
fazendo aqui nesta aula.

O desvio não explicável é a parte do desvio total que não é explicada pelo modelo de regressão,
gf a entre cada valor de 𝑌' e o valor previsto pelo modelo. Assim,
ou seja, é a diferença _𝑌' − 𝑌
podemos definir a soma dos quadrados dos erros (resíduos).

gf a/
𝑆𝑄𝑅 = 0_𝑌' − 𝑌

O coeficiente de correlação é dado por:

𝑆𝑄𝑀
𝑅=‹
𝑆𝑄𝑇

Já vimos que −1 ≤ 𝑅 ≤ 1.

O quadrado do coeficiente de correlação é denominado coeficiente de determinação.

𝑆𝑄𝑀
𝑅/ =
𝑆𝑄𝑇

Também podemos escrever

𝑆𝑄𝑇 − 𝑆𝑄𝐸 𝑆𝑄𝑇 𝑆𝑄𝑅


𝑅/ = = −
𝑆𝑄𝑇 𝑆𝑄𝑇 𝑆𝑄𝑇

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 32


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

𝑆𝑄𝑅
𝑅/ = 1 −
𝑆𝑄𝑇

Temos que 0 ≤ 𝑅/ ≤ 1.

Quando o coeficiente de determinação é próximo de 1, temos que grande parte da variação de


𝑌 é explicada pelo modelo de regressão linear (a correlação é forte).

Quando o coeficiente de determinação é próximo de 0, temos que grande parte da variação de


𝑌 não é explicada pelo modelo, ou seja, a correlação é fraca.

Em outras palavras, o coeficiente de determinação é uma medida de precisão do ajuste feito pela
regressão. O coeficiente de determinação exprime a proporção da variação total de Y que é
explicada pela reta de regressão.

Agora sim vamos entrar na Análise de Variância da Regressão.

Queremos testar se a equação de regressão é estatisticamente significativa, ou seja, se ela tem


algum valor explicativo. Em outras palavras, vamos utilizar a Análise de Variância (ANOVA) para
testar se a variável explicativa (independente) está relacionada com a variável explicada
(dependente). Assim, o teste de hipóteses trabalhado pela Análise de Variância está relacionado
ao coeficiente angular 𝛽.

𝐻 :𝛽 = 0
Πx
𝐻O : 𝛽 ≠ 0

Se a hipótese nula é aceita, concluímos que não existe relação linear significativa entre as
variáveis 𝑋 e 𝑌.

Para montar a tabela da ANOVA, precisamos dos números de graus de liberdade das somas dos
quadrados (sugiro que você revise a aula sobre ANOVA).

Sendo 𝑛 o tamanho da amostra, temos:

𝑔𝑙•‘•’“ = 𝑛 − 1

Como a equação de regressão tem dois parâmetros, então, o número de graus de liberdade do
modelo é 2 − 1 = 1.

Ademais, temos a seguinte relação:

𝑔𝑙•‘•’“ = 𝑔𝑙”‘•–“‘ + 𝑔𝑙—–˜í•š‘˜

Logo,

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 33


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

𝑛 − 1 = 1 + 𝑔𝑙—–˜í•š‘˜

𝑔𝑙—–˜í•š‘˜ = 𝑛 − 2

Lembre-se que o quadrado médio é a razão entre a soma dos quadrados e o número de graus
de liberdade.

Assim, temos a tabela da análise de variância da regressão.

Fonte de Graus de Soma de


Quadrados Médios F
Variação Liberdade Quadrados
𝑆𝑄𝑀 œ••
Modelo 1 𝑆𝑄𝑀 𝑄𝑀𝑀 = 𝐹•–˜•– = œ•ž
1
𝑆𝑄𝑅
Resíduos 𝑛−2 𝑆𝑄𝑅 𝑄𝑀𝑅 =
𝑛−2
𝑆𝑄𝑇
Total 𝑛−1 𝑆𝑄𝑇 𝑄𝑀𝑇 =
𝑛−1

O quadrado médio dos resíduos 𝑄𝑀𝑅 corresponde à estimativa da variância 𝜎 / residual.

Uma prática comum para a regressão múltipla é calcular o coeficiente de determinação ajustado,
simbolizado por 𝑅/ . Esta estatística ajusta a medida da força de explicação para o número de
graus de liberdade. O coeficiente de determinação ajustado é obtido dividindo 𝑆𝑄𝑅 e 𝑆𝑄𝑇 pelos
respectivos graus de liberdade.

𝑆𝑄𝑅/(𝑛 − 2)
𝑅/ = 1 −
𝑆𝑄𝑇/(𝑛 − 1)

A relação entre 𝑅/ e 𝑅/ é dada por:

𝑛−1
𝑅/ = 1 − (1 − 𝑅/ ) ∙
𝑛−2

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 34


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

(CESPE 2018/EBSERH)

Determinado estudo considerou um modelo de regressão linear simples na forma 𝒚𝒊 = 𝜷𝟎 +


𝜷𝟏 𝒙𝒊 + 𝜺𝒊 , em que 𝒚𝒊 representa o número de leitos por habitante existente no município i; 𝒙𝒊
representa um indicador de qualidade de vida referente a esse mesmo município i, para i = 1, ...,
n. A componente 𝜺𝒊 representa um erro aleatório com média 0 e variância 𝝈𝟐 . A tabela a seguir
mostra a tabela ANOVA resultante do ajuste desse modelo pelo método dos mínimos
quadrados ordinários.

A partir das informações e da tabela apresentadas, julgue os itens subsequentes.

01. O referido estudo contemplou um conjunto de dados obtidos de n = 11 municípios.

02. A correlação linear entre o número de leitos hospitalares por habitante (y) e o indicador de
qualidade de vida (x) foi igual a 0,9.

03. O R² ajustado (Adjusted R Square) foi inferior a 0,9.

04. A razão F da tabela ANOVA refere-se ao teste de significância estatística do intercepto 𝛽x , em


que se testa a hipótese nula 𝐻x : 𝛽x = 0 contra a hipótese alternativa 𝐻¢ : 𝛽x ≠ 0.

05. A estimativa de 𝜎 / foi igual a 10.

Comentário

O número de graus de liberdade total é dado por 𝑛 − 1. Logo,

𝑛 − 1 = 11

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 35


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

𝑛 = 12

O item 01 está errado.

A correlação linear é dada por:

𝑆𝑄𝑀
𝑅=‹
𝑆𝑄𝑇

900
𝑅=‹ = .0,9
1.000

O item 02 está errado. Observe que o coeficiente de determinação 𝑅/ é que é igual a 0,9. A
banca tentou confundir.

Pois bem, já sabemos que 𝑅/ = 0,9. Vamos agora calcular o coeficiente de determinação
ajustado.

𝑛−1
𝑅/ = 1 − (1 − 𝑅/ ) ∙
𝑛−2

12 − 1
𝑅/ = 1 − (1 − 0,9) ∙
12 − 2

11
𝑅/ = 1 − 0,1 ∙ = 0,89
10

Logo, o coeficiente de determinação ajustado é inferior a 0,9 e o item 03 está certo.

Vamos analisar o último item. Observemos a equação de regressão linear.

𝑦' = 𝛽x + 𝛽O 𝑥' + 𝜀'

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 36


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

A ANOVA testa a hipótese de que o coeficiente angular 𝛽O é nulo. Portanto, o item 04 está
errado.

Lembre-se que a estimativa de 𝜎 / corresponde ao quadrado médio residual.

£/ = 𝑄𝑀𝑅 = 10
𝜎

O item 05 está certo.

Gabarito: Errado, errado, certo, errado, certo.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 37


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

LISTA DE QUESTÕES DE CONCURSOS SEM COMENTÁRIOS

1. (AOCP 2018/FUNPAPA)

Um pesquisador suspeita que existe uma correlação entre o número de promessas que um
candidato político faz e o número de promessas que são cumpridas uma vez que o candidato é
eleito. Ele acompanha vários políticos proeminentes e registra as promessas feitas (X) e as
promessas mantidas (Y). Utilizando os seguintes dados sumarizados, calcule o coeficiente de
correlação entre as promessas feitas e as promessas mantidas e assinale a alternativa correta.

¤ ¤ ¤ ¤ ¤

0 𝑥' = 280, 0 𝑦' = 28, 0 𝑥' 𝑦' = 940, 0 𝑥'/ = 12.400, 0 𝑦'/ = 140
'¥O '¥O '¥O '¥O '¥O

a) O coeficiente de correlação entre as promessas feitas e as promessas mantidas indicam uma


correlação forte e positiva.

b) O coeficiente de correlação entre as promessas feitas e as promessas mantidas indicam uma


correlação fraca e negativa.

c) O coeficiente de correlação entre as promessas feitas e as promessas mantidas indicam uma


correlação forte e negativa.

d) O coeficiente de correlação entre as promessas feitas e as promessas mantidas indicam uma


correlação fraca e positiva.

e) O coeficiente de correlação entre as promessas feitas e as promessas mantidas indicam uma


correlação 𝑟 ≅ 0,5.

2. (FCC 2016/Prefeitura de Teresina)

Uma Prefeitura conduziu uma pesquisa com 12.000 estudantes da Rede Pública de Ensino,
relacionando a quantidade de sema- nas que os estudantes permaneceram nas escolas, em
período integral, com o desempenho em um teste posteriormente aplicado. Obteve-se os
seguintes resultados médios, para cada grupo de 1.000 alunos, conforme tabela abaixo.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 38


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

A partir da análise da tabela,

a) há uma correlação negativa entre o tempo de permanência na escola e o desempenho no


teste.

b) o coeficiente de correlação “r” é maior que zero.

c) o coeficiente de correlação “r” é menor que zero.

d) o coeficiente de correlação “r” é igual a zero.

e) não se pode observar nenhum tipo ligação entre o tempo de permanência na escola e o
desempenho no teste.

3. (FCC 2016/Prefeitura de Teresina)

Observando-se a correlação entre hipotéticos dados de investimentos em infraestrutura de


transporte público, em Teresina, e o tempo de viagens de ônibus dispendido pelos usuários,
calculou-se um coeficiente de correlação (r) igual a −1,0 (um negativo).

A partir deste resultado,

a) o conhecimento de dados sobre os investimentos em infraestrutura de transporte em nada


contribui para a previsão do tempo dispendido em viagens de ônibus.

b) todos os pontos gerados em um gráfico de coordenadas x e y, relacionando esses


investimentos em infraestrutura de transporte e o tempo dispendido em viagens de ônibus, estão
sobre uma reta.

c) o tempo dispendido com viagens de ônibus decresce, necessariamente, de forma exponencial


frente ao aumento linear de investimentos em infraestrutura de transporte.

d) estabelece-se, necessariamente, uma relação de causa e efeito entre duas variáveis, sempre
que exista uma correlação forte (coeficiente de correlação (r) próximo de 1,0) entre elas.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 39


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

e) há uma intensidade de relação fraca, porque negativa, entre os dados sobre os investimentos
em infraestrutura de transporte e os dados sobre dispêndio de tempo em viagens de ônibus.

4. (FEPESE 2014/ISS-Florianópolis)

Com o objetivo de diminuir os casos de afogamento na temporada de 2015, uma prefeitura de


uma cidade litorânea encomendou estudos estatísticos que identificassem prováveis fatores de
risco.

A empresa contratada comparou os dados disponíveis e entregou um relatório com a seguinte


tabela.

Aplicando o modelo estatístico de regressão linear aos dados da tabela acima, podemos afirmar
que:

a) Os dados são linearmente correlacionados e podemos concluir que o consumo excessivo de


sorvete aumenta o risco de afogamento.

b) Há uma correlação não linear entre os dados e a correlação entre eles é provavelmente
espúria.

c) Há uma correlação não linear entre os dados e podemos concluir que o consumo excessivo de
sorvete aumenta o risco de afogamento.

d) Os dados são linearmente correlacionados e a correlação entre eles é provavelmente espúria.

e) Não há correlação estatística entre os dados.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 40


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

5. (FGV 2014/DPE-RJ)

Através de um estudo para fins comparativos, entre o perfil dos cidadãos que procuram a
Defensoria Pública e a natureza dos seus problemas ou dificuldades levantadas, foram obtidos,
considerando-se o total de processos, os seguintes percentuais:

Então, é possível afirmar que

a) exceto pelo primeiro ano, as mulheres respondem pela maior parte das causas de família.

b) a maior parte das causas de família são geradas a partir de atendimentos às mulheres.

c) o coeficiente de correlação entre os percentuais levantados é de 0,8.

d) o coeficiente de correlação entre os percentuais levantados é de 0,5.

e) a estabilidade do percentual de mulheres, entre o 2º e 3º ano, por estar acompanhada de uma


elevação das causas de família demonstra que a relação existe, mas é fraca.

6. (FCC 2013/DPE-RS)

As variáveis aleatórias X e Y representam, respectivamente, os anos de experiência e os salários,


em reais, dos empregados em um determinado ramo de atividade. Sejam os pares (𝒙𝟏 , 𝒚𝟏 ),
(𝒙𝟐 , 𝒚𝟐 ), ..., (𝒙𝒏 , 𝒚𝒏 ), em que 𝒙𝒊 𝒆 𝒚𝒊 (1 ≤ i ≤ n) são os valores de X e Y, respectivamente. Para
prever 𝒚𝒊 em função de 𝒙𝒊 , optou-se por utilizar uma forma de relação linear entre X e Y tal que
𝒚𝒊 = 𝟐. 𝟎𝟎𝟎 + 𝟒𝟓𝒙𝒊 , obtida pelo método dos mínimos quadrados, verificando-se que nem todos
os pontos pertencem a uma mesma reta. Se o coeficiente de correlação linear entre X e Y for
igual a r (r ≠ zero), então

a) r = 1.

b) multiplicando por 0,5 todos os valores 𝑥' e por 0,8 todos os valores 𝑦' , verifica-se que o novo
coeficiente de correlação linear dos dois novos conjuntos é igual a 0,4r.

c) é possível que r seja negativo.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 41


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

d) r = 0,45.

e) o valor de r é positivo.

7. (FCC 2012/ISS-São Paulo)

Considere as seguintes afirmações:

I. Um dispositivo útil quando se quer verificar a associação entre duas variáveis quantitativas é o
gráfico de dispersão entre essas duas variáveis.

II. O coeficiente de variação é uma medida de dispersão relativa que depende da unidade de
medida da variável que está sendo analisada.

III. Dentre as medidas de posição central, a média é considerada uma medida robusta pelo fato
de não ser afetada por valores aberrantes.

IV. Se o coeficiente de correlação linear de Pearson entre duas variáveis for igual a zero, não
haverá associação linear entre elas, implicando a ausência de qualquer outro tipo de associação.

Está correto o que se afirma APENAS em

a) II e III.

b) I e II.

c) I e III.

d) II e IV.

e) I.

8. (FCC 2019/BANRISUL)

Utilizando o método dos mínimos quadrados, obteve-se a equação de tendência 𝑻 £𝒕 = 𝟏𝟓 + 𝟐, 𝟓𝒕


, sendo t = 1, 2, 3, ..., com base nos lucros anuais de uma empresa, em milhões de reais, nos
últimos 10 anos, em que t 1 representa 2009, t 2 representa 2010 e assim por diante. Por
meio dessa equação, obtém-se que a previsão do lucro anual dessa empresa, no valor de 55
milhões de reais, será́ para o ano

(A) 2021.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 42


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

(B) 2025.

(C) 2024.

(D) 2023.

(E) 2022.

9. (FCC 2018/ISS-São Luís)

Analisando um gráfico de dispersão referente a 10 pares de observações (𝒕, 𝒀𝒕 ) com t = 1, 2, 3,


... , 10, optou-se por utilizar o modelo linear 𝒀𝒕 = 𝜶 + 𝜷𝒕 + 𝜺𝒕 com o objetivo de se prever a
variável Y, que representa o faturamento anual de uma empresa em milhões de reais, no ano
(2007 + t). Os parâmetros 𝜶 e 𝜷 são desconhecidos e 𝜺𝒕 é o erro aleatório com as respectivas
hipóteses do modelo de regressão linear simples. As estimativas de 𝜶 e 𝜷 (a e b,
respectivamente) foram obtidas por meio do método dos mínimos quadrados com base nos
dados dos 10 pares de observações citados. Se a = 2 e a soma dos faturamentos dos 10 dados
observados foi de 64 milhões de reais, então, pela equação da reta obtida, a previsão do
faturamento para 2020 é, em milhões de reais, de

a) 11,6

b) 15,0

c) 13,2

d) 12,4

e) 14,4

10. (FCC 2018/TCE-RS)

Utilizando o método da regressão linear, por mínimos quadrados, obteve-se a equação da reta
estimada 𝑻g = 𝟐𝟎 + 𝟎, 𝟖𝒕 correspondente a uma série de tempo referente às vendas, em 1.000
unidades, de um produto no ano t. Esta equação foi obtida com base nas observações das
vendas nos 12 primeiros anos, isto é, para t = 1, 2, 3, ... ,12.

A soma das vendas observadas, em 1.000 unidades, nesses 12 primeiros anos, foi

a) 252,6

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 43


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

b) 280,0

c) 302,4

d) 292,8

e) 336,0

11. (FCC 2018/CL-DF)

Durante um período de 10 anos (de 2008 a 2017), foi registrado, em cada ano, o faturamento
anual (F) de uma empresa, em milhões de reais, e o respectivo gasto anual com propaganda (G),
em milhões de reais. Um modelo de regressão linear simples 𝑭𝒕 = 𝜶 + 𝜷𝑮𝒕 + 𝜺𝒕 , t = 1, 2, ... foi
elaborado para se prever F em função de G, considerando as informações registradas, em que
𝑭𝟏 e 𝑮𝟏 são o faturamento e o gasto com propaganda em 2008, 𝑭𝟐 e 𝑮𝟐 são o faturamento e o
gasto com propaganda em 2009, e assim por diante. Os parâmetros 𝜶 e 𝜷 são desconhecidos e
𝜺𝒕 é o erro aleatório com as respectivas hipóteses do modelo de regressão linear simples. As
estimativas de 𝜶 e 𝜷 foram obtidas pelo método dos mínimos quadrados, sabendo-se que o
valor da soma dos faturamentos e dos gastos com propaganda de 2008 a 2017 foram, em
milhões de reais, iguais a 120 e 15, respectivamente.

Se a estimativa do coeficiente angular da reta obtida por meio do método dos mínimos
quadrados foi de 1,8, então a previsão do faturamento em um determinado ano, uma vez que a
empresa gastou com propaganda neste ano 2 milhões de reais, é

a) 15,4 milhões de reais.

b) 16,0 milhões de reais.

c) 14,4 milhões de reais.

d) 12,9 milhões de reais.

e) 13,6 milhões de reais.

12. (FCC 2018/SEFAZ-SC)

A tabela a seguir indica o valor y do salário, em número de salários mínimos (SM) e os


respectivos tempos de serviço, em anos, x, de 5 funcionários de uma empresa:

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 44


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Suponha que valha a relação: 𝒚𝒊 = 𝜶 + 𝜷𝒙𝒊 + 𝜺𝒊 em que i representa a i-ésima


observação, 𝜶 e 𝜷 são parâmetros desconhecidos e 𝜺𝒊 é o erro aleatório com as hipóteses para
a regressão linear simples. Se as estimativas de 𝜶 e 𝜷 forem obtidas pelo método de mínimos
quadrados por meio dessas 5 observações, a previsão de salário para um funcionário com 4 anos
de serviço será, em SM, igual a

a) 6,1

b) 5,2

c) 6,0

d) 5,5

e) 5,8

13. (FCC 2017/TRT 11ª Região)

Considere que o gerente de uma empresa comercial adotou o modelo linear simples 𝑽𝒊 = 𝜶 +
𝜷𝒈𝒊 + 𝜺𝒊 para analisar a relação entre o volume de vendas anual (V), em unidades monetárias
(u.m.), em função do gasto anual com promoções de vendas (g), também em u.m. Os
parâmetros 𝜶 e 𝜷 são desconhecidos, i corresponde à i-ésima observação anual e 𝜺𝒊 é o erro
aleatório com as respectivas hipóteses para a regressão linear simples. Com base em 10 pares
de observações anuais (𝒈𝒊 , 𝑽𝒊 ), i = 1, 2, 3, ... , 10, e com a utilização do método dos mínimos
quadrados foram encontradas as estimativas de 𝜶 e 𝜷.

Ox Ox Ox Ox Ox

0 𝑔' = 50, 0 𝑉' = 1.500, 0 𝑔'/ = 314, 0 𝑉'/ = 242.600, 0 𝑔' 𝑉' = 8.460
'¥O '¥O '¥O '¥O '¥O

Em um ano que a empresa não efetua gasto com promoções de vendas, significa que
considerando a equação da reta obtida pelo método dos mínimos quadrados a previsão do
volume de vendas deste ano é igual, em u.m., a

a) 50

b) 150

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 45


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

c) 100

d) 90

e) 75

14. (FCC 2017/DPE-RS)

Deseja-se determinar, usando o método da regressão linear, a tendência (T) da seguinte série de
tempo dada pelo quadro abaixo, em que 𝒀𝒕 representa o volume de vendas (em milhões de
reais) de um produto em t (ano).

Analisando o diagrama de dispersão, optou-se pela forma de tendência T = a + bt, em que a e b


foram obtidos por meio do método dos mínimos quadrados. O valor de a é igual a

a) 4,50

b) 3,00

c) 4,25

d) 4,75

e) 4,00

15. (FCC 2016/ TRT 20ª Região)

Considere que (𝟏𝟎, 𝟎; 𝟐𝟕, 𝟓) é um ponto pertencente à reta de equação 𝒚 = 𝒂 + 𝒃𝒙,


correspondente ao modelo de regressão linear simples 𝒚𝒊 = 𝜶 + 𝜷𝒙𝒊 + 𝜺𝒊 (𝒊 = 𝟏, 𝟐, 𝟑, … ), em que:

I. 𝒚𝒊 é o salário do trabalhador 𝒊 em um determinado país, em unidades monetárias.

II. 𝒙𝒊 é o número de anos de experiência do trabalhador 𝒊.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 46


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

III. 𝜶 e 𝜷 são parâmetros desconhecidos com suas estimativas (𝒂 e 𝒃, respectivamente) obtidas


pelo método dos mínimos quadrados e com base em 20 pares de observações (𝒙𝒊 , 𝒚𝒊 ).

IV. 𝜺𝒊 é o erro aleatório com as respectivas hipóteses consideradas do modelo de regressão


linear simples.

Dados:

/x /x /x /x

0 𝑥' = 144, 0 𝑦' = 480, 0 𝑥' 𝑦' = 3.620, 0 𝑦'/ = 11.770


'¥O '¥O '¥O '¥O

Considerando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que a
estimativa do salário de um trabalhador com 16 anos de experiência é, em unidades monetárias,
de

a) 33,50

b) 40,00

c) 30,75

d) 25,00

e) 35,00

16. (FCC 2015/SEFAZ-PI)

O modelo 𝒀𝒕 = 𝜶 + 𝜷𝒕 + 𝜺𝒕 , 𝒕 = 𝟏, 𝟐, 𝟑, …, foi considerado para prever o lucro de uma companhia


no ano (𝟐𝟎𝟎𝟕 + 𝒕).

Sabe-se que:

• 𝒀𝒕 representa o lucro, em milhões de reais no ano t;


• 𝜶 e 𝜷 são parâmetros desconhecidos;
• 𝜺𝒕 é o correspondente erro aleatório, com as respectivas hipóteses da regressão linear;
• as estimativas de 𝜶 e 𝜷 foram obtidas pelo método de mínimos quadrados, considerando-
se as observações Yt no período de 6 anos (2008 a 2013).

Os dados relativos às observações são:

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 47


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

± ± ± ±

0 𝑡 = 21, 0 𝑡 / = 91, 0 𝑡𝑌 = 140, 0 𝑌• = 36


•¥O •¥O •¥O •¥O

Nessas condições, a previsão de mínimos quadrados para o lucro da companhia, em milhões de


reais, no ano de 2014, é igual a

a) 7,55

b) 8,15

c) 7,90

d) 8,80

e) 9,50

17. (FCC 2015/CNMP)

Seja o modelo linear 𝒀𝒊 = 𝜷𝑿𝒊 + 𝜺𝒊 estabelecendo uma relação linear, sem intercepto, entre duas
variáveis X e Y, em que 𝒀𝒊 i é a variável dependente na observação i, 𝑿𝒊 é a variável explicativa na
observação i e 𝜺𝒊 o erro aleatório com as respectivas hipóteses para a regressão linear simples.
O parâmetro 𝜷 do modelo é desconhecido e sua estimativa foi obtida pelo método dos mínimos
quadrados com base em 10 pares de observações (𝑿𝒊 , 𝒀𝒊 ).

Dados:

Ox Ox Ox Ox

0 𝑋' = 120, 0 𝑌' = 180, 0 𝑋' 𝑌' = 2.400, 0 𝑋'/ = 1.500


'¥O '¥O '¥O '¥O

Considerando a equação da reta obtida pelo método dos mínimos quadrados, obtém-se que Y é
igual a 24 quando X for igual a

a) 15.

b) 6.

c) 16.

d) 18.

e) 20.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 48


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

18. (FCC 2019/SEFAZ-BA)

Em uma determinada indústria, foi efetuada uma pesquisa a respeito da possível relação entre o
número de horas trabalhadas (X), com 𝑿 ≥ 𝟐, e as quantidades produzidas de um produto (Y).
Com base em 10 pares de observações (𝑿𝒊 , 𝒀𝒊 ) e considerando o gráfico de dispersão
correspondente, optou-se por utilizar o modelo linear 𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊 , com 𝒊 representando a
i-ésima observação, ou seja, i = 1, 2, 3, ..., 10. Os parâmetros 𝜶 e 𝜷 são desconhecidos e as suas
estimativas (𝒂 e 𝒃, respectivamente) foram obtidas pelo método dos mínimos quadrados.
Observação: 𝜺𝒊 é o erro aleatório com as respectivas hipóteses do modelo de regressão linear
simples. Considere o gráfico abaixo, construído utilizando os valores encontrados para as
estimativas de 𝜶 e 𝜷.

A previsão da quantidade produzida será igual ao dobro da média verificada das 10 observações
𝒀𝒊 quando o número de horas trabalhadas for igual a

a) 18

b) 12

c) 20

d) 24

e) 22

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 49


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

19. (FCC 2014/SEFAZ-RJ)

Considere o modelo 𝒚𝒊 = 𝜶 + 𝜷𝒙𝒊 + 𝜺𝒊 , i = 1,2,3,… onde:

I. 𝒚𝒊 e 𝒙𝒊 representam, respectivamente, o tempo de reação a certo estímulo, em segundos, e a


idade, em anos, do indivíduo i.

II. 𝜶 e 𝜷 representam os parâmetros desconhecidos do modelo.

III. 𝜺𝒊 representa o erro aleatório com as respectivas hipóteses para a regressão linear simples.

IV. As estimativas de 𝜶 e 𝜷 foram obtidas pelo método de mínimos quadrados por meio de 10
observações, utilizando-se as seguintes informações:
==7ee66==

Nessas condições, a soma de quadrados residuais do modelo é igual a

a) 810

b) 515

c) 920

d) 460

e) 785

20. (FCC 2015/CNMP)

Considere o modelo linear 𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊 , sendo i a i-ésima observação, 𝒀𝒊 a variável


dependente na observação i, 𝑿𝒊 a variável explicativa na observação i e 𝜺𝒊 o erro aleatório com
as respectivas hipóteses para a regressão linear simples. Os parâmetros 𝜶 e 𝜷 são
desconhecidos e suas estimativas (a e b, respectivamente) foram obtidas pelo método dos
mínimos quadrados e com base em 20 pares de observações (𝑿𝒊 , 𝒀𝒊 ), i = 1, 2, ... , 20. Sabe-se
que os pontos (10 ; 9,8) e (40 ; 33,8) pertencem à reta de equação Y = a + bX.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 50


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Pelo quadro de análise de variância correspondente, observa-se que

a) o coeficiente de determinação (𝑅/ ), definido como sendo o resultado da divisão da variação


explicada pela variação total, é igual a 80%.

b) a variação explicada, fonte de variação devido à regressão, é igual a 240.

c) o valor da estatística F (F calculado) utilizado para testar a existência da regressão é igual a 32.

d) o valor da estimativa da variância do modelo teórico é igual a 10,8.

e) a variação explicada, fonte de variação devido à regressão, tem distribuição qui-quadrado com
18 graus de liberdade.

21. (FCC 2018/TRT 2ª Região)

Considere que em um país a variável L representa o lucro, em unidades monetárias, de uma


empresa em um determinado ano e a variável 𝑿 ≥ 𝟎 os investimentos realizados pela empresa,
em unidades monetárias, no mesmo ano. Um modelo de regressão linear correspondente à
equação 𝑳𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊 foi adotado pela empresa com o objetivo de se prever L em função
de X. 𝑳𝒊 representa o lucro da empresa no ano i ( i = 1, 2, 3 ...) e 𝑿𝒊 os investimentos da empresa
em i. Os parâmetros 𝜶 e 𝜷 são desconhecidos e 𝜺𝒊 é o erro aleatório com as respectivas
hipóteses do modelo de regressão linear simples. As estimativas de 𝜶 e 𝜷 foram obtidas por
meio do método dos mínimos quadrados com base nos primeiros 10 pares de observações
(𝑿𝒊 , 𝑳𝒊 ).

Com base na equação da reta obtida por meio do método dos mínimos quadrados e no quadro
de análise de variância considerado para testar a existência de uma relação linear entre L e X, é
correto afirmar que

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 51


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

a) a previsão de L é igual a 0 quando X for igual a 0,5.

b) o decréscimo de L quando X é acrescido de uma unidade monetária é igual a 20 unidades


monetárias.

c) se 𝐹´ (𝑚, 𝑛) é o valor tabelado da distribuição F de Snedecor com m graus de liberdade no


numerador e n graus de liberdade no denominador a um nível de significância α, será aceita a
hipótese de não existência de uma relação linear entre L e X se 𝐹´ (1,8) > 32.

d) dividindo o valor encontrado para a variação explicada pelo valor encontrado para a variação
total encontra-se o coeficiente de determinação (𝑅/ ) que é igual a 0,64.

e) a estimativa da variância do modelo teórico (𝜎 / ) é igual a 400.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 52


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

GABARITO SEM COMENTÁRIO

01. C
02. B
03. B
04. D
05. D
06. E
07. E
08. C
09. D
10. C
11. D
12. D
13. E
14. C
15. E
16. D
17. A
18. E
19. C
20. C
21. C

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 53


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

LISTA DE QUESTÕES DE CONCURSOS COM COMENTÁRIOS

Exercícios sobre Correlação

22. (AOCP 2018/FUNPAPA)

Um pesquisador suspeita que existe uma correlação entre o número de promessas que um
candidato político faz e o número de promessas que são cumpridas uma vez que o candidato é
eleito. Ele acompanha vários políticos proeminentes e registra as promessas feitas (X) e as
promessas mantidas (Y). Utilizando os seguintes dados sumarizados, calcule o coeficiente de
correlação entre as promessas feitas e as promessas mantidas e assinale a alternativa correta.

¤ ¤ ¤ ¤ ¤

0 𝑥' = 280, 0 𝑦' = 28, 0 𝑥' 𝑦' = 940, 0 𝑥'/ = 12.400, 0 𝑦'/ = 140
'¥O '¥O '¥O '¥O '¥O

a) O coeficiente de correlação entre as promessas feitas e as promessas mantidas indicam uma


correlação forte e positiva.

b) O coeficiente de correlação entre as promessas feitas e as promessas mantidas indicam uma


correlação fraca e negativa.

c) O coeficiente de correlação entre as promessas feitas e as promessas mantidas indicam uma


correlação forte e negativa.

d) O coeficiente de correlação entre as promessas feitas e as promessas mantidas indicam uma


correlação fraca e positiva.

e) O coeficiente de correlação entre as promessas feitas e as promessas mantidas indicam uma


correlação 𝑟 ≅ 0,5.

Comentário

O coeficiente de correlação é dado por:

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 54


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

∑[(𝑋' − 𝑋) ) ∙ (𝑌' − 𝑌))]


𝑟=
.∑(𝑋' − 𝑋))/ ∙ ∑(𝑌' − 𝑌))/

Vimos que é possível calcular esses somatórios de uma maneira simplificada.

Vamos calcular a média de X e a média de Y.

∑𝑥' 280
𝑋) = = = 40
𝑛 7

∑𝑦' 28
𝑌) = = =4
𝑛 7

O somatório do numerador é dado por:

0[(𝑋' − 𝑋)) ∙ (𝑌' − 𝑌) )] = 0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌)

= 940 − 7 × 40 × 4

= −180

Os somatórios do denominador são dados por:

0(𝑋' − 𝑋))/ = 0 𝑋'/ − 𝑛 ∙ (𝑋))/ =

= 12.400 − 7 × 40/ = 1.200

0(𝑌' − 𝑌))/ = 0 𝑌'/ − 𝑛 ∙ (𝑌))/ =

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 55


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

= 140 − 7 × 4/ = 28

Assim, o coeficiente de correlação é dado por:

−180 −180
𝑟= =
√1.200 × 28 √12 × 100 × 28

−180 −180
𝑟= =
10√4 × 3 × 4 × 7 10 ∙ 4 ∙ √21

Vamos utilizar a aproximação √21 ≅ 4,5, já que 4,5/ = 20,25.

−180
𝑟≅
40 × 4,5

𝑟 ≅ −1

Veja que o coeficiente de correlação é bem próximo de −1, mas não é igual, já que usamos uma
aproximação. Isso quer dizer que existe uma forte correlação negativa.

Gabarito: C

23. (FCC 2016/Prefeitura de Teresina)

Uma Prefeitura conduziu uma pesquisa com 12.000 estudantes da Rede Pública de Ensino,
relacionando a quantidade de sema- nas que os estudantes permaneceram nas escolas, em
período integral, com o desempenho em um teste posteriormente aplicado. Obteve-se os
seguintes resultados médios, para cada grupo de 1.000 alunos, conforme tabela abaixo.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 56


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

A partir da análise da tabela,

a) há uma correlação negativa entre o tempo de permanência na escola e o desempenho no


teste.

b) o coeficiente de correlação “r” é maior que zero.

c) o coeficiente de correlação “r” é menor que zero.

d) o coeficiente de correlação “r” é igual a zero.

e) não se pode observar nenhum tipo ligação entre o tempo de permanência na escola e o
desempenho no teste.

Comentário

Vamos colocar os valores de x em ordem crescente (e colocar o correspondente valor de y na


linha abaixo).

x 12 19 31 43 47 56 74 75 116 160 164 178


y 11,9 12,6 12,7 13,8 13,2 14,0 14,1 14,6 15,1 15,8 15,3 16,3

Observe que, de uma maneira geral, os menores valores de x estão associados aos menores
valores de y e os maiores valores de x estão associados aos maiores valores de y. Portanto, a
correlação é positiva.

Gabarito: B

24. (FCC 2016/Prefeitura de Teresina)

Observando-se a correlação entre hipotéticos dados de investimentos em infraestrutura de


transporte público, em Teresina, e o tempo de viagens de ônibus dispendido pelos usuários,
calculou-se um coeficiente de correlação (r) igual a −1,0 (um negativo).

A partir deste resultado,

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 57


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

a) o conhecimento de dados sobre os investimentos em infraestrutura de transporte em nada


contribui para a previsão do tempo dispendido em viagens de ônibus.

b) todos os pontos gerados em um gráfico de coordenadas x e y, relacionando esses


investimentos em infraestrutura de transporte e o tempo dispendido em viagens de ônibus, estão
sobre uma reta.

c) o tempo dispendido com viagens de ônibus decresce, necessariamente, de forma exponencial


frente ao aumento linear de investimentos em infraestrutura de transporte.

d) estabelece-se, necessariamente, uma relação de causa e efeito entre duas variáveis, sempre
que exista uma correlação forte (coeficiente de correlação (r) próximo de 1,0) entre elas.

e) há uma intensidade de relação fraca, porque negativa, entre os dados sobre os investimentos
em infraestrutura de transporte e os dados sobre dispêndio de tempo em viagens de ônibus.

Comentário

O coeficiente de correlação linear é −1,0. Portanto, há uma correlação negativa perfeita.

Isso quer dizer que todos os pontos estão sobre uma mesma reta. Além disso, o valor de y
decresce quando o valor de x cresce.

Vamos analisar as alternativas.

a) Se os dados estão sobre uma reta, podemos utilizar essa reta para prever dados futuros, já que
uma variável está em função da outra.

b) Correto. Quando o coeficiente é 1 ou -1, os pontos estão todos sobre a mesma reta.

c) Como o coeficiente de correlação linear é -1, então a relação linear entre as variáveis é
perfeita. Assim, a relação é linear e não exponencial.

d) Correlação forte não indica relação de causa e efeito. A alternativa está errada.

e) Falsa. A correlação é perfeita. Todos os dados estão sobre a mesma reta.

Gabarito: B

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 58


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

25. (FEPESE 2014/ISS-Florianópolis)

Com o objetivo de diminuir os casos de afogamento na temporada de 2015, uma prefeitura de


uma cidade litorânea encomendou estudos estatísticos que identificassem prováveis fatores de
risco.

A empresa contratada comparou os dados disponíveis e entregou um relatório com a seguinte


tabela.

Aplicando o modelo estatístico de regressão linear aos dados da tabela acima, podemos afirmar
que:

a) Os dados são linearmente correlacionados e podemos concluir que o consumo excessivo de


sorvete aumenta o risco de afogamento.

b) Há uma correlação não linear entre os dados e a correlação entre eles é provavelmente
espúria.

c) Há uma correlação não linear entre os dados e podemos concluir que o consumo excessivo de
sorvete aumenta o risco de afogamento.

d) Os dados são linearmente correlacionados e a correlação entre eles é provavelmente espúria.

e) Não há correlação estatística entre os dados.

Comentário

Observe que quando o consumo de sorve diminui, diminui também a quantidade de afogamento
no mês. Os dados estão praticamente sobre uma reta.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 59


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Assim, apesar de haver uma forte correlação positiva, não podemos dizer que um evento causa o
outro. É claro que o consumo de sorvete não influencia na quantidade de afogamentos no mês.
Provavelmente existe alguma causa comum aos dos eventos. Por exemplo, com a chegada do
verão, mais pessoas consomem sorvete e também mais pessoas vão à praia. Com mais pessoas
na praia, temos um aumento no número de afogamentos.

Assim, existe uma correlação linear, mas trata-se de uma correlação espúria.

Gabarito: D

26. (FGV 2014/DPE-RJ)

Através de um estudo para fins comparativos, entre o perfil dos cidadãos que procuram a
Defensoria Pública e a natureza dos seus problemas ou dificuldades levantadas, foram obtidos,
considerando-se o total de processos, os seguintes percentuais:

Então, é possível afirmar que

a) exceto pelo primeiro ano, as mulheres respondem pela maior parte das causas de família.

b) a maior parte das causas de família são geradas a partir de atendimentos às mulheres.

c) o coeficiente de correlação entre os percentuais levantados é de 0,8.

d) o coeficiente de correlação entre os percentuais levantados é de 0,5.

e) a estabilidade do percentual de mulheres, entre o 2º e 3º ano, por estar acompanhada de uma


elevação das causas de família demonstra que a relação existe, mas é fraca.

Comentário

As alternativas A, B e E estão erradas pelo mesmo motivo: a tabela não indica qual o percentual
de mulheres que responde pelas causas de família.

Vamos agora calcular o coeficiente de correlação para decidir entre as alternativas C e D.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 60


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Seja X o atributo “Percentual de Mulheres” e seja Y o atributo “Percentual de Causas de


Família”.

X Y
50 10
60 20
60 30
70 20

Vamos calcular as médias.

50 + 60 + 60 + 70
𝑋) = = 60
4

10 + 20 + 30 + 20
𝑌) = = 20
4

Precisamos de 3 colunas: 𝑋𝑌, 𝑋 / e 𝑌 / .

X Y 𝑿∙𝒀 𝑿𝟐 𝒀𝟐
50 10 50 × 10 = 500 50/ = 2.500 10/ = 100
60 20 60 × 20 = 1.200 60/ = 3.600 20/ = 400
60 30 60 × 30 = 1.800 60/ = 3.600 30/ = 900
70 20 70 × 20 = 1.400 70/ = 4.900 20/ = 400

Como são 4 pares ordenados, então 𝑛 = 4.

Vamos calcular os somatórios das colunas construídas.

0(𝑋' ∙ 𝑌' ) = 500 + 1.200 + 1.800 + 1.400 = 4.900

0 𝑋'/ = 2.500 + 3.600 + 3.600 + 4.900 = 14.600

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 61


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

0 𝑌'/ = 100 + 400 + 900 + 400 = 1.800

Agora estamos prontos para aplicar nas fórmulas.

O somatório do numerador do coeficiente de correlação é:

0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌) = 4.900 − 4 ∙ 60 ∙ 20 = 100

Os somatórios do denominador são:

0 𝑋'/ − 𝑛 ∙ (𝑋))/ = 14.600 − 4 ∙ 60/ = 200

0 𝑌'/ − 𝑛 ∙ (𝑌) )/ = 1.800 − 4 ∙ 20/ = 200

Assim, o coeficiente de correlação é:

100 100
𝑟= =
√200 × 200 200

𝑟 = 0,5

Gabarito: D

27. (FCC 2013/DPE-RS)

As variáveis aleatórias X e Y representam, respectivamente, os anos de experiência e os salários,


em reais, dos empregados em um determinado ramo de atividade. Sejam os pares (𝒙𝟏 , 𝒚𝟏 ),

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 62


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

(𝒙𝟐 , 𝒚𝟐 ), ..., (𝒙𝒏 , 𝒚𝒏 ), em que 𝒙𝒊 𝒆 𝒚𝒊 (1 ≤ i ≤ n) são os valores de X e Y, respectivamente. Para


prever 𝒚𝒊 em função de 𝒙𝒊 , optou-se por utilizar uma forma de relação linear entre X e Y tal que
𝒚𝒊 = 𝟐. 𝟎𝟎𝟎 + 𝟒𝟓𝒙𝒊 , obtida pelo método dos mínimos quadrados, verificando-se que nem todos
os pontos pertencem a uma mesma reta. Se o coeficiente de correlação linear entre X e Y for
igual a r (r ≠ zero), então

a) r = 1.

b) multiplicando por 0,5 todos os valores 𝑥' e por 0,8 todos os valores 𝑦' , verifica-se que o novo
coeficiente de correlação linear dos dois novos conjuntos é igual a 0,4r.

c) é possível que r seja negativo.

d) r = 0,45.

e) o valor de r é positivo.

Comentário

Os pontos não estão sobre uma mesma reta. Portanto, o coeficiente é diferente de 1 e diferente
de -1. A alternativa A está errada.

A alternativa B está errada. Quando multiplicamos as variáveis por constantes de mesmo sinal
(ambas positivas ou ambas negativas), o coeficiente de correlação linear não se altera. Portanto,

𝑟(0,5𝑥' , 0,8𝑦' ) = 𝑟

A inclinação de uma reta de equação 𝑦 = 𝑚𝑥 + 𝑝 é dada pelo coeficiente angular 𝑚. Quando


𝑚 > 0, a reta é ascendente, quando 𝑚 < 0, a reta é descendente.

Como a equação da reta é 𝑦' = 2.000 + 45𝑥' , então o coeficiente angular 45 é positivo. Logo, a
correlação linear é positiva (r é positivo). A resposta é a alternativa E.

Com os dados do problema, não temos como calcular o valor exato de r. Logo, a alternativa D
está errada.

Gabarito: E

28. (FCC 2012/ISS-São Paulo)

Considere as seguintes afirmações:

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 63


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

I. Um dispositivo útil quando se quer verificar a associação entre duas variáveis quantitativas é o
gráfico de dispersão entre essas duas variáveis.

II. O coeficiente de variação é uma medida de dispersão relativa que depende da unidade de
medida da variável que está sendo analisada.

III. Dentre as medidas de posição central, a média é considerada uma medida robusta pelo fato
de não ser afetada por valores aberrantes.

IV. Se o coeficiente de correlação linear de Pearson entre duas variáveis for igual a zero, não
haverá associação linear entre elas, implicando a ausência de qualquer outro tipo de associação.

Está correto o que se afirma APENAS em

a) II e III.

b) I e II.

c) I e III.

d) II e IV.

e) I.

Comentário

A assertiva I está correta. O diagrama de dispersão é muito útil para verificar visualmente a
relação entre as variáveis.

A assertiva II está errada. Apesar de o coeficiente de variação ser uma medida de dispersão
relativa, seu valor não depende da unidade. O coeficiente de variação é adimensional. Lembre-se
que o coeficiente de variação é o quociente entre o desvio padrão e a média. Como o desvio
padrão e a média possuem a mesma unidade, as unidades se cancelam na divisão e o coeficiente
de variação não em unidades.

A sentença III está errada. A média é sim bastante afetada por valores extremos.

A sentença IV está errada. Se o coeficiente de correlação linear é 0, então não existe relação
linear entre as variáveis, mas pode existir outros tipos de relação entre as variáveis (uma relação
logarítmica, por exemplo).

Gabarito: E

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 64


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Exercícios sobre Regressão Linear

29. (FCC 2019/BANRISUL)

Utilizando o método dos mínimos quadrados, obteve-se a equação de tendência 𝑻 £𝒕 = 𝟏𝟓 + 𝟐, 𝟓𝒕


, sendo t = 1, 2, 3, ..., com base nos lucros anuais de uma empresa, em milhões de reais, nos
últimos 10 anos, em que t 1 representa 2009, t 2 representa 2010 e assim por diante. Por
meio dessa equação, obtém-se que a previsão do lucro anual dessa empresa, no valor de 55
milhões de reais, será́ para o ano

(A) 2021.

(B) 2025.

(C) 2024.

(D) 2023.

(E) 2022.

Comentário

Queremos que a previsão seja igual a 55 milhões. Portanto,

𝟓𝟓 = 𝟏𝟓 + 𝟐, 𝟓𝒕

𝟒𝟎 = 𝟐, 𝟓𝒕

𝟒𝟎 𝟒𝟎𝟎
𝒕= = = 𝟏𝟔 𝒂𝒏𝒐𝒔
𝟐, 𝟓 𝟐𝟓

Como a contagem começou no ano de 2009 (t=1 representa o ano de 2009), então para obter o
16º ano devemos adicionar 15 ao ano de 2009.

𝟐𝟎𝟎𝟗 + 𝟏𝟓 = 𝟐𝟎𝟐𝟒

Gabarito: C

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 65


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

30. (FCC 2018/ISS-São Luís)

Analisando um gráfico de dispersão referente a 10 pares de observações (𝒕, 𝒀𝒕 ) com t = 1, 2, 3,


... , 10, optou-se por utilizar o modelo linear 𝒀𝒕 = 𝜶 + 𝜷𝒕 + 𝜺𝒕 com o objetivo de se prever a
variável Y, que representa o faturamento anual de uma empresa em milhões de reais, no ano
(2007 + t). Os parâmetros 𝜶 e 𝜷 são desconhecidos e 𝜺𝒕 é o erro aleatório com as respectivas
hipóteses do modelo de regressão linear simples. As estimativas de 𝜶 e 𝜷 (a e b,
respectivamente) foram obtidas por meio do método dos mínimos quadrados com base nos
dados dos 10 pares de observações citados. Se a = 2 e a soma dos faturamentos dos 10 dados
observados foi de 64 milhões de reais, então, pela equação da reta obtida, a previsão do
faturamento para 2020 é, em milhões de reais, de

a) 11,6

b) 15,0

c) 13,2

d) 12,4

e) 14,4

Comentário

A média dos faturamentos é dada por:

∑𝑌 64
𝑌= = = 6,4
𝑛 10

A média de 𝑡 é dada por:

1 + 2 + ⋯ + 10
𝑡= = 5,5
10

A equação da reta calculada é dada por:


𝒀 = 𝒂 + 𝒃𝒕
O problema informou que 𝒂 = 𝟐.

Sabemos que

𝑌 = 𝑎 + 𝑏𝑡

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 66


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Logo,

6,4 = 2 + 𝑏 ∙ 5,5

4,4 44 4
𝑏= = = = 0,8
5,5 55 5

Assim, a equação da reta é

𝑌 = 2 + 0,8𝑡

Como a contagem começou em 2007, temos que 2020 corresponde a 𝑡 = 13.

𝑌(13) = 2 + 0,8 × 13

𝑌(13) = 12,4

Gabarito: D

31. (FCC 2018/TCE-RS)

Utilizando o método da regressão linear, por mínimos quadrados, obteve-se a equação da reta
estimada 𝑻g = 𝟐𝟎 + 𝟎, 𝟖𝒕 correspondente a uma série de tempo referente às vendas, em 1.000
unidades, de um produto no ano t. Esta equação foi obtida com base nas observações das
vendas nos 12 primeiros anos, isto é, para t = 1, 2, 3, ... ,12.

A soma das vendas observadas, em 1.000 unidades, nesses 12 primeiros anos, foi

a) 252,6

b) 280,0

c) 302,4

d) 292,8

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 67


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

e) 336,0

Comentário

Vamos calcular a média de 𝒕.

𝟏 + 𝟐 + ⋯ + 𝟏𝟐
𝒕= = 𝟔, 𝟓
𝟏𝟐

Assim, temos:

𝑇 = 20 + 0,8𝑡

𝑇 = 20 + 0,8 × 6,5

𝑇 = 25,2

Como a média de T é igual à soma dos valores observados dividido pela quantidade de termos,
temos:

∑𝑇
𝑇=
𝑛

∑𝑇 = 𝑛 × 𝑇

∑𝑇 = 12 × 25,2 = 302,4

Gabarito: C

32. (FCC 2018/CL-DF)

Durante um período de 10 anos (de 2008 a 2017), foi registrado, em cada ano, o faturamento
anual (F) de uma empresa, em milhões de reais, e o respectivo gasto anual com propaganda (G),
em milhões de reais. Um modelo de regressão linear simples 𝑭𝒕 = 𝜶 + 𝜷𝑮𝒕 + 𝜺𝒕 , t = 1, 2, ... foi
elaborado para se prever F em função de G, considerando as informações registradas, em que

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 68


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

𝑭𝟏 e 𝑮𝟏 são o faturamento e o gasto com propaganda em 2008, 𝑭𝟐 e 𝑮𝟐 são o faturamento e o


gasto com propaganda em 2009, e assim por diante. Os parâmetros 𝜶 e 𝜷 são desconhecidos e
𝜺𝒕 é o erro aleatório com as respectivas hipóteses do modelo de regressão linear simples. As
estimativas de 𝜶 e 𝜷 foram obtidas pelo método dos mínimos quadrados, sabendo-se que o
valor da soma dos faturamentos e dos gastos com propaganda de 2008 a 2017 foram, em
milhões de reais, iguais a 120 e 15, respectivamente.

Se a estimativa do coeficiente angular da reta obtida por meio do método dos mínimos
quadrados foi de 1,8, então a previsão do faturamento em um determinado ano, uma vez que a
empresa gastou com propaganda neste ano 2 milhões de reais, é

a) 15,4 milhões de reais.

b) 16,0 milhões de reais.

c) 14,4 milhões de reais.

d) 12,9 milhões de reais.

e) 13,6 milhões de reais.

Comentário

A soma dos faturamentos é igual a 120. Logo, a média é igual a:

∑𝐹 120
𝐹= = = 12
𝑛 10

A soma dos gastos com propaganda é igual a 15. Logo, a média é igual a

∑𝐺 15
𝐺= = = 1,5
𝑛 10

Sabemos ainda que o coeficiente angular da reta calculada é igual a 1,8. Portanto, a equação da
reta é dada por 𝐹• = 𝛼n + 1,8𝐺• .

Vamos calcular a estimativa de 𝛼 substituindo 𝐹• e 𝐺• pelas suas médias.

12 = 𝛼n + 1,8 × 1,5

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 69


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

𝛼n = 9,3

Assim, a reta tem equação:

𝐹• = 9,3 + 1,8𝐺•

Substituindo 𝐺• por 2, temos:

𝐹• (2) = 9,3 + 1,8 × 2

= 12,9

Gabarito: D

33. (FCC 2018/SEFAZ-SC)

A tabela a seguir indica o valor y do salário, em número de salários mínimos (SM) e os


respectivos tempos de serviço, em anos, x, de 5 funcionários de uma empresa:

Suponha que valha a relação: 𝒚𝒊 = 𝜶 + 𝜷𝒙𝒊 + 𝜺𝒊 em que i representa a i-ésima


observação, 𝜶 e 𝜷 são parâmetros desconhecidos e 𝜺𝒊 é o erro aleatório com as hipóteses para
a regressão linear simples. Se as estimativas de 𝜶 e 𝜷 forem obtidas pelo método de mínimos
quadrados por meio dessas 5 observações, a previsão de salário para um funcionário com 4 anos
de serviço será, em SM, igual a

a) 6,1

b) 5,2

c) 6,0

d) 5,5

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 70


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

e) 5,8

Comentário

Vamos calcular as médias de 𝑥 e 𝑦.

2+3+5+3+2
𝑥= =3
5

3+4+7+4+2
𝑦= =4
5

Vamos também calcular o somatório dos produtos 𝑥𝑦 e também o somatório dos quadrados de
X.

∑𝑥𝑦 = 2 × 3 + 3 × 4 + 5 × 7 + 3 × 4 + 2 × 2

∑𝑋𝑌 = 69

∑𝑥 / = 2/ + 3/ + 5/ + 3/ + 2/ = 51

O coeficiente 𝛽o é dado por

∑(𝑋' − 𝑋)((𝑌' − 𝑌)
𝛽o = /
∑_𝑋' − 𝑋a

Vimos que o numerador e o denominador podem ser calculados de outra forma.

0[(𝑋' − 𝑋)) ∙ (𝑌' − 𝑌) )] = 0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌)

= 69 − 5 × 3 × 4

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 71


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

=9

0(𝑋' − 𝑋))/ = 0 𝑋'/ − 𝑛 ∙ (𝑋))/

= 51 − 5 × 3/

=6

Assim, o coeficiente 𝛽o é:

9
𝛽o = = 1,5
6

Vamos agora calcular 𝛼n.

𝑦 = 𝛼n + 𝛽o 𝑥

4 = 𝛼n + 1,5 × 3

𝛼n = −0,5

A equação da reta fica:

𝑦 = −0,5 + 1,5𝑥

Substituindo x por 4, temos:

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 72


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

𝑦(4) = −0,5 + 1,5 × 4 = 5,5

Gabarito: D

34. (FCC 2017/TRT 11ª Região)

Considere que o gerente de uma empresa comercial adotou o modelo linear simples 𝑽𝒊 = 𝜶 +
𝜷𝒈𝒊 + 𝜺𝒊 para analisar a relação entre o volume de vendas anual (V), em unidades monetárias
(u.m.), em função do gasto anual com promoções de vendas (g), também em u.m. Os
parâmetros 𝜶 e 𝜷 são desconhecidos, i corresponde à i-ésima observação anual e 𝜺𝒊 é o erro
aleatório com as respectivas hipóteses para a regressão linear simples. Com base em 10 pares
de observações anuais (𝒈𝒊 , 𝑽𝒊 ), i = 1, 2, 3, ... , 10, e com a utilização do método dos mínimos
quadrados foram encontradas as estimativas de 𝜶 e 𝜷.

Ox Ox Ox Ox Ox

0 𝑔' = 50, 0 𝑉' = 1.500, 0 𝑔'/ = 314, 0 𝑉'/ = 242.600, 0 𝑔' 𝑉' = 8.460
'¥O '¥O '¥O '¥O '¥O

Em um ano que a empresa não efetua gasto com promoções de vendas, significa que
considerando a equação da reta obtida pelo método dos mínimos quadrados a previsão do
volume de vendas deste ano é igual, em u.m., a

a) 50

b) 150

c) 100

d) 90

e) 75

Comentário

Para calcular os coeficientes da reta, precisamos efetuar alguns cálculos para as médias.

∑𝑔' 50
𝑔= = =5
𝑛 10

∑𝑉' 1.500
𝑉= = = 150
𝑛 10

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 73


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

O coeficiente 𝛽o é dado por

∑(𝑋' − 𝑋)((𝑌' − 𝑌)
𝛽o = /
∑_𝑋' − 𝑋a

Na questão, temos que 𝑔 faz o papel de 𝑋 e 𝑉 faz o papel de 𝑌.

Vimos que o numerador e o denominador podem ser calculados de outra forma.

0[(𝑋' − 𝑋)) ∙ (𝑌' − 𝑌) )] = 0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌)

= 8.460 − 10 × 5 × 150

= 960

0(𝑋' − 𝑋))/ = 0 𝑋'/ − 𝑛 ∙ (𝑋))/

= 314 − 10 × 5/

= 64

Assim, o coeficiente 𝛽o é:

960
𝛽o = = 15
64

Vamos agora calcular 𝛼n.

𝑉 = 𝛼n + 𝛽o 𝑔

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 74


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

150 = 𝛼n + 15 × 5

𝛼n = 75

gf = 75 + 15𝑔' .
Assim, a reta calculada é 𝑉

Quando 𝑔' = 0, temos:

gf = 75 + 15 × 0 = 75
𝑉

Gabarito: E

35. (FCC 2017/DPE-RS)

Deseja-se determinar, usando o método da regressão linear, a tendência (T) da seguinte série de
tempo dada pelo quadro abaixo, em que 𝒀𝒕 representa o volume de vendas (em milhões de
reais) de um produto em t (ano).

Analisando o diagrama de dispersão, optou-se pela forma de tendência T = a + bt, em que a e b


foram obtidos por meio do método dos mínimos quadrados. O valor de a é igual a

a) 4,50

b) 3,00

c) 4,25

d) 4,75

e) 4,00

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 75


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Comentário

Vamos calcular as médias de 𝑡 e 𝑌.

∑𝑡 36
𝑡= = = 4,5
8 8

∑𝑌• 88
𝑌= = = 11
8 8

O coeficiente 𝑏 é dado por

∑(𝑋' − 𝑋)((𝑌' − 𝑌)
𝑏= /
∑_𝑋' − 𝑋a

Na questão, temos que 𝑡 faz o papel de 𝑋.

Vimos que o numerador e o denominador podem ser calculados de outra forma.

0[(𝑋' − 𝑋)) ∙ (𝑌' − 𝑌) )] = 0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌)

= 459 − 8 × 4,5 × 11

= 63

0(𝑋' − 𝑋))/ = 0 𝑋'/ − 𝑛 ∙ (𝑋))/

= 204 − 8 × 4,5/

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 76


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

= 42

Assim, o coeficiente 𝑏 é:

63
𝑏= = 1,5
42

Vamos agora calcular 𝑎.

𝑌 = 𝑎 + 𝑏𝑡

11 = 𝑎 + 1,5 × 4,5

𝑎 = 4,25

Gabarito: C

36. (FCC 2016/ TRT 20ª Região)

Considere que (𝟏𝟎, 𝟎; 𝟐𝟕, 𝟓) é um ponto pertencente à reta de equação 𝒚 = 𝒂 + 𝒃𝒙,


correspondente ao modelo de regressão linear simples 𝒚𝒊 = 𝜶 + 𝜷𝒙𝒊 + 𝜺𝒊 (𝒊 = 𝟏, 𝟐, 𝟑, … ), em que:

I. 𝒚𝒊 é o salário do trabalhador 𝒊 em um determinado país, em unidades monetárias.

II. 𝒙𝒊 é o número de anos de experiência do trabalhador 𝒊.

III. 𝜶 e 𝜷 são parâmetros desconhecidos com suas estimativas (𝒂 e 𝒃, respectivamente) obtidas


pelo método dos mínimos quadrados e com base em 20 pares de observações (𝒙𝒊 , 𝒚𝒊 ).

IV. 𝜺𝒊 é o erro aleatório com as respectivas hipóteses consideradas do modelo de regressão


linear simples.

Dados:

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 77


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

/x /x /x /x

0 𝑥' = 144, 0 𝑦' = 480, 0 𝑥' 𝑦' = 3.620, 0 𝑦'/ = 11.770


'¥O '¥O '¥O '¥O

Considerando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que a
estimativa do salário de um trabalhador com 16 anos de experiência é, em unidades monetárias,
de

a) 33,50

b) 40,00

c) 30,75

d) 25,00

e) 35,00

Comentário

Vamos calcular a média de 𝑥 e a média de 𝑦.

∑𝑥' 144
𝑥= = = 7,2
𝑛 20

∑𝑦' 480
𝑦= = = 24
𝑛 20

Assim, podemos obter uma relação entre 𝑎 e 𝑏.

𝑦 = 𝑎 + 𝑏𝑥

24 = 𝑎 + 𝑏 ∙ 7,2

𝑎 + 7,2𝑏 = 24 − 𝐸𝑞𝑢𝑎çã𝑜 𝐼

Além disso, sabemos que a reta 𝑦 = 𝑎 + 𝑏𝑥 passa pelo ponto (10,0; 27,5). Logo,

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 78


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

27,5 = 𝑎 + 𝑏 ∙ 10

𝑎 + 10𝑏 = 27,5 − 𝐸𝑞𝑢𝑎çã𝑜 𝐼𝐼

Vamos multiplicar a equação I por (-1) e montar um sistema.

−𝑎 − 7,2𝑏 = −24
Œ
𝑎 + 10𝑏 = 27,5

O intuito de multiplicar por (-1) a equação I foi para eliminar a incógnita 𝑎.

Somando as duas equações do sistema, temos:

−7,2𝑏 + 10𝑏 = −24 + 27,5

2,8𝑏 = 3,5

𝑏 = 1,25

Vamos agora substituir esse valor na equação II e calcular o valor de 𝑎.

𝑎 + 10𝑏 = 27,5

𝑎 + 10 × 1,25 = 27,5

𝑎 + 12,5 = 27,5

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 79


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

𝑎 = 15

Assim, a reta calculada é:

𝑦 = 15 + 1,25𝑥

Substituindo 𝑥 por 16, temos:

𝑦(16) = 15 + 1,25 × 16 = 35

Gabarito: E

37. (FCC 2015/SEFAZ-PI)

O modelo 𝒀𝒕 = 𝜶 + 𝜷𝒕 + 𝜺𝒕 , 𝒕 = 𝟏, 𝟐, 𝟑, …, foi considerado para prever o lucro de uma companhia


no ano (𝟐𝟎𝟎𝟕 + 𝒕).

Sabe-se que:

• 𝒀𝒕 representa o lucro, em milhões de reais no ano t;


• 𝜶 e 𝜷 são parâmetros desconhecidos;
• 𝜺𝒕 é o correspondente erro aleatório, com as respectivas hipóteses da regressão linear;
• as estimativas de 𝜶 e 𝜷 foram obtidas pelo método de mínimos quadrados, considerando-
se as observações Yt no período de 6 anos (2008 a 2013).

Os dados relativos às observações são:

± ± ± ±
/
0 𝑡 = 21, 0 𝑡 = 91, 0 𝑡𝑌 = 140, 0 𝑌• = 36
•¥O •¥O •¥O •¥O

Nessas condições, a previsão de mínimos quadrados para o lucro da companhia, em milhões de


reais, no ano de 2014, é igual a

a) 7,55

b) 8,15

c) 7,90

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 80


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

d) 8,80

e) 9,50

Comentário

Vamos calcular as médias de 𝑡 e 𝑌.

∑𝑡 21
𝑡= = = 3,5
8 6

∑𝑌• 36
𝑌= = =6
8 6

O coeficiente 𝛽o é dado por

∑(𝑋' − 𝑋)((𝑌' − 𝑌)
𝛽o = /
∑_𝑋' − 𝑋a

Na questão, temos que 𝑡 faz o papel de 𝑋.

Vimos que o numerador e o denominador podem ser calculados de outra forma.

0[(𝑋' − 𝑋)) ∙ (𝑌' − 𝑌) )] = 0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌)

= 140 − 6 × 3,5 × 6

= 14

0(𝑋' − 𝑋))/ = 0 𝑋'/ − 𝑛 ∙ (𝑋))/

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 81


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

= 91 − 6 × 3,5/

= 17,5

Assim, o coeficiente 𝛽o é:

14 140
𝛽o = = = 0,8
17,5 175

Vamos agora calcular 𝛼n.

𝑌 = 𝛼n + 𝛽o 𝑡

6 = 𝛼n + 0,8 × 3,5

𝑎 = 3,2

Queremos a previsão para o ano de 2014. Assim, devemos fazer 𝑡 = 7.

𝑌• = 3,2 + 0,8𝑡

𝑌(7) = 3,2 + 0,8 ∙ 7 = 8,8

Gabarito: D

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 82


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

38. (FCC 2015/CNMP)

Seja o modelo linear 𝒀𝒊 = 𝜷𝑿𝒊 + 𝜺𝒊 estabelecendo uma relação linear, sem intercepto, entre duas
variáveis X e Y, em que 𝒀𝒊 i é a variável dependente na observação i, 𝑿𝒊 é a variável explicativa na
observação i e 𝜺𝒊 o erro aleatório com as respectivas hipóteses para a regressão linear simples.
O parâmetro 𝜷 do modelo é desconhecido e sua estimativa foi obtida pelo método dos mínimos
quadrados com base em 10 pares de observações (𝑿𝒊 , 𝒀𝒊 ).

Dados:

Ox Ox Ox Ox

0 𝑋' = 120, 0 𝑌' = 180, 0 𝑋' 𝑌' = 2.400, 0 𝑋'/ = 1.500


'¥O '¥O '¥O '¥O

Considerando a equação da reta obtida pelo método dos mínimos quadrados, obtém-se que Y é
igual a 24 quando X for igual a

a) 15.

b) 6.

c) 16.

d) 18.

e) 20.

Comentário

Observe que a reta de regressão passa pela origem.

O estimador de 𝛽, nesse caso, pelo método dos mínimos quadrados fica:

∑𝑋𝑌
𝛽o =
∑𝑋 /

2.400
𝛽o = = 1,6
1.500

A equação da reta fica:

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 83


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

gf = 1,6𝑋'
𝑌

Vamos substituir Y por 24.

24 = 1,6𝑋'

24
𝑋' = = 15
1,6

Gabarito: A

39. (FCC 2019/SEFAZ-BA)

Em uma determinada indústria, foi efetuada uma pesquisa a respeito da possível relação entre o
número de horas trabalhadas (X), com 𝑿 ≥ 𝟐, e as quantidades produzidas de um produto (Y).
Com base em 10 pares de observações (𝑿𝒊 , 𝒀𝒊 ) e considerando o gráfico de dispersão
correspondente, optou-se por utilizar o modelo linear 𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊 , com 𝒊 representando a
i-ésima observação, ou seja, i = 1, 2, 3, ..., 10. Os parâmetros 𝜶 e 𝜷 são desconhecidos e as suas
estimativas (𝒂 e 𝒃, respectivamente) foram obtidas pelo método dos mínimos quadrados.
Observação: 𝜺𝒊 é o erro aleatório com as respectivas hipóteses do modelo de regressão linear
simples. Considere o gráfico abaixo, construído utilizando os valores encontrados para as
estimativas de 𝜶 e 𝜷.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 84


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

A previsão da quantidade produzida será igual ao dobro da média verificada das 10 observações
𝒀𝒊 quando o número de horas trabalhadas for igual a

a) 18

b) 12

c) 20

d) 24

e) 22

Comentário

A reta tem equação 𝑦 = 𝑎 + 𝑏𝑥. Sabemos que a reta passa pelos pontos (4,4) e (10,16).

Tendo os dois pontos, podemos rapidamente calcular o coeficiente angular 𝑏 da reta.

Δ𝑌 16 − 4 12
𝑏= = = =2
Δ𝑋 10 − 4 6

Assim, a equação da reta é 𝑦 = 𝑎 + 2𝑥.

Podemos agora qualquer um dos pontos dados para calcular o coeficiente 𝑎.

Sabemos que a reta passa pelo ponto (4,4). Assim, 𝑦 = 4 para 𝑥 = 4.

4=𝑎+2∙4

𝑎 = −4

Assim, a equação da reta é 𝑦 = −4 + 2𝑥.

A questão forneceu o valor ∑𝑋' = 120. Assim, a média de x é:

∑𝑋' 120
𝑥= = = 12
𝑛 10

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 85


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Vamos calcular a média de y. Lembre-se que a reta de mínimos quadrados passa pelo ponto
(𝑥, 𝑦). Logo,

𝑦 = −4 + 2𝑥

𝑦 = −4 + 2 ∙ 12 = 20

Queremos que o valor de 𝑌 seja o dobro dessa média, ou seja, queremos que 𝑦 = 40. Vamos
calcular o valor correspondente de 𝑥.

𝑦 = −4 + 2𝑥

40 = −4 + 2𝑥

44 = 2𝑥

𝑥 = 22

Gabarito: E

Exercícios sobre Análise de Variância da Regressão

40. (FCC 2014/SEFAZ-RJ)

Considere o modelo 𝒚𝒊 = 𝜶 + 𝜷𝒙𝒊 + 𝜺𝒊 , i = 1,2,3,… onde:

I. 𝒚𝒊 e 𝒙𝒊 representam, respectivamente, o tempo de reação a certo estímulo, em segundos, e a


idade, em anos, do indivíduo i.

II. 𝜶 e 𝜷 representam os parâmetros desconhecidos do modelo.

III. 𝜺𝒊 representa o erro aleatório com as respectivas hipóteses para a regressão linear simples.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 86


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

IV. As estimativas de 𝜶 e 𝜷 foram obtidas pelo método de mínimos quadrados por meio de 10
observações, utilizando-se as seguintes informações:

Nessas condições, a soma de quadrados residuais do modelo é igual a

a) 810

b) 515

c) 920

d) 460

e) 785

Comentário

Para calcular as somas de quadrados, precisamos calcular o estimador de 𝛽.

∑(𝑋' − 𝑋)((𝑌' − 𝑌)
𝑏= /
∑_𝑋' − 𝑋a

Vimos que o numerador e o denominador podem ser calculados de outra forma.

0[(𝑋' − 𝑋)) ∙ (𝑌' − 𝑌) )] = 0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌)

= 40.200 − 10 × 30 × 102

= 9.600

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 87


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

0(𝑋' − 𝑋))/ = 0 𝑋'/ − 𝑛 ∙ (𝑋))/

= 13.000 − 10 × 30/

= 4.000

Assim, o coeficiente 𝑏 é:

9.600
𝑏= = 2,4
4.000

Vamos agora calcular as somas de quadrados. Comecemos por SQM.

𝑆𝑄𝑀 = 𝑏 ∙ 0[(𝑋' − 𝑋))(𝑌' − 𝑌))]

Lembre-se da importante transformação que podemos fazer com o somatório acima.

𝑆𝑄𝑀 = 𝑏 ∙ ¼0 𝑋𝑌 − 𝑛 ∙ 𝑋) ∙ 𝑌)½

𝑆𝑄𝑀 = 2,4 ∙ [40.200 − 10 ∙ 30 ∙ 102]

𝑆𝑄𝑀 = 23.040

Poderíamos também ter utilizado outra fórmula que vimos.

𝑆𝑄𝑀 = 𝑏 / ∙ 0(𝑋' − 𝑋))/

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 88


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Utilizando a transformação de somatório, temos:

𝑆𝑄𝑀 = 𝑏 / ∙ ¼0 𝑋'/ − 𝑛 ∙ (𝑋))/ ½

𝑆𝑄𝑀 = 2,4/ ∙ [13.000 − 10 ∙ 30/ ]

𝑆𝑄𝑀 = 23.040

Vamos agora calcular 𝑆𝑄𝑇.

/
𝑆𝑄𝑇 = 0 𝑌'/ − 𝑛 ∙ _𝑌a

𝑆𝑄𝑇 = 128.000 − 10 ∙ 102/ = 23.960

Finalmente, vamos calcular 𝑆𝑄𝑅.

𝑆𝑄𝑇 = 𝑆𝑄𝑀 + 𝑆𝑄𝑅

23.960 = 23.040 + 𝑆𝑄𝑅

𝑆𝑄𝑅 = 920

Gabarito: C

41. (FCC 2015/CNMP)

Considere o modelo linear 𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊 , sendo i a i-ésima observação, 𝒀𝒊 a variável


dependente na observação i, 𝑿𝒊 a variável explicativa na observação i e 𝜺𝒊 o erro aleatório com
as respectivas hipóteses para a regressão linear simples. Os parâmetros 𝜶 e 𝜷 são

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 89


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

desconhecidos e suas estimativas (a e b, respectivamente) foram obtidas pelo método dos


mínimos quadrados e com base em 20 pares de observações (𝑿𝒊 , 𝒀𝒊 ), i = 1, 2, ... , 20. Sabe-se
que os pontos (10 ; 9,8) e (40 ; 33,8) pertencem à reta de equação Y = a + bX.

Pelo quadro de análise de variância correspondente, observa-se que

a) o coeficiente de determinação (𝑅/ ), definido como sendo o resultado da divisão da variação


explicada pela variação total, é igual a 80%.

b) a variação explicada, fonte de variação devido à regressão, é igual a 240.

c) o valor da estatística F (F calculado) utilizado para testar a existência da regressão é igual a 32.

d) o valor da estimativa da variância do modelo teórico é igual a 10,8.

e) a variação explicada, fonte de variação devido à regressão, tem distribuição qui-quadrado com
18 graus de liberdade.

Comentário

Sabemos que a reta passa pelos pontos (10; 9,8) e (40; 33,8). Com isso, podemos rapidamente
calcular o coeficiente angular da reta 𝑏. Lembre-se que o coeficiente angular da reta é a variação
de Y dividida pela variação de X.

Δ𝑌 33,8 − 9,8 24
𝑏= = = = 0,8
Δ𝑋 40 − 10 30

Assim, a reta tem equação 𝑌 = 𝑎 + 0,8𝑋.

Para calcular o valor de 𝑎, basta utilizar um dos pontos dados. Vamos utilizar, por exemplo, o
ponto (10; 9,8). Esse ponto indica que 𝑌 = 9,8 para 𝑋 = 10.

𝑌 = 𝑎 + 0,8𝑋

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 90


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

9,8 = 𝑎 + 0,8 × 10

𝑎 = 1,8

A equação da reta é 𝑌 = 1,8 + 0,8𝑋. Lembre-se que a reta de regressão sempre passa pelo ponto
(𝑋), 𝑌)).

Vamos calcular 𝑋).

∑𝑋' 600
𝑋) = = = 30
𝑛 20

Como a reta passa pelo ponto (𝑋), 𝑌)), vamos substituir 𝑋 e 𝑌 pelas suas médias na equação da
reta.

𝑌 = 1,8 + 0,8𝑋

𝑌) = 1,8 + 0,8𝑋)

𝑌) = 1,8 + 0,8 × 30 = 25,8

Vamos agora calcular as somas de quadrados. Comecemos por SQM.

𝑆𝑄𝑀 = 𝑏 ∙ 0[(𝑋' − 𝑋))(𝑌' − 𝑌))]

Lembre-se da importante transformação que podemos fazer com o somatório acima.

𝑆𝑄𝑀 = 𝑏 ∙ ¼0 𝑋𝑌 − 𝑛 ∙ 𝑋) ∙ 𝑌)½

𝑆𝑄𝑀 = 0,8 ∙ [15.720 − 20 ∙ 30 ∙ 25,8]

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 91


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

𝑆𝑄𝑀 = 192

Vamos agora calcular 𝑆𝑄𝑇.

/
𝑆𝑄𝑇 = 0 𝑌'/ − 𝑛 ∙ _𝑌a

𝑆𝑄𝑇 = 13.612,80 − 20 ∙ 25,8/ = 300

Finalmente, vamos calcular 𝑆𝑄𝑅.

𝑆𝑄𝑇 = 𝑆𝑄𝑀 + 𝑆𝑄𝑅

300 = 192 + 𝑆𝑄𝑅

𝑆𝑄𝑅 = 108

Vamos preencher a tabela da ANOVA.

Fonte de Graus de Soma de


Quadrados Médios F
Variação Liberdade Quadrados
𝑆𝑄𝑀 œ••
Modelo 1 𝑆𝑄𝑀 𝑄𝑀𝑀 = 𝐹•–˜•– = œ•ž
1
𝑆𝑄𝑅
Resíduos 𝑛−2 𝑆𝑄𝑅 𝑄𝑀𝑅 =
𝑛−2
Total 𝑛−1 𝑆𝑄𝑇

Substituindo os valores, temos:

Fonte de Graus de Soma de


Quadrados Médios F
Variação Liberdade Quadrados
O¾/
Modelo 1 𝑆𝑄𝑀 = 192 𝑄𝑀𝑀 = 192 𝐹•–˜•– = ±
= 32
108
Resíduos 20 − 2 = 18 𝑆𝑄𝑅 = 108 𝑄𝑀𝑅 = =6
18
Total 20 − 1 = 19 𝑆𝑄𝑇 = 300

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 92


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

Rapidamente percebemos que a alternativa C está correta.

Vamos analisar as outras alternativas. Vamos calcular o coeficiente de determinação.

𝑆𝑄𝑀 192
𝑅/ = = = 0,64
𝑆𝑄𝑇 300

Logo, a alternativa A está errada.

A alternativa B está errada, pois 𝑆𝑄𝑀 = 192.

A estimativa da variância corresponde ao 𝑄𝑀𝑅 = 6. Logo, a alternativa D está errada.

A alternativa E está errada, pois a variável explicada (modelo) tem 1 grau de liberdade. Além
disso, para termos uma distribuição qui-quadrado, deveríamos dividir a soma de quadrados pelo
desvio padrão.

Gabarito: C

42. (FCC 2018/TRT 2ª Região)

Considere que em um país a variável L representa o lucro, em unidades monetárias, de uma


empresa em um determinado ano e a variável 𝑿 ≥ 𝟎 os investimentos realizados pela empresa,
em unidades monetárias, no mesmo ano. Um modelo de regressão linear correspondente à
equação 𝑳𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊 foi adotado pela empresa com o objetivo de se prever L em função
de X. 𝑳𝒊 representa o lucro da empresa no ano i ( i = 1, 2, 3 ...) e 𝑿𝒊 os investimentos da empresa
em i. Os parâmetros 𝜶 e 𝜷 são desconhecidos e 𝜺𝒊 é o erro aleatório com as respectivas
hipóteses do modelo de regressão linear simples. As estimativas de 𝜶 e 𝜷 foram obtidas por
meio do método dos mínimos quadrados com base nos primeiros 10 pares de observações
(𝑿𝒊 , 𝑳𝒊 ).

Com base na equação da reta obtida por meio do método dos mínimos quadrados e no quadro
de análise de variância considerado para testar a existência de uma relação linear entre L e X, é
correto afirmar que

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 93


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

a) a previsão de L é igual a 0 quando X for igual a 0,5.

b) o decréscimo de L quando X é acrescido de uma unidade monetária é igual a 20 unidades


monetárias.

c) se 𝐹´ (𝑚, 𝑛) é o valor tabelado da distribuição F de Snedecor com m graus de liberdade no


numerador e n graus de liberdade no denominador a um nível de significância α, será aceita a
hipótese de não existência de uma relação linear entre L e X se 𝐹´ (1,8) > 32.

d) dividindo o valor encontrado para a variação explicada pelo valor encontrado para a variação
total encontra-se o coeficiente de determinação (𝑅/ ) que é igual a 0,64.

e) a estimativa da variância do modelo teórico (𝜎 / ) é igual a 400.

Comentário

Consideremos que a reta de regressão tenha equação 𝐿 = 𝑎 + 𝑏𝑋, em que 𝑎 e 𝑏 são as


estimativas de 𝛼 e 𝛽, respectivamente.

Vamos calcular o valor do estimador de 𝛽.

∑(𝑋' − 𝑋)((𝑌' − 𝑌)
𝑏= /
∑_𝑋' − 𝑋a

Na questão 𝐿 cumpre o papel de 𝑌.

Vamos calcular as médias.

∑𝑋' 120
𝑋) = = = 12
𝑛 10

∑𝐿' 1.000
𝐿) = = = 100
𝑛 10

Vimos que o numerador e o denominador podem ser calculados de outra forma.

0[(𝑋' − 𝑋)) ∙ (𝑌' − 𝑌) )] = 0(𝑋' ∙ 𝑌' ) − 𝑛 ∙ 𝑋) ∙ 𝑌)

= 13.600 − 10 × 12 × 100

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 94


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

= 1.600

0(𝑋' − 𝑋))/ = 0 𝑋'/ − 𝑛 ∙ (𝑋))/

= 1.600 − 10 × 12/

= 160

Assim, o coeficiente 𝑏 é:

1.600
𝑏= = 10
160

Vamos agora calcular o valor de 𝑎.

𝐿 = 𝑎 + 𝑏𝑥

100 = 𝑎 + 10 × 12

𝑎 = −20

Logo, a equação da reta é 𝐿 = −20 + 10𝑥.

Vamos analisar cada uma das alternativas.

a) a previsão de L é igual a 0 quando X for igual a 0,5.

Vamos substituir X por 0,5 na reta de regressão.

𝐿(0,5) = −20 + 10 × 0,5 = −15

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 95


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

A alternativa A está errada.

b) o decréscimo de L quando X é acrescido de uma unidade monetária é igual a 20 unidades


monetárias.

Observe que o coeficiente angular da reta é igual a 10. Isso quer dizer que L cresce 10 unidades
quando X cresce 1 unidade. A alternativa B está errada.

c) se 𝐹´ (𝑚, 𝑛) é o valor tabelado da distribuição F de Snedecor com m graus de liberdade no


numerador e n graus de liberdade no denominador a um nível de significância α, será aceita a
hipótese de não existência de uma relação linear entre L e X se 𝐹´ (1,8) > 32.

Vamos calcular as somas dos quadrados. Comecemos pela soma dos quadrados total.

/
𝑆𝑄𝑇 = 0 𝑌'/ − 𝑛 ∙ _𝑌a

𝑆𝑄𝑇 = 120.000 − 10 ∙ 100/ = 20.000

Vamos agora calcular a soma dos quadrados do modelo.

𝑆𝑄𝑀 = 𝑏 ∙ 0[(𝑋' − 𝑋))(𝑌' − 𝑌))]

Lembre-se da importante transformação que podemos fazer com o somatório acima.

𝑆𝑄𝑀 = 𝑏 ∙ ¼0 𝑋𝑌 − 𝑛 ∙ 𝑋) ∙ 𝑌)½

𝑆𝑄𝑀 = 10 ∙ [13.600 − 10 ∙ 12 ∙ 100]

𝑆𝑄𝑀 = 16.000

Agora podemos calcular a soma dos quadrados dos resíduos.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 96


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

𝑆𝑄𝑇 = 𝑆𝑄𝑀 + 𝑆𝑄𝑅

20.000 = 16.000 + 𝑆𝑄𝑅

𝑆𝑄𝑅 = 4.000

Vamos agora preencher a tabela da ANOVA.

Fonte de Graus de Soma de


Quadrados Médios F
Variação Liberdade Quadrados
𝑆𝑄𝑀 œ••
Modelo 1 𝑆𝑄𝑀 𝑄𝑀𝑀 = 𝐹•–˜•– = œ•ž
1
𝑆𝑄𝑅
Resíduos 𝑛−2 𝑆𝑄𝑅 𝑄𝑀𝑅 =
𝑛−2
Total 𝑛−1 𝑆𝑄𝑇

Substituindo os valores, temos:

Fonte de Graus de Soma de


Quadrados Médios F
Variação Liberdade Quadrados
O±.xxx
Modelo 1 𝑆𝑄𝑀 = 16.000 𝑄𝑀𝑀 = 16.000 𝐹•–˜•– = y.xxx
= 32
4.000
Resíduos 10 − 2 = 8 𝑆𝑄𝑅 = 4.000 𝑄𝑀𝑅 = = 500
10 − 2
Total 10 − 1 = 9 𝑆𝑄𝑇 = 20.000

O valor observado da estatística F é igual a 32. Se o valor tabelado for maior do que o valor
observado, então o valor observado cairá na região de aceitação do teste e deveremos aceitar a
hipótese nula. A alternativa C está certa.

d) dividindo o valor encontrado para a variação explicada pelo valor encontrado para a variação
total encontra-se o coeficiente de determinação (𝑅/ ) que é igual a 0,64.

O coeficiente de determinação é o quociente da variação explicada pelo modelo SQM pela


variação total.

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 97


www.estrategiaconcursos.com.br
Guilherme Neves
Aula 19

𝑆𝑄𝑀 16.000
𝑅/ = = = 0,8
𝑆𝑄𝑇 20.000

A alternativa D está errada.

e) a estimativa da variância do modelo teórico (𝜎 / ) é igual a 400.

A estimativa de 𝜎 / corresponde ao 𝑄𝑀𝑅, que é igual a 500.

A alternativa E está errada.

Gabarito: C

CONSIDERAÇÕES FINAIS
Ficamos por aqui, queridos alunos. Espero que tenham gostado da aula.

Vamos juntos nesta sua caminhada. Lembre-se que vocês podem fazer perguntas e sugestões no
nosso fórum de dúvidas.

Você também pode me encontrar no instagram @profguilhermeneves ou entrar em contato


diretamente comigo pelo meu email profguilhermeneves@gmail.com.

Um forte abraço e até a próxima aula!!!

Guilherme Neves

Estatística p/ Polícia Federal (Agente) Com Videoaulas - 2020 - Pré-Edital (Preparação de A a Z) 98


www.estrategiaconcursos.com.br

Você também pode gostar