Escolar Documentos
Profissional Documentos
Cultura Documentos
Regressão Linear
Livro Eletrônico
ESTATÍSTICA
Regressão Linear
Sumário
Thiago Cardoso
2. Avaliação do Modelo..................................................................................................................16
2.1. Análise dos Resíduos.. .............................................................................................................16
2.2. Análise de Variância. . ............................................................................................................. 20
2.3. Análise dos Coeficientes. . ..................................................................................................... 30
Resumo............................................................................................................................................. 36
Mapa Mental................................................................................................................................... 38
Questões Comentadas em Aula.................................................................................................. 39
Exercícios......................................................................................................................................... 47
Gabarito............................................................................................................................................ 73
Gabarito Comentado..................................................................................................................... 74
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 2 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
REGRESSÃO LINEAR
Olá, aluno (a), seja bem-vindo (a) a mais uma aula de Estatística. Hoje, falaremos sobre
Regressão Linear.
Houve um tempo em que esse tema era praticamente inexplorado pelas provas de concur-
so, porém isso mudou. Considerando o panorama atual dos concursos, que estão cada vez
mais valorizando a parte de Estatística Inferencial, devo-lhe advertir que esse é um dos temas
mais importantes atualmente.
Mas fique tranquilo (a)! Você verá que a grande maioria das questões de Regressão Linear
podem ser resolvidas com simples aplicações de fórmulas. Você raramente precisará desen-
volver raciocínios complexos ou contas sofisticadas. Memorize as fórmulas e você terá suces-
so nas questões desse tópico.
Pronto (a) para começar?
1. Regressão Linear
A Regressão Linear é uma técnica muito utilizada em todas as áreas que se utilizam de
gráficos e números. Ela tem por objetivo estudar o comportamento de uma variável em função
da outra. Por exemplo, consideremos um estudo social sobre a idade e o salário de um grupo
de pessoas. Como pessoas da mesma idade podem ter salários diferentes, o gráfico mais ade-
quado para representar essas duas variáveis é o gráfico de dispersão.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 3 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O gráfico de dispersão nos mostra que, de maneira geral, o salário de uma pessoa cresce
com a sua idade.
Não se trata de um comportamento absoluto. Por exemplo, há duas pessoas de 40 anos na
pesquisa: uma delas tem o salário de pouco acima de 5,00 e outra em torno de 15,00. Também
podemos encontrar uma pessoa de 25 anos que ganha mais que outra pessoa de 40 anos.
Porém, há uma tendência de que os salários cresçam em função da idade. A fim de avaliar
essa tendência, podemos traçar uma linha de tendência.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 4 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Em geral, os modelos de regressão linear têm por objetivo diminuir esse erro segundo
algum critério.
Por hora, vamos comentar sobre os parâmetros a e b que definem o modelo de regres-
são linear.
O parâmetro b é o mais importante e está relacionado à inclinação da linha de tendência.
Quanto maior o parâmetro b, maior será a variação na variável Y em resposta a um aumento
da variável X.
Por outro lado, o parâmetro a é chamado de intercepto, pois corresponde ao ponto em que
a linha de tendência intercepta o eixo dos Y. Isso acontece porque, quando X = 0, temos que a
estimativa linear para Y será igual a esse parâmetro.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 5 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
É bastante interessante que, para um problema tão complexo quanto à regressão linear,
tenhamos uma solução razoavelmente simples e elegante. Basta dividir a covariância entre
as duas variáveis pela variância da variável regressora.
É natural, ainda, que as questões tentem confundi-lo (a). Elas vão colocar a variância da
variável resposta no denominador ou trocar a covariância pela correlação.
É possível, sim, obter uma expressão coeficiente b pela correlação, mas ela será ligeira-
mente diferente. Vejamos:
Primeiramente, precisamos nos lembrar de que a correlação é igual à covariância dividida
pelo produto dos desvios-padrões.
Não considero necessário memorizar essa expressão, mas é interessante que você tenha
visto a forma como chegamos até ela, porque isso pode ser exigido em questões de prova.
Para o coeficiente a, considero que a forma mais fácil de lembrar é partir do princípio de
que a média da estimativa deve ser igual à média da variável real.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 6 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Errado.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 7 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Como a regressão linear é escrita da forma Y = a + bX, temos que a variável Y é descrita em
função da variável X. Sendo assim, a variável Y é a variável dependente ou resposta, enquanto
a variável X é a variável explicativa.
Errado.
Certo.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 8 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Já para calcular o coeficiente de intercepto por meio das médias, procedemos assim:
Letra c.
Como não nos foi disponibilizada a covariância, podemos calculá-la a partir da correlação:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 9 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Letra b.
Dessa forma, o coeficiente de inclinação b é dado por uma expressão ligeiramente diferente:
Não temos muito o que comentar. Basta apenas decorar a expressão. Observe bem se o
modelo de regressão linear é fornecido também da forma Y = bX + erro. Se não houver inter-
cepto, é a chave para utilizar a expressão acima.
Número de imóveis
ano
ofertados (X) vendidos (y)
2005 1.500 100
2006 1.750 400
2007 2.000 700
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 10 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Como o enunciado fala numa reta Y = aX sem o coeficiente de intercepto, devemos utilizar a
expressão da reta passando pela origem.
Quando o denominador termina em 25, o modo simples de fazer a conta é multiplicando por 4.
Certo.
Mais uma vez, temos o modelo Y = aX + erro, sem o coeficiente de intercepto. Sendo assim, a
expressão da reta passando pela origem deve ser usada para solucionar o problema:
Errado.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 11 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Como os valores da variável regressora são determinísticos, temos que a única fonte de erro
para o valor de y é o erro aleatório, que é normal gaussiano de variância V.
Sendo assim, Y seguirá uma normal com a mesma variância do erro aleatório fornecido e com
média igual ao produto ax.
Certo.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 12 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
A resolução mais comum, mais simples e que eu acredito que o CESPE esperava que os alu-
nos apresentassem na hora da prova é a seguinte.
Podemos utilizar que a variância do erro é menor ou igual à variância de Y a priori, ou seja,
antes do modelo de regressão linear:
Nesse caso, como existe correlação entre X e Y, podemos descartar o sinal de igual. Logo, a
variância V será:
Portanto, a variância realmente é inferior a 1,5. Eu apresentei essa solução, pois é um recurso
que você pode utilizar e será bem mais fácil do que calcular precisamente a estimativa da
variância do erro.
No entanto, é possível obter o valor preciso da estimativa da variância do erro utilizando fór-
mulas que já conhecemos. Sabemos que:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 13 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Portanto, isso nos levaria a concluir que o gabarito é errado. E, nesse momento, o (a) aluno(a)
se questionaria: mas a variância do erro a posteriori não deveria ser menor que a variância a
priori, que é 1,5?
A resposta é que isso realmente só pode ser garantido quando a amostra é grande. Não se
pode fazer um modelo de regressão linear com uma amostra muito pequena de apenas 5 ele-
mentos. O mesmo pode ser dito para vários e vários estimadores.
Por conta disso, considero uma pequena tragédia essa adaptação feita para uma questão de prova.
Na vida prática, você nunca fará regressão linear com uma amostra de 5 elementos, precisará
de mais dados. Quando a regressão é feita com poucos dados, ela pode, sim, ser pouco efetiva.
A despeito disso, nenhum recurso foi elaborado e a banca manteve o gabarito oficial. Mas eu
não poderia deixar de registrar a minha contrariedade a esse gabarito.
Certo.
Suponhamos que nós queremos escrever y como uma regressão linear em mais de uma
variável independente:
Daremos o nome de x ao vetor (matriz linha) formado por todas as variáveis independen-
tes. No caso, temos:
Para calcular o vetor B, precisamos anotar todas as observações das variações x1, x2 etc.
em uma matriz. Essa matriz terá o número de colunas igual ao número de variáveis e o núme-
ro de linhas igual ao número de observações.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 14 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Observe que o enunciado já deu todas as matrizes trabalhadas para o (a) aluno (a). Basta
multiplicar:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 15 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Certo.
2. Avaliação do Modelo
Agora, vamos falar um pouco mais sobre o erro de estimativa. Algumas características
importantes que o erro deve apresentar:
• média nula: o erro deve apresentar média nula. Caso o erro apresentasse qualquer des-
vio médio, o estimador seria claramente viesado e, portanto, essa média deveria ter
sido incluída no parâmetro a.
Pense, por exemplo, que você está fazendo uma pesquisa sobre o salário médio de um
grupo de pessoas. Então, você descobre que, em média, a sua pesquisa erra o salário médio
das pessoas em 1,00 unidade para cima. Isso significa, na verdade, que a sua linha de tendên-
cia está mal posicionada e que ela deveria ter aparecido 1,00 unidade para baixo.
Quando existe dependência entre o erro e a variável X, é bastante provável que o modelo
de regressão linear não se adapte bem ao sistema que está sendo estudado.
Dito isso, existem algumas métricas importantes de avaliação do erro em modelos de re-
gressão linear. Primeiramente, vejamos uma ideia geral sobre ele.
Os resíduos da variável resposta, por sua vez, correspondem às diferenças entre o valor
correto dessa variável e as suas estimativas.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 16 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Agora, vejamos alguns problemas que podem ser notados com a análise do gráfico
de resíduos.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 17 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
• Assimetria: a média dos erros não é nula, portanto, o coeficiente de intercepto deve ser
ajustado.
• Resíduos extremos: a presença de alguns resíduos muito distantes do padrão dos de-
mais indica a presença de dados atípicos nas suas observações.
Esses dados atípicos podem ser meros frutos da aleatoriedade. Pense, por exemplo, que
você estuda o salário das pessoas em função da sua idade e descobre um jovem de 20 anos
ganha 50 salários-mínimos por mês. Seria uma observação bastante atípica, não é? É possí-
vel de acontecer, mas certamente é bem raro.
Mas, vale notar que esses dados atípicos também podem ser oriundos de erros de me-
didas. Pense, por exemplo, que você está estudando as velocidades de carros em uma via e
descobre um carro que atravessou o radar acima de 500 km/h. Há uma grande chance de
essa medida ter sido um erro do radar.
• Não linearidade: quando se observa uma linha de tendência nos resíduos que não é
uma linha reta.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 18 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Nesse gráfico, observamos uma linha de tendência não linear, o que mostra que uma es-
timativa Ŷ = a + bX não é suficiente para descrever a variável Y em função de X. Seria preciso
incluir também a relação não linear entre as duas variáveis.
O gráfico de resíduos tem por objetivo estudar os resíduos da variável resposta em função
da variável explicativa, que correspondem à diferença entre o valor correto e a estimativa da
variável resposta.
Letra e.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 19 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Perceba que esse fator é diretamente relacionado ao desvio-padrão (ou à variância SYY)
da variável resposta.
• Soma dos Quadrados dos Erros ou Resíduos, SQRes ou SQEr (depois): é a soma dos
quadrados dos erros ou resíduos de estimativa. Corresponde aos desvios em relação
às estimativas lineares, ou seja, depois da regressão linear.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 20 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
É natural esperar que a soma dos erros depois da regressão linear seja menor que a soma
dos erros antes da regressão linear. Afinal, é para isso que serve essa técnica: melhorar a es-
timativa da variável Y.
Assim, define-se:
• Soma dos Quadrados da Regressão SQReg: é a melhoria ou redução dos erros. Tem-se:
Pode-se provar que a soma dos quadrados da regressão se relaciona com a variância
entre as variáveis.
A soma dos quadrados da regressão também pode ser relacionada com a variância da
regressora. Para isso, devemos nos lembrar de que:
Temos, então, duas expressões muito úteis para o cálculo da soma dos quadrados do
modelo de regressão:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 21 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Atenção, assim como a variância, o coeficiente de determinação (R²) tem o seu símbolo
R². Não caia no erro de tirar a raiz, tudo bem? Lembre-se da relação importantíssima:
Trata-se de uma definição simples, porém de suma importância. Uma variável explicativa
pode ser classificada como:
• endógena: quando está correlacionada com a perturbação (chamada endogeneidade),
portanto o coeficiente de determinação do modelo de regressão linear é significativo;
• exógena: quando está descorrelacionada com a perturbação (chamada exogeneidade),
portanto o coeficiente de determinação do modelo de regressão linear é muito pequeno,
próximo a zero.
Vale observar que, como a correlação não implica causalidade, é bastante possível que
a correlação observada seja fruto de erros de medição ou, até mesmo, da aleatoriedade. A
endogeneidade não é uma prova definitiva de que há alguma relação entre as duas variáveis.
Os modelos estatísticos servem apenas como um indicativo inicial de pesquisa.
Na análise de regressão, uma variável explicativa exógena é aquela que não está correlacio-
nada com a perturbação da variável dependente. Portanto, para avaliar se a variável é real-
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 22 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
A razão para isso é que o erro ou desvio do modelo de regressão linear diz respeito ao
quanto o valor real da variável se afasta em relação à estimativa de regressão linear. Por outro
lado, a variância de Y se relaciona ao quanto o valor real da variável se afasta em relação à
média da variável Y.
Se, por acaso, a estimativa do erro do modelo de regressão linear for superior ao próprio
desvio-padrão da variável Y, o nosso modelo está, na verdade, atrapalhando, pois resulta em
desvios maiores do que simplesmente considerar a média de Y.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 23 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Seria, portanto, melhor tomar a média da variável Y como sua estimativa em vez de tomar
o nosso modelo de regressão linear.
Questão bastante direta. Basta nos lembrarmos de que o coeficiente de determinação é igual
ao quadrado da correlação.
Certo.
Já foi dado o SQReg. Podemos, agora, calcular o SQTot nos lembrando de que:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 24 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Letra b.
Letra e.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 25 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Letra d.
A variância do erro depende do valor de X, sendo assim, o modelo de regressão utilizado apre-
senta heterocedasticidade, o que o torna inadequado para representar o relacionamento entre
as variáveis.
Letra e.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 26 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 27 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
• total: N – 1;
• modelo: p – 1;
• erro: N – p.
Considero que é importante apenas saber que todas elas seguem distribuição qui-quadrado
e seus respectivos graus de liberdade. Apenas isso. Não creio que será necessário trabalhar com
as tabelas da distribuição qui-quadrado para as variáveis aleatórias SqTot, SqReg e SqEr.
Esses graus de liberdade são importantes também, porque eles aparecem no denominado
do cálculo das variâncias. Lembre-se:
Vejamos, como exemplo, essa tabela de graus de liberdade extraída da prova da Polícia
Federal, aplicada pelo CESPE em 2018.
Assim, podemos concluir que esse modelo foi construído com base:
• em duas variáveis aleatórias, sendo uma variável aleatória explicativa e uma variável
regressora. Portanto, é um modelo do tipo:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 28 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 29 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
acordo os dados da tabela de dados abaixo, para comparar o desempenho de médias entre
variáveis X1, X2 e X3:
Os graus de liberdade, respectivamente para o fator (I), para o erro (II) e para o total (III) são:
a) 2, 18 e 20.
b) 3, 18 e 21.
c) 2, 20 e 22.
d) 3, 20 e 23.
e) 2, 19 e 21.
Observe que foram colocados um total de 21 dados (N = 21) na tabela e que foram registrados
3 parâmetros (p = 3). Assim, podemos obter:
• Total: N – 1 = 21 – 1 = 20;
• Fator: p – 1 = 3 – 1 = 2;
• Erro: N – p = 21 – 3 = 18.
Letra a.
www.grancursosonline.com.br 30 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Assim, podemos obter o erro padrão. A razão t é a razão entre o valor estimado para o
coeficiente e o seu erro padrão. Dessa maneira, temos:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 31 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Foi fornecido o erro padrão para o modelo de coeficiente angular igual a 0,064. Esse erro já é
muito próximo da própria estimativa do coeficiente. Podemos calcular a estatística normali-
zada para ele:
Esse p-valor é maior que 5%. Isso significa que, ao nível de 5% de significância, não temos
como garantir que realmente o coeficiente de inclinação seja maior que zero. Portanto, não
temos provas estatísticas suficientes contra essa hipótese nula.
Em outras palavras, isso significa que o modelo de regressão linear deduzido não garante que
o seu próprio coeficiente de inclinação seja significativo. Logo, a influência do parâmetro T
sobre Y é muito pequena, materialmente nula.
Podemos, então, dizer que a variável T é, na realidade, uma variável exógena, tendo em vista
que sua influência sobre o parâmetro Y é pouco significativa.
Certo.
2.3.2. Estatística F
O teste F tem por objetivo testar a significância global do modelo. Para isso, considere um
modelo geral de regressão linear com p parâmetros e p – 1 variáveis independentes:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 32 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Para determinar se o modelo é significativo, devemos recorrer ao teste F. Vamos nos re-
cordar da definição da distribuição F de Snedecor.
A distribuição qui-quadrado é obtida pela soma dos quadrados de uma distribuição nor-
mal. Considerando que os erros de um modelo de regressão linear seguem distribuição nor-
mal e são estatisticamente da variável resposta, então podemos criar a seguinte estatística
de teste F:
Como vimos, tanto o SQReg como SQEr seguem distribuições qui-quadradas. Além disso,
o modelo de regressão (SQReg) tem p – 1 graus de liberdade e os erros (SQEr) possuem N – p
graus de liberdade. Assim, temos:
O objetivo da estatística F é que ela testa a aderência do modelo como um todo e não so-
mente de cada coeficiente isoladamente.
O valor calculado deve, então, ser comparado com a estatística crítica que é fornecida nas
tabelas da distribuição F com os números de graus de liberdade apropriados, ou, ainda, com
o auxílio de softwares de estatística, como o R ou até mesmo Excel com a função =INV.F. Se a
estatística F for superior ao valor crítico, então, o modelo será significativo.
Eu sei que você pode ter achado complicada a teoria. Mas, em termos práticos, em ques-
tões de prova tudo o que você precisa fazer é:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 33 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
• compare com a estatística crítica que, na hora da prova, pode ser fornecida por meio de uma
tabela;
• se for maior, conclua que o modelo é significativo. Caso contrário, conclua que o modelo não
é significativo.
Vejamos, como exemplo, essa tabela de graus de liberdade extraída da prova da Polícia
Federal, aplicada pelo CESPE em 2018. Queremos
Com o auxílio do Excel, podemos calcular a estatística limite usando o comando =IN-
V.F(0,95; 1; 899) – usamos 0,95, porque o Excel calcula a distribuição acumulada. E, assim,
obtemos a estatística crítica:
Como F = 1153,8 > Fcrítico, podemos concluir que o modelo de regressão linear em estudo é
significativo.
Vejamos agora uma questão de prova sobre essa estatística.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 34 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
c) 0,8 e 1,5.
d) 0,8 e 12.
e) 0,8 e 75.
O coeficiente de determinação pode ser obtido como a relação entre a soma dos quadrados
da regressão (SQR) e a soma dos quadrados totais (SQT). Assim, temos:
A soma dos quadrados da regressão (SQR) não foi fornecida. Porém, ela pode ser obtida
como a diferença entre a soma dos quadrados totais (SQT) e a soma dos quadrados dos re-
síduos ou erros (SQE):
Letra a.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 35 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
RESUMO
Coeficientes:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 36 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Graus de Liberdade
• total: N – 1;
• modelo: p – 1;
• erro: N – p.
Coeficiente de Determinação
Variância do Erro
Estatística F
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 37 de 128
MAPA MENTAL
www.grancursosonline.com.br 38 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 39 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
a)
b)
c)
d)
e)
Número de imóveis
ano
ofertados (X) vendidos (y)
2005 1.500 100
2006 1.750 400
2007 2.000 700
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 40 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 41 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 42 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 43 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
c) 0,50
d) 0,61
e) 0,69
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 44 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 45 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Os graus de liberdade, respectivamente para o fator (I), para o erro (II) e para o total (III) são:
a) 2, 18 e 20.
b) 3, 18 e 21.
c) 2, 20 e 22.
d) 3, 20 e 23.
e) 2, 19 e 21.
www.grancursosonline.com.br 46 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
EXERCÍCIOS
023. (IBFC/IBGE/SUPERVISOR DE PESQUISAS/2021) Num modelo de regressão linear pelo
método dos mínimos quadrados, sabe-se que a inclinação da reta é a = 3,24 e o intercepto da
reta é b = 12,6, então o valor de para x = 30 é:
a) 126,8
b) 136,8
c) 116,2
d) 108,2
e) 109,8
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 47 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 48 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
a)
b)
c)
d)
e)
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 49 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 50 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
A previsão da quantidade produzida será igual ao dobro da média verificada das 10 observa-
ções Yi quando o número de horas trabalhadas for igual a:
a) 20.
b) 24.
c) 22.
d) 18.
e) 12.
www.grancursosonline.com.br 51 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
A estimativa da variância populacional do modelo teórico (σ²), com base nos dados da amos-
tra, é igual a:
a) 15,300.
b) 16,150.
c) 17,100.
d) 18,165.
e) 19,380.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 52 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 53 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 54 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 55 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
A partir da tabela acima, julgue o seguinte item, com base nos conceitos de inferência
estatística.
Dadas as hipóteses H0: µ = 8 e H1: µ ≠ 8, e sabendo-se que foi utilizada uma amostra de
tamanho 25, que a variável em estudo X segue uma distribuição normal com média µ e vari-
ância 4 e que, para α = 0,05, Φ(-1,96) = 0,05 então o valor crítico para esse teste é aproxima-
damente 7,216.
A partir da tabela acima, julgue o seguinte item, com base nos conceitos de inferência
estatística.
O coeficiente de determinação é aproximadamente 0,59.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 56 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
A partir da tabela acima, julgue o seguinte item, com base nos conceitos de inferência
estatística.
Foram utilizados 19 dados para a estimação do modelo de regressão linear.
Os desvios padrão amostrais das variáveis Y e T foram, respectivamente, 1 e 3,6. Com base
nessas informações, julgue o item a seguir.
Se a média amostral da variável T for igual a 6,5, então a média amostral da variável Y será
igual a 4,35 mil ocorrências.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 57 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Os desvios padrão amostrais das variáveis Y e T foram, respectivamente, 1 e 3,6. Com base
nessas informações, julgue o item a seguir.
A correlação linear entre as variáveis Y e T foi igual a –0,1
A respeito dessa situação hipotética, julgue o próximo item, sabendo que b > 0 e que o desvio
padrão amostral da variável X é igual a 2.
A estimativa do coeficiente angular b, pelo método de mínimos quadrados ordinários, é
igual a 0,25.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 58 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
A respeito dessa situação hipotética, julgue o próximo item, sabendo que b > 0 e que o desvio
padrão amostral da variável X é igual a 2.
A estimativa da variância σ² é superior a 0,5.
A respeito dessa situação hipotética, julgue o próximo item, sabendo que b > 0 e que o desvio
padrão amostral da variável X é igual a 2.
A correlação linear de Pearson entre a variável resposta Y e a variável regressora X é igual a 0,75.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 59 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
6 e mês 7). Em função dessa descontinuidade, o gerente geral de sua empresa pede para
você calcular a previsão da soma das demandas dos dois meses citados. Ele o orientou a
simplificar os cálculos, optando por uma projeção baseada em uma regressão linear que usa
os dados das demandas dos 5 meses desde o início da venda de trigo. Os dados estão apre-
sentados, mês a mês, na tabela a seguir.
Assim, após fazer os cálculos segundo essas orientações, o resultado correto para a
soma pedida é:
a) 24,5.
b) 31,6.
c) 45,0.
d) 51,9.
e) 56,1.
Dados:
Considerando a equação da reta obtida pelo método dos mínimos quadrados, a previsão do
primeiro ano em que a venda irá superar R$ 60.000,00 será em:
a) 2016.
b) 2017.
c) 2018.
d) 2019.
e) 2020.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 60 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 61 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 62 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
A tendência apresenta a forma T = a + bt, em que a e b foram obtidos usando o método dos
mínimos quadrados. Considerando a equação obtida, tem-se que o acréscimo no faturamen-
to do ano t, com t > 1, para o ano (t + 1) é, em milhões de reais, de
a) 1,2.
b) 1,5.
c) 0,6.
d) 2,4.
e) 1,8.
059. (INÉDITA/2021) Sejam X e Y duas variáveis aleatórias tais que a covariância entre elas é
dada por SXY = 3, cujas variâncias são iguais a SXX = 4 e SYY = 9 e cujas médias são iguais,
respectivamente, a μX = 4 e μY = 0. A respeito dessa situação, julgue o seguinte item.
O modelo de regressão linear entre as duas variáveis é Y = X/3 – 4/3.
060. (INÉDITA/2021) Sejam X e Y duas variáveis aleatórias tais que a covariância entre elas é
dada por SXY = 3, cujas variâncias são iguais a SXX = 4 e SYY = 9 e cujas médias são iguais,
respectivamente, a μX = 4 e μY = 0. A respeito dessa situação, julgue o seguinte item.
O coeficiente de determinação do modelo de regressão linear é igual a 25%.
061. (INÉDITA/2021) Uma equipe de médicos desejava estudar a influência do consumo di-
ário de açúcares (em gramas) sobre a pressão diastólica de indivíduos. Pelos estudos com
uma população, foram registrados os seguintes dados:
062. (INÉDITA/2021) Uma equipe de médicos desejava estudar a influência do consumo diário
de açúcares (em gramas) sobre a pressão diastólica de indivíduos. Pelos estudos com uma
população, foram registrados os seguintes dados:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 63 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
063. (INÉDITA/2021) Uma equipe de médicos desejava estudar a influência do consumo di-
ário de açúcares (em gramas) sobre a pressão diastólica de indivíduos. Pelos estudos com
uma população, foram registrados os seguintes dados:
064. (INÉDITA/2021) Uma equipe de médicos desejava estudar a influência do consumo di-
ário de açúcares (em gramas) sobre a pressão diastólica de indivíduos. Pelos estudos com
uma população, foram registrados os seguintes dados:
www.grancursosonline.com.br 64 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Considerando um grupo de pessoas que consomem 100 g de açúcar por dia, o desvio-padrão
esperado para a pressão diastólica nesse grupo é igual a 16 mmHg.
X Y
Média 2 10
Variância 4 36
Covariância 10,8 10,8
X Y
Média 2 10
Variância 4 36
Covariância 10,8 10,8
X Y
Média 2 10
Variância 4 36
Covariância 10,8 10,8
www.grancursosonline.com.br 65 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
uma variável aleatória com distribuição normal, média nula, estatisticamente independente X
e com variância igual a 1.
Sabe-se, ainda, que a média de X é igual a 1 e que a variância de X também é igual a 1.
A respeito dessa situação, julgue o seguinte item.
A covariância entre X e Y é igual a 0,2.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 66 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 67 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
075. (INÉDITA/2021) Foi construído um modelo de regressão linear entre duas variáveis alea-
tórias X e Y, expresso por Y = a + b.X + ε, em que ε é um ruído branco gaussiano e estatistica-
mente independente de X. São conhecidos os seguintes dados sobre as variáveis:
X Y
Média 0 4
Desvio-Padrão 2 5
Covariância –9 –9
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 68 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
076. (INÉDITA/2021) Foi construído um modelo de regressão linear entre duas variáveis alea-
tórias X e Y, expresso por Y = a + b.X + ε, em que ε é um ruído branco gaussiano e estatistica-
mente independente de X. São conhecidos os seguintes dados sobre as variáveis:
X Y
Média 0 4
Desvio-Padrão 2 5
Covariância –9 –9
077. (INÉDITA/2021) Foi construído um modelo de regressão linear entre duas variáveis alea-
tórias X e Y, expresso por Y = a + b.X + ε, em que ε é um ruído branco gaussiano e estatistica-
mente independente de X. São conhecidos os seguintes dados sobre as variáveis:
X Y
Média 0 4
Desvio-Padrão 2 5
Covariância –9 –9
X Y
Média 12 4
Variância 36 9
Covariância 16,2 16,2
www.grancursosonline.com.br 69 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
X Y
Média 12 4
Variância 36 9
Covariância 16,2 16,2
X Y
Média 12 4
Variância 36 9
Covariância 16,2 16,2
X Y
Média 12 4
Variância 36 9
Covariância 16,2 16,2
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 70 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
X Y
Média 12 4
Variância 36 9
Covariância 16,2 16,2
www.grancursosonline.com.br 71 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 72 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
GABARITO
1. E 37. C 73. C
2. E 38. E 74. C
3. C 39. E 75. C
4. C 40. C 76. E
5. b 41. C 77. C
6. C 42. C 78. C
7. E 43. e 79. E
8. C 44. E 80. E
9. C 45. C 81. E
10. C 46. E 82. E
11. e 47. C 83. E
12. E 48. E 84. C
13. C 49. C 85. C
14. b 50. d
15. e 51. d
16. d 52. b
17. e 53. E
18. c 54. C
19. E 55. C
20. a 56. E
21. C 57. E
22. a 58. c
23. e 59. E
24. e 60. C
25. d 61. E
26. d 62. C
27. E 63. E
28. C 64. C
29. c 65. E
30. d 66. E
31. c 67. E
32. e 68. C
33. E 69. E
34. c 70. E
35. C 71. C
36. b 72. E
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 73 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
GABARITO COMENTADO
023. (IBFC/IBGE/SUPERVISOR DE PESQUISAS/2021) Num modelo de regressão linear pelo
método dos mínimos quadrados, sabe-se que a inclinação da reta é a = 3,24 e o intercepto da
reta é b = 12,6, então o valor de para x = 30 é:
a) 126,8
b) 136,8
c) 116,2
d) 108,2
e) 109,8
Letra e.
Pela estimativa dos mínimos quadrados, podemos obter o coeficiente de inclinação do mode-
lo como a razão entre a covariância e a variância da regressora.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 74 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Letra e.
Letra d.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 75 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O enunciado não forneceu o SQTot, mas ele pode ser obtido como a soma:
Afirmação correta.
III – Correta. Para X = 0, temos:
Para X = 1, temos:
Portanto, o incremento é:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 76 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Afirmação correta.
Letra d.
Primeiramente, podemos utilizar a fórmula que relaciona o coeficiente angular com a correla-
ção linear, para uma regressão do tipo y = a·x + b:
Temos:
• a = coeficiente angular = 2,5
• r = correlação linear
• σy = desvio-padrão amostral de y = 5
• σx = desvio-padrão amostral de x = 1,6
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 77 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Apesar do tamanho, trata-se de uma questão apenas de substituição de valores. Note que as
estimativas ocorreram pelo método de mínimos quadrados ordinários, ou seja, o ε=0. Assim,
usando a fórmula:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 78 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
• x = 9
• ε = 0
Temos:
a)
b)
c)
d)
e)
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 79 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Como a correlação é negativa, a tendência geral é de que Y decresça com X. Por isso, as letras
“a” e “b” estão incorretas.
Além disso, como a correlação tem valor absoluto pequeno, muito distante de 1, devemos
ter bastante flutuação em torno da reta de tendência. Vamos comparar o que acontece nas
demais alternativas.
Vale notar que o coeficiente de determinação do modelo é (–0,23)² = 0,0529 = 5,29%. Portanto,
haverá muita flutuação em torno da linha de tendência.
Perceba, então, que a letra “e” se aproxima de uma elevada correlação negativa, que seria uma
correlação próxima de –1. A letra “d” ainda tem um ajuste muito próximo, o que indica uma
forte correlação.
A letra “c”, portanto, é a que mais se adéqua à correlação –0,23, porque mostra uma tendência
geral de decrescimento do item C, mas com baixíssimo coeficiente de determinação.
Letra c.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 80 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Como a variável Y decresce com o aumento da variável X, elas estão negativamente corre-
lacionadas.
Além disso, foi fornecido o R², o coeficiente de determinação do modelo. Podemos dizer, en-
tão, que a variação da variável X explica 73,2% das variações da variável Y.
Não podemos dizer que o coeficiente de correlação é igual a –73,2%, porque o coeficiente de
correlação é igual à raiz quadrada do coeficiente de determinação, que seria:
Letra d.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 81 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
A previsão da quantidade produzida será igual ao dobro da média verificada das 10 observa-
ções Yi quando o número de horas trabalhadas for igual a:
a) 20.
b) 24.
c) 22.
d) 18.
e) 12.
Substituindo, temos:
Para achar o valor de a, basta substituir 1 ponto na equação da reta. Escolhendo o ponto
(4,4), temos:
Logo, a equação é:
Como o somatório das 10 observações foi dado e é 120, temos que a média dessas 10 obser-
vações é 12. Substituindo a média na equação da reta, temos:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 82 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Encontrando o dobro desse valor, temos y=40. Logo, basta substituir novamente na equação
para encontrarmos o valor de X quando Y for o dobro do y encontrado para a média das 10
observações:
Letra c.
Letra e.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 83 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Para ser linear, o gráfico deveria crescer de forma constante entre cada faixa de população
carcerária. O gráfico mostrado apresenta um comportamento mais exponencial do que linear.
Errado.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 84 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
A estimativa da variância populacional do modelo teórico (σ²), com base nos dados da amos-
tra, é igual a:
a) 15,300.
b) 16,150.
c) 17,100.
d) 18,165.
e) 19,380.
Letra c.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 85 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
036. (Um estudo a respeito do índice de cancelamento de assinaturas (Y) de uma operadora
de telefonia celular no período de 2010 a 2014 produziu um ajuste na forma
, em que t = 2010, 2011, 2012, 2013, 2014; é a estimativa desse índice no ano t correspon-
dente; e representam as estimativas de mínimos quadrados ordinários dos coeficientes
da reta ajustada. A tabela a seguir apresenta a análise de variância (ANOVA) do ajuste.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 86 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Sabendo que a estimativa da variância erro aleatório é a razão da soma do quadrado do erro
(dado na tabela) e o grau de liberdade (dado na tabela), basta calcular:
Para resolver a questão, precisamos lembrar a fórmula dos estimadores dos mínimos
quadrados:
Fazendo uma comparação com a fórmula da questão e a fórmula acima, temos que o = t –
2012. Além disso, o valor de a também foi dado e vale 30.
Agora, é preciso calcular o valor de , a partir dos seguintes cálculos:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 87 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Resolvendo:
Certo.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 88 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 89 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Sabendo que:
Temos:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 90 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
A partir da tabela acima, julgue o seguinte item, com base nos conceitos de inferência
estatística.
Dadas as hipóteses H0: µ = 8 e H1: µ ≠ 8, e sabendo-se que foi utilizada uma amostra de
tamanho 25, que a variável em estudo X segue uma distribuição normal com média µ e vari-
ância 4 e que, para α = 0,05, Φ(-1,96) = 0,05 então o valor crítico para esse teste é aproxima-
damente 7,216.
Sabendo que:
Z = valor de Z tabelado = -1,96
= valor crítico para o teste
µ=8
σ =  = 2
N = 25
Então, substituindo na fórmula, temos:
Certo.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 91 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
A partir da tabela acima, julgue o seguinte item, com base nos conceitos de inferência
estatística.
O coeficiente de determinação é aproximadamente 0,59.
Certo.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 92 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
a) Errada. A letra “a” está errada, pois a regressão tem apenas uma variável explicativa.
b) Errada. A letra “b” também está errada porque o coeficiente de determinação é 0,4.
c) Errada. Com um nível de significância de 2%, deve-se rejeitar a hipótese nula de acordo com
o p-valor de 1,05.
d) Errada. O tamanho da amostra, na verdade, é 21.
e) Certa. A estimativa da variância dos erros aleatórios é o W. Seu valor, pela fórmula, será:
Alternativa correta.
Letra e.
A partir da tabela acima, julgue o seguinte item, com base nos conceitos de inferência
estatística.
Foram utilizados 19 dados para a estimação do modelo de regressão linear.
Na tabela tem a informação de graus de liberdade totais. Então, basta aplicar na fórmula, com
N = número de dados:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 93 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Errado.
Os desvios padrão amostrais das variáveis Y e T foram, respectivamente, 1 e 3,6. Com base
nessas informações, julgue o item a seguir.
Se a média amostral da variável T for igual a 6,5, então a média amostral da variável Y será
igual a 4,35 mil ocorrências.
Podemos utilizar a propriedade de que o valor esperado é linear. Então, o valor esperado da
soma é igual à soma de valores esperados e o produto por uma constante; o valor esperado
também fica multiplicado por essa mesma constante.
Certo.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 94 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
são linear simples da forma Ŷ = 5 – 0,1 x T, em que Ŷ representa a reta ajustada em função da
variável regressora T, tal que 1 ≤ T ≤ 12.
Os erros padrão das estimativas dos coeficientes desse modelo, as razões t e seus respecti-
vos p-valores encontram-se na tabela a seguir.
Os desvios padrão amostrais das variáveis Y e T foram, respectivamente, 1 e 3,6. Com base
nessas informações, julgue o item a seguir.
A correlação linear entre as variáveis Y e T foi igual a –0,1
Foi fornecido o coeficiente de inclinação do modelo de regressão, que é dado pela razão en-
tre a covariância e o desvio-padrão da variável regressora (T). Então, podemos calcular a
covariância:
Em seguida, podemos calcular a correlação entre as duas variáveis pela definição de covari-
ância dividida pelos desvios-padrões:
Errado.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 95 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
A respeito dessa situação hipotética, julgue o próximo item, sabendo que b > 0 e que o desvio
padrão amostral da variável X é igual a 2.
A estimativa do coeficiente angular b, pelo método de mínimos quadrados ordinários, é
igual a 0,25.
Como o enunciado forneceu a soma dos quadrados da regressão (SQReg), podemos relacio-
ná-lo com a variância de X usando o coeficiente b e a variância de X usando a expressão:
Certo.
A respeito dessa situação hipotética, julgue o próximo item, sabendo que b > 0 e que o desvio
padrão amostral da variável X é igual a 2.
A estimativa da variância σ² é superior a 0,5.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 96 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Errado.
A respeito dessa situação hipotética, julgue o próximo item, sabendo que b > 0 e que o desvio
padrão amostral da variável X é igual a 2.
A correlação linear de Pearson entre a variável resposta Y e a variável regressora X é igual a 0,75.
A forma mais simples e direta de calcular o coeficiente de determinação é por meio da sua
definição:
Certo.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 97 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Para ter melhor eficiência, o estimador deverá ter menor variância. A afirmação de que há
violação dos pressupostos de homocedasticidade representa uma variação indesejada no
estimador, seja ela positiva ou negativa.
Para ter maior consistência, sabe-se que o aumento no número da amostra é fundamental.
Isso fornecerá um resultado mais preciso e a variância tenderá a 0. Logo, o enunciado mostra
que haverá perda de eficiência e consistência.
Letra d.
Assim, após fazer os cálculos segundo essas orientações, o resultado correto para a
soma pedida é:
a) 24,5.
b) 31,6.
c) 45,0.
d) 51,9.
e) 56,1.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 98 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Primeiramente, precisamos achar a equação da regressão linear da tabela que relaciona mês,
considerado como x, e toneladas, consideradas como y. Segue a fórmula:
x y x·y x2
1 10 10 1
2 13 26 4
3 15 45 9
4 20 80 16
5 21 105 25
∑ 15 79 266 55
Substituindo os valores:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 99 de 128
ESTATÍSTICA
Regressão Linear
Thiago Cardoso
Letra d.
Dados:
Considerando a equação da reta obtida pelo método dos mínimos quadrados, a previsão do
primeiro ano em que a venda irá superar R$ 60.000,00 será em:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
a) 2016.
b) 2017.
c) 2018.
d) 2019.
e) 2020.
Assim, temos:
Calculando α, basta lembrar-se de que o ponto (,) pertence à reta da regressão. Logo:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Então o ano pedido será, no mínimo, 14,75 anos a mais que o ano inicial.
Logo, o primeiro ano em que a venda superará 60 mil reais será 2017.
Letra b.
A normalização deve ser feita sempre dividindo pelo desvio-padrão, não pela variância. Por-
tanto, a variável normal padrão correspondente ao erro será:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Como já alertei no capítulo de Distribuição Normal, essa é uma pegadinha que as questões de
prova sempre estão fazendo. Não caia nela.
Errado.
Já vimos que a média da variável Y pode ser expressa em função da média da variável X:
Certo.
Essa questão de regressão linear foi provavelmente a questão mais difícil de Estatística que
eu já vi em provas de concurso público fora da área de Estatístico.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Primeiramente, vamos à variância do erro, que é expresso em termos da soma dos quadrados
dos resíduos (depois da regressão linear).
Note que a amostra tem 26 elementos e duas variáveis envolvidas (X e Y).
Agora, vamos ao coeficiente de determinação, que é dado pela razão entre a melhoria (SQRe-
gressão) e os erros antes da regressão (SQTotais).
Vamos nos lembrar de que a melhoria (soma dos quadrados da regressão) é igual à redução
dos erros devido à regressão linear:
Como já conhecemos a soma dos quadrados dos resíduos, podemos calcular a soma dos
quadrados totais:
Agora, podemos analisar a soma dos quadrados da regressão, ou seja, a melhoria promovida
pelo modelo de regressão linear.
Já vimos uma importante relação entre a soma dos quadrados da regressão e a covariância
entre as variáveis:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Porém, não queremos a variância, mas, sim, o desvio-padrão, que é a raiz quadrada da
variância:
Certo.
Errado.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Se, para cada , o ponto seguir uma distribuição normal bivariada cuja
matriz de covariânicas seja dada por , então a estimativa do elemento será
igual a 2.
Errado.
A tendência apresenta a forma T = a + bt, em que a e b foram obtidos usando o método dos
mínimos quadrados. Considerando a equação obtida, tem-se que o acréscimo no faturamen-
to do ano t, com t > 1, para o ano (t + 1) é, em milhões de reais, de
a) 1,2.
b) 1,5.
c) 0,6.
d) 2,4.
e) 1,8.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Vale notar que o coeficiente angular é o próprio incremento, porque, para X = 0, teríamos:
Para X = 1, teríamos:
Então, o incremento é:
Tanto a covariância como a variância pode ser obtida a partir dos somatórios fornecidos,
tendo em vista que:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Letra c.
059. (INÉDITA/2021) Sejam X e Y duas variáveis aleatórias tais que a covariância entre elas é
dada por SXY = 3, cujas variâncias são iguais a SXX = 4 e SYY = 9 e cujas médias são iguais,
respectivamente, a μX = 4 e μY = 0. A respeito dessa situação, julgue o seguinte item.
O modelo de regressão linear entre as duas variáveis é Y = X/3 – 4/3.
Dessa forma, o modelo deve ser Y = 3/4.X + a, logo a afirmação está errada. Podemos, ainda,
calcular o coeficiente linear. Para isso, basta tomar as médias:
060. (INÉDITA/2021) Sejam X e Y duas variáveis aleatórias tais que a covariância entre elas é
dada por SXY = 3, cujas variâncias são iguais a SXX = 4 e SYY = 9 e cujas médias são iguais,
respectivamente, a μX = 4 e μY = 0. A respeito dessa situação, julgue o seguinte item.
O coeficiente de determinação do modelo de regressão linear é igual a 25%.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
A correlação pode ser calculada pela definição, que é a razão entre a correlação e o produto
dos desvios-padrões. No enunciado, foram fornecidas as variâncias. Para calcular os des-
vios-padrões, devemos tomar a raiz quadrada:
Certo.
061. (INÉDITA/2021) Uma equipe de médicos desejava estudar a influência do consumo di-
ário de açúcares (em gramas) sobre a pressão diastólica de indivíduos. Pelos estudos com
uma população, foram registrados os seguintes dados:
O parâmetro b pode ser calculado pela relação entre a covariância e o desvio-padrão da vari-
ável independente:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
062. (INÉDITA/2021) Uma equipe de médicos desejava estudar a influência do consumo di-
ário de açúcares (em gramas) sobre a pressão diastólica de indivíduos. Pelos estudos com
uma população, foram registrados os seguintes dados:
A correlação, por sua vez, pode ser obtida como a razão entre a covariância e os desvios-pa-
drões de ambas as variáveis:
Certo.
063. (INÉDITA/2021) Uma equipe de médicos desejava estudar a influência do consumo di-
ário de açúcares (em gramas) sobre a pressão diastólica de indivíduos. Pelos estudos com
uma população, foram registrados os seguintes dados:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Errado.
064. (INÉDITA/2021) Uma equipe de médicos desejava estudar a influência do consumo di-
ário de açúcares (em gramas) sobre a pressão diastólica de indivíduos. Pelos estudos com
uma população, foram registrados os seguintes dados:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Considerando um grupo de pessoas que consomem 100 g de açúcar por dia, o desvio-padrão
esperado para a pressão diastólica nesse grupo é igual a 16 mmHg.
Portanto, a variância de Y após fixar o parâmetro X em 100 g é igual à própria variância do erro
de estimação.
Para calcular a variância do erro de estimação, podemos tomar o modelo completo e usar a
variância total de Y, isto é, antes do modelo de regressão linear.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Certo.
X Y
Média 2 10
Variância 4 36
Covariância 10,8 10,8
Pelo método dos mínimos quadrados, o coeficiente de inclinação é dado pela razão entre a
covariância, as duas variáveis e a variância da regressora:
Errado.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
X Y
Média 2 10
Variância 4 36
Covariância 10,8 10,8
Errado.
X Y
Média 2 10
Variância 4 36
Covariância 10,8 10,8
O coeficiente de correlação pode ser obtido a partir da correlação entre as duas variáveis:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Errado.
Certo.
Como o valor esperado é um operador linear, podemos utilizar a propriedade de que o valor
esperado da soma é igual à soma dos valores esperados:
Portanto, o coeficiente de determinação do modelo é de apenas 3,85%, o que indica uma baixa
relação entre as duas variáveis.
Errado.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
A covariância entre duas variáveis aleatórias é dada pela média do produto menos o produto
das médias. A média dos produtos pode ser calculada pela mesma ideia de que é igual ao
somatório dos produtos dividido pelo total de observações:
Assim, temos:
Certo.
075. (INÉDITA/2021) Foi construído um modelo de regressão linear entre duas variáveis alea-
tórias X e Y, expresso por Y = a + b.X + ε, em que ε é um ruído branco gaussiano e estatistica-
mente independente de X. São conhecidos os seguintes dados sobre as variáveis:
X Y
Média 0 4
Desvio-Padrão 2 5
Covariância –9 –9
Certo.
076. (INÉDITA/2021) Foi construído um modelo de regressão linear entre duas variáveis alea-
tórias X e Y, expresso por Y = a + b.X + ε, em que ε é um ruído branco gaussiano e estatistica-
mente independente de X. São conhecidos os seguintes dados sobre as variáveis:
X Y
Média 0 4
Desvio-Padrão 2 5
Covariância –9 –9
077. (INÉDITA/2021) Foi construído um modelo de regressão linear entre duas variáveis alea-
tórias X e Y, expresso por Y = a + b.X + ε, em que ε é um ruído branco gaussiano e estatistica-
mente independente de X. São conhecidos os seguintes dados sobre as variáveis:
X Y
Média 0 4
Desvio-Padrão 2 5
Covariância –9 –9
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
A variável regressora, também conhecida como independente, é a variável X. Vamos nos lem-
brar do esquema de regressão linear:
Certo.
X Y
Média 12 4
Variância 36 9
Covariância 16,2 16,2
Os coeficientes de variação podem ser obtidos como a relação entre o desvio-padrão e a média:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
X Y
Média 12 4
Variância 36 9
Covariância 16,2 16,2
X Y
Média 12 4
Variância 36 9
Covariância 16,2 16,2
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Errado.
X Y
Média 12 4
Variância 36 9
Covariância 16,2 16,2
Errado.
X Y
Média 12 4
Variância 36 9
Covariância 16,2 16,2
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Errado.
Por definição, o coeficiente de determinação é igual à relação entre a soma dos quadrados da
regressão e a soma dos quadrados totais:
Errado.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Certo.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
Certo.
Thiago Cardoso
Engenheiro eletrônico formado pelo ITA com distinção em Matemática, analista-chefe da Múltiplos
Investimentos, especialista em mercado de ações. Professor desde os 19 anos e, atualmente, leciona
todos os ramos da Matemática para concursos públicos.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.