Você está na página 1de 156

CORRELAÇÃO LINEAR

Prof. Carlos
Henrique
As correlações podem ser:
a) direta – ocorre com dois experimentos que variam no
mesmo sentido. Se aumentarmos
ou diminuirmos um deles, o outro também aumentará ou
diminuirá;
b) inversa – ocorre com dois fenômenos que variam em
sentido contrário. Se
aumentarmos ou diminuirmos um deles, acontecerá o
inverso com o outro, ou seja, diminuirá ou
aumentará;
Prof. Carlos Henrique
c) Correlação nula – quando não existe correlação, ou
seja, as variáveis são independentes
e) Correlação não linear – há uma correlação, porém ela
não ela não é linear

Prof. Carlos Henrique


Correlação DIRETA

Prof. Carlos Henrique


Correlação Inversa

Prof. Carlos Henrique


Correlação Nula

Prof. Carlos Henrique


Correlação Não-Linear

Prof. Carlos Henrique


REGRESSÃO LINEAR SIMPLES

Prof. Carlos
Henrique
FUNÇÃO DO PRIMEIRO GRAU

Prof. Carlos Henrique


FUNÇÃO DO PRIMEIRO GRAU

Prof. Carlos Henrique


FUNÇÃO DO PRIMEIRO GRAU

Prof. Carlos Henrique


FUNÇÃO DO PRIMEIRO GRAU

Prof. Carlos Henrique


Regressão Linear Simples

Prof. Carlos Henrique


O termo 𝛼 + 𝛽𝑋𝑖 é o componente de 𝑌𝑖 que varia
linearmente, de acordo com 𝑋𝑖 . Por sua vez, 𝜀𝑖 é o
componente aleatório de 𝑌𝑖 que descreve os erros (ou
desvios) cometidos quando tentamos aproximar uma
série de observações 𝑋𝑖 por meio de uma reta 𝑌𝑖.
Nesse modelo, 𝑌𝑖 é a variável cujo comportamento
desejamos prever ou explicar, sendo chamada de variável
dependente ou resposta. Por outro lado, a variável 𝑋𝑖 é
utilizada para explicar o comportamento de 𝑌𝑖 , sendo
conhecida como independente, regressora, explanatória
ou explicativa.
Prof. Carlos Henrique
Regressão Linear Simples

O modelo de regressão linear requer que sejam atendidos


alguns pressupostos básicos quanto à variável aleatória 𝜀𝑖 (erro
ou desvio):

i) 𝑬(𝜺𝒊) = 𝟎. A média dos erros é igual a zero. Ou seja, os desvios


"para cima da reta" igualam o valor dos desvios "para baixo
da reta" na média.

Prof. Carlos Henrique


MÉTODO DOS MÍNIMOS
QUADRADOS

Prof. Carlos Henrique


Covariância

Covariância é a média do produtos dos desvios em relação à


média aritmética

Ou

Covariância é a média dos produtos menos o produto das


médias.

Prof. Carlos Henrique


COEFICIENTE ANGULAR

Prof. Carlos Henrique


COEFICIENTE LINEAR

Prof. Carlos Henrique


COEFICIENTE ANGULAR

Prof. Carlos Henrique


Regressão Linear Simples

Prof. Carlos Henrique


Regressão Linear Simples

Se a estimativa do coeficiente angular da reta obtida por meio


do método dos mínimos quadrados foi de 1,8, calcule a
previsão do faturamento em um determinado ano, uma vez
que a empresa gastou com propaganda neste ano 2 milhões de
reais

Prof. Carlos Henrique


Regressão Linear Simples

Prof. Carlos Henrique


Regressão Linear Simples

Prof. Carlos Henrique


Regressão Linear Simples

Prof. Carlos Henrique


Regressão Linear Simples

Prof. Carlos Henrique


Prof. Carlos Henrique
Regressão Linear Simples

Prof. Carlos Henrique


Regressão Linear Simples

Prof. Carlos Henrique


Regressão Linear Simples

Prof. Carlos Henrique


Atenção: Para responder à questão considere um estudo
com o objetivo de obter a relação entre duas variáveis X e Y
por meio do modelo Yi = α + βXi + ∈i, em que i corresponde
à i-ésima observação de X e Y. Os parâmetros α e β são
desconhecidos e ∈i é o erro aleatório com as respectivas
hipóteses consideradas para a regressão linear simples. Com
base em 20 pares de observações (Xi , Yi), i = 1, 2, ..., 20 e
utilizando o método dos mínimos quadrados foram obtidas
as estimativas para α e β.

Prof. Carlos Henrique


Regressão Linear Simples

Prof. Carlos Henrique


Considerando a equação da reta obtida pelo método
dos mínimos quadrados, tem-se que o valor para X
tal que Y = 15 é
(A) 6,0.
(B) 10,5.
(C) 9,0.
(D) 7,5.
(E) 12,0.

Prof. Carlos Henrique


Regressão Linear Simples

Prof. Carlos Henrique


Regressão Linear Simples

Uma empresa fabricante de produtos farmacêuticos, empregando alta tecnologia,


realizou um levantamento do custo total de um de seus produtos (Y), expresso em mil
reais, em função do número total de comprimidos produzidos (X), expresso em
unidades, durante 25 meses, com o objetivo de montar uma regressão linear simples
entre essas variáveis. Observe os seguintes resultados:

Prof. Carlos Henrique


Regressão Linear Simples

Prof. Carlos Henrique


Calcule a reta que melhor se ajusta a esses dados no sentido de minimizar o
quadrado da diferença entre os valores observados e os estimados.
Coeficiente de Correlação Linear de
Pearson

Prof. Carlos Henrique


COEFICIENTE DE CORRELAÇÃO
LINEAR DE PEARSON

Prof. Carlos Henrique


Coeficiente de Correlação Linear de
Pearson

Prof. Carlos Henrique


Coeficiente de Determinação

Prof. Carlos Henrique


Intervalo do coeficiente de Correlação
Linear de Pearson e do coeficiente de
determinação

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear
Sejam X e Y duas variáveis aleatórias e
Julgue os itens seguintes

Var(X) = E(X2) + [E(X)]2

E(XY) = Cov(X,Y) + E(X) · E(Y)

E(2X + 3) = 2E(X)

Se Cov(X,Y) = 0 então X e Y são independentes.


Prof. Carlos Henrique
Correlação Linear

E(X + Y) = E(X) + E(Y) somente no caso de X e Y serem


independentes.

E(2X + 5) = 4E(X)

Var(X + 10) = Var(X) + 10

Cov(X,Y) = Var(X) · Var(Y)

E(3X + 2Y) = 9E(X) + 4E(Y)


Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique


Propriedades da Covariância

Prof. Carlos Henrique


Propriedades da Covariância

Prof. Carlos Henrique


Propriedades do Coeficiente da
Correlação Linear

Prof. Carlos Henrique


Prof. Carlos Henrique
Prof. Carlos Henrique
Prof. Carlos Henrique
Sejam X, Y e Z três variáveis com correlações de Pearson
expressas pela matriz abaixo:

Prof. Carlos Henrique


Correlação Linear
Julgue os itens seguintes:

X e Z são independentes.

a correlação entre X e Y é negativa.

a correlação entre V = a + bX e W = c + dZ, com


a ≠ 0, c ≠ 0, b > 0 e d < 0 é negativa.

a covariância entre X e Y é igual a 0,64.


Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear
Duas variáveis aleatórias x e y têm coeficiente de correlação linear
igual a 0,8. Se w e z são tais que w = 2x – 3 e z = 4 – 2y então o
coeficiente de correlação entre w e z será igual a:
(A) –0,8.
(C) 0,36.
(B) –0,64.
(D) 0,64.
(E) 0,8.

Prof. Carlos Henrique


Prof. Carlos Henrique
VARIÂNCIA DA SOMA OU DA
DIFERENÇA DE DUAS VARIÁVEIS

Prof. Carlos Henrique


Prof. Carlos Henrique
Prof. Carlos Henrique
Banca: CESPE
Órgão: ABIN
Prova: Oficial Técnico de Inteligência - Área 7
Julgue o item que se segue, relativo a análise multivariada.
Se X e Y forem variáveis independentes e tiverem distribuição
normal com médias μx e μy, respectivamente, e variâncias σ2x e σ2y
, respectivamente, então a soma X + Y terá média μx + μy e
variância σ2x + σ2y.

Prof. Carlos Henrique


Prof. Carlos Henrique
José da Silva, um diligente servidor público, realizou uma
pesquisa entre a relação do número de faltas ao serviço (x) e o
número de jogos do Flamengo em um campeonato qualquer (y).
José da Silva descobriu que o coeficiente de correlação linear de
Pearson das duas variáveis é 0,8, enquanto que os desvios padrões
das variáveis x e y são, respectivamente, 4 e 5.

Julgue o item seguinte

O desvio padrão da diferença entre as variáveis x e y é 3

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Covariância

Covariância é a média do produtos dos desvios em relação à


média aritmética

Ou

Covariância é a média dos produtos menos o produto das


médias.

Prof. Carlos Henrique


Prof. Carlos Henrique
Prof. Carlos Henrique
Prof. Carlos Henrique
Coeficiente de Correlação Linear de
Pearson

Prof. Carlos Henrique


COEFICIENTE DE CORRELAÇÃO
LINEAR DE PEARSON

Prof. Carlos Henrique


Coeficiente de Correlação Linear de
Pearson

Prof. Carlos Henrique


Coeficiente de Determinação

Prof. Carlos Henrique


Intervalo do coeficiente de Correlação
Linear de Pearson e do coeficiente de
determinação

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear
Sejam X e Y duas variáveis aleatórias e
Julgue os itens seguintes

Var(X) = E(X2) + [E(X)]2

E(XY) = Cov(X,Y) + E(X) · E(Y)

E(2X + 3) = 2E(X)

Se Cov(X,Y) = 0 então X e Y são independentes.


Prof. Carlos Henrique
Correlação Linear

E(X + Y) = E(X) + E(Y) somente no caso de X e Y serem


independentes.

E(2X + 5) = 4E(X)

Var(X + 10) = Var(X) + 10

Cov(X,Y) = Var(X) · Var(Y)

E(3X + 2Y) = 9E(X) + 4E(Y)


Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique


Propriedades da Covariância

Prof. Carlos Henrique


Propriedades da Covariância

Prof. Carlos Henrique


Propriedades do Coeficiente da
Correlação Linear

Prof. Carlos Henrique


Prof. Carlos Henrique
Prof. Carlos Henrique
Prof. Carlos Henrique
Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear
Duas variáveis aleatórias x (número de casas) e y (quantidade de
carros) têm coeficiente de correlação linear igual a 0,8. Se w e z
são tais que w = 2x – 3 e z = 4 + 2y, calcule o coeficiente de
correlação entre w e z.

Prof. Carlos Henrique


Prof. Carlos Henrique
VARIÂNCIA DA SOMA OU DA
DIFERENÇA DE DUAS VARIÁVEIS

Prof. Carlos Henrique


Prof. Carlos Henrique
Prof. Carlos Henrique
Julgue o item que se segue, relativo a análise multivariada.

Se X e Y forem variáveis independentes e tiverem distribuição


normal com médias μx e μy, respectivamente, e variâncias σ2x e σ2y
, respectivamente, então a soma X + Y terá média μx + μy e
variância σ2x + σ2y.

Prof. Carlos Henrique


Prof. Carlos Henrique
José da Silva, um diligente servidor público, realizou uma
pesquisa entre a relação do número de faltas ao serviço (x) e o
número de jogos do Flamengo em um campeonato qualquer (y).
José da Silva descobriu que o coeficiente de correlação linear de
Pearson das duas variáveis é 0,8, enquanto que os desvios padrões
das variáveis x e y são, respectivamente, 4 e 5.

Julgue o item seguinte

O desvio padrão da diferença entre as variáveis x e y é 3

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


Correlação Linear

Prof. Carlos Henrique


ANÁLISE DE VARIÂNCIA DA REGRESSÃO

Prof. Carlos
Henrique
Análise de Variância da Regressão
A estratégia que adotamos para verificar se compensa ou não
utilizar um modelo de regressão linear, 𝑌𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝜀𝑖, é
observar a redução no resíduo (desvio) quando comparado com
um modelo aproximadamente uniforme 𝑌𝑖 = 𝜇 + 𝜀𝑖.

Se a redução é muito pequena, significa dizer que os dois modelos


são praticamente equivalentes. Isso ocorre quando a inclinação 𝛽
for zero ou um valor muito pequeno, não compensando usar um
modelo mais complexo.
Prof. Carlos Henrique
Análise de Variância da Regressão

Assim, estamos interessados em testar a hipótese:

Prof. Carlos Henrique


Análise de Variância da Regressão

Se a hipótese nula é aceita, concluímos que não existe relação


linear significativa entre as variáveis 𝑋 e 𝑌.

Prof. Carlos Henrique


Análise de Variância da Regressão

O resultado da análise de variância da regressão é uma tabela


que resume várias medidas usadas no teste de hipóteses
anterior. Para montar a tabela de análise de variância
(ANOVA), precisamos conhecer: os graus de liberdade, as
somas dos quadrados e os quadrados médios do modelo, dos
resíduos (erros ou desvios) e total.

Prof. Carlos Henrique


GRAUS DE LIBERDADE

Prof. Carlos Henrique


GRAUS DE LIBERDADE
O número total de graus de liberdade de uma amostra de
tamanho 𝑛 é:

𝐺𝐿𝑇𝑜𝑡𝑎𝑙 = 𝑛 − 1

Prof. Carlos Henrique


GRAUS DE LIBERDADE

Como vimos anteriormente, a equação de regressão possui apenas


dois parâmetros (𝛼 𝑒 𝛽). Portanto, o número de graus de liberdade
do modelo é:

𝐺𝐿𝑀𝑜𝑑𝑒𝑙𝑜 = 2 − 1 = 1

Prof. Carlos Henrique


GRAUS DE LIBERDADE
Agora, temos que descobrir o número de graus de liberdade dos
resíduos. Para isso, utilizamos a seguinte relação:

𝐺𝐿𝑇𝑜𝑡𝑎𝑙 = 𝐺𝐿𝑀𝑜𝑑𝑒𝑙𝑜 + GLRESÍDUOS

Daí, concluímos que:

𝑛 − 1 = 1 + 𝐺𝐿𝑅𝑒𝑠í𝑑𝑢𝑜𝑠

𝐺𝐿𝑅𝑒𝑠í𝑑𝑢𝑜𝑠 = 𝑛 − 2
Prof. Carlos Henrique
GRAUS DE LIBERDADE

Prof. Carlos Henrique


SOMA DOS QUADRADOS

Prof. Carlos Henrique


SOMA DOS QUADRADOS TOTAIS

Prof. Carlos Henrique


SOMA DOS QUADRADOS DO
MODELO DE REGRESSÃO

Prof. Carlos Henrique


Análise de Variância da Regressão

Prof. Carlos Henrique


SOMA DOS QUADRADOS DOS
RESÍDUOS

Prof. Carlos Henrique


Análise de Variância da Regressão

Prof. Carlos Henrique


Análise de Variância da Regressão

Prof. Carlos Henrique


COEFICIENTE DE DETERMINAÇÃO

Prof. Carlos Henrique


COEFICIENTE DE CORRELAÇÃO AJUSTADO

Prof. Carlos Henrique


QUADRADOS MÉDIOS

Prof. Carlos Henrique


QUADRADO MÉDIO DO MODELO

Prof. Carlos Henrique


QUADRADO MÉDIO DOS RESÍDUOS

Prof. Carlos Henrique


QUADRADO MÉDIO TOTAL

Prof. Carlos Henrique


ESTATÍSTICA F (RAZÃO F)
Para testar 𝐻0: 𝛽 = 0 contra 𝐻1: 𝛽 ≠ 0, usamos a seguinte
estatística teste, denominada de estatística 𝐹 (ou razão F):

Prof. Carlos Henrique


Análise de Variância da Regressão

Dessa forma, para avaliar o teste de hipóteses, basta


compararmos o valor da estatística teste com o valor
crítico tabelado:
• Se 𝐹∗ > 𝐹𝑐𝑟í𝑡𝑖𝑐𝑜, podemos rejeitar a hipótese nula;
• Se 𝐹∗ < 𝐹𝑐𝑟í𝑡𝑖𝑐𝑜, não podemos rejeitar a hipótese nula.

Prof. Carlos Henrique


TABELA ANOVA

Prof. Carlos Henrique


Análise de Variância da Regressão

Prof. Carlos Henrique


Análise de Variância da Regressão
(CESPE 2018/EBSERH) Determinado estudo considerou um modelo
de regressão linear simples na forma
𝒚𝒊 = 𝜷𝟎 + 𝜷𝟏𝒙𝒊 + 𝜺𝒊, em que 𝒚𝒊 representa o número de leitos por
habitante existente no município 𝒊; 𝒙𝒊
representa um indicador de qualidade de vida referente a esse
mesmo município 𝒊, para 𝒊 = 𝟏, ⋯ , 𝒏. A
componente 𝜺𝒊 representa um erro aleatório com média 𝟎 e
variância 𝝈𝟐. A tabela a seguir mostra a tabela
ANOVA resultante do ajuste desse modelo pelo método dos
mínimos quadrados ordinários.
Prof. Carlos Henrique
Análise de Variância da Regressão

Prof. Carlos Henrique


Análise de Variância da Regressão
A partir das informações e da tabela apresentadas, julgue os itens subsequentes.

O referido estudo contemplou um conjunto de dados obtidos de


𝑛 = 11 municípios.

A correlação linear entre o número de leitos hospitalares por


habitante (y) e o indicador de qualidade de vida (x) foi igual a
0,9.

Prof. Carlos Henrique


Análise de Variância da Regressão

A razão F da tabela ANOVA refere-se ao teste de significância


estatística do intercepto 𝛽0, em que se testa a hipótese nula
𝐻0: 𝛽0 = 0 contra a hipótese alternativa 𝐻𝐴: 𝛽0 ≠ 0.

O desvio padrão amostral do número de leitos por habitante


foi superior a 10 leitos por habitante.

Prof. Carlos Henrique


Análise de Variância da Regressão

A estimativa de 𝜎2 foi igual a 10.

O 𝑅2 ajustado foi inferior a 0,9.

Prof. Carlos Henrique


Análise de Variância da Regressão

Prof. Carlos Henrique


Análise de Variância da Regressão

(AGENTE PF – 2018) Um pesquisador estudou a relação entre a


taxa de criminalidade (Y) e a taxa de desocupação da população
economicamente ativa (X) em determinada região do país.
Esse pesquisador aplicou um modelo de regressão linear simples
na forma Y = bX + a + ε, em que b representa o coeficiente
angular, a é o intercepto do modelo e ε denota o erro aleatório
com média zero e variância σ2. A tabela a seguir representa a
análise de variância (ANOVA) proporcionada por esse modelo.

Prof. Carlos Henrique


Análise de Variância da Regressão

Prof. Carlos Henrique


Análise de Variância da Regressão
A respeito dessa situação hipotética, julgue os próximos itens,
sabendo que b > 0 e que o desvio padrão amostral da variável X é
igual a 2.

A correlação linear de Pearson entre a variável resposta Y e a


variável regressora X e igual a 0,75.

A estimativa da variância σ2 é superior a 0,5.

A estimativa do coeficiente angular b, pelo método de mínimos


quadrados ordinários, é igual a 0,25.

Prof. Carlos Henrique


Análise de Variância da Regressão

Prof. Carlos Henrique

Você também pode gostar