Você está na página 1de 17

Correlação e Regressão

Professor Raphael Cardeal

somaconcursos.com.br
Correlação e regressão

Visa estudar a associação entre


duas ou mais variáveis aleatórias.

Intensidade, duração e frequência Vazões médias anuais e áreas de


de precipitações intensas drenagem
Correlação e regressão

Variáveis altamente
correlacionadas não apresentam
necessariamente qualquer relação
de causa e efeito
Coeficiente de correlação linear de Pearson

Covariância:
Quanto maior (positivo) o valor da covariância,
mais os valores altos de X se relacionam com Y.
Quanto menor (negativo), mais os valores altos
de X se relacionam com valores baixos de Y.

Coeficiente de correlação linear de Pearson:

Covariância

Desvio padrão
Cardeal, 2023

Considerando 2 variáveis, uma dependente e uma independente, julgue o


seguinte item:

O coeficiente de correlação linear apresenta mesma unidade de medida da


variável dependente.
Coeficiente de correlação linear de Pearson

Coeficiente de correlação linear de Pearson varia entre -1 e 1 e é


admensional.
CESPE / CEBRASPE - 2022 - FUB - Estatístico

Uma regressão linear de Y sobre X consiste em obter a equação de uma reta,


ou uma função linear, como o modelo que irá melhor representar a relação entre
as variáveis; a determinação dos parâmetros dessa reta é denominada
ajustamento.
Considerando essas informações, julgue o seguinte item.

Para quaisquer valores das variáveis X e Y, a existência de um coeficiente de


correlação diferente de zero é garantia para que haja uma relação entre X e Y.
Regressão linear

A partir do gráfico de dispersão podemos observar a existência de uma


relação entre duas variáveis. Nesse contexto, a análise de regressão linear é
uma técnica estatística que propõe uma função linear que explique a relação
entre as variáveis. A função pode ser representada de forma genérica por:

Onde :
e são os coeficientes do modelo.
é o erro do modelo.
Método dos mínimos quadrados

É um método que consiste em minimizar a soma dos quadrados dos resíduos


(ou erros).

O erro é dado pela


diferença entre o
valor observado e o
valor estimado.
Cardeal, 2023

Valores negativos do coeficiente de determinação indicam uma correlação


inversamente proporcionais. E valores próximos a 0 indicam que há pouca
correlação entre os dados amostrais e o modelo.
Coeficiente de determinação e de correlação

O coeficiente de determinação, representado por R2 indica a aparcela de


variabilidade amostral que pode ser explicada pela reta de regressão. O R2 pode
apresentar valores entre 0 e 1, onde valores mais próximos de 1 indicam que o
modelo melhor explica os valores amostrais.

O coeficiente de correlação R é dado por ± 𝑹𝟐 ,


CESPE / CEBRASPE - 2022 - FUB - Estatístico

Uma regressão linear de Y sobre X consiste em obter a equação de uma


reta, ou uma função linear, como o modelo que irá melhor representar a relação
entre as variáveis; a determinação dos parâmetros dessa reta é denominada
ajustamento.
Considerando essas informações, julgue o seguinte item.

Um coeficiente de determinação entre as variáveis X e Y de 95% implica


necessariamente a obtenção de uma reta dos mínimos quadrados crescente, ou
seja, em uma correlação positiva.
CESGRANRIO - 2022 - ELETROBRAS-ELETRONUCLEAR

Nos anos 60, foram feitos diversos estudos para se avaliar o efeito da poluição
sobre a saúde da população, quando se utilizaram métodos estatísticos, como a
correlação linear e a regressão linear.

Entre as características desses dois métodos, encontram-se:


a) Relacionar duas ou mais variáveis, sendo que a correlação utiliza o método
dos mínimos quadrados, enquanto a regressão utiliza a análise de variância.
b) Relacionar duas ou mais variáveis, sendo que a correlação expressa um
grau de relação entre duas variáveis, enquanto a regressão estima uma equação
que mais se ajusta aos dados analisados.
CESGRANRIO - 2022 - ELETROBRAS-ELETRONUCLEAR

c) Relacionar duas ou mais variáveis, sendo que a correlação estima uma


equação que mais se ajusta aos dados analisados, enquanto a regressão
expressa um grau de relação entre variáveis.
d) Normalizar os dados, sendo que a correlação transforma os dados para
uma distribuição normal, enquanto a regressão transforma os dados de modo
linearmente uniforme.
e) Normalizar os dados, sendo que a correlação transforma os dados de modo
linearmente uniforme, enquanto a regressão transforma os dados para uma
distribuição normal.
Regressão linear múltipla

Na regressão linear múltipla estabelece-se o valor de uma variável


dependente Y de acordo com uma função de duas ou mais variáveis
independentes Xi. Sendo a função dada por:

Onde Y representa a variável dependente, X as variáveis independentes e β


os coeficientes da regressão. Esses coeficientes também podem ser encontrados
pelo método dos mínimos quadrados.

Variáveis colineares não fornecem novas informações e dificulta a


análise da influência de cada variável no modelo.
FMP Concursos - 2012 - PROCEMPA - Analista de Logística
Com um conjunto de dados, apresentados na forma de diagrama de dispersão, onde são identificadas
duas variáveis (exemplo: renda e produtos vendidos), pode-se utilizar as seguintes ferramentas estatísticas:
I) regressão linear simples.
II) correlação.
III) regressão linear múltipla.
As alternativas corretas são:

a) I e II.
b) I e III.
c) II e III.
d) I, II e III.
e) Nenhuma das alternativas estão corretas.
OBRIGADO!
Professor Raphael Cardeal

Você também pode gostar