Você está na página 1de 24

REGRESSÃO LINEAR E

CORRELAÇÃO

Profª. Me. ILA RAQUEL MELLO CARDOSO

Mestre em Ciência e Tecnologia de Alimentos - Engª


de Alimentos
Análise de Regressão
 Modelos de regressão são modelos matemáticos
que relacionam o comportamento de uma
variável Y com outra X.
 Linear  equação da reta ou do plano
 Não linear  equação exponencial, geométrica,
e outras.
Para que serve determinar a relação entre
duas variáveis?

1 - Para realizar previsões sobre o comportamento futuro de algum fenômeno da realidade.


 Ex.: Prever a população futura de uma cidade simulando a tendência de crescimento da
população no passado.

2 - Pesquisadores interessados em simular os efeitos sobre uma variável Y em decorrência de


alterações introduzidas nos valores de uma variável X também usam este modelo.
 Ex.: Produtividade (y) de uma área agrícola é alterada quando se aplica certa quantidade
(x) de fertilizante sobre a terra.
Comprimento de uma peça e o peso;
Distancia de freagem de um carro e velocidade;
Quantidade de eletrodomestico de uma residencia e o consumo de enegia.
Diagrama de Dispersão

Gráfico cartesiano

A regressão será linear se observada uma


tendência ou eixo linear na nuvem de pontos
cartesianos.
Modelos de Regressão Linear

Regressão é o processo matemático pelo qual


derivamos os parâmetros “a” e “b” de uma função
f (X).

Estes parâmetros determinam as características


da função que relaciona ‘Y’ com ‘X’que no caso do
modelo linear se representa por uma reta
chamada de reta de regressão.
1 - Pontos plotados no gráfico
Processo de
são definidos, modelados ou
Regressão regredidos.

2 - Corresponde à menor
distância possível entre cada
ponto plotado e a reta.

3 - Busca-se reduzir ao mínimo


possível os somatórios dos
desvios entre Y e Y’.
Método dos Mínimos Quadrados
 É o método de computação matemática pelo
qual se define a curva de regressão.
 Esse método definirá uma reta que minimizará
a soma das distâncias ao quadrado entre os
pontos plotados (X, Y) e a reta (X’,Y’).
 Pelo método dos mínimos quadrados calculam-
se os parâmetros “a” e “b” da reta que minimiza
estas distâncias ou as diferenças (ou o
erro/desvio) entre Y e Y’.
GRAU DE UTILIDADE DA RETA DE
REGRESSÃO

A reta de regressão que se obtém através do


método dos mínimos quadrados é apenas uma
aproximação da realidade, ela é um modo útil
para indicar a tendência dos dados.
Quando a reta de regressão é útil para
avaliar a realidade?

▪ Erro padrão da ▪ Coeficiente de


estimativa determinação
 Se: mede o desvio médio entre  R2 : Ao se analisar a reta de
os valores reais de Y e os regressão observamos que os
valores estimados Y’. pontos (xi, yi) estão distribuídos
 Informa de modo aproximado acima e abaixo da mesma.
a extensão do erro entre os
valores obtidos das estimativas
e os valores de Y fornecidos
pela amostra.
 O que se busca é conseguir o
menor valor possível de Se.
Erro padrão da estimativa
Se: Desvio padrão dos resíduos.
Pode-se dizer então que 68% dos pontos (plotados)
encontram-se dentro de 1 desvio padrão:
-1 ≤ Se ≥ 1
95% dos pontos encontram-se dentro de 2 desvios
padrão:
-2 ≤ Se ≥ 2

Sendo os desvios normalmente distribuídos a fórmula de


Se é obtida da definição da variância da amostra Se2 ,
com n-2 graus de liberdade:
Coeficiente de Determinação
 Variação Total: A soma dos desvios ao quadrado de todos
os pontos em relação a média de Y;

Variação Não Explicada: A diferença entre o valor de um


ponto Y (xi, yi) e seu valor estimado Y' (xi’,yi’) isto é a
distancia entre o ponto Y e a reta de regressão;

Variação Explicada: diferença entre o valor Y’ (estimativa


de Y) situado sobre a reta de regressão e o valor médio de
Y* (situado sobre a reta paralela ao eixo x).
Coeficiente de Correlação
 O coeficiente de determinação é igual ao quadrado do
coeficiente de correlação;

 Para um coeficiente de determinação r2 = 0,738


obtemos o coeficiente de correlação, r = 0,85;

 Valores de r igual ou próximos de 1 ou –1 indica que


exige uma forte relação entre as variáveis: no primeiro
caso a relação é direta, enquanto que no segundo a
relação é inversa.
O coeficiente de determinação indica o quanto a reta de
regressão explica o ajuste da reta, enquanto que o
coeficiente de correlação deve ser usado como uma
medida de força da relação entre as variáveis
CORRELAÇÃO LINEAR SIMPLES
• Duas variáveis x e y
• Ex: comprimento de uma peça e o peso,
diâmetro das barras e a resistência, horas de
trabalho e o rendimento.
Correlação linear direta (positiva)
 Correlação linear inversa (negativa)

 Correlação nula
Correlação não linear (exponencial, geométrica,
logarítmica entre outras)
Coeficiente de Correlação Linear (r)
Mede o grau de relacionamento linear entre as
variáveis;
r = -1, -100%  correlação máxima negativa
r = 1, 100%  correlação máxima positiva
r = 0  correlação nula
r < 30%  correlação fraca
r > 70%  correlação forte
Aplicabilidade
• Exemplo: Se para as variáveis x (distância rodoviária,
em km) e y (tempo, em dias para entregar de
mercadorias por uma transportadora), o valor do
coeficiente de correlação é r = 0,95 (95%), então o
valor do coeficiente de determinação é: r2= (0,95)2 =
0,9025 (90,95%), o que significa que 90,95%da variação
do tempo de entrega das mercadorias são explicadas pela
distância rodoviária envolvida, e que 9,75% restantes
não são explicadas pela distância, mas sim por outros
fatores.
EXERCÍCIOS
1) A TABELA 1 apresenta a produção diária (x) de
determinado tipo de peça, e os respectivos
estoques (y) dessas peças, observados em 6
dias aleatoriamente escolhidos:
Produção (x) Estoque (y)
138 29
167 40
204 53
183 36
125 32
190 47
a) Qual a produção média diária de peças nesse período?
b) Qual o estoque médio diário de peças verificado nesse
período?
c) Determinar o valor do coeficiente de correlação (r).
d) Interpretar o resultado do coeficiente de correlação
linear
e) Calcular o valor do coeficiente de determinação (r2)
f) Interpretar o resultado do coeficiente de determinação
g) Determinar a equação de regressão linear (y = a + bx)
2) A tabela abaixo apresenta as vendas diárias (x)
de determinado tipo de produto, e os respectivos
estoques (y)desse produto, em unidades,
observados em 7 dias aleatoriamente escolhidos:
Venda (x) Estoque (y)
79 30
102 12
58 25
72 40
65 67
90 35
107 20

Você também pode gostar