Você está na página 1de 16

Regressão linear

Profa. Chiara Rodrigues


Regressão
• O termo regressão é usado para designar a
expressão de uma variável dependente (Y) em
função de outra (X), considerada independente.

▫ Exemplo: regressão do peso da leitegada à


desmama em função do número de leitões
desmamados
• Se a relação funcional entre elas é expressa por
uma equação de 1º grau, cuja representação
geométrica é uma linha reta, a regressão é dita
linear.

• Se tal relação não for explicada por equações do


1º grau, exigndo funções de ordem superior, a
regressão é dita não-linear
Diagrama de dispersão

• Fornece uma idéia do tipo de relação existente


entre as variáveis estudadas (linear ou não-
linear).
▫ Diagramas de dispersão
• A relação linear entre duas variáveis pode ser
representada pela equação da reta:

▫ = variável dependente, ou resposta


▫ x = variável independente, ou explanatória
▫ a = intercepto da linha de regressão com o eixo
y quando x = 0
▫ b = coeficiente de regressão
• Para obtenção das constantes a e b aplica-se o
método dos mínimos quadrados:

e
▫ Para ilustrar a aplicação do método dos mínimos
quadrados, observe o exemplo:

Peso (x) N de ovos (y)


250 18300
290 21700
Exemplo 1: Peso de uma espécie de
140 8500
peixe e a quantidade de ovos
225 16450
produzidos por ele, conforme dados ao
90 5000
lado:
340 24350
390 30000
290 21000
200 14200
100 6100
• Representando em gráfico a relação entre x e y,
temos o seguinte diagrama de dispersão:
35000

30000
Número de ovos (y)

25000

20000

15000

10000

5000

0
0 100 200 300 400 500
Peso do peixe (x)

▫ nota-se a inexistência de uma relação linear


• Para facilitar a obtenção das somas, foi
construída a tabela abaixo:
Peso (x) N de ovos (y) x2 y2 xy
250 18300 62500 334890000 4575000
290 21700 84100 470890000 6293000
140 8500 19600 72250000 1190000
225 16450 50625 270602500 3701250
90 5000 8100 25000000 450000
340 24350 115600 592922500 8279000
390 30000 152100 900000000 11700000
290 21000 84100 441000000 6090000
200 14200 40000 201640000 2840000
100 6100 10000 37210000 610000
Σx = 2315 Σy=165600 Σx2=626725 Σy2=3346405000 Σxy=45728250
• Para ajustar uma reta aos dois pontos, considere
n = 10, já que o número de par analisados foi
igual a 10, e aplique as fórmulas do coeficiente
de regressão (b) e do intercepto (a)
b = 45728250 – (2315)(165600)/10
626725 – (2315)2/10

b = 45728250 – 38336400
626725 – 535922,5

b = 7391850
90802,5
b = 81,405
a = 16560 – 81,405 (231,5)

a = - 2285,25
• Portanto a equação de regressão será:

Ŷ = - 2285,25 + 81,405X
▫ Com base nos valores obtidos para a e b, é possível
determinar que a reta que melhor ajusta os pontos
é do tipo:

Ŷ = - 2285,25 + 81,405X

▫ A reta de ajuste pode ser vista no diagrama de


dispersão a partir dos pontos ajustados para os
novos valores de y cuja notação é Ŷ
35000

30000

25000
Quantidade de ovos estimada
(Ŷ) em função do peso do peixe
20000
em gramas (x)
15000

10000

5000

0
0 100 200 300 400 500
x y Ŷ
Para x = 250 Ŷ = -2285,442 + 81,405(250) = 18066,01 250 18300 18066,01
Para x = 290 Ŷ = -2285,442 + 81,405(290) = 21322,24 290 21700 21322,2392
Para x = 140 Ŷ = -2285,442 + 81,405(140) = 9111,37 140 8500 9111,369456
Para x = 225 Ŷ = -2285,442 + 81,405(225) = 16030,86 225 16450 16030,86231
Para x = 90 Ŷ = -2285,442 + 81,405(90) = 5041,08 90 5000 5041,079541
Para x = 340 Ŷ = -2285,442 + 81,405(340) = 25392,53 340 24350 25392,52912
Para x = 390 Ŷ = -2285,442 + 81,405(390) = 29462,82 390 30000 29462,81903
Para x = 290 Ŷ = -2285,442 + 81,405(290) = 21322,24 290 21000 21322,2392
Para x = 200 Ŷ = -2285,442 + 81,405(200) = 13995,72 200 14200 13995,71735
Para x = 100 Ŷ = -2285,442 + 81,405(100) = 5855,14 100 6100 5855,137524

Você também pode gostar