Você está na página 1de 70

Prof.

Alexandre Passito
passito@icomp.ufam.edu.br
 Graficamente, a extrapolação e o ajuste
por barras de erros são vistos abaixo:
f (x) f ( x)  e x

Curva
ajustada

Barra de
f x 
erros

x x
Curva
extrapolada
2
 Ajuste de Curvas ou Regressão

Utilizada para se estabelecer e/ou verificar


se existe uma relação entre as variáveis e
para previsão de valores.

Dados um conjunto de dados deseja-se


encontrar a curva que melhor se ajusta a
estes dados.

3
 Exemplo: Deseja-se encontrar a relação entre
tempo de germinação e temperatura do solo
para sementes de feijão. Para isso são feitas
diversas experiências onde variou-se a
temperatura do solo e determinou-se o
número de dias que a semente demorou para
germinar.

4
 Para resolver este problema propõe-se que a
relação entre as duas variáveis pode ser uma
relação linear ou quadrática. Neste caso:
d  at  b,
ou,
d  at 2  bt  c,
Onde d é o tempo de germinação em dias
t é a temperat ura em graus Celsius
a, b e c os parâmetros a serem determinados
 Existe algum outro fator que poderia influenciar o processo de
germinação, ou seja, considerar apenas a temperatura seria
coerente?

5
 Em uma dada região de Bocaína-SP, acredita-se
que o gado alimentado em um determinado
pasto tem ganho de peso maior que o usual.
Estudos de laboratório detectaram uma
substância no pasto e deseja-se verificar se ela
pode ser utilizada para melhorar o ganho de
peso dos bovinos. Foram escolhidos 15 bois da
mesma raça e idade, e cada animal recebeu uma
determinada concentração de substância X( em
mg/l). O ganho de peso após 30 dias, denotado
por Y, foi anotado e os dados são mostrados na
tabela a seguir( em KG).

6
 Observando a tabela de dados, notamos
que, de fato, à medida que aumenta a
concentração da substância, ocorre o
aumento de peso. Qual a quantidade de
concentração da substância X (em mg/l)
deve ser ingerida pelos bovinos para que o
aumento de peso ao fim de 30 dias seja de
30 Kg?
i 0 1 2 3 4 5 6 7 8 9 10 11 12
xi 0,2 0,5 0,6 0,7 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
yi 9,4 11,4 12,3 10,2 11,9 13,6 14,2 16,2 16,2 17,7 18,8 19,9 22,5

7
 Com esses pontos pode-se desenhar o
seguinte Gráfico:

8
 Qual curva é a mais adequada?
2 3 4 5
Y =-0,74952+2,09714 X Y =-0,24453-1,11365 X+2,38698 X -0,58438 X +0,05755 X -0,00198 X
24 24

22 22

20 20

18 18

Variável dependente
16
Variável dependente

16

14 14

12 12

10 10

8 8

6 6

4 4

2 2

0 0
0 1 2 3 4 5 6 7 8 9 10 11 12 0 1 2 3 4 5 6 7 8 9 10 11 12

Variável independente Variável independente

9
 Tipos de Curvas ou Modelos de Regressão.

 Como encontrar a melhor curva para um


determinado Modelo de Regressão dado um
conjunto de pontos (x1,x2,...,xp,y) ?

 Com definir qual o melhor modelo de


Regressão para seus dados?

10
Regressão
Regressão Linear Regressão Linear Regressão
Polinomial
Simples Múltipla Polinomial
Múltipla

Duas ou mais Duas ou mais


Uma variável Uma variável
variáveis variáveis
independente ou independente ou
independentes ou independentes ou
explicativa explicativa
explicativas explicativas

Uma variável Uma variável Uma variável Uma variável


dependente ou dependente ou dependente ou dependente ou
resposta resposta resposta resposta

Descrita por um Descrita por um


Descrita por uma Descrita por uma
polinômio de grau polinômio de grau
reta reta
maior que 1 maior que 1

11
y  b0  b1 x
x  variável independente ou explicativa
y  variável dependente ou resposta

12
13
y  b0  b1 x1  b2 x2    bp x p
xi  variáveis independentes ou explicativas,
i  1,2,, p e p  2
y  variável dependente ou resposta.

14
15
y  b0  b1 x  b2 x 2    bp x p
x  variável independente ou explicativa,
para p  2
y  variável dependente ou resposta.

16
17
Exemplo
y  b0  b1 x1  b x  b3 x2  b x
2
2 1
2
4 2

x1 , x2 , x3  variáveis independentes ou explicativas,


y  variável dependente ou resposta.

18
19
20
 Considerando que o modelo escolhido foi o de
Regressão Linear Simples deve-se construir uma
reta que relaciona as variáveis, onde:

y = 0 + 1x +   erro associado a componentes


desconhecidas e aleatórias

Exemplo: Dados os valores

x 0,3 2,7 4,5 5,9 7,8


y 1,8 1,5 3,1 3,9 3,3

21
 Poderia se escolher 2 pontos:
x 0,3 2,7 4,5 5,9 7,8
y 1,8 1,5 3,1 3,9 3,3

x y
0,3 1,8
7,8 3,3

u ( x )  1,74  0,2 x

22
 Poderia se escolher 2 pontos:
x 0,3 2,7 4,5 5,9 7,8
y 1,8 1,5 3,1 3,9 3,3

x y
2,7 1,5
5,9 3,9

u ( x )  0,525  0,75 x

23
 Poderia se escolher 2 pontos quaisquer:
x 0,3 2,7 4,5 5,9 7,8
y 1,8 1,5 3,1 3,9 3,3

x y
2 2
6 3

u ( x )  1,5  0,25 x

24
Qual das 3 curvas é melhor?
Como poderíamos quantificá-las
para realmente escolher a
melhor?

25
 Graficamente:

27
28
 A partir dos valores tabelados constrói-se a reta
que melhor se ajusta a estes dados, chamada
Reta de Quadrados Mínimos.

y  b0  b1 x

b1 
 x  y  n x y
i i i i

( x )  n x
i
2 2
i

b0 
 y b x
i 1 i

32
 Qual o valor de f(9,0)?

xi 0,3 2,7 4,5 5,9 7,8


yi 1,8 1,5 3,1 3,9 3,3

y  b0  b1 x

b1 
 x  y  n x y
i i i i

( x )  n x
i
2 2
i

b0 
 y b x
i 1 i

n
38
 Para o exemplo anterior:
f(x) =
1,4977+0,288
3x
i xi yi xi^2 xi*yi di^2
y  b0  b1 x
1 0,3 1,8 0,09 0,54 0,05
2 2.7 1,5 7,29 4,05 0,60 b1 
 x  y  n x y
i i i i

( x )  n x
i
2 2
i
3 4,5 3,1 20,25 13,95 0,09
4 5,9 3,9 34,81 23,01 0,49 b0 
 y b x
i 1 i

5 7,8 3,3 60,84 25,74 0,20 n


 21,2 13,6 123,28 67,29
b1 0,2883 b0 1,4977 1,43

39
40
 Exemplo 01: Ajuste uma reta aos valores de x
e y para os dados apresentados na tabela a
seguir:
7

xi yi
6
1 0,5
2 2,5 5

Variável dependente
3 2,0
4
4 4,0
5 3,5 3
6 6,0
7 5,5 2

y  b0  b1 x 1

b1 
 x  y  n x y
i i i i
0
0 1 2 3 4 5 6 7 8
( x )  n x
i
2 2
i Variável independente

b0 
 y b x
i 1 i

n
41
y  b0  b1 x

b1 
 x  y  n x y
i i i i

( x )  n x 2 2

Solução: n7
i i

  y b x
b0  i 1 i

xi yi xi2 xi yi
1 0,5 1,0 0,5
2 2,5 4,0 5,0
3 2,0 9,0 6,0
4 4,0 16,0 16,0
5 3,5 25,0 17,5
6 6,0 36,0 36,0
7 5,5 49,0 38,5
n n n n

x
i 1
i  28 y
i 1
i  24 x
i 1
2
i  140,0 x y
i 1
i i  119,5

x4 y  3,428571

42
 Solução:
Y =0,07143+0,83929 X
7

5
Variável dependente

0
0 1 2 3 4 5 6 7 8
Variável independente

43
44
 Dadas p variáveis independentes x e uma
variável resposta y sabe-se que a relação entre
elas é representada por uma função linear onde:
y = 0 +  1x1 +  2x2 +  3x3 + ... +  pxp + 

Erro associado a
componentes
i : parâmetros a
desconhecidas e
serem estimados
aleatórias

45
 Similar a Regressão Linear Simples deseja-se
encontrar a curva que melhor se ajuste ao
conjunto de pontos, que é a curva com menor
valor de D.

Como poderíamos encontrar


esta curva?

47
 n n n
  n 
 n x i1 x i2   xip   b0    yi 
 i 1 i 1 i 1
    i 1 
 n n n n
   n 
  xi1 x x
i1 i 1 x x
i 2 i1   xip xi1   b1    yi xi1 
 i 1 i 1 i 1 i 1     i 1 
n n n n    n 
 xi 2 x x
i1 i 2 x x
i2 i2   xip xi 2   b2    yi xi 2 
 i 1 i 1 i 1 i 1     i 1 
    
           
    
 n n n n    n 
  xip x x
i1 ip x x
i 2 ip   xip xip  bp    yi xip 
 i 1 i 1 i 1 i 1   i 1 
52
 Sete programas de computados foram
observados para verificar sua demanda por
recursos. Foram observados
particularmente o número de acessos a
disco (I/O), a quantidade de memória
utilizada (em kilobytes) e o tempo de CPU
(em milissegundos). Os resultados são
mostrados para na tabela a seguir.

53
Programa Tempo de I/O Memória
CPU xi1 xi2
yi
1 2 14 70
2 5 16 75
3 7 27 144
4 9 42 190
5 10 39 210
6 13 50 235
7 20 83 400

54
 Descreva o tempo de CPU como uma função
linear do número de acessos a disco e da
memória utilizada.

55
 Função :

y  b0  b1 x1  b2 x2
x1  número de acessos a disco
x2  quantidade de memória
y  tempo de cpu

56
 n

x x
i1 i2  x   b0    yi 
ip
 b   
  xi1 x x x x
i 1 i1 i 2 i1  x x
ip i1   1    xi1 yi 
 xi 2 x x x x
i1 i 2 i2 i2  x x
ip i 2
  b2    xi 2 yi 
    
           
  xip  xi1 xip  xi 2 xip   xip xip  bp    xip yi 

Como poderíamos resolver


este sistema?
57
 Sistema Linear

 n

x i1 x i2  b0    yi 
   
    
  xi1 x x
i1 i1  xi1 xi 2   b1     xi1 yi 

    
 xi 2 x x  xi 2 xi 2  b2   xi 2 yi 
 i1 i 2

58
Progra Tempo I/O Memória xi1 xi2 yi1 yi1 xi1
ma de CPU xi1 xi2 * * * * *
yi xi1 xi2 xi1 xi2 xi2

1 2 14 70 196 4900 28 140 980


2 5 16 75 256 5625 80 375 1200
3 7 27 144 729 20736 189 1008 3888
4 9 42 190 1764 36100 378 1710 7980
5 10 39 210 1521 44100 390 2100 8190
6 13 50 235 2500 55225 650 3055 11750
7 20 83 400 6889 160000 1660 8000 33200
 66 271 1324 13855 326686 3375 16388 67188

59
 Sistema Linear
 7 271 1324  b0   66 
    
    
 271 13855 67188   b1    3375 
    
    
1324 67188 326686 b2  16388

60
l11  a11  7  2 ,6458
a 21 271
l 21    102 , 4284
l11 2 ,6458
a 31 1324
l 31    500 , 4250
l11 2 ,6458

61
l 22  a 22  l 212  13855  (102 , 4284 ) 2
l 22  57 ,9951
a 32  l 31 l 21 67188  ( 500 , 4250  102 , 4284 )
l 32  
l 22 57 ,9951
l 32  274 ,6834

62
l 33  a 33  l 312  l 322
l 33  326686  ( 500 , 4250 )  ( 274 ,6834 )
2 2

l 33  28 , 4582

63
 2 ,6458 0 0   y1   66 
    
    
Ly  b  102 , 4284 57 ,9951 0   y 2    3375 
    
    
 500 , 4250 274 ,6834 28 , 4582   y 3  16388 

 24 ,9457 
 
 
y   14 ,1367 
 
 
 0 ,7542 

64
 2 ,6458 102 , 4284 500 , 4250   b0   24 ,9457 
    
    
L x y  0
T
57 ,9951 274 ,6834   b1    14 ,1367 
    
    
 0 0 28 , 4582   b2   0 ,7542 

  0 ,1614 
 
 
x   0 ,1182 
 
 
 0 ,0265 

65
 Função :

y  0,1614  0,1182 x1  0,0265 x2


x1  número de acessos a disco
x2  quantidade de memória em kilobytes
y  tempo de cpu em milissegundos

66
67
68
69
70
 A Regressão Polinomial é caracterizada pela
seguinte relação.

y  b0  b1 x  b2 x    bp x
2 p

x  variável independente ou explicativa,


para p  2
y  variável dependente ou resposta.

71
 A Regressão Polinomial é um tipo particular
de Regressão Linear Múltipla onde:

x1  x
x2  x 2

x3  x 3


xp  x p
72
 Na Regressão Linear Múltipla tem-se o
seguinte sistema:
 n

x i1 x i2  x ip   b0    yi 
   
    
  xi1 x x
i1 i1 x x
i 2 i1   xip xi1   b1    xi1 yi 

    
 xi 2 x x
i1 i 2 x
i2 i2 x   xip xi 2   b2    xi 2 yi 

    
           
    
    
 x  b   x y 
  ip x x
i1 ip x x
i 2 ip   ip ip   p    ip i 
x x
73
 Na Polinomial:

 n

 xi i
x 2
  i   b0    yi 
x p

 
    
  xi

i
x 2
i
x 3
  i   b1    xi yi 
x p 1

    
  xi2

i
x 3
i
x 4
  i     i yi 
x p 2 
 b2
    x 2

    
           
    
    
 xp 2 p    xpy 
 i i
x p 1
i 
x p 2
 i   p   i i 
x b

75
 Considere a seguinte tabela
i xi yi
1 1,1000 1,1320
2 2,4000 13,7680
3 5,6000 263,7520
4 7,9000 807,7480
5 9,2000 1313,6560

 Construaos modelos de regressão polinomial


de grau 2 e 3

10
3
 Para polinômio de grau 2 tem-se:

y  b0  b1 x  b2 x 2

 n

x x
i
2
i b0    yi 
   
    
  xi i
x 2
 xi   b1     xi yi 
3

  
    
 xi2 i
x 3
 i   2   i yi 
x 4
 b   x 2

10
4
 Com os dados da tabela

 5 26,2 185,38  b0   2400,056 


    
    
 26,2 185,38 1462,498   b1    19978,144 
    
    
185,38 1462,498 12077,029 b2  169951,33264
b0   141,8962 
   
   
 b1     137,1313
   
   
b2   28,5005 
10
5
 Para polinômio de grau 2 tem-se:
y  141,8962  137,1313x  28,5005 x 2
i xi yi yi^2 ui di^2
1 1,1000 1,1320 1,2814 25,5373 595,6206
2 2,4000 13,7680 189,5578 -23,0563 1356,0271
3 5,6000 263,7520 69565,1175 267,7353 15,8667
4 7,9000 807,7480 652456,8315 837,2726 871,6996
5 9,2000 1313,6560 1725692,0863 1292,5671 444,7428
 2400,0560 2447904,8746 3283,9567
5760268,8031

D (b0 , b1 , b2 ) 3283,9567
R  1
2
  99,94%
 yi 2  n1  yi2  5760268,8031  15 2447904,8746 10
6
 Para polinômio de grau 3 tem-se:

y  b0  b1 x  b2 x  b3 x
2 3

 n

 xi i
x 2
 i  b0    yi 
x 3

 
    
  xi

x x
2
i
3
i  xi4   b1    xi yi 
     
 xi2

i
x 3
i
x 4
 i   2   i yi 
x 5
 b   x 2

    
 x3 6    x3 y 
 i i
x 4
i
x 5
 i  3   i i 
x b
10
7
 Com os dados da tabela
 5 26,2 185,38 1462,498  b0   2400,056 
    
    
 26,2 185,38 1462,498 12077,029   b1   19978,144 
    
     
 185,38 1462,498 12077,029 102267,2708 b2  169951,33264 
    
    
1462,498 12077,029 102267,2708 880476,3109 b3  1467690,3363 
b0   1 
   
   
 b1   1 
   
  
b2   3
   
   
b3   2 
10
8
 Para polinômio de grau 3 tem-se:
y  1  x  3x 2  2 x 3
i xi yi yi^2 ui di^2
1 1,1000 1,1320 1,2814 1,132 0,0000
2 2,4000 13,7680 189,5578 13,768 0,0000
3 5,6000 263,7520 69565,1175 263,752 0,0000
4 7,9000 807,7480 652456,8315 807,748 0,0000
5 9,2000 1313,6560 1725692,0863 1313,656 0,0000
 2400,0560 2447904,8746 0,0000

5760268,8031

D (b0 , b1 , b2 , b3 )
R  1
2
 100%
 yi 2  n1  yi2  10
9
 Na interpolação deseja-se encontrar um valor
intermediário em uma tabela de dados.

 Em regressão o objetivo é encontrar uma curva


que descreva a relação entre os dados
tabelados, seja ela para definir formalmente a
relação seja para tentar prever algum valor fora
do intervalo tabelado.

 É importante ressaltar que em termos de


previsão o valor a ser encontrado não deve
estar muito longe dos valores já encontrados.
11
1
 Em interpolação qualquer que seja o polinômio
interpolador de grau n-1, ele é sempre
construído passando pelos n pontos dados.

 Em regressão, dados n pontos deseja-se


construir a curva que melhor se ajuste a eles, o
que significa que ele poderá não passar por
nenhum ponto. Esta curva é representa por
polinômio de grau g, com g  n-1.

11
2
 Em termos de complexidade computacional, a
interpolação é mais simples por poder evitar a
resolução de um sistema linear.

 Para construir um modelo de regressão deve-se


resolver um sistema linear.

11
3

Você também pode gostar