Escolar Documentos
Profissional Documentos
Cultura Documentos
Alexandre Passito
passito@icomp.ufam.edu.br
Graficamente, a extrapolação e o ajuste
por barras de erros são vistos abaixo:
f (x) f ( x) e x
Curva
ajustada
Barra de
f x
erros
x x
Curva
extrapolada
2
Ajuste de Curvas ou Regressão
3
Exemplo: Deseja-se encontrar a relação entre
tempo de germinação e temperatura do solo
para sementes de feijão. Para isso são feitas
diversas experiências onde variou-se a
temperatura do solo e determinou-se o
número de dias que a semente demorou para
germinar.
4
Para resolver este problema propõe-se que a
relação entre as duas variáveis pode ser uma
relação linear ou quadrática. Neste caso:
d at b,
ou,
d at 2 bt c,
Onde d é o tempo de germinação em dias
t é a temperat ura em graus Celsius
a, b e c os parâmetros a serem determinados
Existe algum outro fator que poderia influenciar o processo de
germinação, ou seja, considerar apenas a temperatura seria
coerente?
5
Em uma dada região de Bocaína-SP, acredita-se
que o gado alimentado em um determinado
pasto tem ganho de peso maior que o usual.
Estudos de laboratório detectaram uma
substância no pasto e deseja-se verificar se ela
pode ser utilizada para melhorar o ganho de
peso dos bovinos. Foram escolhidos 15 bois da
mesma raça e idade, e cada animal recebeu uma
determinada concentração de substância X( em
mg/l). O ganho de peso após 30 dias, denotado
por Y, foi anotado e os dados são mostrados na
tabela a seguir( em KG).
6
Observando a tabela de dados, notamos
que, de fato, à medida que aumenta a
concentração da substância, ocorre o
aumento de peso. Qual a quantidade de
concentração da substância X (em mg/l)
deve ser ingerida pelos bovinos para que o
aumento de peso ao fim de 30 dias seja de
30 Kg?
i 0 1 2 3 4 5 6 7 8 9 10 11 12
xi 0,2 0,5 0,6 0,7 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
yi 9,4 11,4 12,3 10,2 11,9 13,6 14,2 16,2 16,2 17,7 18,8 19,9 22,5
7
Com esses pontos pode-se desenhar o
seguinte Gráfico:
8
Qual curva é a mais adequada?
2 3 4 5
Y =-0,74952+2,09714 X Y =-0,24453-1,11365 X+2,38698 X -0,58438 X +0,05755 X -0,00198 X
24 24
22 22
20 20
18 18
Variável dependente
16
Variável dependente
16
14 14
12 12
10 10
8 8
6 6
4 4
2 2
0 0
0 1 2 3 4 5 6 7 8 9 10 11 12 0 1 2 3 4 5 6 7 8 9 10 11 12
9
Tipos de Curvas ou Modelos de Regressão.
10
Regressão
Regressão Linear Regressão Linear Regressão
Polinomial
Simples Múltipla Polinomial
Múltipla
11
y b0 b1 x
x variável independente ou explicativa
y variável dependente ou resposta
12
13
y b0 b1 x1 b2 x2 bp x p
xi variáveis independentes ou explicativas,
i 1,2,, p e p 2
y variável dependente ou resposta.
14
15
y b0 b1 x b2 x 2 bp x p
x variável independente ou explicativa,
para p 2
y variável dependente ou resposta.
16
17
Exemplo
y b0 b1 x1 b x b3 x2 b x
2
2 1
2
4 2
18
19
20
Considerando que o modelo escolhido foi o de
Regressão Linear Simples deve-se construir uma
reta que relaciona as variáveis, onde:
21
Poderia se escolher 2 pontos:
x 0,3 2,7 4,5 5,9 7,8
y 1,8 1,5 3,1 3,9 3,3
x y
0,3 1,8
7,8 3,3
u ( x ) 1,74 0,2 x
22
Poderia se escolher 2 pontos:
x 0,3 2,7 4,5 5,9 7,8
y 1,8 1,5 3,1 3,9 3,3
x y
2,7 1,5
5,9 3,9
u ( x ) 0,525 0,75 x
23
Poderia se escolher 2 pontos quaisquer:
x 0,3 2,7 4,5 5,9 7,8
y 1,8 1,5 3,1 3,9 3,3
x y
2 2
6 3
u ( x ) 1,5 0,25 x
24
Qual das 3 curvas é melhor?
Como poderíamos quantificá-las
para realmente escolher a
melhor?
25
Graficamente:
27
28
A partir dos valores tabelados constrói-se a reta
que melhor se ajusta a estes dados, chamada
Reta de Quadrados Mínimos.
y b0 b1 x
b1
x y n x y
i i i i
( x ) n x
i
2 2
i
b0
y b x
i 1 i
32
Qual o valor de f(9,0)?
y b0 b1 x
b1
x y n x y
i i i i
( x ) n x
i
2 2
i
b0
y b x
i 1 i
n
38
Para o exemplo anterior:
f(x) =
1,4977+0,288
3x
i xi yi xi^2 xi*yi di^2
y b0 b1 x
1 0,3 1,8 0,09 0,54 0,05
2 2.7 1,5 7,29 4,05 0,60 b1
x y n x y
i i i i
( x ) n x
i
2 2
i
3 4,5 3,1 20,25 13,95 0,09
4 5,9 3,9 34,81 23,01 0,49 b0
y b x
i 1 i
39
40
Exemplo 01: Ajuste uma reta aos valores de x
e y para os dados apresentados na tabela a
seguir:
7
xi yi
6
1 0,5
2 2,5 5
Variável dependente
3 2,0
4
4 4,0
5 3,5 3
6 6,0
7 5,5 2
y b0 b1 x 1
b1
x y n x y
i i i i
0
0 1 2 3 4 5 6 7 8
( x ) n x
i
2 2
i Variável independente
b0
y b x
i 1 i
n
41
y b0 b1 x
b1
x y n x y
i i i i
( x ) n x 2 2
Solução: n7
i i
y b x
b0 i 1 i
xi yi xi2 xi yi
1 0,5 1,0 0,5
2 2,5 4,0 5,0
3 2,0 9,0 6,0
4 4,0 16,0 16,0
5 3,5 25,0 17,5
6 6,0 36,0 36,0
7 5,5 49,0 38,5
n n n n
x
i 1
i 28 y
i 1
i 24 x
i 1
2
i 140,0 x y
i 1
i i 119,5
x4 y 3,428571
42
Solução:
Y =0,07143+0,83929 X
7
5
Variável dependente
0
0 1 2 3 4 5 6 7 8
Variável independente
43
44
Dadas p variáveis independentes x e uma
variável resposta y sabe-se que a relação entre
elas é representada por uma função linear onde:
y = 0 + 1x1 + 2x2 + 3x3 + ... + pxp +
Erro associado a
componentes
i : parâmetros a
desconhecidas e
serem estimados
aleatórias
45
Similar a Regressão Linear Simples deseja-se
encontrar a curva que melhor se ajuste ao
conjunto de pontos, que é a curva com menor
valor de D.
47
n n n
n
n x i1 x i2 xip b0 yi
i 1 i 1 i 1
i 1
n n n n
n
xi1 x x
i1 i 1 x x
i 2 i1 xip xi1 b1 yi xi1
i 1 i 1 i 1 i 1 i 1
n n n n n
xi 2 x x
i1 i 2 x x
i2 i2 xip xi 2 b2 yi xi 2
i 1 i 1 i 1 i 1 i 1
n n n n n
xip x x
i1 ip x x
i 2 ip xip xip bp yi xip
i 1 i 1 i 1 i 1 i 1
52
Sete programas de computados foram
observados para verificar sua demanda por
recursos. Foram observados
particularmente o número de acessos a
disco (I/O), a quantidade de memória
utilizada (em kilobytes) e o tempo de CPU
(em milissegundos). Os resultados são
mostrados para na tabela a seguir.
53
Programa Tempo de I/O Memória
CPU xi1 xi2
yi
1 2 14 70
2 5 16 75
3 7 27 144
4 9 42 190
5 10 39 210
6 13 50 235
7 20 83 400
54
Descreva o tempo de CPU como uma função
linear do número de acessos a disco e da
memória utilizada.
55
Função :
y b0 b1 x1 b2 x2
x1 número de acessos a disco
x2 quantidade de memória
y tempo de cpu
56
n
x x
i1 i2 x b0 yi
ip
b
xi1 x x x x
i 1 i1 i 2 i1 x x
ip i1 1 xi1 yi
xi 2 x x x x
i1 i 2 i2 i2 x x
ip i 2
b2 xi 2 yi
xip xi1 xip xi 2 xip xip xip bp xip yi
n
x i1 x i2 b0 yi
xi1 x x
i1 i1 xi1 xi 2 b1 xi1 yi
xi 2 x x xi 2 xi 2 b2 xi 2 yi
i1 i 2
58
Progra Tempo I/O Memória xi1 xi2 yi1 yi1 xi1
ma de CPU xi1 xi2 * * * * *
yi xi1 xi2 xi1 xi2 xi2
59
Sistema Linear
7 271 1324 b0 66
271 13855 67188 b1 3375
1324 67188 326686 b2 16388
60
l11 a11 7 2 ,6458
a 21 271
l 21 102 , 4284
l11 2 ,6458
a 31 1324
l 31 500 , 4250
l11 2 ,6458
61
l 22 a 22 l 212 13855 (102 , 4284 ) 2
l 22 57 ,9951
a 32 l 31 l 21 67188 ( 500 , 4250 102 , 4284 )
l 32
l 22 57 ,9951
l 32 274 ,6834
62
l 33 a 33 l 312 l 322
l 33 326686 ( 500 , 4250 ) ( 274 ,6834 )
2 2
l 33 28 , 4582
63
2 ,6458 0 0 y1 66
Ly b 102 , 4284 57 ,9951 0 y 2 3375
500 , 4250 274 ,6834 28 , 4582 y 3 16388
24 ,9457
y 14 ,1367
0 ,7542
64
2 ,6458 102 , 4284 500 , 4250 b0 24 ,9457
L x y 0
T
57 ,9951 274 ,6834 b1 14 ,1367
0 0 28 , 4582 b2 0 ,7542
0 ,1614
x 0 ,1182
0 ,0265
65
Função :
66
67
68
69
70
A Regressão Polinomial é caracterizada pela
seguinte relação.
y b0 b1 x b2 x bp x
2 p
71
A Regressão Polinomial é um tipo particular
de Regressão Linear Múltipla onde:
x1 x
x2 x 2
x3 x 3
xp x p
72
Na Regressão Linear Múltipla tem-se o
seguinte sistema:
n
x i1 x i2 x ip b0 yi
xi1 x x
i1 i1 x x
i 2 i1 xip xi1 b1 xi1 yi
xi 2 x x
i1 i 2 x
i2 i2 x xip xi 2 b2 xi 2 yi
x b x y
ip x x
i1 ip x x
i 2 ip ip ip p ip i
x x
73
Na Polinomial:
n
xi i
x 2
i b0 yi
x p
xi
i
x 2
i
x 3
i b1 xi yi
x p 1
xi2
i
x 3
i
x 4
i i yi
x p 2
b2
x 2
xp 2 p xpy
i i
x p 1
i
x p 2
i p i i
x b
75
Considere a seguinte tabela
i xi yi
1 1,1000 1,1320
2 2,4000 13,7680
3 5,6000 263,7520
4 7,9000 807,7480
5 9,2000 1313,6560
10
3
Para polinômio de grau 2 tem-se:
y b0 b1 x b2 x 2
n
x x
i
2
i b0 yi
xi i
x 2
xi b1 xi yi
3
xi2 i
x 3
i 2 i yi
x 4
b x 2
10
4
Com os dados da tabela
D (b0 , b1 , b2 ) 3283,9567
R 1
2
99,94%
yi 2 n1 yi2 5760268,8031 15 2447904,8746 10
6
Para polinômio de grau 3 tem-se:
y b0 b1 x b2 x b3 x
2 3
n
xi i
x 2
i b0 yi
x 3
xi
x x
2
i
3
i xi4 b1 xi yi
xi2
i
x 3
i
x 4
i 2 i yi
x 5
b x 2
x3 6 x3 y
i i
x 4
i
x 5
i 3 i i
x b
10
7
Com os dados da tabela
5 26,2 185,38 1462,498 b0 2400,056
26,2 185,38 1462,498 12077,029 b1 19978,144
185,38 1462,498 12077,029 102267,2708 b2 169951,33264
1462,498 12077,029 102267,2708 880476,3109 b3 1467690,3363
b0 1
b1 1
b2 3
b3 2
10
8
Para polinômio de grau 3 tem-se:
y 1 x 3x 2 2 x 3
i xi yi yi^2 ui di^2
1 1,1000 1,1320 1,2814 1,132 0,0000
2 2,4000 13,7680 189,5578 13,768 0,0000
3 5,6000 263,7520 69565,1175 263,752 0,0000
4 7,9000 807,7480 652456,8315 807,748 0,0000
5 9,2000 1313,6560 1725692,0863 1313,656 0,0000
2400,0560 2447904,8746 0,0000
5760268,8031
D (b0 , b1 , b2 , b3 )
R 1
2
100%
yi 2 n1 yi2 10
9
Na interpolação deseja-se encontrar um valor
intermediário em uma tabela de dados.
11
2
Em termos de complexidade computacional, a
interpolação é mais simples por poder evitar a
resolução de um sistema linear.
11
3