Você está na página 1de 16

Regresso

HAC

Tarefa preditiva em que as classes so


contnuas
Objetivo: predizer um valor numrico para a
sada:

Consumo de um carro em funo de suas


caractersticas

Valor de um imvel em funo das


caractersticas dele e do bairro

1
MD - junho/2008

Regresso
Encontrar uma relao entre um conjunto de
atributos de entrada e um atributo-meta
contnuo da seguinte forma:
y = f(x1,x2,...,xd)
potncia
130

peso
3504

acelerao consumo
12
18

2
HAC

MD - junho/2008

Conjunto de dados para classificao


Dvida

o
o

o
o

x
o

x o

x x
x

x
x

x
o
o o

o
o

o
Renda

Dados no formato atributo-valor:


Renda
Dvida
Status
HAC

3
MD - junho/2008

Formas de representao do classificador


que realiza regresso:

rvore de regresso

Regras de regresso

4
HAC

MD - junho/2008

rvores de regresso

As rvores so compostas por dois tipos de ns:


os ns internos da rvore: cada um desses ns

corresponde a um teste feito em um dos atributos de


entrada do conjunto de treinamento, e
os ns-folha, onde so feitas as predies do atributometa.
Os ns-folha de uma rvore de regresso possuem
uma funo matemtica (que no caso mais simples
pode ser a mdia dos valores que caem em cada nfolha) para predizer o atributo-meta

5
HAC

MD - junho/2008

Exemplo

Definio da rea

Domnio: carros

Os dados relacionam alguns atributos de carros

Definio do problema

encontrar um padro que permita predizer o consumo


de um carro em milhas por galo de combustvel, a
partir de outros atributos do carro

6
HAC

MD - junho/2008

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

HAC

potncia

peso

130.000000
165.000000
150.000000
150.000000
140.000000
198.000000
220.000000
215.000000
225.000000
190.000000
170.000000
160.000000
150.000000
225.000000
95.000000
95.000000
97.000000
85.000000
88.000000
46.000000

3504.000000
3693.000000
3436.000000
3433.000000
3449.000000
4341.000000
4354.000000
4312.000000
4425.000000
3850.000000
3563.000000
3609.000000
3761.000000
3086.000000
2372.000000
2833.000000
2774.000000
2587.000000
2130.000000
1835.000000

acelerao consumo
12.000000
11.500000
11.000000
12.000000
10.500000
10.000000
9.000000
8.500000
10.000000
8.500000
10.000000
8.000000
9.500000
10.000000
15.000000
15.500000
15.500000
16.000000
14.500000
20.500000

18.000000
15.000000
18.000000
16.000000
17.000000
15.000000
14.000000
14.000000
14.000000
15.000000
15.000000
14.000000
15.000000
14.000000
24.000000
22.000000
18.000000
21.000000
27.000000
26.000000

7
MD - junho/2008

Exemplo

exemplos: 1, 2, ,,,,, 20

atributos: potncia, peso, acelerao

atributo meta: consumo

8
HAC

MD - junho/2008

Exemplo carros

Aplicao do algoritmo de regresso

atributo selecionado: potncia


96
> 96

nesse ponto encontrada uma expresso que


calcula o valor do consumo

9
HAC

MD - junho/2008

rvore com equaes linerares


nas folhas

LM1
consumo = -0.0248 * potencia
- 0.0036 * peso
+ 33.4687

LM2
consumo = -0.0391 * potencia

- 0.0014 * peso
+ 26.7157
10
HAC

MD - junho/2008

rvore de regresso
potencia <= 96 :
| peso <= 2251 : LM1 (2/12.257%)
| peso > 2251 : LM2 (3/30.575%)
potencia > 96 :
| potencia <= 206.5 :
| | potencia <= 162.5 :
| | | potencia <= 135 : LM3 (2/0%)
| | | potencia > 135 :
| | | | peso <= 3529 : LM4 (3/20.016%)
| | | | peso > 3529 : LM5 (2/12.257%)
| | potencia > 162.5 : LM6 (4/0%)
| potencia > 206.5 : LM7 (4/0%)
HAC

11
MD - junho/2008

Expresses lineares
LM num: 1 consumo =

-0.0248 * potencia - 0.0034 * peso + 33.1574

LM num: 2 consumo =

-0.0248 * potencia - 0.0033 * peso + 32.8537

LM num: 3 consumo =

-0.0347 * potencia - 0.0014 * peso + 26.955

LM num: 4 consumo =

-0.0342 * potencia - 0.0016 * peso + 27.2618

LM num: 5 consumo =

-0.0342 * potencia - 0.0016 * peso + 27.2789

LM num: 6 consumo =

-0.0326 * potencia - 0.0014 * peso + 26.5767

LM num: 7 consumo =

-0.0296 * potencia - 0.0014 * peso + 25.9602

12
HAC

MD - junho/2008

rvore com valores constantes


nas folhas

(selecionando opo de poda da rvore)

LM1
consumo = 19.2

LM2
consumo = 16.5333

13
HAC

MD - junho/2008

Regras de Regresso
Uma regra na FNC possui a seguinte forma:
if <condio> then <y = f(xi)>
Regra 1: potencia <= 96 : LM1 (5/29.452%)
Regra 2: potencia > 96 : LM2 (15/20.855%)

LM num: 1
consumo = -0.0248 * potencia

- 0.0036 * peso + 33.4697

LM num: 2
consumo = -0.0331 * potencia

- 0.0014 * peso + 26.7157


14

HAC

MD - junho/2008

Erro e Preciso

Para problemas de regresso o erro pode ser


estimado pelo clculo da distncia entre o valor
real e o estimado

Erro mdio quadrtico (MSE)


mse(h) = 1/n (yi h(xi))2

Distncia absoluta mdia (MAD)


mad(h) = 1/n abs((yi h(xi))
15
HAC

MD - junho/2008

Clculo de erro e preciso


potncia

peso

acelerao

consumo

150.000000

3433.000000

12.000000

16.000000

170.000000

3563.000000

10.000000

15.000000

97.000000

2774.000000

15.500000

18.000000

16
HAC

MD - junho/2008