Escolar Documentos
Profissional Documentos
Cultura Documentos
ENTROPIA
Dada uma coleção S contendo exemplos + e –de algum
alvo, a entropia de S relativa a esta classificação boole
p+ é a proporção de exemplos positivos em S
p–é a proporção de exemplos negativos em S
Dada uma coleção S contendo exemplos + e –de algum
alvo, a entropia de S relativa a esta classificação boole
p+ é a proporção de exemplos positivos em S
p–é a proporção de exemplos negativos em S
GANHO DE INFORMAÇÃO
Gain(S,A) = redução esperada na entropia devido a ord
sobre A, ou seja, a redução esperada na entropia causa
partição dos exemplos de acordo com este atributo A
ursividade
com etiqueta = +
com etiqueta = –
ta = valor mais comum do
este A= vi
.
or mais comum do
de algum conceito
ão booleana é:
de algum conceito
ão booleana é:
O
vido a ordenação
opia causada pela
ributo A
Discretização de atributos contínuos
ID Gênero Idade Utiliza jogos de Possui Adquiriu novo
tabuleiro? Notebook? jogo?
1 F 15 N Não Sim
2 M 34 N Sim Sim
3 F 25 S Não Sim
4 F 45 S Sim Sim
5 F 22 N Sim Não
6 M 26 S Não Não
7 M 23 S Sim Não
8 F 18 N Sim Sim
9 F 32 S Não Não
10 F 37 N Não Sim
1. Média simples
1 15
8 18 16.5
5 22 20 18.25
7 23 22.5 21.25 19.75
3 25 24 23.25 22.25 21.00
6 26 25.5 24.75 24.00 23.13 22.06
9 32 29 27.25 26.00 25.00 24.06 23.06
2 34 33 31 29.13 27.56 26.28 25.17
10 37 35.5 34.25 32.63 30.88 29.22 27.75
4 45 41 38.25 36.25 34.44 32.66 30.94
2. Corte
1 15 45-15
8 18 30
5 22 I1 I1
7 23 para 2 intervalos 15
3 25 I1 15-30
6 26 I2 30-45
9 32 I2
2 34 I2 para 3 intervalos 10
10 37 I3 I1 15-25
4 45 I2 25-35
I3 35-45
3. Distribuição uniforme
1 15
8 18 I1 4. Mudança de valor no atributo meta
5 22 1 15 S
7 23 8 18 S
3 25 I2 5 22 N
6 26 7 23 N
9 32 3 25 S
2 34 I3 6 26 N
10 37 9 32 N
4 45 2 34 S
10 37 S
4 45 S
s
24.12
26.46 25.29
29.34 27.90 26.60
I1
I2
I3
I4
ID Livros Academia Netflix? Idade A IDADE Shopping
1 UM DUAS SIM 28 BARIGUI
2 DOIS TRÊS NÃO 27 BARIGUI
3 DOIS DIÁRIO SIM 25 MUELLER se a idade estiver até 25
4 UM DUAS NÃO 18 MUELLER (inclusive) anos, será A; se
estiver entre 26 e 40 (inclusive)
5 DOIS TRÊS SIM 56 MUELLER anos, será B e se estiver igual
6 UM DIÁRIO SIM 34 PÁTIO ou acima de 41 anos, será C.
7 TRÊS TRÊS SIM 64 BARIGUI
8 TRÊS DIÁRIO SIM 48 PÁTIO
9 DOIS DUAS NÃO 16 PÁTIO
10 UM TRÊS SIM 21 PÁTIO
11 DOIS DIÁRIO NÃO 37 BARIGUI
12 TRÊS TRÊS SIM 23 BARIGUI
13 DOIS TRÊS SIM 22 BARIGUI
e estiver até 25
anos, será A; se
26 e 40 (inclusive)
B e se estiver igual
e 41 anos, será C.
a) Três faixas para temperatura e duas para umidade, apresentar as árvores sem recursividade com e sem poda. Utilize o pe
fechando o intervalo no <=
Letra A
ID Tempo Temperatura Temp. Disc Umidade Umidade Disc
1 Ensolarado 85 Alta 85 Alta
2 Ensolarado 80 Alta 90 Alta
3 Nublado 83 Alta 86 Alta
4 Chuvoso 70 Baixa 96 Alta
5 Chuvoso 68 Baixa 80 Normal
6 Chuvoso 65 Baixa 70 Normal
7 Nublado 64 Baixa 65 Normal
8 Ensolarado 72 Média 95 Alta
9 Ensolarado 69 Baixa 70 Normal
10 Chuvoso 75 Média 80 Normal
11 Ensolarado 75 Média 70 Normal
12 Nublado 72 Média 90 Alta
13 Nublado 81 Alta 75 Normal
14 Chuvoso 71 Baixa 91 Alta
Entropia do conjunto
Sim 0.6429 0.4098
Não 0.3571 0.5305
Resultado 0.9403
0.2467 1
0.1518 2
0.0481 3
0.0292 4
sem poda. Utilize o pelo método de corte
3 faixas temperatura
Passo 1 Temperatura Temperatura Faixa
85 64 Baixa
80 65 Baixa
83 68 Baixa
70 69 Baixa
68 70 Baixa
65 71 Baixa
64 72 Média
72 72 Média
69 75 Média
75 75 Média
75 80 Alta
72 81 Alta
81 83 Alta
71 85 Alta
2 Faixas de umidade
Classificação prevista? 70 86
Alta
sim 80 90 Alta
sim 70 90 Alta
nao 90 91 Alta
sim 75 95 Alta
nao 91 96 Alta
sim
Vento Joga?
Não Não
Sim Não
Não Sim
Não Sim
Não Sim
Sim Não
Sim Sim
Não Não
Não Sim
Não Sim
Sim Sim
Sim Sim
Não Sim
Sim Não
Passo 3
Umidade Disc
Normal
Normal
Normal
Alta
Normal
Alta
No Excel resolva a atividade a seguir. Para a idade crie 3 faixas utilizando o método de CORTE, SEM ARREDONDAM
após a quarta casa, se for o caso. Para o salário crie 2 faixas utilizando o método de CORTE, SEM ARREDONDAME
após a quarta casa, se for o caso. Apresente as árvores COM recursividade com e sem poda. Atenção: utilize o Excel c
COMO EDITOR DE TEXTO! Ou seja, os cálculos devem ser realizados pela própria ferramenta!
Sobreme Compra
ID Academia? Idade Idade2 sa Salário Salário2 qual
preferida fruta?
1 Sim 25 A Sorvete 5 Normal Amora
2 Não 18 A Sorvete 7.5 Bom Amora
Framboes
3 Sim 33 B Sorvete 5.7 Bom
a
Salada de
4 Não 28 A 1 Normal Kiwi
frutas
5 Sim 35 B Sorvete 10 Bom Amora
6 Não 39 C Sorvete 9 Bom Amora
7 Sim 40 C Sorvete 7.3 Bom Kiwi
Salada de
8 Sim 44 C 8.9 Bom Amora
frutas
Salada de
9 Não 48 C 9.8 Bom Amora
frutas
Framboes
10 Sim 22 A Sorvete 6.9 Bom
a
Salada de
11 Sim 29 B 3.7 Normal Kiwi
frutas
Salada de Framboes
12 Sim 41 C 4.7 Normal
frutas a
Entropia do conjunto
Amora 0.5000 0.5000
Framboesa 0.2500 0.5000
Kiwi 0.2500 0.5000
Resultado 1.5000
Ganho Academ
QTD Amora FramboesKiwi
Sim 8 3 3 2 1.5613
Não 4 3 0 1 0.0000
Resultado 0.4591
B 3 1 1 1 1.5850
C 5 3 1 1 1.3710
Resultado 0.0325
Entropia do
conjunto
Amora 0.3750 0.5306
Framboesa 0.3750 0.5306
Kiwi 0.2500 0.5000
Resultado 1.5613
Sobreme Compra
Idade2 sa Salário2 qual
preferida fruta?
A Sorvete Normal Amora 1
Framboes
A Sorvete Bom
a 1
Entropia do conjunto
Amora 0.5000 0.5000
Framboesa 0.5000 0.5000
Resultado 1.0000
Compra
Salário2 qual
fruta?
Normal Amora
Framboes
Bom
a
Sobreme Compra
Idade2 sa Salário2 qual
preferida fruta?
Framboes
B Sorvete Bom
a 1
B Sorvete Bom Amora 1
Salada de
B Normal Kiwi
frutas 1
Entropia do
conjunto
Amora 0.3333 0.5283
Framboesa 0.3333 0.5283
Kiwi 0.3333 0.5283
Resultado 1.5850
Academia => Sim => Idade => B => Salário => Normal => Kiwi
Academia => Sim => Idade => B => Salário => Bom => Framboesa/Amora
Sobreme Compra
Idade2 sa Salário2 qual
preferida fruta?
C Sorvete Bom Kiwi 1
Salada de
C Bom Amora
frutas 1
Salada de Framboes
C Normal
frutas a 1
Entropia do
conjunto
Amora 0.3333 0.5283
Framboesa 0.3333 0.5283
Kiwi 0.3333 0.5283
Resultado 1.5850
Idade - 3 faixas
Idade Faixa Idade Maior - Menor
18 A A 48-18 = 30
22 A A 30/3(faixas) = 10
25 A B
28 A A A A <= (18+10) 18-28
29 B B B 28 < B <= (28+10) 29-38
33 B C C C > 38 39-48
35 B C
39 C C
40 C C
41 C A
44 C B
48 C C
Início da árvore
Academia => Sim
Academia => Sim => Idade => B => Salário => Normal => Kiwi
Academia => Sim => Idade => B => Salário => Bom => Amora (Maioria tabela principal
Academia => Sim => Idade => C => Salário => Normal => Framboesa
Academia => Sim => Idade => C => Salário => Bom => Sobremesa
Sobreme Compra
Academi
ID Idade2 sa Salário2 qual
a?
preferida fruta?
2 Não A Sorvete Bom Amora
Salada de
4 Não A Normal Kiwi
frutas
6 Não C Sorvete Bom Amora
Salada de
9 Não C Bom Amora
frutas
Entropia do
conjunto
Amora 0.2500 0.5000
Framboesa 0.7500 0.3113
Resultado 0.8113
Sobreme Compra
ID Salário2 Idade2 sa qual
preferida fruta?
2 Bom A Sorvete Amora
Salada de
4 Normal A Kiwi
frutas
6 Bom C Sorvete Amora
Salada de
9 Bom C Amora
frutas
Salada de
4 Normal A Kiwi
frutas