Você está na página 1de 7

ANÁLISE DISCRIMINANTE

1

ANÁLISE DISCRIMINANTE

Na análise discriminante os grupos ja são

à priori. Supõe-se que as observações estão corretamente classificadas O objetivo é, então:

conhecidos

Verificar se os grupos estão discriminados

Classificar observações

Verificar quais variáveis são as mais importantes

para a discriminação entre os grupos.

desconhecidas

LIMITES LINEARES

entre os grupos. desconhecidas L IMITES LINEARES A NÁLISE DE AGRUPAMENTOS E A NÁLISE DAS COMPONENTES

ANÁLISE DE AGRUPAMENTOS E ANÁLISE DAS COMPONENTES PRINCIPAIS

Ambas as análises são técnicas de redução de dados.

Objetivo da análise de agrupamentos é formar grupos, reduzindo o número original de elementos a poucos grupos.

Objetivo da análise das componentes principais é reduzir o número original de variáveis.

Ambas as análises fornecem os mesmos resultados.

FUNÇÃO DISCRIMINANTE 4 Região de recobrimento
FUNÇÃO DISCRIMINANTE
4
Região de recobrimento

ANÁLISE DISCRIMINANTE LINEAR

Decidir à qual de dois grupos pertenceriam indivíduos

Substituir o conjunto original das mensurações por um único valor

Di, definido como uma combinação linear

Razão mínima entre a diferença entre pares de médias multivariadas

e variância multivariada dentro dos dois grupos.

Para a aplicação de testes de significância:

observações em cada grupo escolhidas ao acaso;

probabilidade de um indivíduo desconhecido pertencer a um dos grupos ser a mesma;

variáveis com distribuição normal;

matrizes de variância dos grupos de mesmo tamanho;

observações usadas para o cálculo das funções discriminantes

classificadas sem erro.

Quando matrizes de variâncias e covariâncias são diferentes escolher

função discriminante quadrática.

 D i =  1 x 1 +  2 x 2 + 

D i =1 x 1 + 2 x 2 + 3 x 3 +

p x p

cálculo das funções discriminantes lineares por regressão linear, onde

a variável dependente consiste no vetor de diferenças entre as

médias multivariadas de dois grupos e as variáveis independentes

matriz de variâncias covariâncias das variáveis em estudo

A solução do sistema de equações lineares resultante pode ser

resolvido, por cálculo matricial, a partir de:

[p]=[Vp 2]-1 [Rp]

Para o cálculo dos coeficientes p, que irão constituir a equação da função discriminante, determina-se o inverso da matriz da variâncias

e covariâncias combinadas e em seguida multiplica essa matriz pelo vetor de diferenças entre médias:

Para testar a significância da função encontrada, ou seja, verificar se os

dois grupos considerados pertencem a uma única população ou à duas distintas populações, calcula-se a distância entre as duas médias multivariadas.

Esta medida de distância é conhecida como “distância generalizada de

Mehalanobis”, ou D², e mede a separação entre as duas médias multivariadas expressa em unidades de variâncias combinadas.

D 2 = D A -D B

D² é usada na seguinte expressão para ser testada pela distribuição F:

(com "p" graus de liberdade para o numerador e " " para o denominador)

F*    n  n  p    n n 
F*  
 n
 n
p
   n n 
1
 (n
A
n
B
2)p   n n
 
A
B
 D
2
 
A
B
A
B

A hipótese nula a ser testada, estabelece que as duas médias multivariadas são iguais, ou que a distância entre ambos os grupos é igual a zero significando que se trata de um único grupo.

11
11
8
8

O valor central do grupo A é determinado por

D A =A x A1 + x A2 + x A3 +

e do grupo B por D B =B x B1 + B x B2 + B x B3 +

A x Ap

B x Bp

O índice discriminante, , ou seja, o ponto na linha descrita pela função discriminante situado exatamente na metade da distância entre os centros dos grupos A e B, é encontrado segundo:

entre os centros dos grupos A e B, é encontrado segundo: D 0  λ (

D 0

λ (

1

x

A1

2

x

B1

)

λ (

2

x

A2

2

x

B2

)

λ

p

(

x

Ap

2

x

Bp

)

 
10
10

A contribuição relativa, em percentagem, de cada variável para o distanciamento entre os dois grupos é fornecida pela expressão:

C p =[(pRp)/D 2 ]*100

Cp mede apenas a contribuição direta da variável, sem levar em consideração o seu inter-relacionamento com as demais existentes.

 
12
12

FUNÇÕES DISCRIMINANTES MULTIGRUPOS

Discriminar entre mais de dois grupos

Análise de variância da matriz inicial parcializada em categorias ou grupos

Soma de quadrados entre grupos [E] mais a soma de quadrados dentro dos grupos [D] é igual à soma

total de quadrados [T]:

[T] = [E] + [D]

Razão [E]/[D] com alto valor: médias dos grupos bem diferentes entre si e os valores dentro de cada grupo bem concentrados ao redor dos respectivos centroides

13
13

Se o conjunto de pesos for o vetor [A1], a análise discriminante pode ser efetuada ao encontrar os valores dos elementos de [A1] de modo que a expressão {[A1]´[E] [A1]}/{[A1]´[D] [A1]}, seja maximiza

Restrição para denominador igual a 1: [A1]´[D] [A1] = 1

Razão maximizada quando [A1] for o autovetor correspondente ao maior autovalor de [D]-1 [E]

Encontrar,como na análise fatorial, eixos ortogonais [A2], [A3], etc., funções discriminantes em sucessão decrescente

15
15

Exemplo de análise discriminante entre dois grupos

 
17
17
ENCONTRAR UM CONJUNTO DE PESOS LINEARES PARA AS VARIÁVEIS QUE TORNEM ESSA RAZÃO MÁXIMA Distâncias
ENCONTRAR UM CONJUNTO DE PESOS LINEARES PARA AS
VARIÁVEIS QUE TORNEM ESSA RAZÃO MÁXIMA
Distâncias entre
Distâncias dentro
dos grupos são
minimizadas
grupos são
maximizadas
14

Observações projetadas no espaço definido pelos eixos

discriminantes:

[Z] = [A]´[X],

onde [X] é a matriz inicial de dados [N x p] e [A] a matriz [p x t] cujas colunas “t” são os maiores autovetores a serem usados nas funções discriminantes.

Os centroides dos g grupos podem ser projetados no

espaço discriminante por

[Zmk] = [A1] [Xmk],

onde

[Xmk] contem as médias de todas as variáveis

para cada grupo.

Escolher as duas funções discriminantes de maior peso para servir como eixos ortogonais para uma distribuição das observações dos diversos grupos e os respectivos centróides.

Uma observação multidimensional de origem desconhecida pode ser projetada nesse diagrama pela sua multiplicação pelo transposto de [A] e verificada sua distância aos diversos centróides

16
16

P:Zona

mineralizada

E: Zona

estéril

X: ?

18
18
19
19

Amostra

Ambiente

API

S

Pr/Ph

S/A

PCIR

GCIR

G-R

1

1C

24.6

1.69

1.1

1.1

-26.23

-26.3

-0.27

2

2C

27

1.58

0.95

1.1

-26.62

-26.89

-0.33

3

3C

28.1

1.53

1.02

1.2

-26.02

-26.21

-0.39

4

4C

29.5

3.1

0.7

0.8

-26.1

-27.16

-1.42

5

5C

32.2

2.61

0.65

0.8

-26.24

-27.2

-1.09

6

6C

33.6

2.27

0.75

0.7

-26.5

-27.19

-0.93

7

7C

31.7

2.52

0.7

0.9

-26.24

-27.07

-1.12

8

8C

33

1.71

0.71

1.2

-26.27

-27

-0.97

9

9C

34

1.95

0.62

1.2

-26.3

-26.95

-0.96

10

10C

28

2.78

0.67

0.7

-26.57

-27.46

-0.83

11

11C

25.5

2.26

0.82

0.9

-25.59

-25.8

-0.6

12

12C

35.4

1.03

0.85

1.3

-25.25

-25.65

-0.5

13

13C

35.1

1.39

0.58

1.1

-25.06

-25.52

-0.54

14

14C

36.6

1.34

0.62

1.3

-25.02

-25.43

-0.53

15

15C

29

1.9

0.74

0.9

-25

-25.42

-0.59

16

16C

38.5

0.98

0.59

1.4

-24.86

-25.19

-0.41

17

17C

30.1

1.73

0.6

0.9

-24.71

-25.14

-0.59

18

18C

31.9

1.02

0.78

1.3

-24.54

-25.04

-0.72

19

19C

24.4

3.87

0.57

0.3

-26.62

-26.96

-0.71

20

20C

22.9

3.83

0.57

0.5

-26.13

-26.72

-0.73

21

21C

18.7

4.82

0.53

0.4

-25.87

-26.13

-0.35

22

1D

54.4

0

1.27

7.8

-25.33

-23.27

4.26

23

2D

54.7

0.05

1.73

14.1

-25.54

-23.75

3.66

24

3D

58.6

0.01

2.09

14.3

-25.92

-24.45

3.36

25

4D

41

0.01

3.95

4.6

-24.54

-22.52

2.82

21
21
Ward: variáveis não padronizadas 6000 5000 4000 3000 2000 1000 23 0 Distância euclidiana 4D
Ward: variáveis não padronizadas 6000 5000 4000 3000 2000 1000 23 0 Distância euclidiana 4D
Ward: variáveis não padronizadas 6000 5000 4000 3000 2000 1000 23 0 Distância euclidiana 4D
Ward: variáveis não padronizadas
6000
5000
4000
3000
2000
1000
23
0
Distância euclidiana
4D
6D
16D
13F
5D
12D
11D
7D
10D
13D
21D
20D
19D
22D
1D
2D
3D
21C
1C
11C
19C
20C
2F
1F
6F
3F
5F
4F
7F
5C
7C
8C
6C
9C
18C
15C
17C
9F
11F
2C
3C
4C
10C
12F
14F
15F
8F
10F
10F
16F
18F
17F
19F
16C
14C
12C
13C
17D
14D
15D
18D
8D
9D
9F 11F 2C 3C 4C 10C 12F 14F 15F 8F 10F 10F 16F 18F 17F 19F
9F 11F 2C 3C 4C 10C 12F 14F 15F 8F 10F 10F 16F 18F 17F 19F
9F 11F 2C 3C 4C 10C 12F 14F 15F 8F 10F 10F 16F 18F 17F 19F
9F 11F 2C 3C 4C 10C 12F 14F 15F 8F 10F 10F 16F 18F 17F 19F
9F 11F 2C 3C 4C 10C 12F 14F 15F 8F 10F 10F 16F 18F 17F 19F
9F 11F 2C 3C 4C 10C 12F 14F 15F 8F 10F 10F 16F 18F 17F 19F

ANÁLISE DISCRIMINANTE MULTIGRUPOS.

O petróleo tanto pode ter origem em carbonatos (C) e folhelhos (F) de origem marinha, como em ambientes deltaicos (D) e para explicar a sua gênese são utilizadas diversas variáveis em conjunto.

Para este exercício são fornecidos dados referentes a 63 amostras de petróleo, nas quais foram obtidas as seguintes variáveis:

API = densidade em unidades API

S= porcentágem de enxofre

Pr/Ph= razão pristâneo/fitâneo

S/A= razão entre hidrocarbonetos saturados e aromáticos

PCIR= razão isotópica de carbono(12C/13C) no petroleo

GCIR= razão isotópica de carbono na fração gasolina

G-R= diferença entre as razoes isotópicas na fração gasolina e no resíduo

20
20

Aplicando, inicialmente, análise de agrupamentos (modelo Q, método Ward, distância euclidiana e variáveis não padronizadas) verificar se esse conjunto de amostras pode ser subdividido em grupos e se esses grupos estão de acordo com os ambientes C, F e D .

 
22
22

Aplicando a análise de agrupamentos (modelo Q, método Ward, distância euclidiana e variáveis padronizadas) verificar se esse conjunto de amostras pode ser subdividido em grupos e se esses grupos estão de acordo com os ambientes C, F e D .

 
24
24
Ward: 3 grupos 200 180 160 140 120 100 80 60 40 20 0 25
Ward: 3 grupos 200 180 160 140 120 100 80 60 40 20 0 25
Ward: 3 grupos 200 180 160 140 120 100 80 60 40 20 0 25
Ward: 3 grupos
200
180
160
140
120
100
80
60
40
20
0
25
Distância euclideana
1D
2D
3D
8D
9D
16D
15D
14D
17D
20D
22D
19D
21D
5D
12D
7D
10D
13D
6D
18D
4D
11D
4F
3F
5F
2F
6F
1F
7F
13F
12F
14F
15F
10F
19F
17F
16F
18F
9F
11F
8F
10F
18C
16C
12C
13C
14C
2C
1C
3C
11C
15C
17C
21C
19C
20C
8C
9C
6C
5C
7C
4C
10C
16F 18F 9F 11F 8F 10F 18C 16C 12C 13C 14C 2C 1C 3C 11C 15C
16F 18F 9F 11F 8F 10F 18C 16C 12C 13C 14C 2C 1C 3C 11C 15C

Em seguida, aplicando análise discriminante, verificar se os grupos encontrados estão significativamente separados, segundo ambientes de deposição, e quais as variáveis mais importantes para essa discriminação.

27
27
29
29

Com a padronização das variáveis os três grupos encontrados agrupam amostras segundo os

ambientes carbonatos (C), folhelhos (F) e deltaicos (D).

26 28
26
28

Para verificar a relação entre amostras e variáveis e, portanto, a influência das variáveis na discriminação entre grupos sobrepor os gráficos

30
30
31 33
31
33

BC-W: largura da caixa craniana na altura da região parietal-escamosal TR-L: comprimento máximo dos dentes molariformes Bu-L: comprimento máximo da “bulla” timpânica Bu-HP: comprimento máximo da “bulla” timpânica medida do bordo dorsal até o processo paroxipital.

Espécie

BC-W

TR-L

Bu-L

Bu-HP

Su

47.0

99.0

26.0

15.0

Su

42.0

93.0

26.0

16.0

Su

40.0

90.0

22.0

13.0

Su

46.0

100.0

22.0

11.0

Su

46.0

96.0

24.0

16.0

Su

42.0

88.0

26.0

15.0

Su

43.0

89.0

23.0

14.0

Su

44.0

78.0

23.0

13.0

Su

44.0

90.0

25.0

11.0

Su

47.0

99.0

27.0

15.0

Su

47.0

92.0

27.0

13.0

Me

78.0

165.0

35.0

18.0

Me

77.0

165.0

37.0

19.0

35
35

Análise Discriminante: XLStat

Medidas cranianas foram obtidas em 7 espécies fósseis de oreodontes (mamífero do Eoceno-Oligoceno dos Estados Unidos da América). As afinidades taxonômicas entre essas espécies estão no gráfico abaixo:

entre essas espécies estão no gráfico abaixo: Subdesmatochoerus sp. ( Su ), Megoreodon gigas loomisi (

Subdesmatochoerus sp. (Su), Megoreodon gigas loomisi (Me), O. osborni (Oo), Psuedodesmatochoerus (Ps), Desmatochoerus hatcheri (De), M. culbertsoni (Mc) e Prodesmatochoerus . meeki

(Pr).

32
32
34 36
34
36
( Ps ), Desmatochoerus hatcheri ( De ), M. culbertsoni ( Mc ) e Prodesmatochoerus .
37
37

4 grupos indicados pela Análise Discriminante:

1: Prodesmatochoerus meeki + Merychoidodon culbertsoni + O. osborni 2: Subdesmatochoerus sp 3: Desmatochoerus hatcheri + Psuedodesmatochoerus 4: Megoreodon gigas loomisi

2: Subdesmatochoerus sp 3: Desmatochoerus hatcheri + Psuedodesmatochoerus 4: Megoreodon gigas loomisi 39 38 40 7
39
39
38
38
40
40