Você está na página 1de 69

Cours dAnalyse des donnes

Analyse en composantes principales


A.C.P.

Plan
Prsentations dexemples
Reprsentation multidimensionnelle des donnes
Analyse des donnes
Analyse des lignes
Analyse des colonnes
Analyse conjointe lignes / colonnes

Valeurs caractristiques
Inertie
Valeurs propres, vecteurs propres,
Cosinus carrs, contributions,

Traitement dexemples

BIMA de dcembre 1997

297
182
689
170
877
2 218
118
1 140
650
98
240
49
82
1 446

225
78
813
110
590
940
27
620
543
96
87
70
110
609

3 209
4 495
27 180
522
5 418
23 109
5 297
9 905
10 535
2 392
1 632
2 329
3 258
14 058

3
1
29
2
14
33
2
9
15
8
46
56
7

Pche : captures totales

Collecte de lait de vache

4
2
43
75
226
145
95
50
26
6
12
2
4
379

Bois brut (1 000 m3) (3)

ufs de consommation

1 063
1 489
3 446
142
2 324
2 170
215
1 342
1 894
470
276
167
321
997

Fruits de table (2)

404
181
1 563
70
562
1 965
490
987
543
240
100
96
137
704

Lgumes frais

Viandes de Volailles

Viande ovine

Viande porcine

1
5

Viande bovine

245 2 490 1 370


740
152
430 1 674
196
60
0
062 13 100 2 775
3 483 8 361
352 1 004 4 000
3 400 3 875
440 4 184 11 500
9 500 22 381
943 6 248 6 114
3 600 55 610
485
733
220
16
0
125 2 048 12 500 11 000 56 202
416 8 081 3 500
750
0
131
769
395
499 2 229
56 1 370 2 000
860 7 255
897
766
228
17
0
2 430 1 201
227
32
0
9 555 7 219 3 039
368
13

5
3
26
2
8
30
1
12
6
3

Pomme de terre

27
300
200
430
370
142
10
345
3
260
38
91
182
550

Betteraves sucrires

712
118
136
374
570
577
142
114
711
498
624
700
954
507

Vins (1000 hl)

2
9
42
4
22
62
2
21
1
4
1
3
5
24

Graines olagineuses

Belgique
Danemark
Allemangne
Grce
Espagne
France
Irlande
Italie
Pays Bas
Autriche
Portugal
Finlande
Sude
Royaume Uni

Crales

Exemple : Production agricole dans lunion europenne

700
876
896
012
400
293
291
018
951
010
880
272
400
212

37
2 077
361
231
1 344
885
418
830
524
9
265
176
415
1 031

Exemple : tude marketing automobile


Cylindre Puissance

Vitesse

Poids

Longueur

Largeur

Honda Civic
Renault 19
Fiat Tipo
Peugeot 405
Renault 21
Citron BX
BMW 530i
Rover 827i
Renault 25
Opel Omega
Peugeot 405 Break
Ford Sierra
BMW 325 iX
Audi 90 Quattro
Ford Scorpio
Renault Espace
Nissan Vanette
VW Caravelle
Ford Fiesta
Fiat Uno
Peugeot 205
Peugeot 205 Rallye
Seat Ibiza SX I
Citron AX Sport

1 396

90

174

850

369

166

1 721

92

180

965

415

169

1 580

83

170

970

395

170

1 769

90

180

1 080

440

169

2 068

88

180

1 135

446

170

1 769

90

182

1 060

424

168

2 986

188

226

1 510

472

175

2 675

177

222

1 365

469

175

2 548

182

226

1 350

471

180

1 998

122

190

1 255

473

177

1 905

125

194

1 120

439

171

1 993

115

185

1 190

451

172

2 494

171

208

1 300

432

164

1 994

160

214

1 220

439

169

2 933

150

200

1 345

466

176

1 995

120

177

1 265

436

177

1 952

87

144

1 430

436

169

2 109

112

149

1 320

457

184

1 117

50

135

810

371

162

1 116

58

145

780

364

155

1 580

80

159

880

370

156

1 294

103

189

805

370

157

1 461

100

181

925

363

161

1 294

95

184

730

350

160

Moyennes

1 906

114

183

1 111

422

169

Exemple : tude marketing automobile


Statistiques lmentaires
+-------------------------+----------------------+----------------------+
| LIBELLE

EFFECTIF

MOYENNE

ECART-TYPE |

MINIMUM

MAXIMUM

+-------------------------+----------------------+----------------------+
| Cylindre

24.00

1906.12

516.79

1116.00

2986.00

| Puissance

24.00

113.67

37.97

50.00

188.00

| Vitesse

24.00

183.08

24.68

135.00

226.00

| Poids

24.00

1110.83

225.44

730.00

1510.00

| Longueur

24.00

421.58

40.47

350.00

473.00

| Largeur

24.00

168.83

7.49

155.00

184.00

+-------------------------+----------------------+----------------------+

Largeur

190
180
170
160
150

190
180
170
160
150

Longueur

Poids
Vitesse

100

200

200

400

190
180
170
160
150
0

1000 2000

500

190
180
170
160
150
150

600

600

600

600

600

400

400

400

400

400

400

200

200

200

200

200

200

2000 4000

2000
1500
1000
500
0

100

200

2000
1500
1000
500
0
0

2000 4000

200

400

2000
1500
1000
500
0
0

100

200

1000 2000

2000
1500
1000
500
0
0

200

400

500

2000
1500
1000
500
0
0

1000 2000

14 16 18 20
0
0
0
0

500

300

300

300

300

300

200

200

200

200

200

100

100

100

100

100

100

200
150
100
50
0

100

200

200
150
100
50
0
0

2000 4000

4000
3000
2000
1000
0
2000 4000
Cylindre

200

200
150
100
50
0
0

100

200

4000
3000
2000
1000
0
0

100

200

Puissance

1000 2000

200
150
100
50
0
0

200

400

4000
3000
2000
1000
0

1000 2000

4000
3000
2000
1000
0
0

200
Vitesse

400

500

0
140 160 180 200

500

200
150
100
50
0
140 160 180 200

200
150
100
50
0
0

4000
3000
2000
1000
0
0

1000 2000
Poids

190

2000
1500
1000
500
0

200

2000 4000

170

0
140 160 180 200

300

Puissance

190
180
170
160
150

600

Cylindre

2000 4000

190
180
170
160
150

4000
3000
2000
1000
0
0

500
Longueur

14 16 18 20
0
0
0
0
Largeur

Exemple : tude marketing automobile

Exemple : Donnes dexpression de gnes

Exemple : Donnes dexpression de gnes

Tableau des donnes

x11 K x1 j K x1 p

M O M
X = xi1 L xij
M O M
xn1 K xnj

ip

np

O M
L x
O M
K x

Notations

ip

X i = xi1 K xij K x

x1 j

ij

nj

M
Xj= x
M
x

Espace des lignes

i
X2
xi j

xi2

xi1

X1

Espace des lignes

X2

X1

Distance entre lignes

i2

i1
X2

d (i1 , i2 ) = ( xi1 j xi2 j ) 2


2

j =1

X1

Distance entre colonnes

Xi

j
X2
xi j

x2j

x1

X1

Distance entre colonnes

Xi

j2

j1
X2

1 X1
d ( j1 , j2 ) = ( xij1 xij2 ) 2
i =1 n
2

Espace des lignes

X2

X1

X
X

Centrage des donnes

i
X

X2
X1

xij = x ij X x j
1

Rduction des donnes

Harmonisation des units de mesure des variables

j j = 1

x ij x j
xij =
j

ur

r
u

X2

X1

ur
2

r
u

r
u

X2

X1

F1

F2

i
X2

F2 (i)

F1(i)

X1


i
F

F (i)

F1 (i )

F1

F1

F1

F1

F1

Donnes sur 1 et axe 2 (93% )


2
1.5

Peugeot 205 Rallye


Citron AX Sport

BMW 325 iX

Seat Ibiza SX I

-4

Peugeot 405 Break

Renault 190

Fiat Uno
-3

-2

-1
Fiat Tipo

Ford Fiesta

Citron0 BX

Ford Sierra
-0.5Peugeot 405
Renault 21
-1

Opel Omega
Renault Espace

-1.5
Nissan Vanette
-2

-2.5
-3

BMW 530i
Rover 827i
Renault 25

0.5

Peugeot 205
Honda Civic

-5

Audi 90 Quattro

VW Caravelle

Ford Scorpio
3


i
F

F (i)

F1 (i )

F1


i
F

F (i)

F1 (i )

F1

Solution analytique

U est vecteur propre de la matrice des


corrlations
Les composantes principales dgagent la
redondance entre les variables.
La variance dune composante principale est sa
valeur propre associe.

Mesure de la dispersion totale


n

1
2
M = d (i, G )
i =1 n
p

= Var ( X j )
j =1

=p

Mesure de la dispersion totale

M = Var ( F )
=1
p

=
i

=1

Part de dispersion dgage par une composante


principale

Var ( F )

= p
M

=1

Xi

Espace des colonnes

j
X2
xi j

x2j

x1j

1
d ( j , G ) = ( xij x j ) 2
i =1 n X1
= Var ( j )
=1

Espace des colonnes

1
d ( j , G ) = ( xij x j ) 2
i =1 n X1
= Var ( j )
=1

Espace des colonnes

j1

j2
n

1
d ( j1 , j2 ) = ( xij1 xij2 ) 2
i =1 n X1
2

= 2 (1 cos( j1Oj2 ) )
= 2 (1 r ( j1 j2 ) )

Espace des colonnes

j1

j2
n

1
d ( j1 , j2 ) = ( xij1 xij2 ) 2
i =1 n X1
2

= 2 (1 cos( j1Oj2 ) )
= 2 (1 r ( j1 j2 ) )

Espace des colonnes

F1

Donnes sur 1 et axe 2 (93% )


2
1.5

Peugeot 205 Rallye


Citron AX Sport

BMW 325 iX

Seat Ibiza SX I

-4

Peugeot 405 Break

Renault 190

Fiat Uno
-3

-2

-1
Fiat Tipo

Ford Fiesta

Citron0 BX

Ford Sierra
-0.5Peugeot 405
Renault 21
-1

Opel Omega
Renault Espace

-1.5
Nissan Vanette
-2

-2.5
-3

BMW 530i
Rover 827i
Renault 25

0.5

Peugeot 205
Honda Civic

-5

Audi 90 Quattro

VW Caravelle

Ford Scorpio
3

j
G

F1

( xij x j )

i'
G

i
F1

Exemple : tude marketing automobile

Rpartition des valeurs propres

1
2
3
4
5
6

Valeurs
Propres

Pourcentages

4.656
0.9152
0.2404
0.1027
0.0647
0.021

77.6%
15.3%
4.0%
1.7%
1.1%
0.4%

100%

77.6%
92.9%
96.9%
98.6%
99.7%
100.0%

Rpartition des valeurs propres

4% 2%
15%

78%

Rpartition des valeurs propres

Valeur propres
Valeur
% de variabilit
% cumul
Vecteurs :
Cylindre
puissance
vitesse
poids
longueur
largeur

1
4.6560
0.7760
0.7760
1
0.4442
0.4145
0.3435
0.4303
0.4302
0.3776
1

2
0.9152
0.1525
0.9285
2
0.0340
0.4212
0.6634
-0.2552
-0.2956
-0.4783
1

3
0.2404
0.0401
0.9686
3
-0.4014
-0.0396
0.3699
-0.4845
0.0440
0.6810
1

4
0.1027
0.0171
0.9857
4
-0.0500
-0.4897
0.3199
-0.1232
0.7118
-0.3653
1

5
0.0647
0.0108
0.9965
5
0.7986
-0.3067
-0.0072
-0.4726
-0.1660
0.1314
1

6
0.0210
0.0035
1.0000
6
0.0109
0.5615
-0.4501
-0.5258
0.4374
-0.1188
1

6.00

U1*U2
0.0151
0.1746
0.2279
-0.1098
-0.1272
-0.1806
0

Facteurs principaux
Honda Civic
Renault 19
Fiat Tipo
Peugeot 405
Renault 21
Citron BX
BMW 530i
Rover 827i
Renault 25
Opel Omega
Peugeot 405 Break
Ford Sierra
BMW 325 iX
Audi 90 Quattro
Ford Scorpio
Renault Espace
Nissan Vanette
VW Caravelle
Ford Fiesta
Fiat Uno
Peugeot 205
Peugeot 205 Rallye
Seat Ibiza SX I
Citron AX Sport

axe 1
-2.0229
-0.7785
-1.2898
-0.2738
0.1805
-0.5046
3.9456
3.1939
3.4396
1.4996
0.5865
0.7393
1.7062
1.4135
2.7951
0.9200
-0.0247
1.2220
-3.4989
-3.7577
-2.6188
-2.2888
-1.9331
-2.6503
0.0000
4.6560

axe 2
0.3199
-0.1329
-0.4342
-0.4647
-0.6371
-0.2076
0.8354
0.7714
0.6092
-0.7757
0.1432
-0.4346
1.3627
1.0893
-0.1217
-0.8885
-1.8204
-2.3848
-0.9043
-0.0149
0.4151
1.4788
0.9014
1.2951
0.0000
0.9152

axe 3
0.5306
0.4415
0.4690
0.1864
-0.0646
0.1511
-0.5156
-0.0142
0.6281
0.5120
0.3488
0.1095
-0.9775
0.1463
-0.3855
0.2599
-1.2486
0.3009
-0.0709
-0.5080
-0.7990
0.1008
-0.0475
0.4464
0.0000
0.2404

Facteurs principaux
Honda Civic
Renault 19
Fiat Tipo
Peugeot 405
Renault 21
Citron BX
BMW 530i
Rover 827i
Renault 25
Opel Omega
Peugeot 405 Break
Ford Sierra
BMW 325 iX
Audi 90 Quattro
Ford Scorpio
Renault Espace
Nissan Vanette
VW Caravelle
Ford Fiesta
Fiat Uno
Peugeot 205
Peugeot 205 Rallye
Seat Ibiza SX I
Citron AX Sport

axe 1
-2.0229
-0.7785
-1.2898
-0.2738
0.1805
-0.5046
3.9456
3.1939
3.4396
1.4996
0.5865
0.7393
1.7062
1.4135
2.7951
0.9200
-0.0247
1.2220
-3.4989
-3.7577
-2.6188
-2.2888
-1.9331
-2.6503
0.0000
4.6560

axe 2
0.3199
-0.1329
-0.4342
-0.4647
-0.6371
-0.2076
0.8354
0.7714
0.6092
-0.7757
0.1432
-0.4346
1.3627
1.0893
-0.1217
-0.8885
-1.8204
-2.3848
-0.9043
-0.0149
0.4151
1.4788
0.9014
1.2951
0.0000
0.9152

axe 3
0.5306
0.4415
0.4690
0.1864
-0.0646
0.1511
-0.5156
-0.0142
0.6281
0.5120
0.3488
0.1095
-0.9775
0.1463
-0.3855
0.2599
-1.2486
0.3009
-0.0709
-0.5080
-0.7990
0.1008
-0.0475
0.4464
0.0000
0.2404

Donnes sur 1 et axe 2 (93% )


2
1.5

Peugeot 205 Rallye


Citron AX Sport

BMW 325 iX

Seat Ibiza SX I

-4

Peugeot 405 Break

Renault 190

Fiat Uno
-3

-2

-1
Fiat Tipo

Ford Fiesta

Citron0 BX

Ford Sierra
-0.5Peugeot 405
Renault 21
-1

Opel Omega
Renault Espace

-1.5
Nissan Vanette
-2

-2.5
-3

BMW 530i
Rover 827i
Renault 25

0.5

Peugeot 205
Honda Civic

-5

Audi 90 Quattro

VW Caravelle

Ford Scorpio
3

Matrice des corrlations

Cylindre
Cylindre
puissance
vitesse
poids
longueur
largeur

1
0.8610
0.6933
0.9049
0.8642
0.7091

puissance
0.8610
1
0.8940
0.7461
0.6885
0.5523

vitesse
0.6933
0.8940
1
0.4914
0.5319
0.3632

poids
0.9049
0.7461
0.4914
1
0.9171
0.7909

longueur
0.8642
0.6885
0.5319
0.9171
1
0.8638

largeur
0.7091
0.5523
0.3632
0.7909
0.8638
1

Corrlations entre variables et facteurs principaux

Cylindre
puissance
vitesse
poids
longueur
largeur

facteur 1
0.9585
0.8944
0.7413
0.9285
0.9283
0.8148

facteur 2
0.0325
0.4030
0.6347
-0.2441
-0.2828
-0.4576

facteur 3
-0.1968
-0.0194
0.1814
-0.2375
0.0216
0.3339

Corrlations entre variables et facteurs principaux

Cylindre
puissance
vitesse
poids
longueur
largeur

facteur 1 facteur 2 facteur 3 facteur 4 facteur 5 facteur 6


0.9585
0.0325
-0.1968
-0.0160
0.2031
0.0016
0.8944
0.4030
-0.0194
-0.1569
-0.0780
0.0813
0.7413
0.6347
0.1814
0.1025
-0.0018
-0.0652
0.9285
-0.2441
-0.2375
-0.0395
-0.1202
-0.0761
0.9283
-0.2828
0.0216
0.2281
-0.0422
0.0633
0.8148
-0.4576
0.3339
-0.1171
0.0334
-0.0172
4.6560
0.9152
0.2404
0.1027
0.0647
0.0210

1
1
1
1
1
1

Matrice des corrlations

Cylindre
Cylindre
puissance
vitesse
poids
longueur
largeur

1
0.8610
0.6933
0.9049
0.8642
0.7091

puissance
0.8610
1
0.8940
0.7461
0.6885
0.5523

vitesse
0.6933
0.8940
1
0.4914
0.5319
0.3632

poids
0.9049
0.7461
0.4914
1
0.9171
0.7909

longueur
0.8642
0.6885
0.5319
0.9171
1
0.8638

largeur
0.7091
0.5523
0.3632
0.7909
0.8638
1

Cosinus carrs
Honda Civic
Renault 19
Fiat Tipo
Peugeot 405
Renault 21
Citron BX
BMW 530i
Rover 827i
Renault 25
Opel Omega
Peugeot 405 Break
Ford Sierra
BMW 325 iX
Audi 90 Quattro
Ford Scorpio
Renault Espace
Nissan Vanette
VW Caravelle
Ford Fiesta
Fiat Uno
Peugeot 205
Peugeot 205 Rallye
Seat Ibiza SX I
Citron AX Sport

axe 1
0.8766
0.6624
0.7640
0.1070
0.0336
0.4826
0.9386
0.9443
0.9358
0.6674
0.6197
0.6313
0.5037
0.5697
0.9157
0.4453
0.0001
0.1918
0.9336
0.9769
0.8857
0.6986
0.7873
0.7788

axe 2
0.0219
0.0193
0.0866
0.3081
0.4183
0.0817
0.0421
0.0551
0.0294
0.1786
0.0369
0.2182
0.3213
0.3384
0.0017
0.4154
0.6448
0.7304
0.0624
0.0000
0.0223
0.2916
0.1712
0.1860

Plan 1x2
0.8985
0.6817
0.8506
0.4151
0.4519
0.5643
0.9807
0.9994
0.9652
0.8460
0.6566
0.8495
0.8250
0.9081
0.9174
0.8607
0.6449
0.9222
0.9960
0.9769
0.9080
0.9902
0.9585
0.9648

Cosinus carrs
Rover 827i
Ford Fiesta
Peugeot 205 Rallye
BMW 530i
Fiat Uno
Renault 25
Citron AX Sport
Seat Ibiza SX I
VW Caravelle
Ford Scorpio
Audi 90 Quattro
Peugeot 205
Honda Civic
Renault Espace
Fiat Tipo
Ford Sierra
Opel Omega
BMW 325 iX
Renault 19
Peugeot 405 Break
Nissan Vanette
Citron BX
Renault 21
Peugeot 405

axe 1
0.9443
0.9336
0.6986
0.9386
0.9769
0.9358
0.7788
0.7873
0.1918
0.9157
0.5697
0.8857
0.8766
0.4453
0.7640
0.6313
0.6674
0.5037
0.6624
0.6197
0.0001
0.4826
0.0336
0.1070

axe 2
0.0551
0.0624
0.2916
0.0421
0.0000
0.0294
0.1860
0.1712
0.7304
0.0017
0.3384
0.0223
0.0219
0.4154
0.0866
0.2182
0.1786
0.3213
0.0193
0.0369
0.6448
0.0817
0.4183
0.3081

Plan 1x2
0.9994
0.9960
0.9902
0.9807
0.9769
0.9652
0.9648
0.9585
0.9222
0.9174
0.9081
0.9080
0.8985
0.8607
0.8506
0.8495
0.8460
0.8250
0.6817
0.6566
0.6449
0.5643
0.4519
0.4151

Cosinus carrs
Honda Civic
Renault 19
Fiat Tipo
Peugeot 405
Renault 21
Citron BX
BMW 530i
Rover 827i
Renault 25
Opel Omega
Peugeot 405 Break
Ford Sierra
BMW 325 iX
Audi 90 Quattro
Ford Scorpio
Renault Espace
Nissan Vanette
VW Caravelle
Ford Fiesta
Fiat Uno
Peugeot 205
Peugeot 205 Rallye
Seat Ibiza SX I
Citron AX Sport

axe 1
0.8766
0.6624
0.7640
0.1070
0.0336
0.4826
0.9386
0.9443
0.9358
0.6674
0.6197
0.6313
0.5037
0.5697
0.9157
0.4453
0.0001
0.1918
0.9336
0.9769
0.8857
0.6986
0.7873
0.7788

axe 2
0.0219
0.0193
0.0866
0.3081
0.4183
0.0817
0.0421
0.0551
0.0294
0.1786
0.0369
0.2182
0.3213
0.3384
0.0017
0.4154
0.6448
0.7304
0.0624
0.0000
0.0223
0.2916
0.1712
0.1860

axe 3
0.0603
0.2131
0.1010
0.0496
0.0043
0.0432
0.0160
0.0000
0.0312
0.0778
0.2192
0.0139
0.1653
0.0061
0.0174
0.0355
0.3033
0.0116
0.0004
0.0179
0.0824
0.0014
0.0005
0.0221

axe 4
0.0356
0.0497
0.0166
0.5331
0.4153
0.3270
0.0012
0.0000
0.0030
0.0477
0.0658
0.1176
0.0043
0.0003
0.0002
0.0833
0.0018
0.0578
0.0011
0.0014
0.0000
0.0016
0.0265
0.0106

axe 5
0.0030
0.0556
0.0136
0.0011
0.1109
0.0072
0.0009
0.0002
0.0005
0.0262
0.0400
0.0135
0.0013
0.0846
0.0644
0.0120
0.0356
0.0000
0.0001
0.0004
0.0078
0.0062
0.0015
0.0022

axe 6
0.0026
0.0000
0.0182
0.0011
0.0177
0.0582
0.0013
0.0004
0.0001
0.0024
0.0184
0.0056
0.0041
0.0008
0.0006
0.0085
0.0144
0.0084
0.0025
0.0034
0.0018
0.0006
0.0131
0.0003

1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000

Analyse des donnes Bois

+--------+------------+----------+----------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
PROPRE
|
| CUMULE |
+--------+------------+----------+----------+
|
1
|
3.4724
|
57.87 |
57.87 |
|
2
|
1.6385
|
27.31 |
85.18 |
|
3
|
0.4436
|
7.39 |
92.57 |
|
4
|
0.3419
|
5.70 |
98.27 |
|
5
|
0.1036
|
1.73 | 100.00 |
|
6
|
0.0000
|
0.00 | 100.00 |
--------------------------------------------+----------------------------------------------------------------------------------+
| ******************************************************************************** |
| **************************************
|
| ***********
|
| ********
|
| ***
|
| *
|
+----------------------------------------------------------------------------------+

Você também pode gostar