Você está na página 1de 104

MODELE CANTITATIVE STATISTICE

DANIEL SCRADEANU

3. Modele cantitative statistice .........................................................................1


3.1. Cuantificarea intensitii corelaiilor .......................................................1
3.1.1. Coeficienii de corelaie...................................................................3
3.1.2. Coeficienii de corelaie a rangurilor..............................................13
3.1.3. Coeficieni de asociere..................................................................19
3.1.4. Coeficieni de corelaie temporal.................................................24
3.2. Factorizarea corelaiilor .......................................................................37
3.2.1. Valori proprii i vectori proprii........................................................39
3.2.2. Standardizarea .............................................................................43
3.2.3. Analiza n componeni principali ...................................................45
3.2.4. Analiza factorial R-MOD .............................................................56
3.2.5. Rotatia factorilor............................................................................64
3.2.6. Analiza factorial Q-MOD .............................................................69
3.3. Modelarea matematic a corelaiilor substaniale................................74
3.3.1. Model liniar de o singur variabil independent..........................74
3.3.2.Model liniar multiplu .......................................................................89
Bibliografie .....................................................................................................98

Modele cantitative statistice

Daniel Scrdeanu

3. Modele cantitative statistice


Modelele

cantitative

statistice

exprim

interdependeele

dintre

componentele ecosistemelor i sunt construite pe baza prelucrrii unui mare


numr de msurtori experimentale realizate pe parcursul unui program
complex de monitorizare.
Elaborarea modelelor statistice se realizeaz n trei etape principale:

Cuantificarea intensitii corelaiilor de diferite tipuri


prin intermediul coeficienilor de corelaie, coeficieni
difereniai n funcie de tipul variabilelor factoriale i al
variabilelor independente (x,y, t);

Factorizarea corelaiilor care are ca scop ierarhizarea i


selectarea corelaiilor reprezentative din punct de vedere
statistic.

Modelarea matematic a corelaiilor de diferite tipuri.

Modelele statistice au un domeniu de aplicare restrans la spaiul i


intervalul de timp n care s-a realizat programul de monitorizare pe baza
cruia s-au obinut datele necesare elaborrii acestora.

3.1. Cuantificarea intensitii corelaiilor


Utilizarea termenului corelaie n ecologie are o semnificatie mult mai
larg dect cea matematic. n sens statistic, corelaia reprezint un anumit
grad de legtur evaluat prin diferite tehnici matematice, fiecare caracter fiind
tratat ca o variabil aleatoare. Ansamblul caracterelor studiate formeaz o
variabil aleatoare cu mai multe componente iar ipoteza normalittii acestei
variabile n spatiul multidimensional este la baza tehnicilor de evaluare a
intensittii corelaiei. In ecologie o mare parte a cercetrii este consacrat
identificrii relatiilor dintre caracteristicile msurabile.

Modele cantitative statistice

Daniel Scrdeanu

Natura corelaiilor n ecologie este determinat de structura fizicochimic i bilogic a obiectelor de studiu care este constituit dintr-un
ansamblu de variabile care formeaz biotopul i biocenoza. De aici rezult
natura substantial a corelaiilor care se realizeaz pe baza compozitiei
fizice, chimice, pe baza speciilor sau a calittii fizico-chimice a cmpurilor
terestre (magnetic, gravimetric etc).
Ecologia se ocup, de asemenea, cu analiza proceselor ce se
desfsoar n timp i spaiu; n acest fel se completeaz spectrul naturii
corelaiilor ecologice cu trei componente principale:

corelaii substantiale;

corelaii temporale.

corelaii spaio-temporale sau topo-probabiliste;

Cercetarea corelaiilor poate fi realizat cu instrumente diferite n


functie de dimensiunea i natura fenomenelor studiate. n literatura exist nc
o mare confuzie n terminologia utilizat pentru instrumentele cu ajutorul
crora evalum intensitatea legturilor/corelaiilor dintre caracteristicile
ecologice.
Vom adopta n continuare pentru instrumentele de cuantificare a
intensittii corelaiilor substaniale dintre dou variabile urmtoarele
categorii:

coeficient de corelaie utilizat pentru variabile cantitative


(numerice) i adaptabil, n anumite circumstane, pentru
variabile calitative (alfanumerice);

coeficient de corelaie a rangurilor utilizai pentru


variabile ordonabile (numerice/alfanumerice);

coeficie de asociere utilizai pentru variabile calitative


(alfanumerice)

Cuantificarea corelaiilor temporale se bazeaz pe o formalizare


particular a serilor de timp se exprim prin:

coeficieni de autocorelaie

coeficieni de intercorelaie

Cuantificarea corelaiilor spaio-temporale presupune o prelucrare


complex i un volum mare de date cu o structur spaial i temporal

Modele cantitative statistice

Daniel Scrdeanu

complex. Metodologia de evaluare a acestor corelaii este de o deosebit


complexitate constituind o direcie special ( Scrdeanu, D., 2003,
Geostatistic aplicat).

3.1.1. Coeficienii de corelaie


Aceast categorie de coeficieni este definit pentru cuantificarea
intensittii legturii dintre caracteristicile ecologice cantitative dar pot fi
adaptati i pentru studiul caracteristicilor calitative.
Caracteristica lor comun este adimensionalitatea i domeniul valoric
restrns ( [ 1;1] sau [0;1] ). Valorile extreme indic o intensitate maxim sau
minim a intensittii corelaiei.

a) Raportul de corelaie

Raportul de corelaie permite evaluarea intensittii i sensului corelaiei


dintre dou variabile geologice

( y, x )

independent de modelul de corelaie.

Raportul de corelaie realizeaz aceast evaluare prin intermediul gradului de


mprtiere al valorilor yi msurate n jurul mediilor condiionate y xi .
Analiznd intensitatea dependenei variabilei y (rezultative) n raport
de variabila x (factorial), dispersia acesteia poate fi exprimat sub forma:
s y2 = s y2( x ) + s y20

(III.169)

n care
s y2 - dispersia total a variabilei y n raport cu toti factorii cunoscuti sau

necunoscuti;
s y2( x ) - dispersia condiionat a variabilei y n raport cu variabila x ;
s y20 - dispersia rezidual a variabilei y n raport cu celelalte variabile care-i

condiioneaz variabilitatea i care nu sunt specificate n model.

Modele cantitative statistice

Daniel Scrdeanu

Separarea dispersiei totale n cele dou componente necesit


gruparea datelor ntr-un tabel de corelaie a crui configuratie este
condiionat de sensul corelaiei. Pentru evaluarea gradului de dependent al
variabilei y n raport cu variabila x , tabelul de corelaie (Tabelul III.19)
contine:

m yxi - mediile variabilei y pentru fiecare interval xi ;


n xi - frecventele marginale ale valorilor yi pentru fiecare interval xi ;
n timp ce tabelul de corelaie al variabilei x n raport cu y ( x = f ( y ) ) (Tabelul
III.20):

m xyi - mediile variabilei x pentru fiecare interval yi ;

n yi - frecventele marginale ale variabilei xi pentru fiecare interval yi .


Tabelul III.19 Corelaie y = f (x )

n xi

Tabelul III.20 Corelaie x = f ( y )

m yxi

var. dependent

n yi

mxyi

var. dependent

x1

y11 , y12 ,..., y1n1

n x1

m yx1

y1

x11 , x12 ,..., x1n1

n y1

m xy1

x2

y 21 , y 22 ,..., y 2 n 2

nx 2

m yx 2

y2

x21 , x22 ,..., x2 n 2

ny2

m xy 2

xk

y k 1 , y k 2 ,..., y knk

n xk

m yxk

yk

xk1 , xk 2 ,..., xknk

n yk

mxyk

Dispersiile s y2 i s y2( x ) se evalueaz cu relaiile:

(y
=
k

2
y(x)

2
y

i =1

my )

(III.170)

k 1

i =1

n xi (m yxi m y )

k 1

(III.171)

Modele cantitative statistice

Daniel Scrdeanu

pentru analiza intensitii corelaiei y = f (x ) , iar dispersiile s x2 i s x2( y ) cu


relaiile:
2
x

(x
=

2
x( y )

i =1

mx )

(III.172)

k 1

i =1

n yi (m xyi m x )

k 1

(III.173)

pentru analiza intensitii corelaiei x = f ( y ) .


Intensitatea corelaiei dintre cele dou variabile se msoar cu ajutorul
raportului dintre dispersia ( s y ( x ) sau s x ( y ) ) i dispersia total ( s 2 y sau s 2 x ).
Pentru exprimarea cantitativ a acestei corelaii se defineste

raportul de

corelaie cu:

y(x ) =

x( y ) =

s y2( x )
s y2

s x2( y )
s x2

(III.174)

(III.175)

Valoarea maxim a raportului de corelaie este 1 i exprim o corelaie


maxim ntre cele dou variabile, iar lipsa de corelaie dintre cele dou
variabile corespondente valorii zero, valoarea minim a raportului de corelaie.
n analiza corelaiei dintre dou variabile geologice, nu ntotdeauna
este evident care din variabile este rezultativ i care este factorial, motiv
pentru care este necesar s se determine valoarea raportului de corelaie n
ambele variante (III.174) i (III.175). Analiza ambelor valori poate conduce la
urmtoarele variante extreme de interpretare:
a) variabila y este dependent de x iar x este independent;

y ( x ) = 1 i x ( y ) = 0

(III.176)

b) variabila x este dependent de y iar y este independent;

Modele cantitative statistice

Daniel Scrdeanu

y ( x ) = 0 i x ( y ) = 1

(III.177)

b) variabilele x i y sunt independente;


c)

y ( x ) = 0 i x ( y ) = 0
d) variabilele

x i

(III.178)

y se intercondiioneaz sau ambele sunt

condiionate de o a treia variabil neidentificat:

y ( x ) = 1 i x ( y ) = 1

(III.179)

n practica analizei corelaiilor dintre variabilele geologice, raportul de


corelaie ia valori cuprinse ntre 0 i 1 iar semnificatia lor statistic se poate
testa cu ajutorul factorului F pe baza inegalittii:

Fexp

2
nk
=

> F ( , 1 ; 2 )
2
1
k 1

(III.180)

n care 1 = k 1 , 2 = n k ( n = perechi de valori, k = numr de intervale de


grupare, = nivelul de semnificaie al testului).
Verificarea inegalittii (III.180) indic o valoare semnificativ statistic a
raportului de corelaie, deci existenta unei corelaii ntre variabilele analizate.

b) Coeficientul corelaiei lineare

Coeficientul corelaiei lineare este cel mai des ntlnit n cercetarea


ecologic a corelaiilor i din nefericire este utilizat n general fr absolut nici
o precautie legat de caracteristicile statistice ale variabilelor implicate.
Definit pentru dou variabile cu repartiie normal ( x, y ), coeficientul
corelaiei lineare (= coef. lui PEARSON = coeficientul corelaiei totale) este
definit cu relaia:
6

Modele cantitative statistice

Daniel Scrdeanu

(x m )(y m )
(x m ) (y m )
n

rxy =

i =1

i =1

(III.181)
Valorile coeficientului de corelaie linear sunt cuprinse ntre 1 i 1 iar
dac x i y sunt independente, rxy = 0 .
Abaterea de la repartitia normal a variabilelor x i y antreneaz
modificri ale interpretrii valorilor coeficientului de corelaie linear. Valoarea
minim a coeficientului Pearson ( rxy = 0 ) nu este un indicator al independentei
celor dou caracteristici, ci numai de necorelare liniar a lor. Acestea pot fi
corelate printr-o relatie functional de tip parabolic, logaritmic etc.
Pentru interpretarea valorilor nenule ale coeficienilor de corelaie, o
explicare grafic este mult mai sugestiv pentru cei neacomodati cu statistica
matematic. Valoarea coeficientului de corelaie linear este n dependen
direct cu distribuia perechilor de valori ( xi , yi ) ntr-un sistem rectangular de
referint

XOY .

Corespunztor

configuratiei

geometrice

distributiei

punctelor, se disting urmtoarele cazuri:


a) alinierea perfect a punctelor de-a lungul unei drepte - fie
ascendent ( rxy = 1 ; Fig. 58a), fie descendent ( rxy = 1 ; Fig. 58b) - care
indic o dependen linear perfect ntre cele dou variabile. O astfel de
situaie este foarte rar ntlnit n studiul unor relatii functionale ntre dou
caracteristici geologice;
b) punctele sunt dispersate aleator, norul de puncte neavnd nici o
orientare preferential (Fig. 58c). n circumstanele amintite anterior, cele
dou variabile sunt independente sau necorelate ( rxy = 0 );

Modele cantitative statistice

Daniel Scrdeanu

c) configuraia tranzitorie ntre cele dou extreme, n care norul de


puncte are o orientare preferenial corespunztoare valorilor lui

rxy

aparinnd intervalului [ 1,1] (Fig. 58d).


a

r 1

r 1

r =0

0 < r <1

Fig. 58 Semnificaia geometric a coeficientului Pearson

O analiz mai detaliat a coeficientului de corelaie linear este reluat


la analiza modelului liniar de o singur variabil independent .
Valorile coeficientului de corelaie linear, n cazul n care repartitia
celor dou variabile se abate de la cea normal, nu mai exprim n mod
obligatoriu intensitatea corelaiei lineare ntre cele dou variabile x i y . n
cazul frecvent al repartitiilor lognormale, pentru calculul coeficientului de
corelaie linear se opereaz cu valorile logaritmate ale caracteristicilor
analizate.
F1
A1

x1

c) Coeficientul cosinus

Coeficientul cosinus este o

A2

x2

msur a distantei unghiulare, utilizat


pentru estimarea similarittii ntre
obiecte geologice de studiu (ex.:
aflorimente, zcminte, bazine de
sedimentare,

acvifere

etc),

1
F2
y1

y2

Fig. 59 Coeficientul cosinus


pentru un spaiu bidimensional

Modele cantitative statistice

Daniel Scrdeanu

reprezentate n spatiul variabilelor msurabile (ex.: compozitie chimic,


compozitie granulometric, parametri hidrogeologici etc). Estimarea lui implic
ortogonalitatea axelor sistemului de referint, motiv pentru care este preferat
n analiza factorial Q - MOD.
ntr-un spatiu bidimensional definirea coeficientului cosinus se
bazeaz pe relatiile trigonometrice elementare ale cosinusului unghiului unei
diferente de unghiuri (Fig.59):

cos A1 A2 = cos(1 2 ) =

x1 y1 + x2 y 2

(x

2
1

)(

+ y12 x22 + y 22

(III.183)

Generaliznd pentru n dimensiuni ( n factori independenti F1 , F2 ,..., Fn ,


spre exemplu n aflorimente probate n cazul analizei Q-MOD) se obine
formula:

xy
x
k

cos A1 A2 =

i =1 i

k
2
i =1 i

i =1

yi2

(III.183)
Acest coeficient de corelaie indic o similaritate complet ntre dou
obiecte geologice A1 i A2 pentru cos = 1 i o disimilaritate total pentru
cos = 0 (corespunztor unui unghi = 90 o echivalent cu ortogonalitatea

vectorilor de poziie).

d) Coeficientul distantei taxonomice

Ca msur a similarittii ntre dou obiecte geologice, coeficientul


distantei taxonomice i are originea n modelul geometric al distantei
euclidiene ntre dou puncte A i B ntr-un spatiu n -dimensional. Distanta
taxonomic ntre cele dou obiecte geologice este invers proportional cu
similaritatea, n fiind numrul de caracteristici proprii celor dou obiecte
geologice studiate.
9

Modele cantitative statistice

Daniel Scrdeanu

n cazul distanei taxonomice dintre dou eantioane A i B


reprezentate prin dou caracteristici x1 i x2 (Fig.60) formula de calcul este:

D AB =

(x1 A x1B )2 + (x2 A x2 B )2

(III.184)

n care:
x1 A - caracteristica x1 determinat n eantionul A (ex.: coninutul n

zinc);
x1B

caracteristica

x1

determinat n eantionul B;
x2 A

x1

- caracteristica

x2

x1 A

determinat n eantionul A
(exemplu:

coninutul

x2 B

x1B

plumb);
- caracteristica

x2

determinat n eantionul B.
x2 A

Dac

pentru

x2B

x2

Fig. 60 Distana taxonomic n spaiu


bidimensional

cele

dou obiecte geologice (A i

B)

se determin mai multe caracteristici ( x1 , x2 ,..., xn ) se utilizeaz o generalizare


a distanei taxonomice:

D AB =

(X
n

i =1

X iB )

iA

(III.185)

Creterea numrului de caracteristici utilizate reduce posibilitatea


interpretrii valorii distantei taxometrice n comparatie cu a altor coeficieni de
corelaie datorit diversittii unittilor de msur i a amplitudinilor de selectie.
Eliminarea acestor inconveniente se realizeaz prin standardizarea valorilor
caracteristicilor msurate, normarea lor pe intervalul

[0,1]

i definirea

coeficientului distanei taxonomice:

10

Modele cantitative statistice

d AB = 1

Daniel Scrdeanu

1 n
( XSiA XSiB )2

n i =1

(III.186)

n care:

XS iA - valoarea standardizat i normat a caracteristicii "i" din eantionul A;


XS iB - valoarea standardizat i normat a caracteristicii "i" din eantionul B.
n aceste condiii, valorile extreme ale coeficientului de distan sunt:
zero, cnd cele dou esantioane sunt identice, deci similaritatea este maxim
i unu, cnd cele dou eantioane A i B sunt total diferite.

e) Coeficientul corelaiei binare

Coeficientul

corelaiei

binare ( rD ) a fost propus de

eab

Derec, Sarcia i Troly (1964)


pentru cercetri metalogenetice
i este definit prin relaia:

rD =

neab ab

ab(n a )(n b )

Fig. 61 Relaia dintre elementele


coeficientului de corelaie binar

(III.188)

n care:
n - numrul total de cazuri analizate (Fig. 61);
a - numrul de cazuri analizate care prezint caracteristica A;
b - numrul de cazuri analizate care prezint caracteristica B;

eab - numrul de cazuri analizate care prezint ambele caracteristici A


i B, a cror corelaie se analizeaz.
Coeficientul de corelaie binar este o msur a intensitatii legturii
ntre caracteristicile A i B. Cu ct coeficientul rD este mai mare (valori

11

Modele cantitative statistice

Daniel Scrdeanu

pozitive) legtura este mai puternic. Valorile negative indic o "respingere" a


caracteristicilor, iar valoarea nul o independen total.
Interpretarea naturalist a valorilor lui

permite ierarhizarea

rD

corelaiilor ntr-un sistem multivariat pe baza coeficienilor corelaiei binare


calculati pentru toate perechile de caracteristici msurabile. Asamblate ntr-o
matrice de similaritate, toate valorile coeficientului de corelaie pot forma o
imagine sintetic a ierarhiilor corelaionale din sistemul studiat. n tabelul III.21
este prezentat configuratia unei astfel de matrici ce va constitui obiectul unor
prelucrri ulterioare n scopul factorizrii corelaionale.
Tabelul III.21 Matricea coeficienilor rD pentru mineralele caracteristice ale
pegmatitelor cu beril din Madagascar i Mozambic (dup P. Lafitte, 1972)
1

10

11

0.31
0.34
-0.16
0.18
0.31
0.17
0.18
-0.06 -0.57
0.26
1
1
0.31
-0.17 -0.46
0.13
0.1
0.05
0.13
0.13
-0.55 -0.19
1
2
0.34
-0.17
-0.16
0.18
-0.28 -0.31 -0.06
0.18
0.01
0.26
1
3
-0.16 -0.46 -0.16
0
0.14
-0.11
0.29
0
0.14
0.15
1
4
0.18
0.13
0.18
0
-0.14
-0.13
-0.07
-0.33
0.08
0.24
1
5
0.31
0.1
-0.28
0.14
-0.24
0.55
0.08
0.08
-0.18
0.06
1
6
0.17
0.05
-0.31 -0.11 -0.13
0.55
-0.13 -0.13
-0.1
-0.29
1
7
0.18
0.13
-0.06
0.29
-0.07
0.08
-0.13
0.73
-0.24
0
1
8
-0.06
0.13
0.18
0
-0.33
0.08
-0.13
0.73
-0.24
0
1
9
0.14
0.08
-0.18
-0.1
-0.24 -0.24
-0.23
1
10 -0.57 -0.55 0.01
0.15
0.24
0.06
-0.28
0
0
-0.23
1
11 0.26 -0.19 0.26
1 - minereuri de Nb i Ta; 2 - mic litinifier; 3 - amfibolit i spodumen; 4 - fosfati de Mn
i Fe; 5 - minerale de Bi; 6 - casiterit i wolframit; 7 - molibdenit; 8 - minerale de U; 9 pmnturi rare; 10 - minerale de Cs; 11 - granat.

12

Modele cantitative statistice

Daniel Scrdeanu

3.1.2. Coeficienii de corelaie a rangurilor

Ordonarea valorilor unei caracteristici geologice ntr-o succesiune


ascendent sau descendent este realizabil att pentru caracteristicile
cantitative ct i pentru cele calitative. Operatiune extrem de ieftin din punct
de vedere al prelucrrii, ordonarea asociaz fiecrei valori a caracteristicii
studiate un numr natural, cunoscut sub denumirea de rang.
Analiza corelaiei rangurilor este o tehnic neparametric pentru studiul
legturilor dintre variabilele geologice care nu tine seama de diferenta dintre
valorile numerice ale propriettilor, ci numai de ordinea lor.
Coeficienii definiti pentru cuantificarea intensittii corelaiei rangurilor
au valori cuprinse n intervalul [ 1,1] i permit analiza corelaiilor pentru dou
sau mai multe variabile. Ei pot fi utilizati cu deosebit succes pentru corelarea
secventelor sedimentare investigate prin carotaj geologic complex n structuri
sedimentare cu numeroase alternane litologice pe unitatea de adncime.

a) Coeficientul lui Spearman

Coeficientul lui Spearman ( SP ) este definit pe baza coeficientului


corelaiei lineare al lui Pearson ntre dou variabile v1 , v2

6i =1 d i2

i are formula:

SP = 1

n(n 2 1)

(III.189)

n care:
n - numrul de perechi de valori ordonate cresctor;

d i - diferenta rangurilor celor dou variabile :


d i = rang xi rang yi
rang xi - rangul valorii xi n sistemul ordonat cresctor;

13

Modele cantitative statistice

Daniel Scrdeanu

rang yi - rangul valorii yi n sistemul ordonat cresctor.


Aplicatie. Analiza corelaiei ntre valoarea economic a unei roci i indicele ei
de duritate pe baza valorilor din tabelul III.22 conduce la o valoare a
coeficientului lui Spearman:

SP = 1

6 150
= 0,9
10 (100 1)

Valorile SP sunr cuprinse n intervalul [ 1,1] iar interpretarea este


similar cu a coeficientului lui Pearson din care este dedus. Pentru aplicaia
precedent se poate concluziona pe baza valorii SP = 0,9 c exist o bun
concordan ntre valoarea economic a rocii i tria ei rezultat dintr-un
ansamblu de proprieti elementare (compoziie mineralogic, structur,
textur etc.).
Tabelul III.22 Calculul coeficientului lui Spearman
Nr.

Proba

crt.

Rangul
Valoare

di

d i2

Trie

economic
1

P1

10

25

P2

-1

P3

P4

10

-9

81

P5

-3

P6

P7

-3

P8

P9

10

P10

14

Modele cantitative statistice

Daniel Scrdeanu

b) Coeficientul lui Kendall

Coeficientul lui Kendall ( k ) are aceleai proprieti cu coeficientul


Spearman, fiind egal cu zero cnd cele dou variabile analizate sunt
independente i cu +1 i -1 cnd dependena dintre cele dou variabile este
maxim, pozitiv sau negativ.
Relaia de definitie este:

k =

2S
n(n 1)

(III.190)

n care:
n - numrul de perechi de valori ordonate;

S - suma concordantelor posibile, calculate prin consemnarea cu +1 a

"consensului" i cu -1 a variaiei inverse.


Aplicatie.
Pentru o serie de n = 5 perechi de valori [densitate ( ), coeziune ( c )]
(Tabelul III.23a), succesiunea operaiunilor necesare calculului coeficientului

k este:
Tabelul III.23 Elementele de calcul pentru coeficientul Kendall
a)
Proba

b)

Rangul

Proba

Rangul

15

Modele cantitative statistice

Daniel Scrdeanu

1. Ordonarea probelor dup rangul unei caracteristici, de exemplu


(Tabelul III.23b).
2. Realizarea perechilor de ranguri prin combinarea probelor
disponibile (Tabelul III.24).
3. Calculul lui S prin nsumarea algebric a variaiilor relative.
4. Calculul lui k cu formula (III.190):

k =

24
= 0,4
5(5 1)

Tabelul III.24 Calculul parametrului

pentru coeficientul Kendall


Consens +1

Nr. crt.

12

31

-1

13

32

-1

14

35

+1

15

34

+1

23

12

+1

24

15

+1

25

14

+1

34

25

+1

35

24

+1

10

45

54

-1

S=

Contrasens -1

n practic, frecvent, seleciile de date conin grupuri de k valori cu


acelai rang. Pentru astfel de situaii se calculeaz un rang mediu prin media
aritmetic a rangurilor celor k valori. Vor apare astfel n seria ordonat a
selectiei k valori cu acelai rang. Tranzitiile ntre valori cu acelai rang sunt
consemnate cu valoarea zero n calculul parametrului S .

16

Modele cantitative statistice

Daniel Scrdeanu

Aplicatie. Dac ordonarea a n = 5 probe dup gradul de alterare este realizat


de doi specialisti (A, B) obtinndu-se situatia din tabelul III.25, rangul mediu al
probelor P3 i P4 dup clasificarea obtinut de specialistul A este:

rangAP 3 = rangAP 4 =

2+3
= 2,5
2

Conform tabelelor de calcul (tabelul III.26 i tabelul III.27):

k =

2 1
= 0,1
5(5 1)

Tabelul III.25 Coef. Kendall


Proba

RANG
A

Tabelul III.27 Coef. Kendall

P1

Nr. crt.

+1/-1

P2

1 2,5

32

-1

P3

2-3

1 2,5

34

P4

2-3

14

31

-1

P5

15

35

Tabelul III.26 Coef.Kendall

2,5 2,5

24

2,5 4

21

-1

Proba

RANG
A

2,5 5

25

2,5 4

41

-1

2,5

2,5 5

45

2,5

10

45

15

S =1

17

Modele cantitative statistice

Daniel Scrdeanu

c) Coeficientul OMEGA-Kendall

Corelarea simultan a rangului mai multor variabile poate fi cuantificat


prin coeficientul definit cu relaia:

K =

12S
m (n 3 n )

(III.191)

n care:
S - suma concordanelor multiple:

S = i =1 S i S
m

(III.192)

S i - suma concordanelor binare;


S - media concordanelor binare;
m - numrul variabilelor comparate;
n - numrul cuplurilor de valori ale selectiei.

Aplicatie. Analiza corelaiei rangurilor a trei variabile V1, V2 i V3, a cror


clasificare este consemnat n tabelul III.28a, conduce la urmtoarele etape
de calcul (Tabelul III.28b):
1 - media concordanelor binare

S=

4+0+2
=2
3

2 - suma concordanelor multiple

S = (4 2) + (0 2) + (2 2) = 8
2

3 - coeficientul K

K =

12 8
= 0,1
3 (53 5)
2

Valoarea 0,1 indic o corelaie nesemnificativ ntre cele trei variabile


(V1, V2 i V3).

18

Modele cantitative statistice

Daniel Scrdeanu

Tabelul III.28 Elementele de calcul pentru coeficientul OMEGA-Kendall


b)
Tranziii

Nr.
crt.

a)
Nr.

Rang

V1

+1/-1

V2

V3

V1:V2 V1:V3 V2:V3

12 21 32

-1

-1

+1

prob

V1

V2

V3

13 24 35

+1

+1

+1

P1

14 25 31

+1

-1

-1

P2

15 23 34

+1

+1

+1

P3

23 14 25

+1

+1

+1

P4

24 15 21

+1

-1

-1

P5

25 13 24

+1

+1

+1

34 15 51

+1

-1

-1

35 45 54

+1

-1

+1

10

45 53 14

-1

+1

-1

Dac n seleciile analizate exist i valori identice, deci cu acelai


rang, formula (III.191) se modific sub forma:

K =

12 S

m 2 n 3 n mi =1 t i3 t i
n

(III.193)
semnificatiilor notatiilor fiind aceleai cu cele mentionate anterior:

3.1.3. Coeficieni de asociere

Asocierea caracteristicilor calitative este o problem de importan


deosebit n cercetarea geologic fundamental. Compararea rocilor pe baza
asociatiilor mineralogice, a nivelurilor stratigrafice pe baza speciilor fosile
determinate, a zcmintelor pe baza caracteristicilor petrografice, toate

19

Modele cantitative statistice

Daniel Scrdeanu

solicit existenta unui instrument pentru ierarhizarea asocierii caracteristicilor


calitative functie de intensitatea ei. Aproape jumtate din datele obtinute prin
prospectiune i explorare geologic sunt de natur calitativ i ignorarea
acestora n etapa de analiz corelaional echivaleaz cu pierderea
contactului cu ambianta geologic a fenomenului studiat.
Coeficienii de asociere permit descrierea cantitativ a celor dou tipuri
de relatii fundamentale ce se stabilesc ntre dou caracteristici calitative A i B
(ex.: A=tipul petrografic: granit, dacit, bazalt etc.; B=caracterul mineralogic:
ortoz, albit, olivin etc.): independenta i asocierea .
Independenta a dou caracteristici calitative A i B este exprimat
cantitativ prin identificarea aceleiai proportii de elemente A, att printre
elementele B ct i nonB. Exprimat prin intermediul frecventelor de grup,
forma clasic a criteriului de independent pentru cele dou caracteristici A i
B este:

( AB ) = ( A )
(B )

(III.194)
Pentru identificarea comod a independentei, indiferent de forma n
care au fost sistematizate datele din cele N puncte de probare, criteriul
exprimat prin relaia (III.194) poate fi formulat n diferite variante echivalente :

( AB ) = ( A)
(B ) N
(III.195)

( AB ) = (B )
( A) N
(III.196)

( AB ) = ( A)(B )
N

(III.197)

( AB ) = ( A) (B )
N

N N

(III.198)

20

Modele cantitative statistice


Ecuaia

(III.198)

Daniel Scrdeanu
exprim

simbolic

regula

fundamental

independentei:
"Dac caracteristicile calitative A i B sunt independente, proportia
elementelor ( AB ) este egal cu proportia elementelor A nmultit cu proportia
elementelor B."
Asocierea exprim existenta unei legturi ntre caracteristicile calitative,
iar functie de sensul, intensitatea i numrul de variabile implicate poate fi:
pozitiv sau negativ, complet sau incomplet, total sau partial.
Asocierea pozitiv a dou caracteristici A i B atrage cresterea
numrului de elemente B o dat cu cresterea numrului de elemente A i este
exprimat de inegalitatea:

( AB ) > ( A)(B )
N

(III.199)
Asocierea negativ, opus celei pozitive, exprim dezasocierea
caracteristicilor comparate, adic reducerea numrului de elemente B
proportional cu cresterea numrului de elemente A, i este exprimat de
inegalitatea:

( AB ) < ( A)(B )
N

(III.200)
Proporional

cu

creterea

intensitii

legturii

ntre

cele

dou

caracteristici calitative implicate, asocierea pozitiv i negativ tind s devin


complete ((A)=(B) - asociere complet; (AB)=0 dezasociere = asociere
negativ complet).
Analiza corelaional a unui sistem geologic, fie el bazin de
sedimentare, zcmnt polimetalic sau de petrol, implic n mod obligatoriu
studiul simultan al mai multor variabile calitative. Numai din considerente
operationale, n anumite etape ale prelucrrii datelor se ignor ansamblul de
corelaii, lunndu-se n considerare numai informatiile referitoare la dou
caracteristici calitative A i B, definindu-se asocierea total ntre acestea.
Definirea asocierii totale, presupune ipoteza c n sistemul studiat nu exist o
alt variabil care s condiioneze variabilele luate n studiu.

21

Modele cantitative statistice

Daniel Scrdeanu

Pentru cuantificarea intensittii asocierii, presupuse totale, se utilizeaz


n mod uzual coeficientul de asociere ( Q ), coeficientul de interdependent
( Y ) i coeficientul de corelaie calitativ ( rAB ).

a) Coeficientul de asociere Yule i Kendall

Coeficientul Yule i Kendal, ( Q ),are relaia de definitie:

Q=

( AB )( ) (B )( A )
( AB )( ) + (B )( A )

(III.201)
Coeficientul de asociere Q este zero cnd cele dou caracteristici A i
B sunt independente, +1 cnd exist asociere pozitiv complet i -1 cnd
cele dou caracteristici sunt dezasociate (= asociere complet negativ).
Coeficientul de asociere Q este independent de proportiile relative ale
elementelor A i n selectia de date, proprietate ce-l face adecvat cazurilor
n care proportiile sunt arbitrare.

b) Coeficientul de interdependen

Coeficientul de interdependen ,( Y ), cu proprieti similare coeficientului de


asociere Q este definit cu relaia:

1
Y=

1+

( A )(B )
( AB )( )
( A )(B )
( AB )( )

(III.202)

22

Modele cantitative statistice

Daniel Scrdeanu

c) Coeficientul de corelaie asociativ

Coeficientul de corelaie asociativ ( rAB ) este definit (Sarapov, 1968)


pe structura coeficientului corelaiei lineare, avnd aceleai proprietti cu
acesta :

rAB =

( AB )( ) ( A )(B )
( A)( )(B )( )

(III.203)
Testarea caracterului total al asocierii caracteristicilor A i B necesit
verificarea influentei unei alte caracteristici C asupra asocierii acestora.
Pentru aceasta se defineste asocierea partial a caracteristicilor A i B n
raport cu C.
Asocierea partial ca i cea total poate fi pozitiv dac se verific
inegalitatea:

( ABC ) > ( AC )(BC )


C

(III.204)
sau negativ dac:

( ABC ) < ( AC )(BC )


C

(III.205)
Prin adaptarea formulelor (III.201), (III.202) i (III.203) se definesc
coeficienii de asociere partial corespunztori:

Q AB.C =

( ABC )(C ) (BC )( AC )


( ABC )(C ) + (BC )( AC )

(III.206)

23

Modele cantitative statistice

Daniel Scrdeanu

1
YAB.C =

1+

( AC )(BC )
( ABC )( C )
( AC )(BC )
( ABC )(C )

(III.207)

rAB.C =

( ABC )(C ) (BC )( AC )


( AC )(C )(BC )(C )

(III.208)
Testarea influentei caracteristicii C asupra asocierii caracteristicilor A i
B se bazeaz pe compararea coeficienilor calculati pentru asociere n raport
att cu caracteristica C ct i cu caracteristica nonC (= ). Egalitatea

Q AB.C = Q AB indic independenta asocierii caracteristicilor A i B n raport cu


caracteristica C, altfel spus, ntre caracteristicile A i B este o asociere total.
Proportional cu cresterea numrului de caracteristici luate n studiu
creste numrul asociatiilor partiale care se pot analiza pentru precizarea
ansamblului de corelaii din sistemul studiat.

3.1.4. Coeficieni de corelaie temporal


n cercetarea ecologic se opereaz frecvent cu serii de valori ale unor
variabile vij ( i = 1,2,3,..., nv ; j = 1,2,3,..., ni ;
H(1) H(3)

nv - numrul de variabile; ni - numrul de

valori pentru fiecare variabil) obtinute


prin determinari realizate la intervale mai
mult sau mai putin egale.
Astfel de serii de valori cunoscute
sub denumirea generic de serii de timp

H(2)

H(4)

H(2)
H(4)

t1 t2 t3 t4
Fig. 62 Serie de timp a nivelurilor
piezometric ale unui acvifer msurate la
piezometrice msurate ntr-un
acvifer freatic
intervale de timp egale (Fig.62),
pot fi constituite din: cote ale nivelului

24

Modele cantitative statistice

Daniel Scrdeanu

NF(2)

X
NF(1)

NF(3)

Y
Fig. 64 Numr de microfosile identificate n puncte de
probare plasate pe o direcie oarecare de probare
succesiunea litologic a unei secvente sedimentare separat n intervale
egale ca grosime (Fig.63), numr de microfosile identificate pe o directie
oarecare de probare (Fig.64).

25

Modele cantitative statistice

a)

v1

Daniel Scrdeanu

v2

b)

v3
t1
t2
t3
.
.
.

tn-1
tn
Fig. 63 Serii de timp rezultate din cercetarea unei
succesiuni sedimentare
a) serie de timp litologic univariat;
b) serie de timp multivariat ( v1 = , v2 = PS ; v3 = )
obinut din diagrafia geofizic complex

Timpul,
ntr-o astfel de

serie de valori sau stri ale procesului studiat este echivalent fie cu grosimea
stratigrafic, fie cu adncimea msurat ntr-un foraj, fie cu distanta de-a
lungul unei directii oarecare din spatiu.
Studiul seriilor de timp beneficiaz de o ampl i sofisticat
metodologie (Tertisco M.et.al.,1985) care nu poate fi utilizat cu eficient
maxim n geologie din dou motive principale:
a)volumul mare de date necesar calculului parametrilor caracteristici analizei
seriilor de timp univariate, cu semnificatie relativ redus n studiul proceselor
geologice complexe, multivariate;
b)complexitatea metodologiei care introduce dificultti de interpretare n
analiza seriilor de timp multivariate, adecvate studiului proceselor geologice
complexe.

a) Formalizarea stocastic a seriilor de timp

26

Modele cantitative statistice

Daniel Scrdeanu

Existenta unui volum minim de date pentru studiul unei serii de timp n
scopul estimrii stocastice a corealtiilor presupune o formalizare care
asociaz caracteristicii studiate (ex.: litologia, nivelul piezometric, numrul de
fosile identificate etc.) o variabil aleatoare de obicei discret (caracterul
discret fiind determinat de modul de colectare a datelor i nu de natura
variabilei studiate), iar continutului variabilei, un ansamblu de stri (ex.: variate
tipuri litologice: calcar, argil, gresie; sensul evolutiei: ascendent, descendent,
constant).
O serie de timp este din punct de vedere formal o succesiune se stri
exclusive, iar instrumentul operational care permite identificarea probabilist a
ponderii componentei deterministe (=corelaionale) a procesului este matricea
de tranzitie.
Matricea de tranzitie sacrific toate informatiile referitoare la pozitia
strilor n secventa de date, n favoarea identificrii tendintei unei stri de a fi
urmat sau precedat de alta.
Exist dou tipuri principale de matrici de tranzitie: matrici de tranzitie
unitar (de un pas) i matrici de tranzitie multipl, fiecare dintre ele putnd fi
exprimate numeric n trei forme diferite: 1) matricea frecventelor de tranzitie,
2) matricea proportiei perechilor de tranzitii, 3) matricea proportiilor de
tranzitie.
1) Matricea frecventelor de tranzitie este format din numrul tranzitiilor de la
o stare la alta determinat pe baza seriei de observatii disponibile.
Pentru seria de n = 31 stri:
ABACDCDABCBADCDCBACABDABCDBACDA
matricea frecventelor celor n 1 = 30 tranzitii ( MFT ) este:

27

Modele cantitative statistice

MFT

Daniel Scrdeanu

TOTAL

TOTAL

A B C D
Total

A
B
MFT =
C
D

0
4

4
0
2
1

3
2
0
3

1
1
5

8
7
8
7

(III.209)
30
Total 8 7 8 7
2) Matricea proporiei perechilor de tranziii ( MPPT ) se obine din MFT prin
divizarea fiecrei valori cu numrul total de tranzitii i exprim ponderea unei
tranzitii n totalul acestora:
A;

B;

C;

D;
Total

A
B
MPPT =
C
D

0,00
0,13

0,03

0,10

0,13
0,00
0,07
0,03

0,10
0,07
0,00
0,10

0,03
0,03
0,17

0,00

0,26
0,23
0,27
0,23

(III.210)

28

Modele cantitative statistice

Daniel Scrdeanu
1,00
Total 0,26 0,23 0,27 0,23

3) Matricea proporiilor de tranziie ( MPT ) exprim proporia n care o stare


poate fi urmat de alta fr a ine seama de ponderea strii iniiale n totalul
acestor tranzitii. Ea se calculeaz prin divizarea fiecrui element dintr-un rnd
al MFT prin suma frecventelor din rndul respectiv.
A

D
Total

A
B
MPT =
C
D

0,000
0,571

0,125

0,428

0,500
0,000
0,250
0,143

0,375
0,286
0,000
0,428

0,125
0,143
0,625

0,000

1,000
1,000
1,000
1,000

(III.211)
Cele trei forme de exprimare ale matricii de tranzitie pot fi construite
pentru o tranzitie unitar cnd procesul studiat opereaz la momente
consecutive, exprimate formal de indicele superscris al probabilittii de
tranzitie de la starea "j" la starea "k".
p (jk1) = P{Vm+1 = k Vm = j}

(III.212)
Pentru o tranzitie multipl ( n pai), probabilitatea de tranzitie de la
starea "j" la starea "k" se scrie:
p (jkn ) = P{Vm+n = k Vm = j}

(III.213)
n cazul n care probabilittile p jk depind numai de pasul n i sunt
independente de pozitia initial "m" (situatie valabil pentru un lan Markov
omogen) matricea de tranzitie multipl se calculeaz pe baza matricilor de
tranziie unitar.

29

Modele cantitative statistice


Relaia de recurent a

Daniel Scrdeanu
prognozei strii sistemului pentru orice

"moment" este:

p ( m ) = p (0 ) P ( m )
(III.214)
n care P (m ) este matricea constituit din probabilittile de tranzitie multipl
p (jkm ) .

Aplicatie.Pentru matricea proportiei de tranzitie unitar:


GRESIE 0,70 0,20 0,10
MPT 1 = ARGILA 0,16 0,50 0,34
CALCAR 0,50 0,25 0,25

se obine prin calcule succesive:

(2 )

MPT 1

0,57 0,27 0,16


= 0,36 0,37 0,27
0,52 0,29 0,11

0,50 0,30 0,20


MPT 1 = 0,50 0,30 0,20
0,50 0,30 0,20
(6 )

(4 )

MPT 1

0,50 0,30 0,20


= 0,48 0,31 0,21
0,50 0,30 0,20

0,50 0,30 0,20


MPT 1 = 0,50 0,30 0,20
0,50 0,30 0,20
(8 )

o matrice de echilibru, care nu se modific peste o anumit valoare a


exponentului i care prin structura numeric exprim intensitatea corelaiilor
care exist n seria de timp analizat.
Pentru exemplificarea modului n care se reflect gradul de
determinare n structura unei matrici de tranzitie prezentm n continuare:
a) matricea unui proces determinist de tipul MPTD:
...ABCDABCDAABCDABCD...
A B C D

B
30

Modele cantitative statistice

A
B
MPTD =
C
D

0
0

1
0
0
0

0
1
0
0

Daniel Scrdeanu

0
0
1

cu exprimarea grafic a tranzitiilor n fig. 65.

b) matricea unui proces aleator de tip MPDA:

...DBABCDCABCABDCDCBCDBAD...

A 0,000
B 0,360
MPDA =
C 0,370

D 0,150

0,390
0,000
0,100
0,460

0,450
0,320
0,000
0,390

0,160
0,320
0,530

0,000

C
Fig. 66 Tranziiile n MPDA

cu exprimarea grafic a tranzitiilor n fig. 66.


La un numr mare de valori ale unei serii de timp aleatoare,
probabilittile devin egale (ex.: P( A B ) = P ( A C ) = P( A D ) = 1 / 3 ) n cazul unui
sistem cu patru stri distincte A,B,C,D). ntre cele dou extreme (model
determinist i aleator) exist o infinitate de variante diferentiate prin
intensitatea corelaiilor.
Descrierea statistic a seriilor de timp este realizat prin patru functii
elementare:

dispersia,

densitatea

de

probabilitate,

coeficientul

de

autocorelaie sau intercorelaie i densitatea spectral. Dac primele dou


sunt utilizate pentru orice variabil cu comportament aleator, ultimele dou
sunt specifice seriilor de timp.

b) Coeficientul de autocorelaie

31

Modele cantitative statistice

Daniel Scrdeanu

Autocovarianta este covarianta a dou realizri ale aceleiai variabile


( V ) care este determinat n dou puncte separate prin intervalul h .
Covarianta, ca o functie de h poate fi scris sub forma:
CV (h ) = E (Vn ,Vn+h ) = lim 1 Vn Vn+h
N

(III.215)
n care

h - "distanta" dintre cele dou valori ( h = 0,1,2,..., N 1 );


N - numrul de valori ale seriei de timp.

Functia de covariant este simetric n jurul valorii zero:

CV ( h ) = CV (h )
(III.216)
iar dac h = 0 covarianta se reduce la dispersie (=variant) i se poate scrie :

CV (0) = var(V ) =

1
N

V
n =1

2
n

(III.217)
Coeficientul de autocorelaie se obine prin divizarea covariantei la
variant i poate fi scris sub forma:

RV (h ) =

CV (h )
CV (0)

(III.218)
Estimatorul coeficientului de corelaie se calculeaz cu relaia:

rV (h ) =

(N h )iN=1h vi vi+h iN=1h vi iN=1h vi+h


(N h ) vi2 ( vi )2 (N h ) vi2+h ( vi+h )2

(III.219)

32

Modele cantitative statistice

Daniel Scrdeanu

Valorile coeficientului de autocorelaie sunt cuprinse n intervalul [ 1,1]


i evident Rv (0) = 1 este valoarea care indic o corelaie maxim. Valoarea

Rv (0) = 1

indic o corelaie maxim invers. Valorile estimate ale

coeficientului de autocorelaie permit identificarea ciclicitilor dintr-o serie de


timp.
Reprezentarea

Rv (h )

grafic

+1

variatiei

coeficientului
Nivel semnificaie
minim

de

autocorelaie n functie de

h poart denumirea de
0

3
1

corelogram (Fig. 67) i

5
4

Nivel semnificaie
minim

-1

h ilustreaz
sintetic

ntr-o

form

semnificatia

statistic a componentelor
ciclice ale seriei studiate.

Fig. 67 Corelograma unei serii de timp

Selectarea

componentelor cu semnificatie statistic se face prin alegerea unui nivel de


semnificatie minim care filtreaz valorile coeficientului de autocorelaie. Intrun model pentru reproducerea i prognoza seriei de timp sunt reprezentate
numai componentele al cror coeficient de autocorelaie depseste nivelul de
semnificatie minim.
Aplicatie. Ca un exemplu simplu se poate calcula corelograma unui proces
geologic de tip markovian descris printr-o matrice de tranzitie. Acest lucru se
poate realiza prin asocierea unei valori numerice fiecrei stri a sistemului .
Pentru un proces cu dou stri distincte, asociind unei stri valoarea
unu i celei de-a doua valoarea zero matricea de tranzitie va fi notat:
p
MPT = 00
p10

p01
p11

33

Modele cantitative statistice

Daniel Scrdeanu

n care p01 , p01 , p10 i p11 sunt probabilittile de tranzitie din sistemul studiat.
Conform relaiei (III.215):
CV (h ) = E (Vn = Vn+h = 1) = P(Vn = 1) P(Vn+h = 1Vn = 1)

i deoarece

P(Vn = 1) = E (Vn ) = p1

n care p0 , p1 sunt probabilittile stabile ale matricii MPT:

CV (h ) = p1 p11h
i

RV (h ) = p11h
Corelograma unui astfel de proces markovian corespunde puterilor
probabilittilor de tranzitie p11 i n general, pentru orice lan markov va fi o
functie simpl de MPT (h ) .
Dac se calculeaz corelograma uni proces aleator "pur" n care

E (Vn ) = 0 , atunci RV (h ) = 0 pentru h = 1,2,3,... avnd un singur maxim de


RV (h ) = 1 pentru h = 0 . Acest lucru este n acord cu definitia unui proces
aleator n care se presupune c nu exist corelaii ntre Vn i Vn+h pentru orice
n i orice h diferit de zero.

U, V
c) Coeficientul de
intercorelaie

Coeficient
ul

intercorelaie

0
Fig. 68 Variaia n timp a dou caracteristici
geologice cu comportament aleator

de

este

utilizat

34

Modele cantitative statistice

Daniel Scrdeanu

pentru evaluarea intensittii corelaiei dintre dou serii de timp ce msoar


variatia a dou variabile disticte U ,V (ex.: U =precipitatiile, V =cota nivelului
piezometric al unui acviferului freatic); U =porozitatea, V =valoarea PS-ului
corespunztor nregistrat ntr-un carotaj etc.) (Fig. 68).

Relaia de calcul pentru coeficientul de intercorelaie este:

rUV (h ) =

(N h )iN=1hViU i+h iN=1hVi iN=1hU i+h


(N h ) vi2 ( vi )2 (N h )U i2+h (U i+ h )2

(III.220)
Domeniul de variatie i semnificatia coeficientului de intercorelaie sunt
analoage cu cele ale coeficientului de autocorelaie. Referindu-se la dou
variabile RUV (0) este identic cu coeficientul lui Pearson i numai n cazul unei
corelaii liniare perfecte ntre U i V va avea valoarea unitar, pozitiv sau
negativ dup cum corelaia este direct respectiv invers.
Corelograma coeficientului de intercorelaie este utilizat n scopul
identificrii periodicittii seriilor de timp multivariate, a decalajelor cu
semnificatie statistic pentru cupluri de dou variabile.
Prin analiza corelaiei dintre variatia precipitatiilor i a nivelului
piezometric din acviferele freatice se poate evalua, spre exemplu, cu ajutorul
coeficientului de intercorelaie, durata de tranzit a apei prin zona de aerare i
implicit vulnerabilitatea la poluare a acviferelor.
***
Att pentru coeficientul de autocorelaie ct i pentru cel de
intercorelaie seriile de timp sunt presupuse lineare i stationare. Dac aceste
condiii nu sunt ndeplinite, evaluarea corelaiilor temporare presupune o
preprocesare care s realizeze:
35

Modele cantitative statistice

Daniel Scrdeanu

a ) linearizarea datelor (prin logaritmare, ridicare la putere, extragerea


rdacinii de un ordin oarecare) sau separarea datelor ntr-un numr oarecare
de subdomenii pe care s se comporte linear;
b) eliminarea tendintelor neperiodice care mascheaz componentele ciclice
ale seriilor de timp. Aceast operatiune se realizeaz prin identificarea
modelului analitic al tendintei i eliminarea ei din datele brute. Evaluarea
coeficienilor se opereaz asupra valorilor "reziduale" (M.Tertisco et.al., 1985).

36

Modele cantitative statistice

Daniel Scrdeanu

3.2. Factorizarea corelaiilor


Rezultat

din

complexitatea

proceselor

ecologice,

necesitatea

identificrii factorilor principali care determin evolutia fenomenelor este


obiectivul final al descrierii multivariate a proceselor ecologice. Unul din cele
mai adaptate instrumente pentru soluionarea acestei probleme este analiza
factorial.
Analiza factorial a fost privit n general ca o metod misterioas de o
mare complexitate. O parte din misterul care o nconjoar provine din bogata
terminologie utilizat. Analiza factorial a fost dezvoltat de psihologii
experimentalisti n anii 1930-1940 i mare parte din terminologie are
semnificatie numai n contextul acestui domeniu.
Obiectivul original al analizei factoriale a fost s dea un sistem corect
de evaluare a inteligentei prin corelarea punctajelor obtinute din diferite teste
relative la abilitatea mental. Este n general acceptat faptul c punctajul dintrun singur test nu poate da o msur real a inteligentei unei persoane. O
persoan bine nzestrat intelectual va obine rezultate mai bune la
majoritatea testelor de inteligent dect o persoan considerat inferioar
mental. Diferentele la testele specifice nu reflect diferentele mentale ci de
educatie, cultur general i circumstantiale, legate de condiiile n care se
desfsoar testele. Psihologii au considerat analiza factorial capabil s
extrag coeficientul corect de evaluare a inteligentei din rezultatele tuturor
testelor chiar dac nici unul dintre aceste teste, individual, nu este capabil s
o fac corect.
Aplicat n cercetri biologice i geologice analiza factorial studiaz
relatiile dintre un numr mare de variabile msurabile, cu scopul evidentierii
unor noi variabile, teoretice, numite factori.
Aceste noi variabile (=teoretice =factori) sunt ntr-un numr mai mic
dect variabilele msurabile i sunt n acelai timp functii lineare de variabilele
msurabile.
Noile variabile sunt astfel stabilite nct s explice ntr-un procent ct
mai mare varianta variabilelor originale. Se caut prin analiza factorial
37

Modele cantitative statistice

Daniel Scrdeanu

gsirea unui numr ct mai mic de factori (=variabile teoretice) care s


exprime variabilitatea observat pin intermediul valorilor msurate.
Variabilitatea rezidual, rmas neexprimat este o pierdere de
informatie compensat prin numrul redus de variabile teoretice cu care se
opereaz n continuare pentru modelarea procesului studiat.
Variabilele teoretice (=factorii) vor putea reflecta fenomene naturale
care sunt la originea variabilittii observate i astfel se vor putea interpreta
ntr-o optic naturalist rezultatele calculelor cantitative.
Fundamentate pe aceleai principii, factorizarea corelaiilor sistemelor
multivariate poate fi abordat prin trei variante ale analizei factoriale: analiza
n componeni principali, analiza factorial R-MOD i analiza factorial QMOD.
Separarea tipurilor de sedimente pe baza variabilittii compozitiei
granulometrice i identificarea fractiunilor caracteristice diferitelor tipuri de
sedimente pot fi realizate prin aplicarea analizei componentilor principali.
Dac se studiaz un corp plutonic, pentru stabilirea numrului factorilor care
condiioneaz distributia elementelor chimice i mineralelor se utilizeaz
analiza factorial R-MOD. Gruparea taxonomic a unui lot de esantioane
prelevate din diferite tipuri de roci (ex.: sienit, monzonit, diorit, quartit, gabrou,
norit, diabaz) pe baza oxizilor continuti (ex.: SiO2, Al2O3, Fe2O3, FeO, MgO,
CaO, Na2O, K2O) se poate realiza printr-o analiz factorial Q-MOD.
Toate variantele analizei factoriale vor fi luate n studiu n acest capitol,
punctul de plecare fiind obligatoriu analiza n componenti principali.
Obiectivul operational al analizei factoriale este interpretarea structurii
matricilor de varian-covarian pentru un ansamblu multivariat de date.
Tehnica utilizat este extragerea valorilor proprii i a vectorilor proprii din
aceste matrici care exprim sintetic ansamblul de relatii dintre variabilele
msurate.

38

Modele cantitative statistice

Daniel Scrdeanu

3.2.1. Valori proprii i vectori proprii


Determinarea valorilor proprii i vectorilor proprii este privit ca fiind
cea mai dificil operatie n algebra matricial. Dificultatea nu const n metoda
de calcul, care nu este mai dificil dect alte procedee matematice, ci n
perceperea semnificatiei acestor instrumente n mod intuitiv.
Pentru o clar percepere a acestor semnificatii vom utiliza o
interpretare geometric deosebit de clar aplicabil matricei coordonatelor a
dou puncte plasate ntr-un spatiu bidimensional i vom interpreta valorile
propprii, vectorii proprii i functiile asociate ca proprietti geometrice ale
aranjamentului acestor puncte.
Aceast abordare ne limiteaz la matrici mici (2X2) dar rezultatele
obtinute pot fi extrapolate la sisteme mai mari chiar dac calculul manual
devine impracticabil. Trebuie notat cu acest prilej c suntem ntr-un domeniu
n care puterea de calcul chiar a celor mai moderne calculatoare deseori este
inadecvat pentru soluionarea problemelor reale.
a) Valori proprii
Considerm sistemul matricial ipotetic:

[A][X ] = [X ]
(III.258)
care formal este similar cu

[A][X ] = [B] n care [B] = [X ]


(III.259)
Ecuaia poate fi rescris sub forma:

([A] [I ])[X ] = [O]


(III.260)

39

Modele cantitative statistice

Daniel Scrdeanu

n care I este matricea identitate.


Pentru matrici [2X2], ecuaia matricial (III.260) poate fi scris sub
forma sistemului:
( A11 )X 1 + A12 X 2 = 0

A21 X 1 + ( A22 )X 2 = 0

(III.261)
Presupunnd c sistemul are i alte soluii dect cea banal
X 1 = X 2 = 0 atunci trebuie ca:

det A I = 0
(III.262)
care prin dezvoltare devine ecuaia:

2 2 ( A11 + A22 ) + A11 A22 A21 A12 = 0


(III.263)
cu dou soluii reale n cazul unei matrici A simetrice.
Aplicatie. Pentru dou puncte P1 (4,8) i P2 (8,4 ) matricea coordonatelor este:

4 8
A=

8 4
iar matricea pentru calculul valorilor proprii

4
A=
8

8
4

Soluiile ecuaiei de gradul doi care rezult prin dezvoltarea


determinantului sunt:

1 = 4 i 2 = 12

40

Modele cantitative statistice

Daniel Scrdeanu

Punctele P1 i P2 pot fi imaginate ca fiind plasate pe conturul unei


elipse al crei centru este plasat n centrul sistemului de referint. Elipsa este
ca o anvelop care cuprinde ambele puncte iar valorile proprii pot fi
interpretate ca semiaxele elipsei. Raportul axelor poate fi o expresie numeric
a gradului de mprstiere a punctelor. Cu ct punctele sunt mai apropiate,
lungimea axelor difer mai mult i elipsa tinde spre o dreapt. Dac cele dou
puncte se afl pe doi vectori perpendiculari elipsa devine cerc.
Ca exemplificare se calculeaz valorile proprii pentru matricile
coordonatelor a dou puncte situate pe dou axe care fac un unghi de: a)
90o; b) 45o; c) 30o; d) 0o (Fig. 69).
P1
4 8
P ; a) 8 4

2
4 8
4 8

4 8
b)

8 4

6 8
c)

8 6

a)
1 = 8,95
1 = 12
2 = 8,95

b)
1 = 12

c)
1 = 14

d)

2 = 4

2 = 2

2 = 0

y
O

P2(-4;8)

y
P2(4;8)
P1(8;4) O

O
O

d)

y
P1(6;8)

O
P1(8;4)
x

O
O

P(4;8)

P2(8;6)
x

O;O

Fig. 69 Semnificaia geometric a valorilor proprii i vectorilor proprii


Ca regul de verificare a corectitudinii calculului valorilor proprii se
retine c suma valorilor proprii este egal cu urma matricii initiale (suma
valorilor de pe diagonala principal).
Valorile proprii reprezint lungimile celor dou semiaxe ale elipsei pe
care sunt plasate cele dou puncte sau, generaliznd, la "n" dimensiuni, "n"
semiaxe ale elipsoidului care nglobeaz toate punctele ntr-un spatiu cu "n"
dimensiuni.

41

Modele cantitative statistice

Daniel Scrdeanu

b) Vectori proprii
Revenind la ecuaia

([A] [I ])[X ] = [O] ,

dac dup calculul valorilor

proprii acestea sunt utilizate pentru calculul soluiei nebanale, se obin vectorii
proprii ai matricii iniiale.
Pentru matricea [2X2] dezvoltnd ecuaia (III.260) se obine:
A11
A
21

A12 X 1 0

=
A22 X 2 0

(III.264)
Vectorul

[X 1 , X 2 ]

se numeste vector propriu (=caracteristic proprie

=caracteristic latent =vector principal) asociat valorii proprii.


Pentru a concluziona relativ la partea operational, trebuie mentionat
c pentru a afla vectorii proprii i valorile proprii ale unei matrici [n n ] trebuie
s-i gsim determinantul, rdcinile ecuaiei polinomiale caracteristice i s
soluionm un set de n ecuaii cu n necunoscute.
Aplicatie. Revenind pentru interpretare la matricea

4 8
A=

8 4
ecuaia de calcul pentru vectorul propriu al valorii proprii 1 = 12 este:
8 X 1 0
4 12

=
8
4 12 X 2 0

cu soluia
X 1 1
X = 1
2

Pentru ecuaie exist o infinitate de vectori proprii pentru c sistemul


este satisfcut de

42

Modele cantitative statistice

Daniel Scrdeanu
X1
1
X = 1

unde este o constant oarecare. Practic este insuficient s ne limitm la

= 1 deoarece, aa cum se va vedea, suntem interesai de valorile


rapoartelor dintre elementele vectorului care nu se schimb prin multiplicare
cu o constant.
Pentru cea de-a doua valoare proprie 2 = 4 , soluia pentru al doilea
vector propriu este:
X1
1
X = 1

2

Revenind la figura 69, vectorii proprii pot fi interpretati ca pantele celor


dou axe ale elipsei. Primul vector propriu defineste bisectoarea unghiului
determinat de cele dou puncte i centrul elipsei i a crei lungime este egal
cu prima valoare proprie ( 1 = 12 ), iar ce-l de-al doilea vector propriu definete
axa ortogonal cu prima.
De retinut c matricile simetrice au toate valori proprii reale iar vectorii
proprii corespondenti sunt ortogonali.

3.2.2. Standardizarea

Analiza factorial este deseori confruntat cu interpretarea unei matrici


de varian-covarian obtinut dintr-o colectie de caracteristici geologice
exprimate n unitti de msur diferite.
Valorile exprimate n unitti de msur diferite nu pot fi comparate
direct necesitnd o transformare a datelor originale prin standardizare.
Standardizarea se realizeaz prin extragerea din fiecare valoare
original a valorii medii a variabilei i divizarea diferentei prin abaterea
standard. Se obine astfel un nou set de valori cu media zero i dispersia unu
.
43

Modele cantitative statistice

Daniel Scrdeanu

Standardizarea permite compararea variabilelor exprimate n unitti de


msur diferite, altfel spus permite compararea "merelor" cu "perele".
Dac se opereaz cu matricea de corelaie a variabilelor studiate, cum
este cazul n analiza factorial Q-MOD sau R-MOD, nu este necesar s se
standardizeze valorile pentru c de fapt matricea de corelaie este matricea
de varian-covarian a datelor standardizate.
Standardizarea poate avea o influent determinant asupra structurii
matricii de variant-covariant i n consecint asupra rezultatelor analizei
factoriale dac amplitudinile de selectie ale variabilelor difer semnificativ i
distributiile sunt puternic asimetrice. Cnd unittile de msur nu difer se
recomand din acest evitarea standardizrii.
Pentru ilustrarea efectului standardizrii s considerm reprezentrile
grafice ale datelor brute (Fig. 70) i ale celor standardizate (Fig. 71) pentru
care au fost calculate separat matricile de covariant, valorile proprii i vectorii
proprii.
Efectul standardizrii este extinderea ambelor variabile pe acelai
interval valoric cu modificarea raportului de mprstiere a valorilor pe cele
dou axe i rotirea axelor principale cu 45o (cu 45o pentru toate matricile
binare i cu valori diferite n cazul matricilor mai mari).
De asemenea, se remarc o reducere slab a variantei de-a
lungul primului vector propriu (de la 96% la 93%), reducere care se
accentueaz proportional cu diferenta dintre domeniile de variatie ale
variabilelor originale.

Tabelul III.32 Elementele de standardizare


Valori nestandardizate
Valori standardizate
MEDIA
m( X 1 ) = 5
m( XS1 ) = 0
m( X 2 ) = 10
m( XS 2 ) = 0
VARIANA
2
s ( X 1 ) = 6,08
s 2 ( XS1 ) = 1
s 2 ( X 2 ) = 27,54
s 2 ( XS 2 ) = 1
MATRICE DE COVARIAN
MATRICE DE CORELAIE
6,08 11,08
1,00 0,86
cov =
R=

11,08 27,54
0,86 1,00
44

Modele cantitative statistice

1 = 32,23 (96% )
2 = 1,39 (4% )
V1 [0,39;0,92]
V2 [0,92;0,39]

Daniel Scrdeanu
VALORI PROPRII

VECTORI PROPRII

1 = 1,86 (93% )
2 = 0,14 (7% )
V1 [0,707;0,707 ]
V2 [ 0,707;0,707]

20

15

1
-2

-1

10

-1

-2
0
0

10

15

20

Fig. 70 Reprezentarea grafic


a datelor nestandardizate

Fig. 71 Reprezentarea grafic a


datelor standardizate

3.2.3. Analiza n componeni principali


Analiza n componenti principali const n transformarea liniar a m
variabile msurabile corelate, n n variabile teoretice care sunt combinatii
linerare ale celor vechi. Fiecare nou variabil este astfel creat nct s
nglobeze ct mai mult din varianta total a datelor originale.
Componentii principali nu sunt altceva dect vectorii proprii ai matricii
de varian-covarian. n calcule nu este implicat nici o ipotez probabilist
sau testare astfel nct A.C.P., strict vorbind, este doar o prelucrare
matematic i nu o procedur statistic. Utilitatea A.C.P. este apreciat dup
performante i nu dup consideratii teoretice.

a) Metodologia de lucru

45

Modele cantitative statistice

Daniel Scrdeanu

Presupunnd c dispunem de o colectie de 25 de exemplare de


brahiopode i msurm pentru fiecare exemplar lungimea X 1 i ltimea X 2
(tabelul III.32) matricea de varian-covarian obinut prin calcul este

20,3 15,60
cov =

15,60 24,10
Reprezentnd grafic aceast matrice, considernd-o ca fiind alctuit
din coordonatele a dou puncte cu abscisele pe prima linie i cu ordonatele
pe a doua, se obine o reprezentare vectorial care exprim grafic corelaia
dintre cele dou variabile X 1 i X 2 (Fig. 72 i 73).
Calculul vectorilor proprii i al valorilor proprii conduc la obinerea
elementelor elipsei ce nglobeaz toate cele 20 de puncte din tabelul III.32:
VectorI = [0,66;0,75], VectorII = [0,75;0,66] cu I = 37,9 i II = 6,5 (Fig. 74).

Tabelul

III.32

Elemente

ale

analizei

componenti principali
VALORILE

VALORILE

DATELE

SELECTIEI

FACTORIZATE

ORDONATE

Nr.

X1

X2

Y1

Y2

X1

X2

3.49

0.92

10

10.14

-3.64

7.72

1.18

9.97

-0.81

10

11.46

-2.14

6.14

3.91

13

14.37

-3.38

12.04

3.32

9.71

3.42

10

11.96

1.43

11

14

16.45

-2.45

10

12

10

11.87

2.84

10

10

46

Modele cantitative statistice

Daniel Scrdeanu

13

11

12

16.28

0.28

11

10

14

12

10

15.44

2.35

12

11

15

12

11

16.19

1.69

12

12

16

13

16

13.11

5.75

13

13

17

13

14

19.1

0.45

13

13

18

13

15

19.85

-0.22

13

13

19

13

17

21.35

-1.54

13

14

20

14

14.52

5.84

14

14

21

15

13

19.68

2.6

15

15

22

17

13

21

4.1

17

17

23

17

17

24

1.45

17

17

24

18

19

26.16

0.87

18

19

25

20

20

28.23

1.7

20

20

Se poate defini variana total a setului de date ca sum a varianelor


individuale i deoarece valorile acestor variane se afl pe diagonala
principal a matricii de varian-covarian ea va fi numeric egal cu urma
acestei matrici i implicit cu suma valorilor proprii ale matricii:
Variana total = 20,3 + 24,1 = 44,4

47

Modele cantitative statistice

Daniel Scrdeanu

30

Var X2

10

Cov X2

Cov X1

20

Var X1
0

10

20

30

Fig. 72 & 73 Reprezentarea grafic a matricii de varian-covarian

Fig. 74 Elipsa definit de variana i covariana datelor din tabelul III.32


La aceast varian total variabila X 1 contribuie cu 20,3/44,4 = 46%
iar X 1 cu 24,1/44,4 = 54%.
Variana total fiind egal cu suma valorilor proprii ale matricii de
varian-covarian rezult c axele elipsei ce nglobeaz toate perechile
( X i , Yi ) reprezint variana total, iar fiecare ax exprim o anumit parte din
ea. Pentru matricea utilizat, axa principal reprezint 37,9/44,4 = 86% din
variana total n timp ce a doua ax, corespunztoare celei de-a doua valori
proprii ( 2 = 6,5 ) 6,5/44,4 = 14%.
Astfel spus, dac msurm variana setului de date de-a lungul primei
axe principale putem reprezenta 86% din totalul varianei totale. Este evident
48

Modele cantitative statistice

Daniel Scrdeanu

c cel putin una din axele principale va fi mai eficient n exprimarea varianei
dect oricare din axele originale i implicit, printre celelalte axe principale se
va gsi una mai puin eficient dect oricare din axele originale.
Dac se realizeaz transformrile liniare de forma:
Y1 (i ) = V11 X 1 (i ) + V12 X 2 (i )Y2 (i ) = V21 X 1 (i ) + V22 X 2 (i )

n care V11 ,V12 ,V21 ,V22 sunt elementele celor doi vectori proprii, se creaz dou
noi variabile factorizate: Y1 care reprezint

37,9/44,4 = 86% i Y2 numai

6,5/44,4 = 14% din variana total (Tabelul III.32)


Deoarece noile variabile proprii Y1 i Y2 sunt msurate de-a lungul
celor doi vectori, ortogonali, corelaia dintre ele va fi zero.
Componentele vectorilor proprii ( V11 ,V12 ,V21 ,V22 ), coeficienii numerici ai
ecuaiilor liniare de generare a noilor variabile sunt ponderile fiecrei variabile
pe un anumit factor (ex.: V11 este ponderea variabilei X 1 pe "factorul" Y1 ).
Dac este obligatoriu din considerente de eficient a prelucrrii datelor
s reducem sistemul nostru la numai o variabil: dac renuntm la una din
variabilele originale X 1 sau X 2 pierdem 46% sau 56% din variana total.
Dac convertim variabilele originale prin proiectarea pe axele componentilor
principali, opernd cu Y1 pstrm 86% din variana total pierznd doar 14%.

b) Influenta covariantei asupra A.C.P.

Eficiena repartizrii varianei totale pe un numr de factori mai mic


dect cel al variabilelor originale este determinat de intensitatea corelaiei
dintre ele.
Pentru exemplificare, n setul de date brute se realizeaz o ordonare i
o randomizare a valorilor (Tabelul III.32). Se obin dou noi serii de 20 de
perechi de valori fiecare cu aceeai varian dar cu covariane diferite.

49

Modele cantitative statistice

Daniel Scrdeanu

Reprezentrile grafice ale celor dou serii de valori ilustreaz n raport


cu seria iniial a valorilor cresterea corelaiei n cazul ordonrii i reducerea
ei n cazul randomizrii (Fig. 75 i 76).

R
ez
ult

X2

X2

ate
le
cal
cul
ulu

X1

X1
Fig. 76 Datele randomizate

Fig. 75 Datele ordonate

i pentru cele dou noi seturi de date conduc la urmtoarele rezultate:


VALORI ORDONATE

VALORI RANDOMIZATE

20,3 21,9
cov =

21,9 24,1

20,3 0,05
cov =

0,05 24,1
VALORI PROPRII

1 = 44,2(99% )

1 = 24,3(54,7% )

2 = 0,2(1% )

2 = 20,1(45,3% )
VECTORI PROPRII

V1 = [0,68;0,74]

V1 = [ 0,22;0,98]

V2 = [0,74;0,68]

V2 = [0,98;0,22]

50

Modele cantitative statistice

Daniel Scrdeanu

Reprezentrile grafice sunt sugestive pentru ilustrarea eficientei cu


care componentii principali pot exprima variana n cele dou cazuri (fig. 77 i
30

30

X2
I

Vector 1

20
10

II
10

20

30

30

X1

Fig. 77 Elipsa valorilor ordonate

Vector 2

Fig. 78 Cercul valorilor randomizate

78).

n cazul valorilor ordonate (Fig. 77), axa principal poate exprima 99%
din variana total, cea de-a doua fiind asa de scurt nct practic este
imposibil de reprezentat grafic. Dac renuntm la ceast a doua component
pierderea de varian a datelor originale este foarte mic.
Se poate reduce deci dimensionalitatea setului de date originale de la
doi la unu prin proiectarea pe prima ax principal cu o pierdere de varian
total de 1%, utiliznd relaia: Y1 (i ) = V11 X 1 (i ) + V12 X 2 (i ) .
In cazul valorilor randomizate (Fig. 78), cele dou valori proprii sunt
practic identice, elipsa devenind cerc. Nici una din axele principale, n aceste
condiii, nu va capta mai bine variana total n comparatie cu variabilele
originale. n aceast situatie A.C.P. nu i gseste utilitatea i factorizarea
corelaiei nu i are obiect, corelaia lipsind ntre variabile.

c) Aplicatie

51

Modele cantitative statistice

Daniel Scrdeanu

Aplicarea analizei n componenti principali este exemplificat prin


separarea tipurilor de sedimente pe baza analizelor granulometrice realizate
pe 50 de probe recoltate din cinci domenii distincte (I, II, II, IV, V) pentru care
s-au determinat apte fractiuni granulometrice ( x1 , x2 , x3 , x4 , x5 , x6 , x7 ).
Calculul matricii de varian-covariant se face pe date originale,
nestandardizate deoarece toate sunt msurate n aceleai unitti de msur.
Deoarece matricea de covariant este supradeterminat (suma tuturor
fractiunilor granulometrice este 100), una din valorile proprii teoretic trebuie s
fie nul. Practic ea va fi foarte mic i nu nul deoarece nu n toate probele
suma fractiunilor componente dau 100 din cauza erorilor de determinare.
Tabelul III.33 Matricea de varian-covarian a celor 7 fraciuni

x3

x5

x4

x6

x7

x1

x2

x1

4,8443

x2

-2,6234

468,848

x3

-0,0011

81,3941

353,1255

x4

-1,5449

-200,2109

-84,6165

130,2741

x5

-0,5972

-84,2597

-73,0435

44,7616

30,4350

x6

-0,3805

-71,2097

-65,5433

34,9927

23,7565

22,4189

x7

-0,0222

-57,8578

-56,1533

23,9136

19,3907

17,967

Tabelul III.34 Valorile proprii ale matricii de variancovarian


Vector

Valoare proprie

Varian total Varian total


cumulat %

659,7759

64,18

64,19

II

318,4384

30,98

95,17

III

35,1959

3,42

98,59

IV

6,7528

0,66

99,25

3,8193

0,37

99,62

VI

2,3763

0,23

99,85

52

Modele cantitative statistice


VII

Daniel Scrdeanu

1,5540

0,15

100,00

Tabelul III.35 Vectori proprii


Var

II

III

IV

VI

VII

x1

-0,0019

0,0039

-0,0689

-0,5829

0,7554

0,2793

0,0818

x2

0,7710

-0,4777

0,3194

0,1885

0,1169

0,1581

0,0326

x3

0,4167

0,8647

0,0531

0,2119

0,1123

0,1294

0,0421

x4

-0,3907

0,0761

0,8844

0,0704

0,0490

0,2280

0,0028

x5

-0,1895

-0,0794

-0,0775

0,6308

0,6255

-0,3240

-0,2401

x6

-0,1618

-0,0813

-0,1629

0,3330

0,0526

0,2510

0,8723

x7

-0,1308

-0,0735

-0,2750

0,2570

-0,0815

0,8107

-0,4146

Pe baza elementelor calculate n tabelele III.33, III.34, III.35 se deduc


elemetele necesare interpretrii.
Primii doi componeni principali acumuleaz 95,17% din variana total,
ncrcarea principal aparinnd fraciunii fine i foarte fine (factorul I: ( x2 ),
( x3 ) i ( x4 ); factorul II: ( x2 ) i ( x3 )).
Diferena dintre cele cinci medii de sedimentare poate fi complet
descris prin numai doi factori principali. Prin reprezentarea variabilelor
transformate n sistemul de referin al factorilor I i II separarea lor este
evident (Fig. 79).

53

Modele cantitative statistice

Daniel Scrdeanu

20

10

-10

-20

II

-30

-40

-50

-60

-70
-70

-50

-30

-10

10

30

I
Fig. 79 Reprezentarea valorilor funcie de factorii I, II

Relaiile de transformare sunt:


1)pentru factorul I:

YI (i ) = 0,0019 X 1 (i ) + 0,7710 X 2 (i ) + 0,4167 X 3 (i ) 0,3907 X 4 (i ) 0,1895 X 5 (i ) 0,1618 X 6 (i ) 0,1308 X 7 (i )


2)pentru factorul II:
YII (i ) = 0,0039 X 1 (i ) 0,4777 X 2 (i ) + 0,8647 X 3 (i ) + 0,0761X 4 (i ) 0,0794 X 5 (i ) 0,0813 X 6 (i ) 0,0735 X 7 (i )
2,25
2,0

Eficiena

1,75

celor

doi

factori poate fi comparat

1,50

cu puterea de separare a

1,25

tipurilor de sedimente pe

1,0

baza medianei i gradului

0,75

de sortare (Fig. 80) sau a

0,5

procentajului de nisip i

0,25

raportului dintre nisip fin i


3

Fig. 80 Separarea funcie de median


(OX) i gradul de sortare (OY)

nisip foarte fin (Fig. 81).


Fiecare din aceste
diagrame sunt aproximativ

la fel de eficiente n separarea tipurilor de sedimente.

54

Modele cantitative statistice

Daniel Scrdeanu

Avantajul A.C.P este implicat de faptul c din analiza ncrcrilor


factorilor pentru fiecare variabil se poate concluziona c sedimentele
analizate pot fi considerate o mixtur de material nisipos i silt argilos.
Aceast observatie sugereaz nu numai un alt mod de a privi sedimentele dar
indic i o posibilitate de reducere a fractiunilor granulometrice la trei,
suficiente pentru a permite separarea clar a celor cinci tipuri de sedimente.

3,5
3,0

Analiza

2,5

componeni
2,0

n
principali

poate fi utilizat n acest

1,5

mod

1,0

eficientei

relative

separarea

tipurilor

de

sedimente

0,5
0

20

40

60

80

100

Fig. 81 Separarea tipurilor de sedimente funcie


de coninutul n nisip (OX) i raportul nisip
fin/nisip foarte fin (OY)

pentru

testarea

altor

coeficieni sau parametri


statistici

(ex.:

media,

mediana, coeficientul de
sortare).

55

Modele cantitative statistice

Daniel Scrdeanu

3.2.4. Analiza factorial R-MOD

n analiza factorial R-MOD (R este simbolul matematic al matricii de


corelaie) relatiile dintre m variabile msurabile sunt privite ca o reflectare a
corelaiei acestora cu p factori necorelai. Presupunerea uzual este c

p < m.
Rezult c variana total are dou componente: una determinat de

p factori comuni i alta individual/specific fiecrei variabile.


Modelul matematic poate fi exprimat sub forma:
p

X j = l jr f r + j
r =1

(III.264)
n care:
f r - factorul comun;

p - numrul de factori;
l jr - ncrcarea factorului r pe variabila j ;

j - variaia aleatoare specific variabilei X j ;


Presupunnd o distributie normal multivariat a variabilelor X j , variana i
covariana formeaz o matrice [m m] ale crei elemente diagonale sunt de
forma:
p

s 2jr = l 2jr + var j


r =1

(III.265)
iar restul elementelor de forma:

56

Modele cantitative statistice

Daniel Scrdeanu
p

cov jk = l jr lkr
r =1

(III.266)
Dac notm matricea varian-covarian cu s 2 , cu L matricea [m p ]

a ncrcrilor factoriale i cu var( j ) matricea diagonal [m m] cu variantele


aleatoare specifice fiecrei variabile, avem relaia:

[s ] = [L] [L] + [var( )]


2

(III.267)
Produsul [L ] [L ]

conduce la o matrice [m m] cu p valori proprii

pozitive i cu vectorii proprii asociai. Dac p = m , matricea var( j ) = 0 i


problema este echivalent cu Analiza n Componeni Principali.
Analiza Factorial cere ca numrul de factori s fie mai mic dect
numrul de variabile i s fie cunoscut nainte de nceperea analizei. Acest
lucru presupune deinerea unor informaii suplimentare fa de datele
numerice ce vor fi prelucrate i din care s rezulte numrul de factori ce
trebuie extrai. Dac p nu este cunoscut, mprtirea variantei ntre factorii
comuni i factorii specifici poate fi rezolvat ntr-un numr practic nelimitat de
variante.

a) Diferenta operational dintre A.C.P. i A.F.R.-MOD

Calculul valorilor proprii i vectorilor proprii n analiza factorial R-MOD


se face plecnd de la matricea de corelaie. Acest lucru implic transformarea
componentelor principale ale vectorilor n factori.
Vectorii proprii obtinuti din matricea de corelaie sunt normalizati (adic
suma ponderilor este unitar) i pentru a putea realiza analiza factorial
trebuie convertit valorea unitar a vectorului ntr-o valoare a crei lungime s
reprezinte valoarea proprie corespunztoare. Acest lucru se face prin
multiplicarea fiecrei componente a vectorului propriu normalizat cu rdcina

57

Modele cantitative statistice

Daniel Scrdeanu

ptrat a valorii proprii corespunztoare. Rezultatul este un factor, adic un


vector care este ponderat proportional cu mrimea varianei totale pe care o
reprezint.
Pentru matricea de corelaie:

1,00 0,86
COV =

0,86 1,00
cu valorile i vectorii proprii:

1 = 1,86 i V1 = [0,707 0,707]


2 = 0,14 i V1 = [ 0,707 0,707]
factorii ce nglobeaz variana ansamblului sunt:

0,707 1,86 0,964


FACTOR1 =
=

0
,
707
1
,
86
0,964

0,707 0,14 0,264


FACTOR 2 =
=

0
,
707
0
,
14

0,264
Verificarea corectitudinii convertirii vectorilor proprii standardizati n
factori se face prin nsumarea ptratelor ponderilor factoriale care trebuie s
fie egale cu valorile proprii:
0,9642 + 0,9642 = 1,86
Primul factor reprezint

(-0,264) 2 + 0,2642 = 0,14


1,86/2,00=93%

din variana total a

variabilelor originale. Din aceast varian 0,9642/1,86=50% este ponderea


variabilei 1 i 0,9642/1,86=50% este ponderea variabilei 2.
Al doilea factor reprezint 0,14/2,0=7% din variana total a datelor cu
(-0,264)2/0,14=50%

pondere pentru prima variabil i 0,2642/0,14=50%

pentru a doua.
Cei doi factori redau 100% din variana total iar scrierea matricial
utilizat pentru exprimarea ponderilor factoriale este:
FACTORI
58

Modele cantitative statistice

Daniel Scrdeanu
I

VARIABILE:

II

1 0,964 0,264
2 0,964 0,264

Prin nsumarea ptratelor ponderilor factoriale pentru fiecare variabil


se obine mrimea total a varianei retinut de factori care poart numele de
comunalitate. Pentru matricea [2 2] luat ca exemplu, comunalittile pentru
ambele variabile sunt unitare:
Variabila 1: h 21 = (0,964) + ( 0,264) = 1
2

Variabila 2: h 2 2 = (0,964 ) + (0,264) = 1


2

Dac numrul factorilor extrai coincide cu numrul variabilelor,


comunalittile sunt egale cu variana original i pentru c se lucreaz cu
variabile standardizate ea va fi egal cu unitatea.
Dac se extrag mai putin de m factori ( m = nr. variabile) comunalittile
vor fi subunitare i vor fi un coeficient al eficientei setului de factori relativ la
exprimarea varianei setului original de date. Spre exemplu, dac se retine
numai primul factor comunalittile matricii factorilor sunt:

h 21 = 0,964 2 = 0,93 pentru variabila 1;


h 2 2 = 0,9642 = 0,93 pentru variabila 2.
Mrimea comunalittii este dependent de numrul de factori alei i
aceasta ridic marile probleme ale analizei factoriale.

b) Cti factori trebuie alei?

Problema alegerii factorilor nu are soluie unic fiind o problem de


optiune:
a) psihologii experimentalisti extrag attia factori ct cere teoria accceptat
pentru studiul esantonului de date;
b) se extrag attia factori ct pot fi reprezentati grafic (2 sau 3);
c) se extrag toti factorii proprii care au valori proprii mai mari ca 1, adic
factorii care contin variane mai mari dect cele ale variabilelor standardizate.
59

Modele cantitative statistice

Daniel Scrdeanu

Dac pentru retinerea unei mari prti din variana total a sistemului
este nevoie de multi factori, modelul analizei factoriale se consider
neadecvat analizei esantionului de date disponibil.

c) Aplicatii

Un exemplu clasic pentru aplicarea analizei factoriale R-MOD este


separarea a 25 prisme rectangulare (Tabelul III.35) dup form i mrime
(cei doi factori) pe baza unui numr de 7 variabile:
X1 = axa lung;
X2 = axa intermediar;
X3 = axa scurt;
X4 = cea mai lung diagonal;
X5 = (raza sferei circumscrise)/(raza sferei nscrise)
X6 = (axa lung +axa intermediar)/(axa scurt)
X7 = (aria total/volumul)
n tabelele III.35b i III.36 sunt prezentate matricea de corelaie, valorile
proprii i matricea vectorilor proprii, pentru prelucrare i interpretare fiind
retinuti doar primii doi factori (corespunztori formei i mrimii) pentru care
valorile proprii corespunztoare sunt supraunitare.
Etapele de prelucrare ale cror rezultate intermediare sunt sintetizate
n tabelele III.35, 36 i 37 sunt:
Tabelul III.35 Dimensiunile a 25 de prisme generate aleator
Nr.crt.

X1

X2

X3

X4

X5

X6

X7

3,760

3,660

0,540

5,275

9,768

13,741

4,782

9,840

9,270

1,510

13,604

9,017

12,668

1,745

8,390

4,920

2,540

10,053

3,956

5,237

1,432

4,940

4,380

1,030

6,678

6,494

9,059

2,807

7,230

2,300

1,770

7,790

4,393

5,374

2,274

60

Modele cantitative statistice

Daniel Scrdeanu

9,460

7,310

1,040

11,999

11,579

16,182

2,415

9,550

5,350

4,250

11,742

2,766

3,509

1,054

4,940

4,520

4,500

8,067

1,793

2,103

1,292

8,210

3,080

2,420

9,097

3,753

4,657

1,719

10

9,410

6,440

5,110

12,495

2,446

3,103

0,914

11

5,900

5,760

1,550

8,388

5,395

7,497

1,973

12

1,660

1,610

1,570

2,799

1,783

2,087

3,716

13

5,510

1,340

1,270

5,808

4,566

5,382

3,427

14

4,690

3,010

2,170

5,983

2,760

3,554

2,013

15

7,120

5,490

3,680

9,716

2,642

3,430

1,189

16

8,590

2,980

1,170

9,170

7,851

9,909

2,616

17

9,730

1,330

1,000

9,871

9,871

11,064

3,704

18

9,640

9,490

1,030

13,567

13,133

18,519

2,354

19

8,740

7,000

3,310

11,675

3,529

4,757

1,119

20

3,270

0,620

0,440

3,357

7,629

8,838

8,389

21

5,510

3,980

1,300

6,924

5,326

7,304

2,403

22

9,030

7,080

2,590

11,762

4,539

6,217

1,276

23

7,570

7,280

7,070

12,662

1,791

2,101

0,822

24

6,220

6,140

4,520

9,842

2,175

2,732

1,089

25

8,590

4,990

1,340

10,022

7,500

10,162

2,130

X4

X5

X6

X7

Tabelul III.35b Matricea de corelaie


Variabilele

X1

X2

X3

X1

1,000

X2

0,580

1,000

X3

0,201

0,364

1,000

X4

0,911

0,834

0,439

1,000

X5

0,283

0,166

-0,704

0,163

1,000

X6

0,287

0,261

-0,681

0,202

0,990

1,000

X7

-0,533

-0,609

-0,649

-0,676

0,427

0,357

1,000

Tabelul III.36 Valorile proprii

61

Modele cantitative statistice

Daniel Scrdeanu

Vector

Valoare proprie

Varian total

Var.cumulat [%]

3,3946

48,4949

48,4949

II

2,805

40,0783

88,5731

III

0,4373

6,2473

94,8204

IV

0,2779

3,9707

98,7911

0,0810

1,1565

99,9476

VI

0,0034

0,0487

99,9963

VII

0,0003

0,0037

100,0000

Tabelul III.37 Vectorii proprii


Variabile

X1

0,4053

X2

IV

VI

VII

-0,2929 -0,6674

0,0888

-0,2267

0,4098

-0,2782

0,4316

-0,2224

0,6980

-0,0338

-0,4366

0,1443

-0,2540

X3

0,3854

0,3559

0,1477

0,6276

0,5121

0,1875

-0,1081

X4

0,4939

-0,2323 -0,1186

0,2103

-0,1054

-0,5878

0,5359

X5

-0,1277

-0,5751

0,0294

0,1108

0,3890

-0,4232 -0,5562

X6

-0,0968

-0,5800

0,1743

-0,0061

0,3549

0,5003

0,4975

X7

-0,4809

-0,1303

0,0176

0,7353

-0,4553

0,0332

0,0489

1.

Calculul

II

ponderilor

III

factorilor

comuni

prin

multiplicarea

ponderilor

normalizate cu radicalul valorilor proprii:


X1

[L]T

X2

X3

X4

X5

X6

X7

FactI 0,747 0,795 0,710 0,910 0,235 0,178 0,886


=

0,971
0,218
FactII 0,491 0,373 0,596 0,389 0,963

2. Calculul comunalitilor prin nsumarea ptratelor ponderilor factoriale


pentru fiecare variabil prin luarea n considerare a primilor doi factori
conduce la:

62

Modele cantitative statistice

Daniel Scrdeanu

0,747 2 + 0,4912 0,798


X 1

X 2
0,771
2
2
0,795 + 0,373

0,7102 + ( 0,596)2 0,860


X 3

2
2
2
H = 0,910 + 0,389 = 0,979 pentru X 4
( 0,235)2 + 0,9632 0,983
X 5

2
2
( 0,178) + 0,971 0,976
X 6
2
( 0,886) + 0,2182 0,833
X 7

3. Calculul varianei reziduale care exprim ponderea componentei specifice


( j ):
l H12 0,202
X 1

X 2

2
l H 2 0,229

l H 32 0,140
X 3

Re z = l H 42 = 0,021 pentru X 4
l H 2 0,017
X 5
5

2
l H 6 0,024
X 6
l H 2 0,167
X 7

Dac sunt retinuti m factori dintr-un set de m variabile matricea de

[ ]

covarian original s 2 poate fi generat prin multiplicarea tuturor perechilor


de ponderi factoriale i nsumarea acestora pentru toti factorii.
Cnd p < m matricea original nu poate fi reprodus exact. Pentru
variabilele j i k covariana reproductibil este dat de relaia:
s 2jk = l j1 lk 1 + l j 2 lk 2 + ... + l jp lkp

(III.268)
n care l j1 este ncrcarea variabilei j pe factorul 1. Notnd cu L matricea
ncrcrilor factoriale rezult c matricea reproductibil pe baza celor p
factori se poate calcula prin:

[s ] = [L] [L]
'2

Reziduul matricii varian-covarian poate fi calculat prin diferenta:

63

Modele cantitative statistice

Daniel Scrdeanu

[s ] [L] [L] = [s
2

rezidual

(III.269)
Analiza factorial este aplicat cu eficient n separarea faciesurilor
calcaroase. Toomey (1966) a determinat pentru calcarele de Leavenworth
(Pensilvanian superior =Carbonifer superior) din nordul regiunii Midcontinet 19
tipuri de constituenti petrografici: calcit spatic, micrit, pellete, trilobiti,
ostracode,

moluste,

brachiopode,

fusulinide,

foraminifere

mobile,

spiculi

de

foraminifere

spongieri,
ncrustate,

echinoderme,
Tubiphytes,

Epimastopore, alge cu structur laminar, granule cu nvelis algal i particule


de schelete necunoscute. Datele au fost determinate n 33 de probe i pe
baza lor au fost delimitate cinci grupuri bine individualizate: grupul fusulinide
calcit, grupul micrit, grupul foraminifere mici, grupul cochilii-briozoare i grupul
granulelor cu nvelis algal, din care primele patru formeaz un cluster cu
coeziunea intern mai mare.
Analiza factorial R-MOD poate fi utilizat pentru separarea cu
eficient maxim i total obiectivitate a tipurilor de crbune pe baza
parametrilor fizico-chimici care se determin n mod clasic: grosime, greutate
specific, cenus, umiditate, substante volatile, sulf, continut n carbon, putere
calorific etc.

3.2.5. Rotatia factorilor


Dei analiza factorial poate reduce dimensionalitatea unei probleme
pentru a o face mai usor de studiat, semnificatia factorilor poate fi dificil de
dedus. Aceast dificultate poate fi determinat de faptul c pozitia a p axe
factoriale ortogonale ntr-un spatiu m dimensional ( p < m ) sunt fortate de

m p axe inutile care de asemenea trebuie plasate ortogonal n spatiul de


probare.

64

Modele cantitative statistice

Daniel Scrdeanu

Deoarece avem nevoie numai de p axe factoriale, dup eliminarea


axelor inutile pare posibil i avantajos s rotim axele factoriale pentru a gsi o
pozitie care s maximizeze variana ncrcrilor factoriale.
Metoda KAISER-VARIMAX are ca obiectiv rotirea fiecrei axe n pozitia
n care proiectia fiecrei variabile s se plaseze n vecintatea extremittii sau
originii sistemului de axe factoriale. Metoda opereaz prin ajustarea
ncrcrilor factoriale astfel nct ele s fie ori aproape de 1 , ori aproape de
zero. n acest mod pentru fiecare factor vor fi cteva ponderi semnificative iar
restul aproximativ nule.
Totui, n unele cazuri, rotirea rigid a axelor prin pstrarea
ortogonalittii nu va mbuntti sau chiar poate conduce la rezultate confuze.
Aceste situatii pot indica o corelare a factorilor (factori oblici) sau neadecvarea
modelului factorial pentru analiza sistemului.
Criteriul VARIMAX implic maximizarea varianei ncrcrilor factoriale.
Se poate defini variana ncrcrilor pe factorul k sub forma:
2

l2 m l2
p j =1 jp2 j =1 jp2
h
h j
j
sk2 =
p2

(III.270)
Cantitatea care trebuie minimizat este:

V = sk2
k =1

(III.271)
Variana este calculat din ncrcrile factoriale l jp care sunt corectate
prin divizarea lor cu comunalitatile h 2j , astfel nct numai partea comun a
varianei

fiecrei

variabile

este

luat

considerare

ndeprtnd

constrngerile impuse de cele m p componente (necesare pentru luarea n


considerare a ntregii variane a sistemului).
Maximizarea varianei implic mrirea domeniului ncrcrilor care
conduce la "extremizarea" ponderilor.

65

Modele cantitative statistice

Daniel Scrdeanu

Rotatia factorilor se face iterativ. Dou axe sunt ajustate simultan


considernd restul axelor stationare. Dup ce toate axele au fost ajustate
procesul este reiterat pn cnd cresterea varianei ncrcrilor la fiecare
iteratie rmne sub o anumita valoare.
Aplicatie. Rotatia axelor cu metoda Varimax. Considerm cazul ponderilor
factoriale pentru cei doi factori utilizati n separarea prismelor (notate cu
1,2,...) pe baza formei i mrimii.
Dup rotatie, pozitia relativ a variabilelor nu se schimb ci numai
raportul fa de axele factoriale. Lungimea vectorilor este functie de proportia
i variana original a fiecarei variabile preluat de axele factoriale. n
56

1,0

1,0

II

1
2

0,5

56

II
7

0,5
1
24

-1,0

-0,5

0,5

1,0

-1,0

-0,5

-0,5

0,5

1,0

-0,5
3

-1,0

-1,0

Fig. 82 ncrcrile factoriale nainte de


Fig. 83 ncrcrile factoriale dup
rotirea axelor
rotirea axelor
exemplul prezentat, cei doi factori prelund 88,59% din variana sistemului,
lungimea vectorilor de pozitie este aproape unitar.
Reprezentarea grafic a proieciilor factoriale (rotite sau nerotite) este
mult mai complicat dect proiectarea pe axele componenilor principali.
Componenii principali sunt transformri liniare i deci putem proiecta datele
originale pe axele principale.
n analiza factorial proiectiile datelor originale (=variabile msurabile)
pe axele factoriale reprezint estimrile contributiilor diferitilor factori asupra
fiecrei observatie (=proba n care se execut determinarea celor m

66

Modele cantitative statistice

Daniel Scrdeanu

variabile). Deoarece factorii nii sunt estimai din aceleai date, calculul
proiectiilor factoriale este un proces circular, iar rezultatele nu sunt unice.
Calculul proieciilor factoriale este esenial pentru studiile geologice.
Pentru explicitarea modului de calcul ne vom referi la setul iniial de date [ X ]
care este o matrice [m n] ( m - numr variabile; n - numr de probe).
n cazul ACP se poate calcula o matrice a proieciilor factoriale [F ] prin
multiplicarea matricii de date [X ] cu matricea ncrcrilor factoriale [L ] :

[X ] [L] = [F ]

(III.272)

Dac reinem p factori, matricea ncrcrilor [L ] va fi [m p ] , iar


matricea proiectiilor va fi [n p ] .
Se tie c variabilele originale nu reprezint numai efectul factorilor
comuni dar au i o component specific ( j ) . Matricea proieciilor calculat n
acest mod va reflecta parial structura covarianei datelor originale, n msura
n care factorii preiau aceast covarian.
Influenta variatiei specifice ( j ) trebuie eliminat pentru realizarea
proieciilor factoriale. Acest lucru se realizeaz prin multiplicarea ecuaiei
(III.273) cu inversul matricii de covarian:

[X ] [s 2 ]1 [L] = [F ']

(III.273)

Deoarece inversarea matricii de covarian este laborioas calculul nu


se realizeaz direct din aceast ecuaie. Se calculeaz n primul rnd
matricea [s ] prin nmultirea matricii ncrcrilor factoriale cu transpusa ei:

[L]T [L] = [S ]
(III.274)
Matricea obtinut se inverseaz i se multiplic cu [L ] obtinndu-se
matricea coeficienilor proiectiilor factoriale [B ] :

[L] [S ]1 = [B]
(III.275)

67

Modele cantitative statistice

Daniel Scrdeanu

Matricea proiectiilor factoriale se obine din produsul cu matricea


datelor originale:

[X ] [B ] = [F ']
(III.276)
Sintetiznd n termenii matricilor ncarcrilor factoriale, operaia se
poate scrie:

[X ] [B ] = [F ']
(III.277)

[X ] [L] [S ]1 = [F ']
(III.278)

[X ] [L] ([L]T [L])

= [F ']

(III.279)
Aceeai procedur este utilizat pentru a obine proieciile factoriale n
cazul axelor rotite sau nerotite. De retinut c matricea [X ] contine variabilele
standardizate i nu pe cele initiale din selectia de valori ca n A.C.P.,
deoarece A.C.P. calculeaz ncrcrile componentilor principali plecnd de la
matricea de varian-covarian n timp ce ncrcrile factoriale se calculeaz
plecnd de la matricea de corelaie.
Problema specificrii numrului de factori p care trebuie retinuti este
critic. Numrul lor afecteaz mrimea matricii reproduse i reziduale,
comunalittile i ncrcrile factoriale specifice ( j ). ncrcrile factoriale
comune nu sunt afectate.
Astfel, dac p = 2 i factorii sunt extrai din datele originale, ncrcrile
pe factorii I i II nu sunt modificate dac se extrage i un al treilea factor.
Totui, dac extragem i rotim doi factori, ponderile factoriale pot fi radical
diferite de cele obtinute dac extragem i rotim trei factori din setul de date.
Cnd sunt extrai doi factori ei nu introduc constrngeri la rotatie ca atunci
cnd sunt extrai trei. Metoda Varimax pstreaz orogonalitatea factorilor.
Exist metode de rotatie a axelor factoriale care nu pstrez
ortogonalitatea, conducnd la rezultate mai uor de prelucrat deoarece se pot
obine mai multe ponderi factoriale extreme. Din punct de vedere interpretativ
apar contradicii cu principiile metodei care presupune c factorii comuni sunt

68

Modele cantitative statistice

Daniel Scrdeanu

necorelai, adic ortogonali. Renunnd la restricia ortogonalitii se admite


intercorelaia dintre factori.
Dac factorii sunt corelai ntre ei, relatiile ntre variabilele originale i
factorii identificati sunt mult mai complexe dect n modelul adoptat deoarece
interactiunile sunt att ntre perechile de variabile ct i ntre perechile de
factori. Prezenta corelaiilor ntre factori conduce la ideea c exist alti
SUPERFACTORI independenti care actioneaz asupra variabilelor msurate
i factorilor comuni separai la primul nivel. Soluiile de rotatie oblic introduc
mai mult subiectivitate n interpretare i trebuie abordate cu mult atenie.

3.2.6. Analiza factorial Q-MOD


Analiza factorial Q-MOD, introdus n geologie de Imbrie i Purdy
(1962), este o a doua form de analiz factorial n care rolul valorilor (sau
probelor) i al variabilelor se schimb. Prin aceast analiz se urmarete
evidenierea corelaiilor dintre probe, avnd ca obiectiv gruparea lor ntr-o
structur dendritic din care s poat fi deduse relaiile dintre ele.
n 1962, cnd au introdus analiza Q-MOD n cercetarea geologic,
Imbrie i Purdy au utilizat-o pentru realizarea unui sistem obiectiv de
clasificare a sedimentelor carbonatice actuale din Great Bahama Bank.
Metoda a mai fost utilizat de Harbaugh i Demirmen (1964) pentru a
discerne limitele de facies din calcarele de Americus.
Primul pas n analiza factorial Q-MOD este crearea unei matrici de
similaritate

[n n]

n care n este numrul de probe n care se face

determinarea diferitelor m caracteristici geologice, calitative sau cantitative.


Msura similaritii poate fi oricare dintre coeficienii de similaritate definii in
capitolul III.2. cu valori cuprinse n intervalul [ 1,+1]. Cel mai utilizat coeficient
de similaritate n analiza Q-MOD este coeficientul cosinus .
Analiza

factorial

Q-MOD

are

ca

obiectiv

identificarea

unui

hiperelipsoid
n-dimensional care este definit prin corelaiile dintre cei n vectori care

69

Modele cantitative statistice

Daniel Scrdeanu

reprezint cele n probe. Fiecare vector este determinat prin cele m variabile
care au fost msurate n fiecare prob i din acest motiv dimensionalitatea
problemei nu depeste numrul variabilelor ( m ).
Al doilea pas este identificarea principalelor axe ale hiperelipsoidului
prin extragerea valorilor i vectorilor proprii. Deoarece vor fi reinute, de
fiecare dat, mai puini factori dect numrul probelor, nu este necesar
extragerea tuturor valorilor i vectorilor proprii, acest lucru reducnd mult din
timpul de calcul.
n al treilea pas se realizeaz maximizarea ncrcrilor factoriale prin
rotaia axelor factoriale. Rotaia axelor se poate face pn ce fiecare factor
coincide cu una din probele ce alctuiesc selecia de date. Pe lng tehnicile
ce pstreaz ortogonalitatea axelor factoriale dup rotaie, analiza factorial
Q-MOD apeleaz i la rotaia ce conduce la oblicitatea axelor factoriale cu
implicaiile semnalate n paragraful anterior.
Aplicaie. Ca un exemplu al aplicrii analizei Q-MOD, prezentm n
continuare o analiz petrografic. Tabelul II.37 conine componenii chimici
majori a 20 de eantioane (1-Sienit, 2-Sienit, 3-Sienit, 4-Monzonit, 5-Diorit, 6Diorit, 7-Diorit, 8-Diorit cuaritic, 9-Gabrou, 10-Gabrou, 11-Norit, 12-Norit, 13Gabrou cu hipersten, 14-Gabrou cu hipersten, 15-Sienit, 16-Sienit cuaritic,
17-Sienit alterat, 18-Monzonit, 19-Monzonit, 20-Diabaz). Prin analiza Q-MOD
se urmrete plasarea ficrei probe n poziia proprie a seriei difereniate de
roci magmatice.
Plasarea probelor n succesiunea fireasc, determinat de compoziia
chimic, se realizeaz prin utilizarea ncrcrilor factoriale ce exprim variana
ansamblului petrografic probat. Deoarece valorile vor fi standardizate, vectorii
definii vor avea lungimi unitare i probele vor fi plasate pe circumferina unui
cerc cu raz unitar. Unghiurile dintre aceti vectori sunt o msur a
similaritii dintre probe. Pentru evaluarea matricii de similaritate, ca rezultat al
primei etape de prelucrare se utilizeaz coeficientul de cos , rezultatul fiind
consemnat n tabelul III.38 (ANEXA 1).

70

Modele cantitative statistice

Daniel Scrdeanu

Identificarea axelor este limitat la primii doi factori care asigur n


etapa final o reprezentare grafic simpl. ncrcrile factoriale pentru fiecare
prob sunt sintetizate n tabelul III.39.
Tabelul III.39 ncrcrile factoriale pentru primii doi factori (I i II)
Proba

II

Proba

II

0,9948

-0,0910

11

0,9833

0,1202

0,9918

-0,1223

12

0,9890

0,1259

0,9958

-0,0587

13

0,9721

0,1719

0,9989

-0,0126

14

0,9561

0,02323

0,9963

-0,0191

15

0,9918

-0,1257

0,9904

0,1188

16

0,9844

-0,1665

0,9959

-0,0838

17

0,9866

0,0783

0,9996

0,0010

18

0,9950

-0,0870

0,9983

0,0204

19

0,9945

-0,0946

10

0,9978

0,0223

20

0,9981

-0,0161

Rotirea axelor prin metoda Varimax maximizeaz variana ncrcrilor


factoriale (Tabel III.40) care permit reprezentarea grafic cea mai sugestiv a
gruprii celor 20 de probe funcie de afinitile lor chimice (Fig. 84).
Tabelul III.40 ncrcrile factoriale dup rotaie (pentru factorii I i II)
Proba

II

h2

Proba

II

h2

0,7851

0,6177

0,9980

11

0,6316

0,7632

0,9814

0,8044

0,5959

0,9986

12

0,6319

0,7712

0,9940

0,7636

0,6418

0,9950

13

0,5879

0,7930

0,9745

0,7342

0,6774

0,9980

14

0,5348

0,8259

0,9681

0,7368

0,6709

0,9929

15

0,8068

0,5904

0,9995

0,6377

0,7671

0,9950

16

0,8295

0,5556

0,9968

0,7809

0,6236

0,9988

17

0,6628

0,7350

0,9796

0,7254

0,6878

0,9993

18

0,7825

0,6207

0,9976

0,7111

0,7009

0,9970

19

0,7873

0,6148

0,9979

10

0,7094

0,7020

0,9960

20

0,7360

0,6744

0,9965

71

Modele cantitative statistice

Daniel Scrdeanu

n final trebuie remarcat c analiza factorial Q-MOD are acelai


obiectiv ca orice analiz a gruprilor ns cu o eficien mai mare datorat
reducerii timpului de calcul, n condiiile n care se apeleaz la mijloacele
automate.
Eficiena metodei este sporit i de faptul c ea este aplicabil i n condiiile
n care matricea de similaritate conine i coeficieni negativi, caz n care
analiza factorial R-MOD nu este utilizabil.
Tabel III.37 Principalii oxizi din 20 de eantioane recoltate dintr-o serie magmatic
Nr.
prob

X1=SiO2 X2=Al2O3 X3=Fe2O3 X4=FeO X5=MgO X6=CaO X7=Na2O X8=K2O

61,7

15,1

2,0

2,3

3,7

4,6

4,4

4,5

58,3

17,9

3,2

1,7

1,5

3,7

5,9

5,3

51,2

17,6

3,5

4,3

3,2

4,5

5,7

4,4

54,4

14,3

3,3

4,1

6,1

7,7

3,4

4,2

58,0

15,7

0,7

2,8

5,0

10,9

3,0

3,2

46,6

15,9

2,9

10,0

7,0

9,6

2,7

0,7

58,0

17,3

2,2

3,8

2,2

4,3

4,3

4,1

55,5

16,5

1,7

4,6

6,7

6,7

3,2

2,5

55,4

15,3

2,7

5,5

5,8

9,9

2,9

1,5

10

55,9

13,5

2,7

5,9

6,5

8,9

2,4

1,7

11

47,2

14,5

1,6

13,8

5,2

8,1

3,1

1,2

12

48,2

18,3

1,3

6,1

10,8

9,4

1,3

0,7

13

44,8

18,8

2,2

4,7

11,3

14,6

0,9

0,1

14

47,0

14,1

0,8

15,0

16,0

2,3

0,4

1,7

15

59,8

17,3

3,6

1,6

1,2

3,8

5,0

5,1

72

Modele cantitative statistice

Daniel Scrdeanu

16

66,2

16,2

2,0

0,2

0,8

1,3

6,5

5,8

17

50,0

9,9

3,5

5,0

11,9

8,3

2,4

5,0

18

57,4

18,5

3,7

2,1

1,7

6,8

4,5

3,7

19

59,8

15,3

3,8

3,3

2,2

3,9

3,0

4,4

20

52,2

18,2

3,3

4,4

4,7

6,5

4,6

1,9

73

Modele cantitative statistice

Daniel Scrdeanu

3.3. Modelarea matematic a corelaiilor substaniale


Exprimarea ntr-o form sintetic a sistemului de corelaii ntre
caracteristicile unui proces este obiectivul final al oricrei cercetri
sistematice. Modelul operational rezultat din formalizarea matematic a
sistemului de corelaii este o constructie intelectual care nlocuieste "vizibilul
complicat" (procesele fizico-chimice studiate) cu "invizibilul" (ecuaii, sisteme
etc.) uor de manevrat.
n funcie de calitatea descrierii (complet sau de tendint), scara
modelului

(atomic,

macroscopic),

caracterul

intrinsec

(determinist,

probabilist, linear, nelinear), structura matematic (algebric, n diferene finite


sau element finit, diferenial) exist o diversitate de modele aplicabile studierii
proceselor geolgice. n continuitate imediat cu demersul statistic de
prelucrare a informatiilor geologice prezentm cea mai simpl modalitate de
formalizare empiric a relaiilor dintre variabilele unui proces geologic
complex: modelarea linear a corelaiilor substaniale.

3.3.1. Model liniar de o singur variabil independent

Cel mai simplu model pentru corelaia ntre dou variabile geologice
este cel liniar, n care se presupune c dependena poate fi descris prin
ecuaia unei drepte:

y = 0 + 1 x + e
(III.277)
n care

y - variabila dependent (= rezultativ);


x - variabila independent (= factorial);

0 , 1 - parametrii modelului;

74

Modele cantitative statistice

Daniel Scrdeanu

e - eroarea de estimare a modelului.

Exist dou modele liniare limit pentru dependena dintre dou


variabile geologice x i y :
a) ambele variabile ( x i y ) sunt afectate de erori ntmpltoare (Fig. 85);
b) variabila independent ( x ) este cunoscut riguros, iar variabila dependent
( y ) este afectat de erori distribuite normal (Fig. 86).
Modelul a) este adecvat studierii corelaiei coninuturilor de Au i Ag
dintr-un zcmnt sau dintre granulozitate i porozitate ntr-un acvifer nisipos,
iar modelul b) se recomand pentru studiul corelaiei ntre adncime ( x ) i
coninutul n Au ( y ) sau ntre adncimea ( x ) i gradul de saturare ( y ) din
zona de aerare a unui acvifer freatic.
Pentru studiul complet al corelaiei liniare ntre dou variabile este
necesar parcurgerea unui numar de patru etape de prelucrare.
a) Reprezentarea grafica

Reprezentarea
grafic

ni

repartiiei

bidimensionale a variabilelor
analizate

este

cea

mai

rapid form de identificare


calitativ

corelaiei.

Ea

analiza
diagrama

existenei
se

trei
de

poate

variante:

mprtiere,

stereograma i dreapta de
corelaie.

y
Fig. 86 Model liniar cu o singur variabil (y)
afectat de erori

75

Modele cantitative statistice

Daniel Scrdeanu

nxy

x2
x1

y1
y2

y
Fig. 85 Model liniar cu ambele variabile (x,y) afectate de erori aleatoare

a)Diagrama de mprtiere
Diagrama de mprtiere este cea mai simpl form de reprezentare
grafic n care utiliznd un sistem de referin rectangular, fiecare pereche de
valori msurat ( xi , yi ) se materializeaz printr-un punct. Se obine n acest
mod o mulime de puncte a crei configuraie geometric sugereaz prezena
9
8
7

PLUMB

6
5
4
3
2
1
0
0

10

12

14

16

18

20

ZINC
Fig. 87 Diagrame de mprtiere

76

Modele cantitative statistice

Daniel Scrdeanu

sau absena corelaiei ntre cele dou variabile (Fig. 87).


Punctele pot avea o distribuie: haotic - corelaia ntre cele dou
variabile fiind nul, concentrat pe o zon alungit rectilinie - corelaia fiind de
tip liniar sau concentrat pe o zon alungit curbilinie, situaie n care se
presupune existena unei corelaii neliniare ntre cele dou variabile.
Diagrama de corelaie poate fi realizat i cu valori standardizate,
variant recomandat atunci cnd valorile sunt exprimate n uniti de msur
diferite i au amplitudini de selecie disproporionate.
Stereograma
Stereograma este o reprezentare tridimensional care se bazeaz pe
gruparea bidimensional a valorilor celor dou variabile dup aranjarea n
ordine cresctoare a variabilei independente. Intervalele de grupare care
formeaz compartimentele tabelului de corelaie (Tabel III.41), pentru ambele
variabile se stabilesc dup aceleai criterii ca cele stabilite pentru descrierea
univariat.
Tabelul III.41 Tabel de corelaie pentru dou variabile ( x, y )
y1

y2

...

yk

...

yn

x1

nx1 y1

nx1 y2

...

nx1 yk

...

nx1

x2

nx2 y1

nx2 y2

...

nx2 yk

...

nx2

...

...

...

...

...

...

...

xl

nxl y1

nxl y2

...

nxl yk

...

nxl

xy

n y1

n y2

...

n yk

...

y
x

n tabelul de corelaie apar trei tipuri de frecvene:


1) frecvena valorilor perechi ( nxi yi ) reprezint numrul de perechi pentru
fiecare interval de grupare.
2) frecvene pariale dup variabila X ( nxi ) care reprezint numrul de valori
ale variabilei Y

corespunztoare unei valori xi sau valorii centrale a


77

Modele cantitative statistice

Daniel Scrdeanu

intervalului i, xci , care se calculeaz nsumnd frecventele perechilor de valori


de pe un rnd al tabelului III.41.
k

nxi = nxi y j

(i = 1,2,..., l )

j =1

(III.278)
3) frecvenele pariale dup variabila Y ( n yi ) se evalueaz n mod analog pe
coloanele tabelului III.41.
l

n yi = nx j yi

(i = 1,2,..., k )

j =1

(III.279)
Stereograma se obine prin construirea pentru fiecare compartiment al
tabelului de corelaie a unui paralelipiped avnd nlimea proporional cu
frecvenele perechilor de valori. Suprafaa care mbrac stereograma poart
denumirea de suprafa de frecven i ofer o imagine global a corelaiei
ntre cele dou variabile ntr-un spatiu tridimensional.
Dreapta de corelaie
Dreapta de corelaie reprezint grafic tendina pe care o urmeaz
media unei variabile n comparaie cu valorile celeilalte variabile. Se
construiesc dou drepte de corelaie pentru fiecare cuplu de dou variabile
( x, y ):
a) dreapta de corelaie corespunztoare modelului y = f ( x ) n care
pentru fiecare xi se determin i se reprezint valoarea medie (Fig. 89).
b) dreapta de corelaie corespunztoare modelului x = f ( y ) n care
pentru fiecare valoare yi se calculeaz i se reprezint grafic (Fig. 90).

78

Modele cantitative statistice

x1

xk

Daniel Scrdeanu

xk

Linia n jurul creia se grupeaz punctele se numete linie de regresie


i pentru foarte multe caracteristici geologice este rectilinie. Raporturile
spaiale dintre cele dou drepte de regresie ( x = f ( y ) i y = f ( x ) ) exprim
intensitatea corelaiei dintre variabilele analizate:
1) independena, dac cele dou linii de regresie sunt ortogonale (Fig. 91a);
2) dependena total, dac cele dou linii de regresie coincid (Fig. 91b);
3) dependena intermediar, dac cele dou linii de regresie formeaz un
anumit unghi, unghi a crui mrime este invers proporional cu intensitatea
corelaiei (nul cnd unghiul este de 90o).

Cele trei modele de reprezentare grafic a distribuiei bidimensionale a


unui cuplu de variabile geologice exprim doar calitativ intensitatea corelaiei,
care poate fi cuantificat prin intermediul unor parametri.
79

Modele cantitative statistice

Daniel Scrdeanu

b) Evaluarea intensitii corelaiei liniare

Din reprezentrile grafice se pot deduce la nivel calitativ inexistena


corelaiei sau existenta unei corelaii directe sau inverse. Cele dou variabile
sunt corelate direct dac valorile mari ale uneia tind s se asocieze cu cele
mari ale celeilalte. In rocile poroase, porozitatea i permeabilitatea sunt un
exemplu tipic de variabile pozitiv corelate. Dou variabile geologice sunt
corelate negativ dac valorile mari ale uneia tind s se asocieze cu valorile
mici ale celeilalte. Corelaii negative se stabilesc de obicei ntre concentratiile
a dou elemente majore, de exemplu n rocile dolomitice continutul n calciu
este n mod normal corelat negativ cu continutul de magneziu.
Sub aspect cantitativ, intensitatea corelaiei lineare se poate cuantifica
prin intermediul coeficientului de corelaie Pearson i a coeficentului de
corelaie a rangurilor.
a)Coeficientul de corelaie Pearson
Coeficientul de corelaie este cel mai utilizat parametru pentru
cuantificarea intensittii corelaiei liniare a dou variabile i se calculeaz cu
relaia:

= xy
xy

(x m )(y m )
(x m ) (y m )
n

i =1

i =1

i =1

=r

(III.280)
Coeficientul de corelaie ( ) are valori cuprinse ntre -1 i +1, indiferent
de amplitudinea seleciei de date. Valorile extreme ale coeficientului de
corelaie liniar indic o aliniere perfect a punctelor ntr-o diagram de
mprstiere de-a lungul unei drepte fie cu panta pozitiv ( = 1 ; corelaie
pozitiv), fie cu panta negativ ( = 1 ; corelaie negativ.

80

Modele cantitative statistice

Daniel Scrdeanu

Pentru valori r < 1 ( r fiind estimatorul lui ), distribuia punctelor se abate de


la linia dreptei devenind din ce n ce mai difuz cu ct r descrete de la 1
spre 0.
Valoarea coeficientului de corelaie este puternic influentat de
existenta perechilor aberante de puncte. O bun aliniere a ctorva valori
extreme poate creste foarte mult valoarea coeficientului de corelaie pentru
dou variabile slab corelate i invers, o bun corelaie poate fi "distrus" de
slaba aliniere a ctorva valori extreme.
Aplicatie.

Pentru

analiza

corelaiei ntre continuturile n


Au i Ag din zcmntul Cavnic
filonul

80

s-a

evaluat

un

coeficient de corelaie r1 = 0,64


cu luarea n cosiderare a tuturor
valorilor selectiei n care era
inclus i o pereche de valori
afectat de erori de msurare
(Fig. 92). Prin eliminarea acestei singure perechi de valori i recalcularea
coeficientului de corelaie s-a obinut r2 = 0,84 .

Dac relaia dintre dou variabile nu este linear, coeficientul de


corelaie ( r ) poate avea o valoare foarte mic. Din acest motiv este deseori
util s se suplimenteze utilizarea lui cu cea a coeficientului de corelaie a
rangurilor.
b)Coeficientul de corelaie a rangurilor
Coeficientul de corelaie a rangurilor

( r )

se calculeaz aplicnd

formula de calcul a coeficienilor de corelaie Pearson rangurilor valorilor


variabilelor.

81

Modele cantitative statistice

Daniel Scrdeanu

R xy
r =

R x R
y

(R
n

i =1

(R
n

i =1

xi

xi

)(

mRx Ryi mRy

mRx

) (R
2

i =1

yi

mR y

= ri

(III.281)
n care:

Rxi , Ryi - rangul valorii xi respectiv yi ;

R , R - abaterea standard a rangurilor valorilor variabilelor x , respectiv y ;


x

mRx , mRy - media rangurilor valorilor Rx1 ,..., Rx n , respectiv R y1 ,..., Ryn .

O mare diferent ntre r i poate fi deseori determinat de


prezena unei perechi de valori extreme. Spre deosebire de coeficientul de
corelaie ( r ), coeficientul de corelaie a rangurilor ( rr ) nu este att de sensibil
la perechi extreme de valori. O valoare mare a coeficientului de corelaie a
rangurilor i una mic a coeficientului de corelaie Pearson poate fi datorat
faptului c un numr redus de perechi aberante afecteaz buna corelaie a
variabilelor studiate. Dac coeficientul de corelaie a rangurilor este mare i
coeficientul de corelaie Pearson mic este posibil o "mbuntire" fals a
corelaiei prin prezenta ctorva valori extreme bine "aliniate".
Pentru situatia prezentat anterior valorile corespunztoare ale
coeficientului de corelaie a rangurilor sunt: rr1 = 0,80 nainte de eliminarea
valorii extreme i rr2 = 0,79 , eliminarea valorii aberante avand o influenta mult
mai mic asupra coeficientului de corelaie a rangurilor dect asupra
coeficientului de corelaie r .
Diferenta dintre r i rr poate fi revelatoare i asupra altui aspect al
corelaiei ntre cele dou variabile: cel al liniarittii. Dac rr = +1 , adic
rangurile celor dou variabile sunt identice, valorilor mari ale variabilei x le
corespund valori mari ale variabilei y , corelaia are intensitate maxim dar ea
nu este obligatoriu de tip linear. Neliniaritatea corelaiei este evidentiat de
valorile mici ale ale coeficientului de corelaie ( r ).

82

Modele cantitative statistice

Daniel Scrdeanu

c)Testarea adecvrii modelului liniar

Adecvarea unui model liniar este sintetizat n evaluarea semnificatiei


statistice a coeficientului de corelaie care se poate realiza n dou etape
succesive: cea a acceptrii (functie de valoarea calculat) existentei unei
corelaii liniare i cea de evaluare a incertitudinii asupra intensittii acesteia.
Testarea statistic a existentei corelaiei liniare se poate realiza cu
ajutorul testului STUDENT aplicat ipotezelor statistice:
H0 : = 0

H1 : 0

(absenta corelatiei liniare )


( prezenta corelatiei liniare )

Pentru testarea inexistentei corelaiei ( = 0 ) se calculeaz valoarea:

texp = n 2

r
1 r2

(III.282)
care se compar cu valorile repartiiei STUDENT t ( , ) cu = n 2 .
n alternativ texp < t ( , ) se accept ipoteza absenei corelaiei liniare
ntre cele dou variabile. Dac texp > t ( , ) , din punct de vedere statistic se
admite existena unei corelaii liniare ntre cele dou variabile i se trece la
etapa de evaluare a incertitudinii asupra valorii r calculate.
Calculul intervalului de ncredere pentru valoarea coeficientului de
corelaie se poate realiza utiliznd variabila cu repartiie normal propus
de Fisher:

z=

1 1+ r
ln
2 1 r

(III.283)
Pentru calculul intervalului de ncredere al coeficientului de corelaie
( ) se utilizeaz relaiile:

rinf =

e 2 z1 1
e 2 z1 1

<
<
r
=
sup
e 2 z2 + 1
e 2 z2 + 1

(III.284)
n care:
z1 = z nps z

(III.285)

83

Modele cantitative statistice

Daniel Scrdeanu
z2 = z + nps z

(III.286)

np - argumentul funciei inverse Laplace ( 1 ) pentru o anume probabilitate


( p ) de verificare a ipotezei testate.

sz =

1
- abaterea standard a variabilei z .
n3
Pe baza abaterii standard a coeficientului de corelaie
sr =

1 r2
n

(III.287)
intervalul de ncredere al coeficientului de corelaie pentru o probabilitate p
se calculeaz cu relaia:
1 r2
1 r2
r np
< < r + np
n
n

(III.288)

d) Parametrii modelului

Evaluarea parametrilor modelului statistic liniar parcurge cele dou


etape clasice de calcul al parametrilor pe baza eantionului de date
disponibile i de evaluare a incertitudinii acestor parametri.
a) Calculul parametrilor
Calculul parametrilor a0 i a1 ca estimaii de selecie ale parametrilor
( 0 i 1 ) se realizeaz prin metoda celor mai mici ptrate care const n
minimizarea sumei ptratelor abaterii valorilor seleciei de la ecuaia general.
Notnd suma ptratelor abaterilor de la modelul liniar:
n

SPA = [ yi (a0 a1 xi )]

i =1

(III.289)
prin derivare n raport cu a0 i a1 se obine sistemul de ecuaii normale
84

Modele cantitative statistice

Daniel Scrdeanu

n
n

+
=
a
r
a
x
yi

1 i
0

i =1
i =1
n
n
n
2
a
0 xi + a1 xi = xi yi
i=1
i =1
i =1

(III.290)
Prin rezolvarea sistemului (III.290 ) se obin soluiile:
s xy

a0 = m y s mx

xx

a = s xy
1 s xx

(III.291)
n care:
n

mx - media valorilor variabilei x : mx xi / n


i =1
n

m y - media valorilor variabilei y : mx xi / n

??

i =1

s xy = xi2
i =1

n
1 n
xi yi

n i=1 i=1

(III.292)
1 n
s xx = x xi
n i=1
i =1
n

2
i

(III.293)
b) Evaluarea incertitudinii
Evaluarea intervalului de ncredere pentru parametrii modelului ( , 1 )
se bazeaz pe amploarea fluctuaiilor variabilei

n jurul modelului

determinat de parametrii calculai a0 i a1 :

y2 s y2 =

1 n
(yi my )2

n 1 i=1

(III.294)
Parametrul a0 , ce estimeaz parametrul necunoscut 0 , are o
distribuie N ( 0 , 0 ) n care:

85

Modele cantitative statistice

Daniel Scrdeanu
n

i =1

i =1

2 = y2 xi2 / n ( xi mx )2
0

(III.295)
Variabila:

texp = ( 0 a0 ) / s0
(III.296)
are o distributie t cu = n 2 grade de libertate n care
n
n
2
s20 = s y2 xi2 / n ( xi mx )
i =1
i=1

(III.297)

Pentru un nivel de semnificaie , intervalul de incredere pentru


parametrul 0 se scrie:


a0 t 1 ; s 0 < 0 < a0 + t s0
1 ;
2
2
(III.298)
n condiiile acelorai ipoteze, valoarea 0 nu se accept ca o
estimaie a valorii 0 dac


texp > t 1 ;
2
(III.299)

Parametrul a1 ce estimeaz parametrul necunoscut 1 are o distribuie

N 1 , 1 n care:

= y 2 / ( xi mx )2
1

i=1

(III.300)
Variabila

t exp = (a1 1 ) / s1
(III.301)
are deci o distribuie t cu = n 2 grade de libertate, abaterea standard de
estimaie calculndu-se cu relaia:

n
2
s21 = s y2 / ( xi m x )
i =1

(III.302)
86

Modele cantitative statistice

Daniel Scrdeanu

Intervalul de ncredere pentru parametrul a1 corespunztor unui nivel


de semnificaie este deci:



a1 t 1 ; s1 < 1 < a1 + t 1 ; s1
2
2
(III.303)
n mod analog, valoarea a1 este acceptat ca estimaie a parametrului

1 numai n cazul n care:



t exp < t 1 ;
2
(III.304)

e) Aplicaie

Diagrama de mprtiere pentru masa n stare umed ( M w ) i masa n


stare uscat ( M d ) a depozitelor recoltate din iazul de decantare Baia Sprie
sugereaz o corelaie linear ntre aceti doi parametri (Fig. 93).

340
335
330
325
320
315
310
305
300
295
290
285
280
275
270
265
245

250

255

260

265

270

275

280

285

290

Fig. 93 Diagrama de mprtiere pentru M w i M d

295

300

305

87

Modele cantitative statistice

Daniel Scrdeanu

Pe baza celor 49 de valori prelucrate se vor parcurge n continuare


principalele etape ale obinerii modelului:

Mw = + Md
Realizarea stereogramei evideniaz ntr-un mod sugestiv dou
aspecte determinante pentru strategia aplicrii metodologiei clasice:
- existena unui numr de valori extreme aberante ce trebuie eliminate
naintea evalurilor numerice;
- caracterul normal al repartiiei bidimensionale a variabilelor M w i M d care
asigur interpretarea corect att a valorilor coeficientului de corelaie ct i a
parametrilor modelului.
Intensitatea corelaiei ntre cele dou variabile este evaluat prin
intermediul coeficientului de corelaie:
1) naintea eliminrii valorilor extreme: r1 = 0,32 , valoare care contrazice
flagrant aspectul diagramei de mprtiere i al stereogramei;
2) dup eliminarea a opt valori extreme: r2 = 0,889 .
Testarea adecvrii modelului devine formal la o valoare a
coeficientului de corelaie r2 = 0,889 i ntr-adevr prin calcul se obine:

t ( = 0,05; = 39) = 0,021 < t exp = 12,12


criteriu care confirm din punct de vedere statistic adecvarea modelului linear.
Intervalul de ncredere al coeficientului corelaiei lineare este:

0,81 < < 0,93


Parametrii modelului estimai n condiiile aceleiai precizii sunt:

20,36 < < 40,68 cu estimatorul a = 18,17


0,812 < < 1,217 cu estimatorul b = 0,781
Modelul estimat al corelaiei lineare este deci:

M w = 18,17 + 0,781 M d
Acest model poate fi utilizat cu o bun aproximare pentru deducerea
unuia dintre parametrii pe baza celuilalt reducnd la jumtate efortul de
determinare realizat n laborator pentru depozitele iazului Baia Sprie. Desigur

88

Modele cantitative statistice

Daniel Scrdeanu

c pentru alte amplasamente coeficienii i poate chiar structura modelului vor


fi alii deoarece acest model este un model empiric valabil doar pentru
domeniul valor (valoric??) al seleciei pe baza creia a fost construit.

3.3.2.Model liniar multiplu

Complexitatea proceselor geologice implic frecvent analiza influenei


simultane a mai multor variabile, aparent independente, asupra unei variabile
considerat dependent (rezultativ) de aciunea acestora.
Modelarea linear a cestei corelaii multiple este cea mai simpl soluie
adoptat ntr-o etap preliminar de studiu. Formal ea se exprim prin
ecuaia:

y = 0 + 1 x1 + 2 x2 + ... + n xn + ei
(III.304)
n care:

y - variabila rezultativ (independent);


x1 , x2 ,..., xn - variabilele factoriale;

1 , 2 ,..., n - parametrii modelului;


ei - eroarea de estimare.
Din punct de vedere metodologic, utilizarea acestui model pune dou
probleme specifice aplicrii ei n studiul variabilelor geologice:
1) alegerea variabilei rezultative;
2) stabilirea numrului de variabile factoriale.
Caracterul rezultativ sau factorial al unei variabile poate fi bine precizat
n contextul geologic n care se realizeaz studiul sau rezult dup rularea
tuturor variabilelor sistemului pe poziia variabilei rezultative.
Dac spre exemplu, caracterul rezultativ al cotei nivelului piezometric
ntr-un acvifer freatic, n raport cu variabilele factoriale: precipitaii, grad de
acoperire cu vegetaie, modul de infiltrare i porozitate, pare evident, nu
acelai lucru se poate spune despre analiza corelaiei dintre coninuturile de
Au, Ag, Pb, Zn, Cu dintr-un zcmnt polimetalic. n acest al doilea caz
89

Modele cantitative statistice

Daniel Scrdeanu

stabilirea variabilei rezultative poate fi aleas dup criterii statistice pe baza


valorii maxime a coeficientului corelaiei multiple sau pragmatice, de exemplu,
necesitatea prognozrii coninutului unui anumit metal (Au) funcie de
coninutul celorlalte.
Numrul variabilelor factoriale ale modelului este controlat de criterii
operaionale (capacitatea de prelucrare a instrumentului de calcul) precum i
de necesitile interpretrii rezultatelor. De cele mai multe ori n modelarea
statistic se prefer un numr minim de variabile pentru ca efectele numerice
s nu estompeze caracteristicile intrinseci ale procesului modelat.
Precizarea configuraiei modelului liniar multiplu este obligatoriu s fie
precedat de o analiz factorial care s simplifice i s ierarhizeze la nivel
statistic importana variabilelor n reflectarea ansamblului de corelaii propriu
sistemului studiat.

a) Analiza grafic a corelaiei multiple

Diagrama de mprtiere este singura dintre reprezentrile grafice


utilizate n cazul modelului liniar de o singur variabil independent care
poate fi generalizat pentru cazul a trei dimensiuni, corespunztor unei corelaii
multiple cu dou caracteristici independente i una factorial.
n cazul a trei variabile X 1, X 2 i X 3 , tripletele ( x1, x 2, x3 ) pot fi
considerate ca determinnd un punct ale crei coordonate sunt valorile x1, x 2
i x3 . Reprezentate ntr-un sistem de referin ortogonal, toate punctele vor
forma o mulime cu o anumit dispoziie geometric n raport cu diferite
"suprafee de corelaie". Gruparea punctelor n vecintatea unei astfel de
suprafee poate fi o msur calitativ a intensitii corelaiei ntre cele trei
variabile.
Pentru mai mult de trei variabile, reprezentri grafice care s rezume n
mod sugestiv corelaia ntre variabile nu se poate realiza dect dup prelucrri
speciale de tipul celor prezentate n cadrul analizei factoriale.
Datele brute nu mai pot fi examinate prin aceleai procedee prezentate
la modelul liniar de o singur variabil independent (stereograma, dreapta de
90

Modele cantitative statistice

Daniel Scrdeanu

regresie) dect formnd perechi din variabila rezultativ i fiecare variabil


factorial, metod care ignor ns tocmai efectul ansamblului de intercorelaii
pe care tinde s-l exprime modelul corelaiei multiple.

b) Evaluarea intensitii corelaiei

Calitatea modelului liniar multiplu se evalueaz sub dou aspecte:


a) intensitatea corelaiei ntre variabila rezultativ i toate variabilele factoriale,
cuantificat cu ajutorul raportului corelaiei multiple i coeficientului corelaiei
multiple;
b) intensitatea corelaiei ntre variabila rezultativ i fiecare variabil factorial,
exprimat prin coeficientul de corelaie parial.
a) Raportul corelaiei multiple
Raportul corelaiei multiple se calculeaz cu formula:

(y y

2
*
x1... xn

(y

R y ( x1... xn ) = 1

i =1

i =1

(III.305)
n care

yi - valoarea msurat a variabilei rezultative;


y *x1x 2... xn - valoarea estimat a variabilei rezultative;
y - media valorilor msurate ale variabilei rezultative;
k - numrul de probe n care se msoar cele n variabile.

Valoarea R y ( x 2,..., xn ) depinde deci de raportul dintre dispersia valorilor


determinate pe baza ecuaiei de regresie linear i dispersia valorilor
msurate ale variabilei rezultative. Cu ct valorile msurate se abat mai puin
de la valorile calculate, cu att coeficientul de corelaie are o valoare mai
mare i ca atare corelaia este mai intens.

91

Modele cantitative statistice

Daniel Scrdeanu

Evaluarea intensitii corelaiei multiple


Coeficientul corelaiei multiple ntre variabilele y, x1, x 2,..., xn msoar
gradul de precizie cu care y poate fi reprezentat prin modelul liniar multiplu.
Relaia de calcul a coeficientului corelaiei multiple este:
1 k
a 0 yi + a1 x1i yi + ... + an xni yi yi
n i =1
i =1
i =1
i =1
k

R y ( x1x 2... xn ) =

1 k
y

yi

n i =1
i =1
k

2
i

(III.306)
utilizabil dup evaluarea parametrilor modelului prin intermediul coeficienilor

a0, a1, a 2,..., an .


Coeficientul corelaiei multiple se poate calcula i cu formula:

)(

)(

R y ( x1x 2... xn ) = 1 1 ry21 1 ry22.1 ... 1 ryn2 .12...(n1)

(III.307)
n care ry21 , ry22.1 ,..., ryn2 .12...(n1) sunt coeficienii de corelaie parial.
Dac R y ( x1x 2... xn ) = 1 , variabila rezultativ y poate fi perfect reprezentat
prin modelul liniar multiplu. Se poate demonstra c R y ( x1x 2... xn ) este mai mare
dect coeficientul de corelaie ntre y i orice funcie liniar de x1, x 2,..., xn
diferit de cea din expresia (III.304).
Coeficientul corelaiei multiple este mai mare sau egal cu zero i deci
n mod evident este mai mare (sau egal) dect oricare din coeficienii de
corelaie parial care aparin modelului. Ca o consecin a acestui fapt, dac

R y ( x1x 2... xn ) = 0 toi coeficienii de corelaie referitori la y sunt zero i deci y


este independent fa de toate variabilele factoriale ale modelului.

Coeficienii de corelaie partial


Coeficienii de corelaie parial exprim intensitatea corelaiei ntre
variabila rezultativ ( y ) i o variabil factorial oarecare ( x1, x 2,..., xn ) cnd
restul variabilelor modelului rmn constante.

92

Modele cantitative statistice

Daniel Scrdeanu

Pentru un model liniar multiplu cu n variabile calculul coeficienilor de


corelaie parial se face funcie de coeficienii de ordin inferior cu relaia de
recuren:
ry1.23...n =

ry1.23...(n1) ryn.23...(n1) r1n.23...(n1)

(1 r

2
yn.23...( n 1)

)(1 r

2
1n.23...( n 1)

(III.308)
Pentru un model liniar cu dou variabile independente:

y = a 0 + a1x1 + a 2 x 2
(III.309)
aplicnd formula (III.308) se obine relaia de calcul a coeficientului corelaiei
pariale ntre y i x1 :

ry1.2 =

ry1 ry 2 r12

(1 r )(1 r )
2
y2

2
12

(III.310)
n care ry1 , ry 2 i r12 sunt coeficienii de corelaie binar calculai cu formula
(III.280) utilizat pentru evaluarea intensitii modelului liniar cu o singur
variabil independent.
Coeficienii corelaiei pariale au valori cuprinse ntre -1 i +1
semnificaia fiind cea a coeficientului de corelaie Pearson analizat n detaliu
la paragraful IV.2.1.

c) Testarea adecvrii modelului liniar multiplu

Adecvarea modelului liniar multiplu este condiionat de semnificaia


statistic a coeficientului corelaiei multiple.
Pentru modelul liniar multiplu, suma ptratelor abaterilor valorilor
observate ale lui y fa de media lor este egal prin definiie cu
k s y2

(III.311)
avnd = k 1 grade de libertate i dou componente:

93

Modele cantitative statistice

Daniel Scrdeanu

a) suma ptratelor abaterilor valorilor msurate fa de cele date de ecuaia


modelului i care este egal cu:

k s y2 1 R y2( x1x 2... xn )

(III.312)
cu k n grade de libertate;
b) suma ptratelor abaterilor valorilor calculate prin ecuaia modelului fa de
media valorilor msurate:
k s y2 R y2( x1x 2... xn )

(III.313)
cu n 1 grade de libertate.
Dac y (valoarea msurat) i y * (valoarea estimat prin model) sunt
complet necorelate, abaterile lui y fa de valorile modelului ( y * ), vor fi
independente de abaterile valorilor calculate fa de media valorilor msurate
i deci dispersiile celor dou componente vor fi practic identice ( R = 0 ).
Testarea semnificaiei statistice a diferenei celor dou componente
poate fi realizatat cu ajutorul repartiiei Z calculnd factorul experimental:
R y2( x1x 2... xn )
k n
1
Z exp = ln

2
z 1 R y ( x1x 2... xn ) n 1

(III.314)
cu = n 1 i 2 = k = n grade de libertate.
Dac

Z exp < Z ( , 1 , 2 )
(III.315)
valoarea coeficientului de corelaie R y ( x1x 2,..., xn ) este nesemnificativ i modelul
liniar multiplu nu este adecvat modelrii corelaiei ntre n + 1 variabile.
n caz contrar, din punct de vedere statistic, corespunztor nivelului de
semnificaie ales, modelul liniar multiplu este adecvat modelrii relaiei ntre
variabila rezultativ ( y ) i variabilele factoriale: x1, x 2,..., xn .
Semnificaia coeficientului corelaiei multiple este puternic afectat de
numrul de valori disponibile ( k ) i numrul de variabile ale modelului ( n ). n
cazul limit n care numrul de variabile este egal cu numrul de observaii

94

Modele cantitative statistice

Daniel Scrdeanu

disponibile, toate corelaiile pariale de cel mai ridicat grad posibil vor fi egale
cu valoarea unitar i n consecin R va indica o corelaie total indiferent de
ansamblul real de corelaii din sistemul studiat.

d) Parametrii modelului

Evaluarea parametrilor modelului corelaiei multiple parcurge aceleai


dou etape cu cele prezentate n paragraful precedent pentru modelul liniar
cu o singur variabil independent.
Calculul parametrilor
Evaluarea parametrilor a0, a1,..., an se face prin aplicarea modelului

y = a0 + a1x1 + a1x 2 + ... + anxn


(III.316)
n mod analog cu procedeul aplicat modelului liniar de o singur
variabil independent se minimizeaz suma abaterii ptratelor:
k

SPA = [ yi (a 0 + a1x1i + a 2 x 2 i + ... + anxni )]

i =1

(III.317)
prin derivare n raport cu a0, a1,..., an obinndu-se sistemele :
k
SPA
[ yi (a0 + a1x1i + ... + anxni )]2 = 0
2
=

a 0
i =1

k
SPA
2
= 2 x1i [ yi (a0 + a1x1i + ... + anxni )] = 0

i =1
a1
k
SPA
2
= 2 xni [ yi (a0 + a1x1i + ... + anxni )] = 0

i =1
an

(III.318)

95

Modele cantitative statistice

Daniel Scrdeanu

k
k
k

a
0
k
a
1
x
1
...
an
xn
yi
+
+
+
=

i
i

i =1
i =1
i =1

k
k
k
k
2
a
0
x
1
a
1
x
1
...
an
xn
x
1
x1yi
+
+
+
=

i
i
=
1
=
1
=
1
=
1
i
i
i
i

k
k
k
k
2
a
0
xn
a
1
x
1
xn
...
an
xn
xnyi
+
+
+
=

i
i
i =1
i =1
i =1
i =1

(III.319)
prin a cror rezolvare se obin valorile parametrilor.
Fiecare dintre parametrii modelului ( a1, a 2,..., an ) reprezint variaia
medie a variabilei rezultative ( y ) corespunztoare unei variaii unitare a
variabilei factoriale, considerndu-le pe celelalte constante.
Termenul liber ( a 0 ) reprezint nivelul de referin al variabilei
rezultative fr a avea o semnificaie geologic precizat.
b) Evaluarea incertitudinii
Pentru parametrii modelului corelaiei multiple intervalul de ncredere
se evalueaz pe baza inegalitii:
a j t ( , )

s yyi
n

< j < a j + t ( , )

s yyi
n

(III.320)
pentru coeficienii variabilelor factoriale ( j = 1,2,..., n ) iar pentru termenul liber
pe baza inegalitii:
a0 t ( , )

s yyi
n

< 0 < a0 + t ( , )

s yyi
n

(III.321)
n care

s yyi - abaterea medie ptratic a valorilor observate fa de valorile calculate


prin model:

(y
k

s yyi =

i =1

yi*

k n 1

(III.321)
s a j - abaterea standard introdus de fiecare variabil factorial:

96

Modele cantitative statistice

Daniel Scrdeanu

sa j =

s yyi

(x
k

i =1

ij

m xj )

(III.322)

e) Aplicatie

Dintr-un acvifer freatic s-a exploatat pe o perioad de 10 ani un debit


ce variaz de la 1000 la 6000 m3/zi. Acviferul este alimentat prin infiltraii
rezultate din precipitaii care n zon au valoarea medie de 350 mm/an.
Pentru optimizarea regimului de funcionare a forajelor de drenaj s-a
elaborat un model statistic de tip linear pe baza valorilor medii lunare ale
debitelor exploatate i precipitaiilor pe perioada 1970 - 1980.
Elaborarea modelului a cuprins trei etape: identificarea variabilelor
modelului, evaluarea parametrilor i evaluarea performanelor.
a) Identificarea variabilelor modelului s-a realizat pe baza corelogramelor
calculate pentru cele dou variabile principale (Q-debit i P-precipitaii). Din
corelogramele calculate se remarc o autocorelare important a debitului de

RQQ

RQP

+1

+1

3
0

-1

-1

Fig. 96 Autocorelograma Q-Q


Fig. 97 Autocorelograma Q-P
exploatare pentru un decalaj de 1 lun i 4 luni (Fig. 96) i o corelare
important ntre precipitaii i debitul de exploatare cu un decalaj de o lun
(Fig. 97).
n aceste condiii modelul identificat optim este de forma:

97

7 t

Modele cantitative statistice

Daniel Scrdeanu

Q(t ) = a0 + a1Q(t 1) + a 2Q(t 4 ) + a3P(t 1)

b) Evaluarea parametrilor modelului prin minimizarea abaterilor a condus la


coeficienii: a 0 = 2077,5; a1 = 0,3299; a 2 = 0,2128; a3 = 0,9648 .
c)

m3
Q
zi

7000

Performanele

modelului exprimate prin


coeficientul

corelaiei

multiple i a coeficienilor
de corelaie parial sunt:
5000

corelaia

total

ntre

QQ(t 1)Q(t 4 )P(t 1) :

R = 0,65

3000

corelaia parial ntre Q


Q(t 1) :

1000
0

1975

1980

rQQ (t 1) = 0,16 ;

corelaia parial ntre Q

Fig. 98 Relaia dintre debitul calculat (modelat)


i
i cel msurat

Q(t 4) :

rQQ (t 4 ) = 0,14 ;
corelaia parial ntre Q i P(t 1) :

rQP (t 1) = 0,63 .

Grafic relaia dintre valorile observate i cele calculate prin model (Fig.
98) exprim o bun adecvare a modelului pentru corelaiile ntre debitul de
exploatare i precipitaii.

Bibliografie
Andrews, D.J.& Hanks, T.C., Scarp degraded by linear diffusion : inverse
solution for age, J.Geophys.Res.90, 10193-208, 1985.
Bailey, N.T.J., The elements of stochastic processes with applications to the
natural sciences, John Wiley & Sons, Inc., New York, 1964.
Berg, P., Poneau, Y.& Vidal, C., Order within chaos, John Wiley and sons,
New York, 1986.
Bomboe, P., Geologie matematic (vol. I, Analiza statistic a datelor

98

Modele cantitative statistice

Daniel Scrdeanu

geologice), Editura Universittii din Bucuresti, 1979.


Brown, S.R., A note on the description of surface roughness using fractal
dimension, Geophys. Res. Lett. 14, 1095-8, 1987.
Cennini, C., Tratatul de pictur, Ed.Meridiane, 1977.
Chauvet, P., Aide memoire de Geostatistique Lineare, Fascicule 2, Cahiers de
Geostatistique, Centre de Geostatistique, Ecole de Mines de Paris, 1991.
Cheeney, R.F., Statistical methods in geology, George Allen & Unwin
(publishers) Ltd, London, 1983.
Clarke, G.P.Y. and Dane, J.H., A simplified theory of point kriging and its
extension to cokriging and sampling optimization, Bulletin 609, Alabama
Agricultural
Experiment Station, Auburn University, Alabama, february 1991.
Craiu, V., Enache, R., Bsc, O., Teste de concordanta cu programe n
Fortran, Editura stiintific si enciclopedic, Bucuresti, 1986.
Daccord, G. & Lenormand, R., Fractal patterns from chemical dissolution,
Nature 325, 41-3, 1987.
David, M., Handbook of applied advanced geostatistical ore reserve
estimation, Elsevir, Amsterdam, 1988.
David, M., Geostatistical ore reserve estimation, Elsevier, Amsterdam, 1977.
Davis, J. C., and McCullagh, M. J., Display of analysis data, Wiley, New
York, 1975.
Delfiner, P., Matheron, G., Les fonction Aleatoires Intrinseques d'ordre k,Les
Cahiers du Centre de Morphologie Mathematique de Fontainebleau, Ecole de
Mines
de Paris, 1980.
Delhomme, J.P., Les variables regionalisees dans les sciences de l'eau,
B.R.G.M., Deuxieme serie, no4, Section III, Hydrogeologie-geologie de
l'ingeneur,
Paris, 1978.
Deutsch, C.V., Journel, A.G., GSLIB: Geostatistical Software Library, New
York, Oxford University Press, 1992.
Deverle, P., H., Mineral resources appraisal, Calderon Press, Oxford, 1984.
Dick O., Fractalvision : Put fractals to work, Bucuresti, Teora, 1995.
Dubuc, B., Quiniou, J.F., Roques-Carmes, C., Tricot, C. & Zucker, S.W.,
99

Modele cantitative statistice

Daniel Scrdeanu

Evaluating the fractal dimension of profiles, Phys.Rev. A39, 1500-2, 1989.


Fabbri, A.G., Image processing of geological data, New York, Van Nostrand
reinhold Company, 1984.
Fabbri, A.G., and Kasvand, T., Image processing for detection of twodimensional markovian prpperties as functions of distances from crystal
profiles, in
Proc. 3rd European symposium dor stereology , Ljubliana, Yugoslavia, June
22-26,
1981, Stereologia Iugoslavica, v. 3, (suppl. 1),
Fouquet, Ch.De, Simulation conditionnelle de fonctions aleatoires: cas
gaussien stationnaire et schema lineaire, Centre de Geostatistique, Ecole des
mines
de Paris, 1993.
Guillaume, A., Analyse des variables regionalise, Doin Editeur, Paris, 1977.
Hirata, T., Satoh, T. & Ito, K., Fractal structure of spatial distribution of
microfracturing in rock, Geophys. J. Roy. Astron. Doc. 90, 369-74, 1987.
Houlding, S.W., Practical Geostatistics, Modeling and Spatial Analysis,
Springer,-Verlag Berlin Heidelboerg, 2000
Isaaks, E.H., Srivasrava, M.R., Un introduction to Applied Geostatistics,
New York, Oxford University Press, 1989.
Journel, A.G., Huijbregts, Ch.J., Mining Geostatistics, Academic Press,
London, 1978.
Journel, A.G., Exploitation des mines.Guide pratique de geostatistique, Ecole
des mines d'Ales, 1975.
Kasvand, T., Fabbri, A.G. and Nel, L.D., Digitization and processing of large
regional geological maps, Nat. Res. Council Can., Elec. Eng. Division, Report,
ERB938, 1981.
Kecs, W., Complemente de matematic cu aplicatii n tehnic, Editura
tehnic,
Bucuresti, 1989.
Kruhl, J.H., Fractals and dynamic systems in geoscience, Springler-Verlag,
Berlin Heidelberg New York., 1994.
100

Modele cantitative statistice

Daniel Scrdeanu

Laffite, P., Trait dinformatique gologique, Masson et Cie Editeurs, Paris.


Marsily, G.De, Quantitative Hydrogeology, New York, London, Academic
Press,INC, 1986.
Matheron, G., Traite de Geostatistique Appliquee, (tome I), Technip, Paris,
1976.
Matheron, G., Traite de Geostatistique Appliquee, (tome II), Technip, Paris,
1963.
Matheron, G., La theorie des variables rgionnalises, et ses applications,
Les Cahiers du Centre de Morphologie Mathematique de Fontainebleau,
Fascicule 5,
Ecole de Mines de Paris, 1970.
Matheron, G., Le ch oix des modles en gostatistique, in Advanced
Geostatistics for mining industry., Guaracio et al., Reidel, 1976.
Matheron, G., Estimer et choisir, Les Cahiers du Centre de Morphologie
Mathematique de Fontainebleau, Fascicule 7, Ecole de mines de Paris, 1978.
McCall, J., and Marker, B. (editors), Earth science mapping, Graham
&Trotman, London, 1989.
Mihoc, G.m Bergthaller, C., Urseanu, V., Procese stocastice, Editura
stiintific si enciclopedic, Bucuresti, 1978.
Mont, OL., Lippert, R. H., Spitz, O.T., Fortran IV and map program for
computation and plotting of trend surgfaces degrees 1 through 6, Michigan,
1979.
Murgu,M., Analiza retelelor de explorare si valorificarea optim a
zcmintelor minerale, Tipografia Univ.Bucuresti, 1979.
Onicescu, O., Stefnescu, V., Elemente de statistic informational cu
aplicatii, Editura tehnic, Bucuresti, 1979.
Preston, F.W., and Davis, J.C., Sedimentary porous materials as a realization
of stochastic processes, in Random Processes in Geology, D.R.Merriam, ed.,
Springer-Verlag, New-York, 1976.
Rivoirard, J., Introduction au krigeage disjonctif et a la geostatistique non
lineaire, Centre de Geostatistique, Ecole des mines de Paris, 1991.
Rosenfeld, A., & Kak, A.C., Digital picture processing, Academic press, New
york, 1976.
101

Modele cantitative statistice

Daniel Scrdeanu

Rousseau, J.J., Scrieri despre art, B.P.T., Bucuresti, 1981.


Schwarzacher, W., Sedimentation models and quantitative stratigraphy,
Elsevier scientific publishing company, Amsterdam, 1975.
Scrdeanu, D., Mihnea, G., L'etude de variationes spatiales de grandeurs
hydrogeologique a l'aide du krigeage, Analele Univ.Bucuresti, 1987.
Scrdeanu, D., Optimizarea metodelor de explorare a zcmintelor de lignit,
Tez de doctorat, Univ.Buc, 1993.
Scrdeanu, D., Informatic geologic, Editura Univ.Bucuresti, 1995.
Scrdeanu, D., Modele geostatistice n Hidrogeologie, vol.I, Editura didactic
si Pedagogic, R.A.-Bucuresti, 1996.
Shakeel, A., Estimation des transmissivites des aquifers par methodes
geostatistique mulrivariables et resolution indirecte du probleme inverse,
These
presentee a l'Ecole Nationale Superieure des Mines de Paris, 1987.
Silasi, I., Geostatistic aplicat n cercetarea zcmintelor si evaluarea
rezervelor, Multiplicat n atelierele C.P.P.G. al M.M.P.G.,Bucuresti, 1975.
Srivastava, G. S., Optical processing of structural contour maps, J. Math.
Geol. 9, 1975.
Strang, G., Linear algebra and its applications, Academic Press, New York,
1980.
Teodorescu, D., Modele stohastice optimizate, Editura Academiei R.S.R,
Bucuresti, 1982.
Trescott, P.C. at. al., Finite-difference model for aquifer simulation in two
dimensions with results of nuerical experiments, Geological Survey,
Washington,
1976.
Turcotte D.L., Fractals chaos in geology and geophysics, Cambridge
University Press, 1992.
Wackernagel, H., Cours de geostatistique multivariable, Centre de
Geostatistique, Ecole des mines de Paris, 1993.
Wiener, U., Isaic-Maniu, A., Vod, V., Aplicatii ale retelelor probabiliste n
tehnic, Editura tehnic, Bucuresti, 1983.
Tatarkiewicz,W., Istoria esteticii, Editura meridiane, Bucuresti, 1978.
Zorilescu, D., Prognoza resurselor de materii prime minerale, Editura
102

Modele cantitative statistice

Daniel Scrdeanu

tehnic, Bucuresti, 1975.


Zorilescu, D., Modele operationale ale problemelor miniere, Editura tehnic.
Bucuresti, 1981.
Zorilescu, D., Introducere n geostatistica informational, Editura Academiei,
Bucuresti, 1990.

103