Escolar Documentos
Profissional Documentos
Cultura Documentos
DANIEL SCRADEANU
Daniel Scrdeanu
cantitative
statistice
exprim
interdependeele
dintre
Daniel Scrdeanu
Natura corelaiilor n ecologie este determinat de structura fizicochimic i bilogic a obiectelor de studiu care este constituit dintr-un
ansamblu de variabile care formeaz biotopul i biocenoza. De aici rezult
natura substantial a corelaiilor care se realizeaz pe baza compozitiei
fizice, chimice, pe baza speciilor sau a calittii fizico-chimice a cmpurilor
terestre (magnetic, gravimetric etc).
Ecologia se ocup, de asemenea, cu analiza proceselor ce se
desfsoar n timp i spaiu; n acest fel se completeaz spectrul naturii
corelaiilor ecologice cu trei componente principale:
corelaii substantiale;
corelaii temporale.
coeficieni de autocorelaie
coeficieni de intercorelaie
Daniel Scrdeanu
a) Raportul de corelaie
( y, x )
(III.169)
n care
s y2 - dispersia total a variabilei y n raport cu toti factorii cunoscuti sau
necunoscuti;
s y2( x ) - dispersia condiionat a variabilei y n raport cu variabila x ;
s y20 - dispersia rezidual a variabilei y n raport cu celelalte variabile care-i
Daniel Scrdeanu
n xi
m yxi
var. dependent
n yi
mxyi
var. dependent
x1
n x1
m yx1
y1
n y1
m xy1
x2
y 21 , y 22 ,..., y 2 n 2
nx 2
m yx 2
y2
ny2
m xy 2
xk
y k 1 , y k 2 ,..., y knk
n xk
m yxk
yk
n yk
mxyk
(y
=
k
2
y(x)
2
y
i =1
my )
(III.170)
k 1
i =1
n xi (m yxi m y )
k 1
(III.171)
Daniel Scrdeanu
(x
=
2
x( y )
i =1
mx )
(III.172)
k 1
i =1
n yi (m xyi m x )
k 1
(III.173)
raportul de
corelaie cu:
y(x ) =
x( y ) =
s y2( x )
s y2
s x2( y )
s x2
(III.174)
(III.175)
y ( x ) = 1 i x ( y ) = 0
(III.176)
Daniel Scrdeanu
y ( x ) = 0 i x ( y ) = 1
(III.177)
y ( x ) = 0 i x ( y ) = 0
d) variabilele
x i
(III.178)
y ( x ) = 1 i x ( y ) = 1
(III.179)
Fexp
2
nk
=
> F ( , 1 ; 2 )
2
1
k 1
(III.180)
Daniel Scrdeanu
(x m )(y m )
(x m ) (y m )
n
rxy =
i =1
i =1
(III.181)
Valorile coeficientului de corelaie linear sunt cuprinse ntre 1 i 1 iar
dac x i y sunt independente, rxy = 0 .
Abaterea de la repartitia normal a variabilelor x i y antreneaz
modificri ale interpretrii valorilor coeficientului de corelaie linear. Valoarea
minim a coeficientului Pearson ( rxy = 0 ) nu este un indicator al independentei
celor dou caracteristici, ci numai de necorelare liniar a lor. Acestea pot fi
corelate printr-o relatie functional de tip parabolic, logaritmic etc.
Pentru interpretarea valorilor nenule ale coeficienilor de corelaie, o
explicare grafic este mult mai sugestiv pentru cei neacomodati cu statistica
matematic. Valoarea coeficientului de corelaie linear este n dependen
direct cu distribuia perechilor de valori ( xi , yi ) ntr-un sistem rectangular de
referint
XOY .
Corespunztor
configuratiei
geometrice
distributiei
Daniel Scrdeanu
rxy
r 1
r 1
r =0
0 < r <1
x1
c) Coeficientul cosinus
A2
x2
acvifere
etc),
1
F2
y1
y2
Daniel Scrdeanu
cos A1 A2 = cos(1 2 ) =
x1 y1 + x2 y 2
(x
2
1
)(
+ y12 x22 + y 22
(III.183)
xy
x
k
cos A1 A2 =
i =1 i
k
2
i =1 i
i =1
yi2
(III.183)
Acest coeficient de corelaie indic o similaritate complet ntre dou
obiecte geologice A1 i A2 pentru cos = 1 i o disimilaritate total pentru
cos = 0 (corespunztor unui unghi = 90 o echivalent cu ortogonalitatea
vectorilor de poziie).
Daniel Scrdeanu
D AB =
(III.184)
n care:
x1 A - caracteristica x1 determinat n eantionul A (ex.: coninutul n
zinc);
x1B
caracteristica
x1
determinat n eantionul B;
x2 A
x1
- caracteristica
x2
x1 A
determinat n eantionul A
(exemplu:
coninutul
x2 B
x1B
plumb);
- caracteristica
x2
determinat n eantionul B.
x2 A
Dac
pentru
x2B
x2
cele
B)
D AB =
(X
n
i =1
X iB )
iA
(III.185)
[0,1]
i definirea
10
d AB = 1
Daniel Scrdeanu
1 n
( XSiA XSiB )2
n i =1
(III.186)
n care:
Coeficientul
corelaiei
eab
rD =
neab ab
ab(n a )(n b )
(III.188)
n care:
n - numrul total de cazuri analizate (Fig. 61);
a - numrul de cazuri analizate care prezint caracteristica A;
b - numrul de cazuri analizate care prezint caracteristica B;
11
Daniel Scrdeanu
permite ierarhizarea
rD
10
11
0.31
0.34
-0.16
0.18
0.31
0.17
0.18
-0.06 -0.57
0.26
1
1
0.31
-0.17 -0.46
0.13
0.1
0.05
0.13
0.13
-0.55 -0.19
1
2
0.34
-0.17
-0.16
0.18
-0.28 -0.31 -0.06
0.18
0.01
0.26
1
3
-0.16 -0.46 -0.16
0
0.14
-0.11
0.29
0
0.14
0.15
1
4
0.18
0.13
0.18
0
-0.14
-0.13
-0.07
-0.33
0.08
0.24
1
5
0.31
0.1
-0.28
0.14
-0.24
0.55
0.08
0.08
-0.18
0.06
1
6
0.17
0.05
-0.31 -0.11 -0.13
0.55
-0.13 -0.13
-0.1
-0.29
1
7
0.18
0.13
-0.06
0.29
-0.07
0.08
-0.13
0.73
-0.24
0
1
8
-0.06
0.13
0.18
0
-0.33
0.08
-0.13
0.73
-0.24
0
1
9
0.14
0.08
-0.18
-0.1
-0.24 -0.24
-0.23
1
10 -0.57 -0.55 0.01
0.15
0.24
0.06
-0.28
0
0
-0.23
1
11 0.26 -0.19 0.26
1 - minereuri de Nb i Ta; 2 - mic litinifier; 3 - amfibolit i spodumen; 4 - fosfati de Mn
i Fe; 5 - minerale de Bi; 6 - casiterit i wolframit; 7 - molibdenit; 8 - minerale de U; 9 pmnturi rare; 10 - minerale de Cs; 11 - granat.
12
Daniel Scrdeanu
6i =1 d i2
i are formula:
SP = 1
n(n 2 1)
(III.189)
n care:
n - numrul de perechi de valori ordonate cresctor;
13
Daniel Scrdeanu
SP = 1
6 150
= 0,9
10 (100 1)
Proba
crt.
Rangul
Valoare
di
d i2
Trie
economic
1
P1
10
25
P2
-1
P3
P4
10
-9
81
P5
-3
P6
P7
-3
P8
P9
10
P10
14
Daniel Scrdeanu
k =
2S
n(n 1)
(III.190)
n care:
n - numrul de perechi de valori ordonate;
k este:
Tabelul III.23 Elementele de calcul pentru coeficientul Kendall
a)
Proba
b)
Rangul
Proba
Rangul
15
Daniel Scrdeanu
k =
24
= 0,4
5(5 1)
Nr. crt.
12
31
-1
13
32
-1
14
35
+1
15
34
+1
23
12
+1
24
15
+1
25
14
+1
34
25
+1
35
24
+1
10
45
54
-1
S=
Contrasens -1
16
Daniel Scrdeanu
rangAP 3 = rangAP 4 =
2+3
= 2,5
2
k =
2 1
= 0,1
5(5 1)
RANG
A
P1
Nr. crt.
+1/-1
P2
1 2,5
32
-1
P3
2-3
1 2,5
34
P4
2-3
14
31
-1
P5
15
35
2,5 2,5
24
2,5 4
21
-1
Proba
RANG
A
2,5 5
25
2,5 4
41
-1
2,5
2,5 5
45
2,5
10
45
15
S =1
17
Daniel Scrdeanu
c) Coeficientul OMEGA-Kendall
K =
12S
m (n 3 n )
(III.191)
n care:
S - suma concordanelor multiple:
S = i =1 S i S
m
(III.192)
S=
4+0+2
=2
3
S = (4 2) + (0 2) + (2 2) = 8
2
3 - coeficientul K
K =
12 8
= 0,1
3 (53 5)
2
18
Daniel Scrdeanu
Nr.
crt.
a)
Nr.
Rang
V1
+1/-1
V2
V3
12 21 32
-1
-1
+1
prob
V1
V2
V3
13 24 35
+1
+1
+1
P1
14 25 31
+1
-1
-1
P2
15 23 34
+1
+1
+1
P3
23 14 25
+1
+1
+1
P4
24 15 21
+1
-1
-1
P5
25 13 24
+1
+1
+1
34 15 51
+1
-1
-1
35 45 54
+1
-1
+1
10
45 53 14
-1
+1
-1
K =
12 S
m 2 n 3 n mi =1 t i3 t i
n
(III.193)
semnificatiilor notatiilor fiind aceleai cu cele mentionate anterior:
19
Daniel Scrdeanu
( AB ) = ( A )
(B )
(III.194)
Pentru identificarea comod a independentei, indiferent de forma n
care au fost sistematizate datele din cele N puncte de probare, criteriul
exprimat prin relaia (III.194) poate fi formulat n diferite variante echivalente :
( AB ) = ( A)
(B ) N
(III.195)
( AB ) = (B )
( A) N
(III.196)
( AB ) = ( A)(B )
N
(III.197)
( AB ) = ( A) (B )
N
N N
(III.198)
20
(III.198)
Daniel Scrdeanu
exprim
simbolic
regula
fundamental
independentei:
"Dac caracteristicile calitative A i B sunt independente, proportia
elementelor ( AB ) este egal cu proportia elementelor A nmultit cu proportia
elementelor B."
Asocierea exprim existenta unei legturi ntre caracteristicile calitative,
iar functie de sensul, intensitatea i numrul de variabile implicate poate fi:
pozitiv sau negativ, complet sau incomplet, total sau partial.
Asocierea pozitiv a dou caracteristici A i B atrage cresterea
numrului de elemente B o dat cu cresterea numrului de elemente A i este
exprimat de inegalitatea:
( AB ) > ( A)(B )
N
(III.199)
Asocierea negativ, opus celei pozitive, exprim dezasocierea
caracteristicilor comparate, adic reducerea numrului de elemente B
proportional cu cresterea numrului de elemente A, i este exprimat de
inegalitatea:
( AB ) < ( A)(B )
N
(III.200)
Proporional
cu
creterea
intensitii
legturii
ntre
cele
dou
21
Daniel Scrdeanu
Q=
( AB )( ) (B )( A )
( AB )( ) + (B )( A )
(III.201)
Coeficientul de asociere Q este zero cnd cele dou caracteristici A i
B sunt independente, +1 cnd exist asociere pozitiv complet i -1 cnd
cele dou caracteristici sunt dezasociate (= asociere complet negativ).
Coeficientul de asociere Q este independent de proportiile relative ale
elementelor A i n selectia de date, proprietate ce-l face adecvat cazurilor
n care proportiile sunt arbitrare.
b) Coeficientul de interdependen
1
Y=
1+
( A )(B )
( AB )( )
( A )(B )
( AB )( )
(III.202)
22
Daniel Scrdeanu
rAB =
( AB )( ) ( A )(B )
( A)( )(B )( )
(III.203)
Testarea caracterului total al asocierii caracteristicilor A i B necesit
verificarea influentei unei alte caracteristici C asupra asocierii acestora.
Pentru aceasta se defineste asocierea partial a caracteristicilor A i B n
raport cu C.
Asocierea partial ca i cea total poate fi pozitiv dac se verific
inegalitatea:
(III.204)
sau negativ dac:
(III.205)
Prin adaptarea formulelor (III.201), (III.202) i (III.203) se definesc
coeficienii de asociere partial corespunztori:
Q AB.C =
(III.206)
23
Daniel Scrdeanu
1
YAB.C =
1+
( AC )(BC )
( ABC )( C )
( AC )(BC )
( ABC )(C )
(III.207)
rAB.C =
(III.208)
Testarea influentei caracteristicii C asupra asocierii caracteristicilor A i
B se bazeaz pe compararea coeficienilor calculati pentru asociere n raport
att cu caracteristica C ct i cu caracteristica nonC (= ). Egalitatea
H(2)
H(4)
H(2)
H(4)
t1 t2 t3 t4
Fig. 62 Serie de timp a nivelurilor
piezometric ale unui acvifer msurate la
piezometrice msurate ntr-un
acvifer freatic
intervale de timp egale (Fig.62),
pot fi constituite din: cote ale nivelului
24
Daniel Scrdeanu
NF(2)
X
NF(1)
NF(3)
Y
Fig. 64 Numr de microfosile identificate n puncte de
probare plasate pe o direcie oarecare de probare
succesiunea litologic a unei secvente sedimentare separat n intervale
egale ca grosime (Fig.63), numr de microfosile identificate pe o directie
oarecare de probare (Fig.64).
25
a)
v1
Daniel Scrdeanu
v2
b)
v3
t1
t2
t3
.
.
.
tn-1
tn
Fig. 63 Serii de timp rezultate din cercetarea unei
succesiuni sedimentare
a) serie de timp litologic univariat;
b) serie de timp multivariat ( v1 = , v2 = PS ; v3 = )
obinut din diagrafia geofizic complex
Timpul,
ntr-o astfel de
serie de valori sau stri ale procesului studiat este echivalent fie cu grosimea
stratigrafic, fie cu adncimea msurat ntr-un foraj, fie cu distanta de-a
lungul unei directii oarecare din spatiu.
Studiul seriilor de timp beneficiaz de o ampl i sofisticat
metodologie (Tertisco M.et.al.,1985) care nu poate fi utilizat cu eficient
maxim n geologie din dou motive principale:
a)volumul mare de date necesar calculului parametrilor caracteristici analizei
seriilor de timp univariate, cu semnificatie relativ redus n studiul proceselor
geologice complexe, multivariate;
b)complexitatea metodologiei care introduce dificultti de interpretare n
analiza seriilor de timp multivariate, adecvate studiului proceselor geologice
complexe.
26
Daniel Scrdeanu
Existenta unui volum minim de date pentru studiul unei serii de timp n
scopul estimrii stocastice a corealtiilor presupune o formalizare care
asociaz caracteristicii studiate (ex.: litologia, nivelul piezometric, numrul de
fosile identificate etc.) o variabil aleatoare de obicei discret (caracterul
discret fiind determinat de modul de colectare a datelor i nu de natura
variabilei studiate), iar continutului variabilei, un ansamblu de stri (ex.: variate
tipuri litologice: calcar, argil, gresie; sensul evolutiei: ascendent, descendent,
constant).
O serie de timp este din punct de vedere formal o succesiune se stri
exclusive, iar instrumentul operational care permite identificarea probabilist a
ponderii componentei deterministe (=corelaionale) a procesului este matricea
de tranzitie.
Matricea de tranzitie sacrific toate informatiile referitoare la pozitia
strilor n secventa de date, n favoarea identificrii tendintei unei stri de a fi
urmat sau precedat de alta.
Exist dou tipuri principale de matrici de tranzitie: matrici de tranzitie
unitar (de un pas) i matrici de tranzitie multipl, fiecare dintre ele putnd fi
exprimate numeric n trei forme diferite: 1) matricea frecventelor de tranzitie,
2) matricea proportiei perechilor de tranzitii, 3) matricea proportiilor de
tranzitie.
1) Matricea frecventelor de tranzitie este format din numrul tranzitiilor de la
o stare la alta determinat pe baza seriei de observatii disponibile.
Pentru seria de n = 31 stri:
ABACDCDABCBADCDCBACABDABCDBACDA
matricea frecventelor celor n 1 = 30 tranzitii ( MFT ) este:
27
MFT
Daniel Scrdeanu
TOTAL
TOTAL
A B C D
Total
A
B
MFT =
C
D
0
4
4
0
2
1
3
2
0
3
1
1
5
8
7
8
7
(III.209)
30
Total 8 7 8 7
2) Matricea proporiei perechilor de tranziii ( MPPT ) se obine din MFT prin
divizarea fiecrei valori cu numrul total de tranzitii i exprim ponderea unei
tranzitii n totalul acestora:
A;
B;
C;
D;
Total
A
B
MPPT =
C
D
0,00
0,13
0,03
0,10
0,13
0,00
0,07
0,03
0,10
0,07
0,00
0,10
0,03
0,03
0,17
0,00
0,26
0,23
0,27
0,23
(III.210)
28
Daniel Scrdeanu
1,00
Total 0,26 0,23 0,27 0,23
D
Total
A
B
MPT =
C
D
0,000
0,571
0,125
0,428
0,500
0,000
0,250
0,143
0,375
0,286
0,000
0,428
0,125
0,143
0,625
0,000
1,000
1,000
1,000
1,000
(III.211)
Cele trei forme de exprimare ale matricii de tranzitie pot fi construite
pentru o tranzitie unitar cnd procesul studiat opereaz la momente
consecutive, exprimate formal de indicele superscris al probabilittii de
tranzitie de la starea "j" la starea "k".
p (jk1) = P{Vm+1 = k Vm = j}
(III.212)
Pentru o tranzitie multipl ( n pai), probabilitatea de tranzitie de la
starea "j" la starea "k" se scrie:
p (jkn ) = P{Vm+n = k Vm = j}
(III.213)
n cazul n care probabilittile p jk depind numai de pasul n i sunt
independente de pozitia initial "m" (situatie valabil pentru un lan Markov
omogen) matricea de tranzitie multipl se calculeaz pe baza matricilor de
tranziie unitar.
29
Daniel Scrdeanu
prognozei strii sistemului pentru orice
"moment" este:
p ( m ) = p (0 ) P ( m )
(III.214)
n care P (m ) este matricea constituit din probabilittile de tranzitie multipl
p (jkm ) .
(2 )
MPT 1
(4 )
MPT 1
B
30
A
B
MPTD =
C
D
0
0
1
0
0
0
0
1
0
0
Daniel Scrdeanu
0
0
1
...DBABCDCABCABDCDCBCDBAD...
A 0,000
B 0,360
MPDA =
C 0,370
D 0,150
0,390
0,000
0,100
0,460
0,450
0,320
0,000
0,390
0,160
0,320
0,530
0,000
C
Fig. 66 Tranziiile n MPDA
dispersia,
densitatea
de
probabilitate,
coeficientul
de
b) Coeficientul de autocorelaie
31
Daniel Scrdeanu
(III.215)
n care
CV ( h ) = CV (h )
(III.216)
iar dac h = 0 covarianta se reduce la dispersie (=variant) i se poate scrie :
CV (0) = var(V ) =
1
N
V
n =1
2
n
(III.217)
Coeficientul de autocorelaie se obine prin divizarea covariantei la
variant i poate fi scris sub forma:
RV (h ) =
CV (h )
CV (0)
(III.218)
Estimatorul coeficientului de corelaie se calculeaz cu relaia:
rV (h ) =
(III.219)
32
Daniel Scrdeanu
Rv (0) = 1
Rv (h )
grafic
+1
variatiei
coeficientului
Nivel semnificaie
minim
de
autocorelaie n functie de
h poart denumirea de
0
3
1
5
4
Nivel semnificaie
minim
-1
h ilustreaz
sintetic
ntr-o
form
semnificatia
statistic a componentelor
ciclice ale seriei studiate.
Selectarea
p01
p11
33
Daniel Scrdeanu
n care p01 , p01 , p10 i p11 sunt probabilittile de tranzitie din sistemul studiat.
Conform relaiei (III.215):
CV (h ) = E (Vn = Vn+h = 1) = P(Vn = 1) P(Vn+h = 1Vn = 1)
i deoarece
P(Vn = 1) = E (Vn ) = p1
CV (h ) = p1 p11h
i
RV (h ) = p11h
Corelograma unui astfel de proces markovian corespunde puterilor
probabilittilor de tranzitie p11 i n general, pentru orice lan markov va fi o
functie simpl de MPT (h ) .
Dac se calculeaz corelograma uni proces aleator "pur" n care
U, V
c) Coeficientul de
intercorelaie
Coeficient
ul
intercorelaie
0
Fig. 68 Variaia n timp a dou caracteristici
geologice cu comportament aleator
de
este
utilizat
34
Daniel Scrdeanu
rUV (h ) =
(III.220)
Domeniul de variatie i semnificatia coeficientului de intercorelaie sunt
analoage cu cele ale coeficientului de autocorelaie. Referindu-se la dou
variabile RUV (0) este identic cu coeficientul lui Pearson i numai n cazul unei
corelaii liniare perfecte ntre U i V va avea valoarea unitar, pozitiv sau
negativ dup cum corelaia este direct respectiv invers.
Corelograma coeficientului de intercorelaie este utilizat n scopul
identificrii periodicittii seriilor de timp multivariate, a decalajelor cu
semnificatie statistic pentru cupluri de dou variabile.
Prin analiza corelaiei dintre variatia precipitatiilor i a nivelului
piezometric din acviferele freatice se poate evalua, spre exemplu, cu ajutorul
coeficientului de intercorelaie, durata de tranzit a apei prin zona de aerare i
implicit vulnerabilitatea la poluare a acviferelor.
***
Att pentru coeficientul de autocorelaie ct i pentru cel de
intercorelaie seriile de timp sunt presupuse lineare i stationare. Dac aceste
condiii nu sunt ndeplinite, evaluarea corelaiilor temporare presupune o
preprocesare care s realizeze:
35
Daniel Scrdeanu
36
Daniel Scrdeanu
din
complexitatea
proceselor
ecologice,
necesitatea
Daniel Scrdeanu
38
Daniel Scrdeanu
[A][X ] = [X ]
(III.258)
care formal este similar cu
39
Daniel Scrdeanu
A21 X 1 + ( A22 )X 2 = 0
(III.261)
Presupunnd c sistemul are i alte soluii dect cea banal
X 1 = X 2 = 0 atunci trebuie ca:
det A I = 0
(III.262)
care prin dezvoltare devine ecuaia:
4 8
A=
8 4
iar matricea pentru calculul valorilor proprii
4
A=
8
8
4
1 = 4 i 2 = 12
40
Daniel Scrdeanu
2
4 8
4 8
4 8
b)
8 4
6 8
c)
8 6
a)
1 = 8,95
1 = 12
2 = 8,95
b)
1 = 12
c)
1 = 14
d)
2 = 4
2 = 2
2 = 0
y
O
P2(-4;8)
y
P2(4;8)
P1(8;4) O
O
O
d)
y
P1(6;8)
O
P1(8;4)
x
O
O
P(4;8)
P2(8;6)
x
O;O
41
Daniel Scrdeanu
b) Vectori proprii
Revenind la ecuaia
proprii acestea sunt utilizate pentru calculul soluiei nebanale, se obin vectorii
proprii ai matricii iniiale.
Pentru matricea [2X2] dezvoltnd ecuaia (III.260) se obine:
A11
A
21
A12 X 1 0
=
A22 X 2 0
(III.264)
Vectorul
[X 1 , X 2 ]
4 8
A=
8 4
ecuaia de calcul pentru vectorul propriu al valorii proprii 1 = 12 este:
8 X 1 0
4 12
=
8
4 12 X 2 0
cu soluia
X 1 1
X = 1
2
42
Daniel Scrdeanu
X1
1
X = 1
3.2.2. Standardizarea
Daniel Scrdeanu
11,08 27,54
0,86 1,00
44
1 = 32,23 (96% )
2 = 1,39 (4% )
V1 [0,39;0,92]
V2 [0,92;0,39]
Daniel Scrdeanu
VALORI PROPRII
VECTORI PROPRII
1 = 1,86 (93% )
2 = 0,14 (7% )
V1 [0,707;0,707 ]
V2 [ 0,707;0,707]
20
15
1
-2
-1
10
-1
-2
0
0
10
15
20
a) Metodologia de lucru
45
Daniel Scrdeanu
20,3 15,60
cov =
15,60 24,10
Reprezentnd grafic aceast matrice, considernd-o ca fiind alctuit
din coordonatele a dou puncte cu abscisele pe prima linie i cu ordonatele
pe a doua, se obine o reprezentare vectorial care exprim grafic corelaia
dintre cele dou variabile X 1 i X 2 (Fig. 72 i 73).
Calculul vectorilor proprii i al valorilor proprii conduc la obinerea
elementelor elipsei ce nglobeaz toate cele 20 de puncte din tabelul III.32:
VectorI = [0,66;0,75], VectorII = [0,75;0,66] cu I = 37,9 i II = 6,5 (Fig. 74).
Tabelul
III.32
Elemente
ale
analizei
componenti principali
VALORILE
VALORILE
DATELE
SELECTIEI
FACTORIZATE
ORDONATE
Nr.
X1
X2
Y1
Y2
X1
X2
3.49
0.92
10
10.14
-3.64
7.72
1.18
9.97
-0.81
10
11.46
-2.14
6.14
3.91
13
14.37
-3.38
12.04
3.32
9.71
3.42
10
11.96
1.43
11
14
16.45
-2.45
10
12
10
11.87
2.84
10
10
46
Daniel Scrdeanu
13
11
12
16.28
0.28
11
10
14
12
10
15.44
2.35
12
11
15
12
11
16.19
1.69
12
12
16
13
16
13.11
5.75
13
13
17
13
14
19.1
0.45
13
13
18
13
15
19.85
-0.22
13
13
19
13
17
21.35
-1.54
13
14
20
14
14.52
5.84
14
14
21
15
13
19.68
2.6
15
15
22
17
13
21
4.1
17
17
23
17
17
24
1.45
17
17
24
18
19
26.16
0.87
18
19
25
20
20
28.23
1.7
20
20
47
Daniel Scrdeanu
30
Var X2
10
Cov X2
Cov X1
20
Var X1
0
10
20
30
Daniel Scrdeanu
c cel putin una din axele principale va fi mai eficient n exprimarea varianei
dect oricare din axele originale i implicit, printre celelalte axe principale se
va gsi una mai puin eficient dect oricare din axele originale.
Dac se realizeaz transformrile liniare de forma:
Y1 (i ) = V11 X 1 (i ) + V12 X 2 (i )Y2 (i ) = V21 X 1 (i ) + V22 X 2 (i )
n care V11 ,V12 ,V21 ,V22 sunt elementele celor doi vectori proprii, se creaz dou
noi variabile factorizate: Y1 care reprezint
49
Daniel Scrdeanu
R
ez
ult
X2
X2
ate
le
cal
cul
ulu
X1
X1
Fig. 76 Datele randomizate
VALORI RANDOMIZATE
20,3 21,9
cov =
21,9 24,1
20,3 0,05
cov =
0,05 24,1
VALORI PROPRII
1 = 44,2(99% )
1 = 24,3(54,7% )
2 = 0,2(1% )
2 = 20,1(45,3% )
VECTORI PROPRII
V1 = [0,68;0,74]
V1 = [ 0,22;0,98]
V2 = [0,74;0,68]
V2 = [0,98;0,22]
50
Daniel Scrdeanu
30
X2
I
Vector 1
20
10
II
10
20
30
30
X1
Vector 2
78).
n cazul valorilor ordonate (Fig. 77), axa principal poate exprima 99%
din variana total, cea de-a doua fiind asa de scurt nct practic este
imposibil de reprezentat grafic. Dac renuntm la ceast a doua component
pierderea de varian a datelor originale este foarte mic.
Se poate reduce deci dimensionalitatea setului de date originale de la
doi la unu prin proiectarea pe prima ax principal cu o pierdere de varian
total de 1%, utiliznd relaia: Y1 (i ) = V11 X 1 (i ) + V12 X 2 (i ) .
In cazul valorilor randomizate (Fig. 78), cele dou valori proprii sunt
practic identice, elipsa devenind cerc. Nici una din axele principale, n aceste
condiii, nu va capta mai bine variana total n comparatie cu variabilele
originale. n aceast situatie A.C.P. nu i gseste utilitatea i factorizarea
corelaiei nu i are obiect, corelaia lipsind ntre variabile.
c) Aplicatie
51
Daniel Scrdeanu
x3
x5
x4
x6
x7
x1
x2
x1
4,8443
x2
-2,6234
468,848
x3
-0,0011
81,3941
353,1255
x4
-1,5449
-200,2109
-84,6165
130,2741
x5
-0,5972
-84,2597
-73,0435
44,7616
30,4350
x6
-0,3805
-71,2097
-65,5433
34,9927
23,7565
22,4189
x7
-0,0222
-57,8578
-56,1533
23,9136
19,3907
17,967
Valoare proprie
659,7759
64,18
64,19
II
318,4384
30,98
95,17
III
35,1959
3,42
98,59
IV
6,7528
0,66
99,25
3,8193
0,37
99,62
VI
2,3763
0,23
99,85
52
Daniel Scrdeanu
1,5540
0,15
100,00
II
III
IV
VI
VII
x1
-0,0019
0,0039
-0,0689
-0,5829
0,7554
0,2793
0,0818
x2
0,7710
-0,4777
0,3194
0,1885
0,1169
0,1581
0,0326
x3
0,4167
0,8647
0,0531
0,2119
0,1123
0,1294
0,0421
x4
-0,3907
0,0761
0,8844
0,0704
0,0490
0,2280
0,0028
x5
-0,1895
-0,0794
-0,0775
0,6308
0,6255
-0,3240
-0,2401
x6
-0,1618
-0,0813
-0,1629
0,3330
0,0526
0,2510
0,8723
x7
-0,1308
-0,0735
-0,2750
0,2570
-0,0815
0,8107
-0,4146
53
Daniel Scrdeanu
20
10
-10
-20
II
-30
-40
-50
-60
-70
-70
-50
-30
-10
10
30
I
Fig. 79 Reprezentarea valorilor funcie de factorii I, II
Eficiena
1,75
celor
doi
1,50
cu puterea de separare a
1,25
tipurilor de sedimente pe
1,0
0,75
0,5
procentajului de nisip i
0,25
54
Daniel Scrdeanu
3,5
3,0
Analiza
2,5
componeni
2,0
n
principali
1,5
mod
1,0
eficientei
relative
separarea
tipurilor
de
sedimente
0,5
0
20
40
60
80
100
pentru
testarea
altor
(ex.:
media,
mediana, coeficientul de
sortare).
55
Daniel Scrdeanu
p < m.
Rezult c variana total are dou componente: una determinat de
X j = l jr f r + j
r =1
(III.264)
n care:
f r - factorul comun;
p - numrul de factori;
l jr - ncrcarea factorului r pe variabila j ;
(III.265)
iar restul elementelor de forma:
56
Daniel Scrdeanu
p
cov jk = l jr lkr
r =1
(III.266)
Dac notm matricea varian-covarian cu s 2 , cu L matricea [m p ]
(III.267)
Produsul [L ] [L ]
57
Daniel Scrdeanu
1,00 0,86
COV =
0,86 1,00
cu valorile i vectorii proprii:
0
,
707
1
,
86
0,964
0
,
707
0
,
14
0,264
Verificarea corectitudinii convertirii vectorilor proprii standardizati n
factori se face prin nsumarea ptratelor ponderilor factoriale care trebuie s
fie egale cu valorile proprii:
0,9642 + 0,9642 = 1,86
Primul factor reprezint
pentru a doua.
Cei doi factori redau 100% din variana total iar scrierea matricial
utilizat pentru exprimarea ponderilor factoriale este:
FACTORI
58
Daniel Scrdeanu
I
VARIABILE:
II
1 0,964 0,264
2 0,964 0,264
Daniel Scrdeanu
Dac pentru retinerea unei mari prti din variana total a sistemului
este nevoie de multi factori, modelul analizei factoriale se consider
neadecvat analizei esantionului de date disponibil.
c) Aplicatii
X1
X2
X3
X4
X5
X6
X7
3,760
3,660
0,540
5,275
9,768
13,741
4,782
9,840
9,270
1,510
13,604
9,017
12,668
1,745
8,390
4,920
2,540
10,053
3,956
5,237
1,432
4,940
4,380
1,030
6,678
6,494
9,059
2,807
7,230
2,300
1,770
7,790
4,393
5,374
2,274
60
Daniel Scrdeanu
9,460
7,310
1,040
11,999
11,579
16,182
2,415
9,550
5,350
4,250
11,742
2,766
3,509
1,054
4,940
4,520
4,500
8,067
1,793
2,103
1,292
8,210
3,080
2,420
9,097
3,753
4,657
1,719
10
9,410
6,440
5,110
12,495
2,446
3,103
0,914
11
5,900
5,760
1,550
8,388
5,395
7,497
1,973
12
1,660
1,610
1,570
2,799
1,783
2,087
3,716
13
5,510
1,340
1,270
5,808
4,566
5,382
3,427
14
4,690
3,010
2,170
5,983
2,760
3,554
2,013
15
7,120
5,490
3,680
9,716
2,642
3,430
1,189
16
8,590
2,980
1,170
9,170
7,851
9,909
2,616
17
9,730
1,330
1,000
9,871
9,871
11,064
3,704
18
9,640
9,490
1,030
13,567
13,133
18,519
2,354
19
8,740
7,000
3,310
11,675
3,529
4,757
1,119
20
3,270
0,620
0,440
3,357
7,629
8,838
8,389
21
5,510
3,980
1,300
6,924
5,326
7,304
2,403
22
9,030
7,080
2,590
11,762
4,539
6,217
1,276
23
7,570
7,280
7,070
12,662
1,791
2,101
0,822
24
6,220
6,140
4,520
9,842
2,175
2,732
1,089
25
8,590
4,990
1,340
10,022
7,500
10,162
2,130
X4
X5
X6
X7
X1
X2
X3
X1
1,000
X2
0,580
1,000
X3
0,201
0,364
1,000
X4
0,911
0,834
0,439
1,000
X5
0,283
0,166
-0,704
0,163
1,000
X6
0,287
0,261
-0,681
0,202
0,990
1,000
X7
-0,533
-0,609
-0,649
-0,676
0,427
0,357
1,000
61
Daniel Scrdeanu
Vector
Valoare proprie
Varian total
Var.cumulat [%]
3,3946
48,4949
48,4949
II
2,805
40,0783
88,5731
III
0,4373
6,2473
94,8204
IV
0,2779
3,9707
98,7911
0,0810
1,1565
99,9476
VI
0,0034
0,0487
99,9963
VII
0,0003
0,0037
100,0000
X1
0,4053
X2
IV
VI
VII
-0,2929 -0,6674
0,0888
-0,2267
0,4098
-0,2782
0,4316
-0,2224
0,6980
-0,0338
-0,4366
0,1443
-0,2540
X3
0,3854
0,3559
0,1477
0,6276
0,5121
0,1875
-0,1081
X4
0,4939
-0,2323 -0,1186
0,2103
-0,1054
-0,5878
0,5359
X5
-0,1277
-0,5751
0,0294
0,1108
0,3890
-0,4232 -0,5562
X6
-0,0968
-0,5800
0,1743
-0,0061
0,3549
0,5003
0,4975
X7
-0,4809
-0,1303
0,0176
0,7353
-0,4553
0,0332
0,0489
1.
Calculul
II
ponderilor
III
factorilor
comuni
prin
multiplicarea
ponderilor
[L]T
X2
X3
X4
X5
X6
X7
62
Daniel Scrdeanu
X 2
0,771
2
2
0,795 + 0,373
2
2
2
H = 0,910 + 0,389 = 0,979 pentru X 4
( 0,235)2 + 0,9632 0,983
X 5
2
2
( 0,178) + 0,971 0,976
X 6
2
( 0,886) + 0,2182 0,833
X 7
X 2
2
l H 2 0,229
l H 32 0,140
X 3
Re z = l H 42 = 0,021 pentru X 4
l H 2 0,017
X 5
5
2
l H 6 0,024
X 6
l H 2 0,167
X 7
[ ]
(III.268)
n care l j1 este ncrcarea variabilei j pe factorul 1. Notnd cu L matricea
ncrcrilor factoriale rezult c matricea reproductibil pe baza celor p
factori se poate calcula prin:
[s ] = [L] [L]
'2
63
Daniel Scrdeanu
[s ] [L] [L] = [s
2
rezidual
(III.269)
Analiza factorial este aplicat cu eficient n separarea faciesurilor
calcaroase. Toomey (1966) a determinat pentru calcarele de Leavenworth
(Pensilvanian superior =Carbonifer superior) din nordul regiunii Midcontinet 19
tipuri de constituenti petrografici: calcit spatic, micrit, pellete, trilobiti,
ostracode,
moluste,
brachiopode,
fusulinide,
foraminifere
mobile,
spiculi
de
foraminifere
spongieri,
ncrustate,
echinoderme,
Tubiphytes,
64
Daniel Scrdeanu
l2 m l2
p j =1 jp2 j =1 jp2
h
h j
j
sk2 =
p2
(III.270)
Cantitatea care trebuie minimizat este:
V = sk2
k =1
(III.271)
Variana este calculat din ncrcrile factoriale l jp care sunt corectate
prin divizarea lor cu comunalitatile h 2j , astfel nct numai partea comun a
varianei
fiecrei
variabile
este
luat
considerare
ndeprtnd
65
Daniel Scrdeanu
1,0
1,0
II
1
2
0,5
56
II
7
0,5
1
24
-1,0
-0,5
0,5
1,0
-1,0
-0,5
-0,5
0,5
1,0
-0,5
3
-1,0
-1,0
66
Daniel Scrdeanu
variabile). Deoarece factorii nii sunt estimai din aceleai date, calculul
proiectiilor factoriale este un proces circular, iar rezultatele nu sunt unice.
Calculul proieciilor factoriale este esenial pentru studiile geologice.
Pentru explicitarea modului de calcul ne vom referi la setul iniial de date [ X ]
care este o matrice [m n] ( m - numr variabile; n - numr de probe).
n cazul ACP se poate calcula o matrice a proieciilor factoriale [F ] prin
multiplicarea matricii de date [X ] cu matricea ncrcrilor factoriale [L ] :
[X ] [L] = [F ]
(III.272)
[X ] [s 2 ]1 [L] = [F ']
(III.273)
[L]T [L] = [S ]
(III.274)
Matricea obtinut se inverseaz i se multiplic cu [L ] obtinndu-se
matricea coeficienilor proiectiilor factoriale [B ] :
[L] [S ]1 = [B]
(III.275)
67
Daniel Scrdeanu
[X ] [B ] = [F ']
(III.276)
Sintetiznd n termenii matricilor ncarcrilor factoriale, operaia se
poate scrie:
[X ] [B ] = [F ']
(III.277)
[X ] [L] [S ]1 = [F ']
(III.278)
= [F ']
(III.279)
Aceeai procedur este utilizat pentru a obine proieciile factoriale n
cazul axelor rotite sau nerotite. De retinut c matricea [X ] contine variabilele
standardizate i nu pe cele initiale din selectia de valori ca n A.C.P.,
deoarece A.C.P. calculeaz ncrcrile componentilor principali plecnd de la
matricea de varian-covarian n timp ce ncrcrile factoriale se calculeaz
plecnd de la matricea de corelaie.
Problema specificrii numrului de factori p care trebuie retinuti este
critic. Numrul lor afecteaz mrimea matricii reproduse i reziduale,
comunalittile i ncrcrile factoriale specifice ( j ). ncrcrile factoriale
comune nu sunt afectate.
Astfel, dac p = 2 i factorii sunt extrai din datele originale, ncrcrile
pe factorii I i II nu sunt modificate dac se extrage i un al treilea factor.
Totui, dac extragem i rotim doi factori, ponderile factoriale pot fi radical
diferite de cele obtinute dac extragem i rotim trei factori din setul de date.
Cnd sunt extrai doi factori ei nu introduc constrngeri la rotatie ca atunci
cnd sunt extrai trei. Metoda Varimax pstreaz orogonalitatea factorilor.
Exist metode de rotatie a axelor factoriale care nu pstrez
ortogonalitatea, conducnd la rezultate mai uor de prelucrat deoarece se pot
obine mai multe ponderi factoriale extreme. Din punct de vedere interpretativ
apar contradicii cu principiile metodei care presupune c factorii comuni sunt
68
Daniel Scrdeanu
[n n]
factorial
Q-MOD
are
ca
obiectiv
identificarea
unui
hiperelipsoid
n-dimensional care este definit prin corelaiile dintre cei n vectori care
69
Daniel Scrdeanu
reprezint cele n probe. Fiecare vector este determinat prin cele m variabile
care au fost msurate n fiecare prob i din acest motiv dimensionalitatea
problemei nu depeste numrul variabilelor ( m ).
Al doilea pas este identificarea principalelor axe ale hiperelipsoidului
prin extragerea valorilor i vectorilor proprii. Deoarece vor fi reinute, de
fiecare dat, mai puini factori dect numrul probelor, nu este necesar
extragerea tuturor valorilor i vectorilor proprii, acest lucru reducnd mult din
timpul de calcul.
n al treilea pas se realizeaz maximizarea ncrcrilor factoriale prin
rotaia axelor factoriale. Rotaia axelor se poate face pn ce fiecare factor
coincide cu una din probele ce alctuiesc selecia de date. Pe lng tehnicile
ce pstreaz ortogonalitatea axelor factoriale dup rotaie, analiza factorial
Q-MOD apeleaz i la rotaia ce conduce la oblicitatea axelor factoriale cu
implicaiile semnalate n paragraful anterior.
Aplicaie. Ca un exemplu al aplicrii analizei Q-MOD, prezentm n
continuare o analiz petrografic. Tabelul II.37 conine componenii chimici
majori a 20 de eantioane (1-Sienit, 2-Sienit, 3-Sienit, 4-Monzonit, 5-Diorit, 6Diorit, 7-Diorit, 8-Diorit cuaritic, 9-Gabrou, 10-Gabrou, 11-Norit, 12-Norit, 13Gabrou cu hipersten, 14-Gabrou cu hipersten, 15-Sienit, 16-Sienit cuaritic,
17-Sienit alterat, 18-Monzonit, 19-Monzonit, 20-Diabaz). Prin analiza Q-MOD
se urmrete plasarea ficrei probe n poziia proprie a seriei difereniate de
roci magmatice.
Plasarea probelor n succesiunea fireasc, determinat de compoziia
chimic, se realizeaz prin utilizarea ncrcrilor factoriale ce exprim variana
ansamblului petrografic probat. Deoarece valorile vor fi standardizate, vectorii
definii vor avea lungimi unitare i probele vor fi plasate pe circumferina unui
cerc cu raz unitar. Unghiurile dintre aceti vectori sunt o msur a
similaritii dintre probe. Pentru evaluarea matricii de similaritate, ca rezultat al
primei etape de prelucrare se utilizeaz coeficientul de cos , rezultatul fiind
consemnat n tabelul III.38 (ANEXA 1).
70
Daniel Scrdeanu
II
Proba
II
0,9948
-0,0910
11
0,9833
0,1202
0,9918
-0,1223
12
0,9890
0,1259
0,9958
-0,0587
13
0,9721
0,1719
0,9989
-0,0126
14
0,9561
0,02323
0,9963
-0,0191
15
0,9918
-0,1257
0,9904
0,1188
16
0,9844
-0,1665
0,9959
-0,0838
17
0,9866
0,0783
0,9996
0,0010
18
0,9950
-0,0870
0,9983
0,0204
19
0,9945
-0,0946
10
0,9978
0,0223
20
0,9981
-0,0161
II
h2
Proba
II
h2
0,7851
0,6177
0,9980
11
0,6316
0,7632
0,9814
0,8044
0,5959
0,9986
12
0,6319
0,7712
0,9940
0,7636
0,6418
0,9950
13
0,5879
0,7930
0,9745
0,7342
0,6774
0,9980
14
0,5348
0,8259
0,9681
0,7368
0,6709
0,9929
15
0,8068
0,5904
0,9995
0,6377
0,7671
0,9950
16
0,8295
0,5556
0,9968
0,7809
0,6236
0,9988
17
0,6628
0,7350
0,9796
0,7254
0,6878
0,9993
18
0,7825
0,6207
0,9976
0,7111
0,7009
0,9970
19
0,7873
0,6148
0,9979
10
0,7094
0,7020
0,9960
20
0,7360
0,6744
0,9965
71
Daniel Scrdeanu
61,7
15,1
2,0
2,3
3,7
4,6
4,4
4,5
58,3
17,9
3,2
1,7
1,5
3,7
5,9
5,3
51,2
17,6
3,5
4,3
3,2
4,5
5,7
4,4
54,4
14,3
3,3
4,1
6,1
7,7
3,4
4,2
58,0
15,7
0,7
2,8
5,0
10,9
3,0
3,2
46,6
15,9
2,9
10,0
7,0
9,6
2,7
0,7
58,0
17,3
2,2
3,8
2,2
4,3
4,3
4,1
55,5
16,5
1,7
4,6
6,7
6,7
3,2
2,5
55,4
15,3
2,7
5,5
5,8
9,9
2,9
1,5
10
55,9
13,5
2,7
5,9
6,5
8,9
2,4
1,7
11
47,2
14,5
1,6
13,8
5,2
8,1
3,1
1,2
12
48,2
18,3
1,3
6,1
10,8
9,4
1,3
0,7
13
44,8
18,8
2,2
4,7
11,3
14,6
0,9
0,1
14
47,0
14,1
0,8
15,0
16,0
2,3
0,4
1,7
15
59,8
17,3
3,6
1,6
1,2
3,8
5,0
5,1
72
Daniel Scrdeanu
16
66,2
16,2
2,0
0,2
0,8
1,3
6,5
5,8
17
50,0
9,9
3,5
5,0
11,9
8,3
2,4
5,0
18
57,4
18,5
3,7
2,1
1,7
6,8
4,5
3,7
19
59,8
15,3
3,8
3,3
2,2
3,9
3,0
4,4
20
52,2
18,2
3,3
4,4
4,7
6,5
4,6
1,9
73
Daniel Scrdeanu
(atomic,
macroscopic),
caracterul
intrinsec
(determinist,
Cel mai simplu model pentru corelaia ntre dou variabile geologice
este cel liniar, n care se presupune c dependena poate fi descris prin
ecuaia unei drepte:
y = 0 + 1 x + e
(III.277)
n care
0 , 1 - parametrii modelului;
74
Daniel Scrdeanu
Reprezentarea
grafic
ni
repartiiei
bidimensionale a variabilelor
analizate
este
cea
mai
corelaiei.
Ea
analiza
diagrama
existenei
se
trei
de
poate
variante:
mprtiere,
stereograma i dreapta de
corelaie.
y
Fig. 86 Model liniar cu o singur variabil (y)
afectat de erori
75
Daniel Scrdeanu
nxy
x2
x1
y1
y2
y
Fig. 85 Model liniar cu ambele variabile (x,y) afectate de erori aleatoare
a)Diagrama de mprtiere
Diagrama de mprtiere este cea mai simpl form de reprezentare
grafic n care utiliznd un sistem de referin rectangular, fiecare pereche de
valori msurat ( xi , yi ) se materializeaz printr-un punct. Se obine n acest
mod o mulime de puncte a crei configuraie geometric sugereaz prezena
9
8
7
PLUMB
6
5
4
3
2
1
0
0
10
12
14
16
18
20
ZINC
Fig. 87 Diagrame de mprtiere
76
Daniel Scrdeanu
y2
...
yk
...
yn
x1
nx1 y1
nx1 y2
...
nx1 yk
...
nx1
x2
nx2 y1
nx2 y2
...
nx2 yk
...
nx2
...
...
...
...
...
...
...
xl
nxl y1
nxl y2
...
nxl yk
...
nxl
xy
n y1
n y2
...
n yk
...
y
x
Daniel Scrdeanu
nxi = nxi y j
(i = 1,2,..., l )
j =1
(III.278)
3) frecvenele pariale dup variabila Y ( n yi ) se evalueaz n mod analog pe
coloanele tabelului III.41.
l
n yi = nx j yi
(i = 1,2,..., k )
j =1
(III.279)
Stereograma se obine prin construirea pentru fiecare compartiment al
tabelului de corelaie a unui paralelipiped avnd nlimea proporional cu
frecvenele perechilor de valori. Suprafaa care mbrac stereograma poart
denumirea de suprafa de frecven i ofer o imagine global a corelaiei
ntre cele dou variabile ntr-un spatiu tridimensional.
Dreapta de corelaie
Dreapta de corelaie reprezint grafic tendina pe care o urmeaz
media unei variabile n comparaie cu valorile celeilalte variabile. Se
construiesc dou drepte de corelaie pentru fiecare cuplu de dou variabile
( x, y ):
a) dreapta de corelaie corespunztoare modelului y = f ( x ) n care
pentru fiecare xi se determin i se reprezint valoarea medie (Fig. 89).
b) dreapta de corelaie corespunztoare modelului x = f ( y ) n care
pentru fiecare valoare yi se calculeaz i se reprezint grafic (Fig. 90).
78
x1
xk
Daniel Scrdeanu
xk
Daniel Scrdeanu
= xy
xy
(x m )(y m )
(x m ) (y m )
n
i =1
i =1
i =1
=r
(III.280)
Coeficientul de corelaie ( ) are valori cuprinse ntre -1 i +1, indiferent
de amplitudinea seleciei de date. Valorile extreme ale coeficientului de
corelaie liniar indic o aliniere perfect a punctelor ntr-o diagram de
mprstiere de-a lungul unei drepte fie cu panta pozitiv ( = 1 ; corelaie
pozitiv), fie cu panta negativ ( = 1 ; corelaie negativ.
80
Daniel Scrdeanu
Pentru
analiza
80
s-a
evaluat
un
( r )
se calculeaz aplicnd
81
Daniel Scrdeanu
R xy
r =
R x R
y
(R
n
i =1
(R
n
i =1
xi
xi
)(
mRx
) (R
2
i =1
yi
mR y
= ri
(III.281)
n care:
mRx , mRy - media rangurilor valorilor Rx1 ,..., Rx n , respectiv R y1 ,..., Ryn .
82
Daniel Scrdeanu
H1 : 0
texp = n 2
r
1 r2
(III.282)
care se compar cu valorile repartiiei STUDENT t ( , ) cu = n 2 .
n alternativ texp < t ( , ) se accept ipoteza absenei corelaiei liniare
ntre cele dou variabile. Dac texp > t ( , ) , din punct de vedere statistic se
admite existena unei corelaii liniare ntre cele dou variabile i se trece la
etapa de evaluare a incertitudinii asupra valorii r calculate.
Calculul intervalului de ncredere pentru valoarea coeficientului de
corelaie se poate realiza utiliznd variabila cu repartiie normal propus
de Fisher:
z=
1 1+ r
ln
2 1 r
(III.283)
Pentru calculul intervalului de ncredere al coeficientului de corelaie
( ) se utilizeaz relaiile:
rinf =
e 2 z1 1
e 2 z1 1
<
<
r
=
sup
e 2 z2 + 1
e 2 z2 + 1
(III.284)
n care:
z1 = z nps z
(III.285)
83
Daniel Scrdeanu
z2 = z + nps z
(III.286)
sz =
1
- abaterea standard a variabilei z .
n3
Pe baza abaterii standard a coeficientului de corelaie
sr =
1 r2
n
(III.287)
intervalul de ncredere al coeficientului de corelaie pentru o probabilitate p
se calculeaz cu relaia:
1 r2
1 r2
r np
< < r + np
n
n
(III.288)
d) Parametrii modelului
SPA = [ yi (a0 a1 xi )]
i =1
(III.289)
prin derivare n raport cu a0 i a1 se obine sistemul de ecuaii normale
84
Daniel Scrdeanu
n
n
+
=
a
r
a
x
yi
1 i
0
i =1
i =1
n
n
n
2
a
0 xi + a1 xi = xi yi
i=1
i =1
i =1
(III.290)
Prin rezolvarea sistemului (III.290 ) se obin soluiile:
s xy
a0 = m y s mx
xx
a = s xy
1 s xx
(III.291)
n care:
n
??
i =1
s xy = xi2
i =1
n
1 n
xi yi
n i=1 i=1
(III.292)
1 n
s xx = x xi
n i=1
i =1
n
2
i
(III.293)
b) Evaluarea incertitudinii
Evaluarea intervalului de ncredere pentru parametrii modelului ( , 1 )
se bazeaz pe amploarea fluctuaiilor variabilei
n jurul modelului
y2 s y2 =
1 n
(yi my )2
n 1 i=1
(III.294)
Parametrul a0 , ce estimeaz parametrul necunoscut 0 , are o
distribuie N ( 0 , 0 ) n care:
85
Daniel Scrdeanu
n
i =1
i =1
2 = y2 xi2 / n ( xi mx )2
0
(III.295)
Variabila:
texp = ( 0 a0 ) / s0
(III.296)
are o distributie t cu = n 2 grade de libertate n care
n
n
2
s20 = s y2 xi2 / n ( xi mx )
i =1
i=1
(III.297)
a0 t 1 ; s 0 < 0 < a0 + t s0
1 ;
2
2
(III.298)
n condiiile acelorai ipoteze, valoarea 0 nu se accept ca o
estimaie a valorii 0 dac
texp > t 1 ;
2
(III.299)
N 1 , 1 n care:
= y 2 / ( xi mx )2
1
i=1
(III.300)
Variabila
t exp = (a1 1 ) / s1
(III.301)
are deci o distribuie t cu = n 2 grade de libertate, abaterea standard de
estimaie calculndu-se cu relaia:
n
2
s21 = s y2 / ( xi m x )
i =1
(III.302)
86
Daniel Scrdeanu
a1 t 1 ; s1 < 1 < a1 + t 1 ; s1
2
2
(III.303)
n mod analog, valoarea a1 este acceptat ca estimaie a parametrului
e) Aplicaie
340
335
330
325
320
315
310
305
300
295
290
285
280
275
270
265
245
250
255
260
265
270
275
280
285
290
295
300
305
87
Daniel Scrdeanu
Mw = + Md
Realizarea stereogramei evideniaz ntr-un mod sugestiv dou
aspecte determinante pentru strategia aplicrii metodologiei clasice:
- existena unui numr de valori extreme aberante ce trebuie eliminate
naintea evalurilor numerice;
- caracterul normal al repartiiei bidimensionale a variabilelor M w i M d care
asigur interpretarea corect att a valorilor coeficientului de corelaie ct i a
parametrilor modelului.
Intensitatea corelaiei ntre cele dou variabile este evaluat prin
intermediul coeficientului de corelaie:
1) naintea eliminrii valorilor extreme: r1 = 0,32 , valoare care contrazice
flagrant aspectul diagramei de mprtiere i al stereogramei;
2) dup eliminarea a opt valori extreme: r2 = 0,889 .
Testarea adecvrii modelului devine formal la o valoare a
coeficientului de corelaie r2 = 0,889 i ntr-adevr prin calcul se obine:
M w = 18,17 + 0,781 M d
Acest model poate fi utilizat cu o bun aproximare pentru deducerea
unuia dintre parametrii pe baza celuilalt reducnd la jumtate efortul de
determinare realizat n laborator pentru depozitele iazului Baia Sprie. Desigur
88
Daniel Scrdeanu
y = 0 + 1 x1 + 2 x2 + ... + n xn + ei
(III.304)
n care:
Daniel Scrdeanu
Daniel Scrdeanu
(y y
2
*
x1... xn
(y
R y ( x1... xn ) = 1
i =1
i =1
(III.305)
n care
91
Daniel Scrdeanu
R y ( x1x 2... xn ) =
1 k
y
yi
n i =1
i =1
k
2
i
(III.306)
utilizabil dup evaluarea parametrilor modelului prin intermediul coeficienilor
)(
)(
(III.307)
n care ry21 , ry22.1 ,..., ryn2 .12...(n1) sunt coeficienii de corelaie parial.
Dac R y ( x1x 2... xn ) = 1 , variabila rezultativ y poate fi perfect reprezentat
prin modelul liniar multiplu. Se poate demonstra c R y ( x1x 2... xn ) este mai mare
dect coeficientul de corelaie ntre y i orice funcie liniar de x1, x 2,..., xn
diferit de cea din expresia (III.304).
Coeficientul corelaiei multiple este mai mare sau egal cu zero i deci
n mod evident este mai mare (sau egal) dect oricare din coeficienii de
corelaie parial care aparin modelului. Ca o consecin a acestui fapt, dac
92
Daniel Scrdeanu
(1 r
2
yn.23...( n 1)
)(1 r
2
1n.23...( n 1)
(III.308)
Pentru un model liniar cu dou variabile independente:
y = a 0 + a1x1 + a 2 x 2
(III.309)
aplicnd formula (III.308) se obine relaia de calcul a coeficientului corelaiei
pariale ntre y i x1 :
ry1.2 =
ry1 ry 2 r12
(1 r )(1 r )
2
y2
2
12
(III.310)
n care ry1 , ry 2 i r12 sunt coeficienii de corelaie binar calculai cu formula
(III.280) utilizat pentru evaluarea intensitii modelului liniar cu o singur
variabil independent.
Coeficienii corelaiei pariale au valori cuprinse ntre -1 i +1
semnificaia fiind cea a coeficientului de corelaie Pearson analizat n detaliu
la paragraful IV.2.1.
(III.311)
avnd = k 1 grade de libertate i dou componente:
93
Daniel Scrdeanu
(III.312)
cu k n grade de libertate;
b) suma ptratelor abaterilor valorilor calculate prin ecuaia modelului fa de
media valorilor msurate:
k s y2 R y2( x1x 2... xn )
(III.313)
cu n 1 grade de libertate.
Dac y (valoarea msurat) i y * (valoarea estimat prin model) sunt
complet necorelate, abaterile lui y fa de valorile modelului ( y * ), vor fi
independente de abaterile valorilor calculate fa de media valorilor msurate
i deci dispersiile celor dou componente vor fi practic identice ( R = 0 ).
Testarea semnificaiei statistice a diferenei celor dou componente
poate fi realizatat cu ajutorul repartiiei Z calculnd factorul experimental:
R y2( x1x 2... xn )
k n
1
Z exp = ln
2
z 1 R y ( x1x 2... xn ) n 1
(III.314)
cu = n 1 i 2 = k = n grade de libertate.
Dac
Z exp < Z ( , 1 , 2 )
(III.315)
valoarea coeficientului de corelaie R y ( x1x 2,..., xn ) este nesemnificativ i modelul
liniar multiplu nu este adecvat modelrii corelaiei ntre n + 1 variabile.
n caz contrar, din punct de vedere statistic, corespunztor nivelului de
semnificaie ales, modelul liniar multiplu este adecvat modelrii relaiei ntre
variabila rezultativ ( y ) i variabilele factoriale: x1, x 2,..., xn .
Semnificaia coeficientului corelaiei multiple este puternic afectat de
numrul de valori disponibile ( k ) i numrul de variabile ale modelului ( n ). n
cazul limit n care numrul de variabile este egal cu numrul de observaii
94
Daniel Scrdeanu
disponibile, toate corelaiile pariale de cel mai ridicat grad posibil vor fi egale
cu valoarea unitar i n consecin R va indica o corelaie total indiferent de
ansamblul real de corelaii din sistemul studiat.
d) Parametrii modelului
i =1
(III.317)
prin derivare n raport cu a0, a1,..., an obinndu-se sistemele :
k
SPA
[ yi (a0 + a1x1i + ... + anxni )]2 = 0
2
=
a 0
i =1
k
SPA
2
= 2 x1i [ yi (a0 + a1x1i + ... + anxni )] = 0
i =1
a1
k
SPA
2
= 2 xni [ yi (a0 + a1x1i + ... + anxni )] = 0
i =1
an
(III.318)
95
Daniel Scrdeanu
k
k
k
a
0
k
a
1
x
1
...
an
xn
yi
+
+
+
=
i
i
i =1
i =1
i =1
k
k
k
k
2
a
0
x
1
a
1
x
1
...
an
xn
x
1
x1yi
+
+
+
=
i
i
=
1
=
1
=
1
=
1
i
i
i
i
k
k
k
k
2
a
0
xn
a
1
x
1
xn
...
an
xn
xnyi
+
+
+
=
i
i
i =1
i =1
i =1
i =1
(III.319)
prin a cror rezolvare se obin valorile parametrilor.
Fiecare dintre parametrii modelului ( a1, a 2,..., an ) reprezint variaia
medie a variabilei rezultative ( y ) corespunztoare unei variaii unitare a
variabilei factoriale, considerndu-le pe celelalte constante.
Termenul liber ( a 0 ) reprezint nivelul de referin al variabilei
rezultative fr a avea o semnificaie geologic precizat.
b) Evaluarea incertitudinii
Pentru parametrii modelului corelaiei multiple intervalul de ncredere
se evalueaz pe baza inegalitii:
a j t ( , )
s yyi
n
< j < a j + t ( , )
s yyi
n
(III.320)
pentru coeficienii variabilelor factoriale ( j = 1,2,..., n ) iar pentru termenul liber
pe baza inegalitii:
a0 t ( , )
s yyi
n
< 0 < a0 + t ( , )
s yyi
n
(III.321)
n care
(y
k
s yyi =
i =1
yi*
k n 1
(III.321)
s a j - abaterea standard introdus de fiecare variabil factorial:
96
Daniel Scrdeanu
sa j =
s yyi
(x
k
i =1
ij
m xj )
(III.322)
e) Aplicatie
RQQ
RQP
+1
+1
3
0
-1
-1
97
7 t
Daniel Scrdeanu
m3
Q
zi
7000
Performanele
corelaiei
multiple i a coeficienilor
de corelaie parial sunt:
5000
corelaia
total
ntre
R = 0,65
3000
1000
0
1975
1980
rQQ (t 1) = 0,16 ;
Q(t 4) :
rQQ (t 4 ) = 0,14 ;
corelaia parial ntre Q i P(t 1) :
rQP (t 1) = 0,63 .
Grafic relaia dintre valorile observate i cele calculate prin model (Fig.
98) exprim o bun adecvare a modelului pentru corelaiile ntre debitul de
exploatare i precipitaii.
Bibliografie
Andrews, D.J.& Hanks, T.C., Scarp degraded by linear diffusion : inverse
solution for age, J.Geophys.Res.90, 10193-208, 1985.
Bailey, N.T.J., The elements of stochastic processes with applications to the
natural sciences, John Wiley & Sons, Inc., New York, 1964.
Berg, P., Poneau, Y.& Vidal, C., Order within chaos, John Wiley and sons,
New York, 1986.
Bomboe, P., Geologie matematic (vol. I, Analiza statistic a datelor
98
Daniel Scrdeanu
Daniel Scrdeanu
Daniel Scrdeanu
Daniel Scrdeanu
Daniel Scrdeanu
103