Você está na página 1de 28

AUTOCORELAREA ERORILOR

• Modelul de regresie: Y=Xβ+ε

 cov(ε 1 , ε 1 ) cov(ε 1 , ε 2 )  cov(ε 1 , ε n ) 


• V= cov(ε 2 , ε 1 ) cov(ε 2 , ε 2 )  cov(ε 2 , ε n )
 
    
 
 cov(ε n , ε 1 ) cov(ε n , ε 2 )  cov(ε n , ε )
n 

• Erorile sunt autocorelate⇒∃i≠j astfel încât Cov(εi,εj) ≠ 0.

 1 ρ1  ρ n −1 
ρ unde
1  ρ n − 2  cov(ε i , ε i + k ) γk
σ ε2  1 ρk = = k = 1, n - 1
• V=      var(ε i ) var(ε i + k ) γ 0
 
 ρ n −1 ρ n−2  1 
1
AUTOCORELAREA ERORILOR

Problemele ce se pun în acest caz sunt:


1. Identificarea cauzelor de apariţie a corelării
erorilor
2. Testele statistice utilizate pentru depistarea
autocorelării
3. Metode de estimare a parametrilor în cazul
autocorelării

2
1. Cauzele de apariţie a autocorelării erorilor
• Absenţa uneia sau mai multor variabile explicative importante
– neincluderea uneia sau mai multor variabile explicative importante
poate genera autocorelarea erorilor.
– exemplu: y i = a + bx1i + cx 2i + ε i
– variabila exogenă x3 este omisă ⇒ variabilele reziduale sunt
autocorelate şi reziduul va fi explicitat prin intermediul acestei
variabile omise: ε i = α + βx3i + u i
• Modelul de regresie nu este corect specificat: fie modelul se
exprimă sub forma unei combinaţii liniare de variabile în
condiţiile în care o specificare corectă a modelului trebuie să fie
exprimată printr-o combinaţie liniară de logaritmi de variabile
exogene etc.
• Au fost făcute transformări neadecvate sau interpolări în cadrul
seriei de date 3
2. Testele statistice utilizate pentru depistarea
autocorelării: Durbin Watson
• Variabila reziduală satisface: ε i = ρε i −1 + u i
• Ipoteze: Ho: ρ=0 Ha: ρ≠0
n


∑ (e i − ei −1 ) 2
Statistica testului: DW = i =2
n

∑ ei 2

i =1

Numărătorul statisticii va fi scris sub forma echivalentă:
n 2 n n n n n
∑( ei − ei −1 ) = ∑ei − 2 ∑ei ei −1 + ∑ei−1 = 2∑ − 2 ∑ei ei −1 − e12 − en2 .
ei2
i =2 i =2 i =2 i =2 i =1 i =2
Atunci statistica d va fi:
e12 + en2
d = 2(1 − ρ1 ) − n
.
∑ei2
i =1
Dacă seria de date este suficient de mare, vom neglija termenii
extremi din seria reziduurilor, obţinând:
d = 2 (1 − ρ1 ). 4
• d1 şi d2 extrase din tabela Durbin Watson pentru α, k şi n:
– 0 < DW < d1 ⇒ autocorelare pozitivă a erorilor
– d1 ≤ DW ≤ d2 ⇒ indecizie, recomandată acceptarea
autocorelării pozitive
– d2 < DW < 4-d2 ⇒ erori independente
– 4-d2 ≤ DW ≤ 4-d1 ⇒ indecizie, recomandată acceptarea
autocorelării negative
– 4-d1< DW <4 ⇒ autocorelare negativă a erorilor
• Observaţie: Testul Durbin Watson nu poate fi aplicat decât dacă:
– modelul de regresie are termen liber
– matricea X este nestochastică
– printre variabilele explicative nu se află şi variabila endogenă
cu decalaj
5
– seriile de date nu sunt atributive
Testul Durbin Watson

Testul Durbin-Watson pentru α= 5 %.


n k=1 k=2 k=3 k=4 k=5
d1 d2 d1 d2 d1 d2 d1 d2 d1 d2
15 1,08 1,36
0,95 1,54 0,82 1,75 0,69 1,97 0,56 2,21
20 1,20 1,41
1,10 1,94 1,00 1,68 0,90 1,83 0,79 1,99
30 1,35 1,49
1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,83
40 1,44 1,54
1,39 1,60 1,34 1,66 1,29 1,72 1,23 1,79
50 1,50 1,59
1,46 1, 1,42 1,67 1,38 1,72 1,34 1,77
63
100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,37 1,78

6
3. Metode de estimare a parametrilor în cazul
autocorelării
• Erorile prezintă o autocorelare de un anumit ordin ⇒ estimatorii
parametrilor sunt nedeplasaţi şi consistenţi, dar nu sunt eficienţi.
1. Se estimează parametrii modelului de regresie: Y=Xβ+ε prin metoda celor
mai mici pătrate şi se obţine seria erorilor (ei)i=1,n
2. Se consideră că erorile urmează un proces autoregresiv de ordinul I:
n

∑e e

ρ= i =2
n
i i−1
ε i = ρε i −1 + u i
∑e
i =2
2
i−1

p ∧ ∧ p ∧ ∧
3. y i = β 0 + ∑ β j x ji + ε i ⇒ y i − ρ ⋅ yi −1 = β 0 (1 − ρ ) + ∑ β j ( x ji − ρ x ji −1 ) + ε i − ρ ε i −1
j =1 j =1
 * ∧
p
 y i = y i − ρ y i −1
Notând:  * ∧
*
⇒ yi = α 0 + ∑ β j x*ji + υ i υ i → N (0, σ ) 2
υ
x ji = x ji − ρ x ji −1 j =1
 ∧
α0 = β0 (1 − ρ)

7
4. Se estimează parametrii noului model şi apoi se revine la modelul iniţial.
HOMOSCEDASTICITATEA

u
• Y=Xβ+ε

E (ε ) = 0
 x
 w1 0  0
 0
 2
w1  0 
Var ( ε ) = σ ε
  
  

 0 0  w1 

• Problemele ce se pun în acest caz sunt:


1. Testele statistice utilizate pentru depistarea heteroscedasticităţii
2. Metode de estimare a parametrilor în cazul heteroscedasticităţii

8
1. Testele statistice utilizate pentru depistarea
heteroscedasticităţii - Testul White
1. Se estimează parametrii modelului de regresie: Y=Xβ+ε prin metoda
celor mai mici pătrate şi se obţine seria erorilor (ei)i=1,n
2. Se explicitează seria (ei2)i=1,n în raport cu una sau mai multe variabile
exogene şi se kdefineşte modelul
k de regresie:
1. e 2
i = ∑ a x
j ji
j =1
+ ∑ b j ji + v i
x
j =1
2

2. e = a1 x1i + a 2 x 2i + b1 x12i + b2 x 22i + c1 x1i x 2i + vi


2
i
3. Ipotezele testului:
• H0: a1=...=ak=b1=...=bk=0 ⇔ model homoscedastic
• H1: ∃a1 ≠ 0 sau bj ≠ 0 ⇔ model heteroscedastic
4. Statistica testului: LM=nR2→χr2
• Observaţie:
– o creştere a lui r conduce la diminuarea puterii testului
– pentru un număr mare de variabile exogene se recomandă modelul 1
– pentru un număr moderat de variabile exogene se recomandă 9
2. Metode de estimare a parametrilor în cazul
heteroscedasticităţii
• În cazul în care heteroscedasticitatea este indusă de o variabilă exogenă
într-o manieră multiplicativă: σ i2 = σ ε2 x 2ji ,
• Fenomenul de heteroscedasticitate se elimină prin transformarea modelului:
yi x1i x pi ε
= β1 + ... + βp + i
x ji x ji x ji x ji

yi x x pi  εi
• Notând: y =
*
i x =  1i ,...,
*
 ε i* =
x ji i
x x x ji
 ji ji 

• Modelul devine: y i = xi β + ε i
* * *

• După estimarea parametrilor acestui model transformat se revine în modelul


iniţial cu estimatorii.

10
MULTICOLINEARITATEA
• este determinată de prezenţa corelării între variabilele exogene ⇒
determinantul matricei X’X este zero, deci aceasta nu este inversabilă.
• Se consideră modelul centrat şi redus, deci modelul de regresie fără
termen liber:
– matricea de corelaţie evaluată pentru variabilele exogene este 1/n(X’X)-1
– variaţia estimatorilor este σ2R-1/n
– prezenţa corelării variabilelor exogene conduce la creşterea varianţei acelor
estimatori ai parametrilor modelului liniar de regresie ce corespund
variabilelor exogene aflate într-o dependenţă liniară semnificativă, deci
scăderea performanţelor modelului de regresie estimat prin forma clasică a
metodei celor mai mici pătrate.

• Problemele ce se pun în acest caz sunt:


1. Indicatori pentru semnalarea coliniarităţii
2. Înlăturarea efectului de multicoliniaritate 11
1. Indicatori pentru semnalarea coliniarităţii
• Criteriul Klein
– se determină raportul de corelaţie Ry2 şi coeficienţii liniari de corelaţie a
r
variabilelor exogene xi / x j , i≠j.
R y < rxi / x j
2 2
– două variabile exogene Xi şi Xj sunt coliniare dacă:
– sunt identificate numai dependenţele liniare dintre două variabile exogene.
• Criteriul Belsley
– se calculează valorile proprii ale matricei X’X, deci soluţii ale ecuaţiei: |
X’X-λIp|=0.
– în cazul în care una sau mai multe valori proprii sunt zero sau aproximativ
zero, fenomenul de colinearitate este semnificativ şi va afecta într-o bună
măsură calitatea estimatorilor. λ max
ρ(X ) =
– se calculează indicatorul: λ min

– dacă valorile acestui indicator sunt superioare lui 1 ⇒ colinearitatea


– o valoare cuprinsă între 20 şi 30 sau mai mare, pentru datele reale, relevă
12 o
colinearitate puternică a variabilelor exogene.
2. Înlăturarea efectului de multicoliniaritate
• Estimarea prin partiţionarea matricei X în două blocuri de variabile
– se consideră partiţionarea matricei în două submatrice ale căror coloane
sunt liniar independente: X=(Xm, Xp-m)
– se estimează parametrii modelului de regresie: y=Xmβm+εm

– se calculează apoi: y* = y − y m
– şi se estimează parametrii modelului liniar de regresie: y*=Xrβr+εr

• Eliminarea mecanică a coliniarităţii


– dacă dependenţa
n celor două variabile exogene este: x2i=αx1i + µi
∧ ∑x 1i x 2i
α= i =1
n
cu
∑x
i =1
2
2i

y i = ( β 1 + αβ 2 ) x1i + η i
atunci se estimează modelul de regresie:

13
Exemplu
• Departamentul de HR al unei mari companii care
produce aparatură industrială de înaltă precizie vrea să
folosească modelele de regresie pentru fundamentarea
deciziei de recrutare a directorilor de vînzări.
• Compania are 45 de regiuni de vînzare, fiecare fiind
coordonată de către un director de vînzări(sales
manager).
• Mulţi dintre directorii de vînzări au studii universitare în
domeniul ingineriei electrice şi datorită gradului înalt de
specializare a produselor vîndute, conducerea companiei
crede că ar trebui acceptaţi pentru postul de director de
vînzări doar candidaţii cu studii tehnice.

14
• În timpul interviului pentru angajare, candidaţii trebuie
să susţină două tipuri de teste, specifice jobului: Strong-
Campbell Interest Inventory Test şi Wonderlic Personnel
Test.

• Din cauza timpului şi a banilor cheltuiţi în procesul de


testare, la nivelul conducerii sînt discuţii cu privire la
eliminarea unuia sau a ambelor teste.

• Pentru început, directorul HR adună informaţii despre


toţi cei 45 de directori: anii de experienţă în vînzări,
studii de inginerie, precum şi punctajele de la cele două
teste. 15
• Variabila dependentă este indicele vînzărilor(sales
index), care este raportul dintre vînzările actuale din
regiunea respectivă şi vînzările planificate
(actual/targeted sales).

• Valorile target sînt stabilite în fiecare an de către


conducerea companiei, după consultarea directorilor de
vînzări, fiind bzate pe performanţele anterioare şi
potenţialul pieţei din fiecare regiune.

16
Datele

17
Variabilele studiate
• Sales –raportul dintre vînzările anuale şi vînzările
planificate din fiecare regiune.
• Wonder – scorul la testul Wonderlic Personnel Test. Cu
cît punctajul este mai mare, cu atît abilităţile manageriale
ale candidatului sînt mai puternice.
• SC – scorul la testul Strong-Campbell. Cu cît punctajul
este mai mare, cu atît candidatul este mai indicat pentru
munca de vînzări.
• Experience - numărul de ani de experienţă în vînzări
înainte de a deveni director.
• Engineer – o variabilă dummy, care ia valoarea 1 dacă
directorul de vînzări are studii tehnice şi 0 altfel. 18
Obiectivele studiului
• În urma studiului trebuie realizat cel mai bun model de
predicţie a vînzărilor.

• Studiul trebuie să răspundă la următoarele întrebări:


– Pe viitor ar trebui păstrate la angajare cele două teste?
– Se susţine ideea că a avea studii tehnice este un avantaj în
munca de vînzări?
– Este realistă ipoteza de a angaja numai ingineri pe
poziţiile de directori de vînzări?
– Cît de importantă este experienţa anterioară?

19
Formalizarea modelului
• Y – sales index
• X1 – scorul la testul Wonderlic Personnel (abilităţi
manageriale)
• X2 - scorul la testul Strong-Campbell (abilităţi de
vînzări)
• X3 – numărul de ani de experienţă în vînzări
• X4 – variabila indicator a studiilor tehnice

• Modelul iniţial:
Y   0  1 X 1   2 X 2  3 X 3   4 X 4  
20
21
22
23
24
SC Residual Plot

30

20

10

0
Residuals

-10

-20

-30

-40

-50
0 10 20 30 40 50 60 70 80 90
SC
25
26
Scatter Diagram

140

120

100

80
Y

60

40

20

0
0 10 20 30 40 50 60 70 80 90
X
27
Concluzii
• Singurul factor semnificativ de influenţă asupra
vînzărilor este rezultatul la testul SC( abilităţi de vînzări)
• Este recomandat ca la angajare să fie eliminat testul
Wonderlic Personnel(aptitudini manageriale)
• Experienţa sau studiile tehnice nu trebuie sa fie un
criteriu definitoriu la angajare.

28

Você também pode gostar