Escolar Documentos
Profissional Documentos
Cultura Documentos
1 ρ1 ρ n −1
ρ unde
1 ρ n − 2 cov(ε i , ε i + k ) γk
σ ε2 1 ρk = = k = 1, n - 1
• V= var(ε i ) var(ε i + k ) γ 0
ρ n −1 ρ n−2 1
1
AUTOCORELAREA ERORILOR
2
1. Cauzele de apariţie a autocorelării erorilor
• Absenţa uneia sau mai multor variabile explicative importante
– neincluderea uneia sau mai multor variabile explicative importante
poate genera autocorelarea erorilor.
– exemplu: y i = a + bx1i + cx 2i + ε i
– variabila exogenă x3 este omisă ⇒ variabilele reziduale sunt
autocorelate şi reziduul va fi explicitat prin intermediul acestei
variabile omise: ε i = α + βx3i + u i
• Modelul de regresie nu este corect specificat: fie modelul se
exprimă sub forma unei combinaţii liniare de variabile în
condiţiile în care o specificare corectă a modelului trebuie să fie
exprimată printr-o combinaţie liniară de logaritmi de variabile
exogene etc.
• Au fost făcute transformări neadecvate sau interpolări în cadrul
seriei de date 3
2. Testele statistice utilizate pentru depistarea
autocorelării: Durbin Watson
• Variabila reziduală satisface: ε i = ρε i −1 + u i
• Ipoteze: Ho: ρ=0 Ha: ρ≠0
n
•
∑ (e i − ei −1 ) 2
Statistica testului: DW = i =2
n
∑ ei 2
i =1
•
Numărătorul statisticii va fi scris sub forma echivalentă:
n 2 n n n n n
∑( ei − ei −1 ) = ∑ei − 2 ∑ei ei −1 + ∑ei−1 = 2∑ − 2 ∑ei ei −1 − e12 − en2 .
ei2
i =2 i =2 i =2 i =2 i =1 i =2
Atunci statistica d va fi:
e12 + en2
d = 2(1 − ρ1 ) − n
.
∑ei2
i =1
Dacă seria de date este suficient de mare, vom neglija termenii
extremi din seria reziduurilor, obţinând:
d = 2 (1 − ρ1 ). 4
• d1 şi d2 extrase din tabela Durbin Watson pentru α, k şi n:
– 0 < DW < d1 ⇒ autocorelare pozitivă a erorilor
– d1 ≤ DW ≤ d2 ⇒ indecizie, recomandată acceptarea
autocorelării pozitive
– d2 < DW < 4-d2 ⇒ erori independente
– 4-d2 ≤ DW ≤ 4-d1 ⇒ indecizie, recomandată acceptarea
autocorelării negative
– 4-d1< DW <4 ⇒ autocorelare negativă a erorilor
• Observaţie: Testul Durbin Watson nu poate fi aplicat decât dacă:
– modelul de regresie are termen liber
– matricea X este nestochastică
– printre variabilele explicative nu se află şi variabila endogenă
cu decalaj
5
– seriile de date nu sunt atributive
Testul Durbin Watson
6
3. Metode de estimare a parametrilor în cazul
autocorelării
• Erorile prezintă o autocorelare de un anumit ordin ⇒ estimatorii
parametrilor sunt nedeplasaţi şi consistenţi, dar nu sunt eficienţi.
1. Se estimează parametrii modelului de regresie: Y=Xβ+ε prin metoda celor
mai mici pătrate şi se obţine seria erorilor (ei)i=1,n
2. Se consideră că erorile urmează un proces autoregresiv de ordinul I:
n
∑e e
∧
ρ= i =2
n
i i−1
ε i = ρε i −1 + u i
∑e
i =2
2
i−1
p ∧ ∧ p ∧ ∧
3. y i = β 0 + ∑ β j x ji + ε i ⇒ y i − ρ ⋅ yi −1 = β 0 (1 − ρ ) + ∑ β j ( x ji − ρ x ji −1 ) + ε i − ρ ε i −1
j =1 j =1
* ∧
p
y i = y i − ρ y i −1
Notând: * ∧
*
⇒ yi = α 0 + ∑ β j x*ji + υ i υ i → N (0, σ ) 2
υ
x ji = x ji − ρ x ji −1 j =1
∧
α0 = β0 (1 − ρ)
7
4. Se estimează parametrii noului model şi apoi se revine la modelul iniţial.
HOMOSCEDASTICITATEA
u
• Y=Xβ+ε
E (ε ) = 0
x
w1 0 0
0
2
w1 0
Var ( ε ) = σ ε
0 0 w1
8
1. Testele statistice utilizate pentru depistarea
heteroscedasticităţii - Testul White
1. Se estimează parametrii modelului de regresie: Y=Xβ+ε prin metoda
celor mai mici pătrate şi se obţine seria erorilor (ei)i=1,n
2. Se explicitează seria (ei2)i=1,n în raport cu una sau mai multe variabile
exogene şi se kdefineşte modelul
k de regresie:
1. e 2
i = ∑ a x
j ji
j =1
+ ∑ b j ji + v i
x
j =1
2
yi x x pi εi
• Notând: y =
*
i x = 1i ,...,
*
ε i* =
x ji i
x x x ji
ji ji
• Modelul devine: y i = xi β + ε i
* * *
10
MULTICOLINEARITATEA
• este determinată de prezenţa corelării între variabilele exogene ⇒
determinantul matricei X’X este zero, deci aceasta nu este inversabilă.
• Se consideră modelul centrat şi redus, deci modelul de regresie fără
termen liber:
– matricea de corelaţie evaluată pentru variabilele exogene este 1/n(X’X)-1
– variaţia estimatorilor este σ2R-1/n
– prezenţa corelării variabilelor exogene conduce la creşterea varianţei acelor
estimatori ai parametrilor modelului liniar de regresie ce corespund
variabilelor exogene aflate într-o dependenţă liniară semnificativă, deci
scăderea performanţelor modelului de regresie estimat prin forma clasică a
metodei celor mai mici pătrate.
– se calculează apoi: y* = y − y m
– şi se estimează parametrii modelului liniar de regresie: y*=Xrβr+εr
y i = ( β 1 + αβ 2 ) x1i + η i
atunci se estimează modelul de regresie:
13
Exemplu
• Departamentul de HR al unei mari companii care
produce aparatură industrială de înaltă precizie vrea să
folosească modelele de regresie pentru fundamentarea
deciziei de recrutare a directorilor de vînzări.
• Compania are 45 de regiuni de vînzare, fiecare fiind
coordonată de către un director de vînzări(sales
manager).
• Mulţi dintre directorii de vînzări au studii universitare în
domeniul ingineriei electrice şi datorită gradului înalt de
specializare a produselor vîndute, conducerea companiei
crede că ar trebui acceptaţi pentru postul de director de
vînzări doar candidaţii cu studii tehnice.
14
• În timpul interviului pentru angajare, candidaţii trebuie
să susţină două tipuri de teste, specifice jobului: Strong-
Campbell Interest Inventory Test şi Wonderlic Personnel
Test.
16
Datele
17
Variabilele studiate
• Sales –raportul dintre vînzările anuale şi vînzările
planificate din fiecare regiune.
• Wonder – scorul la testul Wonderlic Personnel Test. Cu
cît punctajul este mai mare, cu atît abilităţile manageriale
ale candidatului sînt mai puternice.
• SC – scorul la testul Strong-Campbell. Cu cît punctajul
este mai mare, cu atît candidatul este mai indicat pentru
munca de vînzări.
• Experience - numărul de ani de experienţă în vînzări
înainte de a deveni director.
• Engineer – o variabilă dummy, care ia valoarea 1 dacă
directorul de vînzări are studii tehnice şi 0 altfel. 18
Obiectivele studiului
• În urma studiului trebuie realizat cel mai bun model de
predicţie a vînzărilor.
19
Formalizarea modelului
• Y – sales index
• X1 – scorul la testul Wonderlic Personnel (abilităţi
manageriale)
• X2 - scorul la testul Strong-Campbell (abilităţi de
vînzări)
• X3 – numărul de ani de experienţă în vînzări
• X4 – variabila indicator a studiilor tehnice
• Modelul iniţial:
Y 0 1 X 1 2 X 2 3 X 3 4 X 4
20
21
22
23
24
SC Residual Plot
30
20
10
0
Residuals
-10
-20
-30
-40
-50
0 10 20 30 40 50 60 70 80 90
SC
25
26
Scatter Diagram
140
120
100
80
Y
60
40
20
0
0 10 20 30 40 50 60 70 80 90
X
27
Concluzii
• Singurul factor semnificativ de influenţă asupra
vînzărilor este rezultatul la testul SC( abilităţi de vînzări)
• Este recomandat ca la angajare să fie eliminat testul
Wonderlic Personnel(aptitudini manageriale)
• Experienţa sau studiile tehnice nu trebuie sa fie un
criteriu definitoriu la angajare.
28