Você está na página 1de 10

1.

Argumentarea variabilelor
In acest proiect doresc sa analizez legatura dintre elementele specifice unei regiuni. Obiectivele acestui proiect
sunt sa determine functia care descrie cel mai bine relatia dintre populatia mai multor sate din judetul Ilfov si
rata emigrarii sau dezvoltarea regional, sa observe legaturile care se stabilesc intre acestea trei variabile si sa
estimeze un model econometric valid si semnificativ statistic. Pentru inceput am definit variabilele modelului :
- variabila dependenta sau varianta de explicat (Y): populatia satului in 2002;
- variabile independente sau variante explicative (X1, X2): rata emigrarii in 2002 si dezvoltarea
regionala.
Pentru a analiza relatia dintre aceste variabile am construit o baza de date in Excel cu 3 variabile pe un
esantion de 30 unitati.
Judet

Comuna

Sat

ILFOV

MAGURELE

MAGURELE

ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV

POPESTILEORDENI
BRAGADIRU
CHITILA
BALOTESTI
VOLUNTARI
CORNETU
01.Dec
MOGOSOAIA
JILAVA
CHIAJNA
BRANESTI
AFUMATI
CIOROGARLA
DOMNESTI
SNAGOV
DOBROIESTI
BERCENI
SNAGOV
CLINCENI
CORBEANCA
PERIS
DRAGOMIRESTIVALE
TUNARI
GLINA
DRAGOMIRESTIVALE
CHIAJNA
CORBEANCA
CERNICA
CERNICA

POPESTI LEORDENI
BRAGADIRU
CHITILA
BALOTESTI
VOLUNTARI
CORNETU
1 DECEMBRIE
MOGOSOAIA
JILAVA
CHIAJNA
BRANESTI
AFUMATI
CIOROGARLA
DOMNESTI
SNAGOV
DOBROESTI
BERCENI
GHERMANESTI
CLINCENI
CORBEANCA
PERIS
DRAGOMIRESTIVALE
TUNARI
GLINA
DRAGOMIRESTIDEAL
ROSU
OSTRATU
CERNICA
CERNICA

ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
Tabel1

Populatia
satului in
2002
(loc)
5.004

Rata
emigrarii in
2002 (%)

Dezvoltarea
regionala

6,20

102,71

15.115
8.165
11.283
5.273
30.016
4.989
6.598
5.232
8.966
3.839
4.236
6.613
3.069
2.560
1.484
3.944
1.365
2.034
3.762
1.370
2.100

7,21
5,02
7,09
1,52
3,90
7,62
7,43
3,82
1,68
4,17
1,42
4,99
3,26
3,12
6,06
0,76
2,19
4,42
2,13
2,19
2,65

99,43
99,31
97,68
96,69
95,94
95,29
94,80
93,94
91,01
86,45
85,13
84,81
84,21
83,74
83,63
83,20
81,73
81,11
80,02
79,04
78,42

1.213

1,65

3.617
4.409

3,87
4,08

2.195

10,02

3.397
367
2.799

13,84
4,80
0,36
3,50

3.745

78,30
77,83
76,63
76,28
75,58
73,12
72,66
73,22

SUMMARY OUTPUT
Regression Statistics
Multiple R
0,571494753
R Square
0,326606253
Adjusted R Square
0,276725234
Standard Error
4793,267991
Observations
30
ANOVA
df
Regression

Residual

27

Total

29
Coefficients

Intercept

-25202,91225

Rata emigrarii in 2002


(%)
Dezvoltarea regionala

34,27557374
355,3453874

SS
30087257
4
62033628
7
92120886
1
Standard
Error

MS
1504362
87
2297541
8

t Stat

F
6,547
71

Significan
ce F
0,0048043
27

Pvalue

Lower
95%

8473,331
249

2,97438
1

0,006
12

308,3800
281
99,71993
55

0,11114
72
3,56343
38

0,912
32
0,001
39

Upper
95%

42588,751
69
598,46797
14
150,73698
3

7817,072
821
667,0191
189
559,9537
918

RESIDUAL OUTPUT
Predicted
Populatia
satului in 2002

Observation

11506,89933

Residuals
6502,899
333

16

4723,9101
49

3239,910
149

Lower
96,0%
43486,87
668
631,1545
029
140,1672
362

Upper
96,0%
6918,947
832
699,7056
504
570,5235
386

10376,47469

10259,30704

9749,992641

9208,106684

9022,054411

8917,924294

8739,102906

8309,397631

10

7193,791563

11

5658,020817

12

5094,484531

13

5105,099663

14
15

4831,228755
4661,515794

4738,525
311
2094,307
04
1533,007
359
3935,106
684
20993,94
559
3928,924
294
2141,102
906
3077,397
631
1772,208
437
1819,020
817
858,4845
311
1507,900
337
1762,228
755
-

17

4386,7792
69

18

3913,8068
4

19

3769,8462
61

20

3303,4456
11

21

2957,8760
23

22

2753,8290
59

23

2678,6603
78

442,7792
689
2548,806
84
1735,846
261
458,5543
886
1587,876
023
653,8290
589
1465,660
378

25

2586,5052
49
2165,8170
21

26

2248,0444
02

27

2129,6283
3

28

944,38679
49

1267,371
67
577,3867
949

29
30

627,62234
26
935,44151

2171,377
657
2809,558

24

1030,494
751
2243,182
979
53,04440
209

2101,515
794

85

482

Tabel2

2. Calculul corelatiilor dintre variabile


Populatia satului in
2002
Populatia satului in
2002
Rata emigrarii in
2002 (%)
Dezvoltarea
regionala

Rata emigrarii in
2002 (%)

Dezvoltarea
regionala

1
0,099549797

0,571225126

0,143865177

Tabel3

Conform tabelului de mai sus, se poate observa corelatiile existente intre variabile, iar cea mai puternica corelatie este intre populatia
satului si dezvoltarea regionala (coef. de corelatie 0,5712).

3. Validitatea modelului cu ajutorul ANOVA


H0: bj = 0, variabilele independente nu au o influenta semnificativa asupra lui Y;
H1: bj 0, variabilele independente au o influenta semnificativa asupra lui Y
In urma introducerii datelor in Excel, din analiza de regresie, prezentata in Tabelul 2, am obtinut un
model de regresie de forma: y= -25.202,91+34,27 x1 + 355,34 x2+ei , iar valoare ajustata a lui y este:
= -25.202,91 + 34,27 x1 + 355,34 x2 .
Pentru a studia intensitatea legaturii dintr-o variabila dependenta (Y) si mai multe variabile
independente (X1, X2) utilizand metoda corelatiei, se calculeaza raportul de corelatie multipla (Multiple
R). R = 0,5714 arata ca intre populatia satului si cele doua variabile luate in calcul exista o legatura
aproape puternica.
Patratul raportului de corelatie multipla este coeficientul de determinatie (R 2), el arata proportia din
variatia totala a variabilei Y care este explicata de variabilele independente, astfel ca un R 2 = 0,3266 arata
ca 32,66 % din variatia populatiei este influentata de rata emigratiei si de indicele dezvoltarii regionale.
Avand rezultatele afisate din Excel, ca Fc = 6,5477 > Ft (pragul de semnificatie)= 0,0048 fiind mai mic
de 0,05, asadar nu exista suficiente motive pentru a accepta ipoteza nula, deci ea este respinsa si se
accepta ca adevarata ipoteza alternativa H1: bj 0, de unde rezulta ca modelul este semnificativ statistic,
deci modelul este valid (variabilele independente au o influenta semnificativa asupra lui Y), pentru o
probabilitate de cel mult 100 0,48 = 99,52%.
4. Semnificatia parametrilor ecuatiei de regresie
Intercept este termenul liber, coeficientul b0 fiind de -25.202,91, el reprezentand punctul in care toate
variabilele explicative sunt 0. Deoarece tb0 = -2,9743 iar pragul de semnificatie P-value este de 0,0061
fiind mai mic decat 0,05 inseamna ca acest coeficient este semnificativ(cu o probabilitate de 100 0,61 =
99,36% > 95%)
Coeficientul b1 (coefficient de regresi) este de 34,27 ceea ce inseamna ca la crestere ratei emigrarii cu
1%, populatia satului va creste cu 34,2755 persoane. Deoarece tb1 = 0,1111 iar pragul de semnificatie Pvalue este de 0,9123 fiind mai mare decat 0,05 inseamna ca acest coeficient este nesemnificativ (cu o
probabilitate de 100 91,23 = 8,77% < 95%).
Coeficientul b2 este de 355,34 ceea ce inseamna ca la cresterea indicelui dezvoltarii regionale cu o
unitate, populatia satului va creste cu 355,3453 persoane. Deoarece tb2 = 3,5634 iar pragul de semnificatie
p-value este de 0,0013 fiind mai mic decat 0,05, inseamna ca acest coefficient este semnificativ (cu o
probabilitate de 100 0.13 = 99,87% > 95%).
Se poate observa ca pentru variabila rate emigrarii am obtinut un coefficient de regresie
nesemnificativ.
5. Estimarea valorii variabilei dependente in functie de valori stabilite ale variabilelor
independente
Pentru valori ale lui x1 = 10 si x2 = 70, atunci = -25.202,91 + 34,27 * 10 + 355,34 * 70, atunci vom
avea = 13,59.

6. Testarea homoscedasticitatii
H0: modelul prezinta homoscedasticitate;
H1: modelul prezimta heteroscedasticitate.
S-au scos un numar de 6 valori de la mijlocul seriei, formandu-se doua serii egale de 12 observatii.
Judet

Comuna

Sat

ILFOV
ILFOV
ILFOV
ILFOV

CERNICA
CORBEANCA
CERNICA
CHIAJNA
DRAGOMIRESTIVALE
GLINA
TUNARI
DRAGOMIRESTIVALE
PERIS
CORBEANCA
CLINCENI
SNAGOV
BERCENI
DOBROIESTI
SNAGOV
DOMNESTI
CIOROGARLA
AFUMATI
BRANESTI
CHIAJNA
JILAVA
MOGOSOAIA
01.Dec
CORNETU
VOLUNTARI
BALOTESTI
CHITILA
BRAGADIRU
POPESTILEORDENI
MAGURELE

CERNICA
OSTRATU
CERNICA
ROSU
DRAGOMIRESTIDEAL
GLINA
TUNARI
DRAGOMIRESTIVALE
PERIS
CORBEANCA
CLINCENI
GHERMANESTI
BERCENI
DOBROESTI
SNAGOV
DOMNESTI
CIOROGARLA
AFUMATI
BRANESTI
CHIAJNA
JILAVA
MOGOSOAIA
1 DECEMBRIE
CORNETU
VOLUNTARI
BALOTESTI
CHITILA
BRAGADIRU
POPESTI LEORDENI
MAGURELE

ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
ILFOV
Tabel 4

Populatia
satului in
2002
(loc)
2.799
367

Rata
emigrarii in
2002 (%)

3.397

0,36
4,80
3,50
13,84

2.195

10,02

4.409
3.617

4,08
3,87

1.213

1,65

2.100
1.370
3.762
2.034
1.365
3.944
1.484
2.560
3.069
6.613
4.236
3.839
8.966
5.232
6.598
4.989
30.016
5.273
11.283
8.165
15.115
5.004

2,65
2,19
2,13
4,42
2,19
0,76
6,06
3,12
3,26
4,99
1,42
4,17
1,68
3,82
7,43
7,62
3,90
1,52
7,09
5,02
7,21
6,20

3.745

Dezvoltarea
regionala
72,66
73,12
73,22
75,58
76,28
76,63
77,83
78,30
78,42
79,04
80,02
81,11
81,73
83,20
83,63
83,74
84,21
84,81
85,13
86,45
91,01
93,94
94,80
95,29
95,94
96,69
97,68
99,31
99,43
102,71

S-au format regresiile pentru fiecare serie in parte si s-au calculat variatia reziduala pentru acestea, iar
apoi s-a determinat testul Goldfeld-Quandt.. Conform datelor din Tabelul 5 si 6, SSE1 = 16.555.106,39,
SSE2 = 557.099.924,1, GQ = SSE2 / SSE1 = 33.6512, iar F critic = 2,686637. Cum GQ > F critic,
respingem H0 , deci seria de valori nu prezinta homoscedasticitate.

SUMMARY OUTPUT
Regression Statistics
0,120032
Multiple R
527
0,014407
R Square
807
0,204612
Adjusted R Square
68
1356,265
Standard Error
558
Observations
12
ANOVA
df
Regression
Residual
Total

Intercept
Rata emigrarii in
2002 (%)
Dezvoltarea
regionala
Tabel5

2
9
11
Coefficien
ts

SS
242009,6
138
16555106
,39
16797116
Standard
Error

MS
12100
4,8
18394
56

F
0,06578
29

Significa
nce F
0,936780
1

t Stat

P-value

Lower
95%

2844,805
124

11480,41
182

0,2477
96

0,80985
28

38,25206
544
5,612960
023

108,5292
21

0,3524
59
0,0378
4

0,73260
73

148,3280
223

0,97064
01

23125,69
1
207,2580
9
341,1542
6

Upper
95%

Lower
95,0%

Upper
95,0%

28815,
3

23125,7

28815,3

283,76
22

207,258

283,762
2

329,92
83

341,154

329,928
3

SUMMARY
OUTPUT
Regression Statistics
0,26791
Multiple R
2
0,07177
R Square
7
Adjusted R
Square
-0,13449
7867,65
Standard Error
5
Observations
12
ANOVA
df
Regression

Residual

Total

11

SS
43079016,5
5
557099924,
1
600178940,
7

Coefficie
nts

Standard
Error

Intercept

-31345,9

49105,2638
9

X Variable 1

-321,238

X Variable 2

442,033
3

Tabel6

MS
21539508,
27
61899991,
57

t Stat

F
0,347972
717

P-value
0,539153
015

1197,23775
5

0,6383414
0,2683156
82

547,711701
5

0,8070546
74

0,440441
036

0,794505
015

Significanc
eF
0,7152132
64

Lower 95%
142429,74
71
3029,5776
24
796,97665
77

Upper
95%

Lower
95,0%

Upper
95,0%

79737,90
133

-142430

79737,9

2387,102
293

3029,58

2387,10
2

1681,043
235

796,977

1681,04
3

Você também pode gostar