Escolar Documentos
Profissional Documentos
Cultura Documentos
CAPITOLUL 4.
diagram de structur
curb de concentrare
curba frecvenelor cumulate
ogiv
diagram de corelaii
Nr. loc.
(ni)
Centr.
intera. xi
x i ni
Frecvene
cumulate
xi -x
(xi - x )2ni
11
3,5
38,5
11
-38,975
16709,556
53
87
61
23
13
4
7
259
7,5
15,0
35,0
75,0
150,0
250-0
350,0
-
397,5
1305
2135
1725
1950
1000
2450
11.001
64
151
212
235
248
252
259
-
-34,975
-27,475
-7,475
32,525
107,525
207,525
307,525
-
64832,281
65674,178
3408,413
24331,138
150301,12
172266,5
662001,37
1159524,3
Obs.1. din datele prezentate lipsete oraul Bucureti care avnd o populaie de peste 5 ori mai mare
dect limita superioar a ultimului interval de grupare se constituie ntr-un element atipic
al colectivitii localitilor urbane din Romnia;
Obs.2. intervalele de grupare folosite n statistica oficial a Romniei pentru aceste date sunt neegale.
Pentru calculul mediei este necesar stabilirea centrelor intervalelor de grupare (xi), ca
medii aritmetice simple ale limitelor fiecrui interval de grupare. Primul interval se consider nchis
la limita inferioar de 200 pers.
x=
11001
= 42,475 mii persoane
259
Media este varianta care mparte seria ordonat n dou pri egale.
Loc Me =
n +1
;
2
Loc Me
259 + 1
= 130 .
2
ntr-o serie organizat pe intervale de grupare, dup aflarea locului medianei se procedeaz
la identificarea intervalului ce conine mediana. Adunnd treptat frecvenele ajungem la un numr
mai mare sau egal cu cel al locului meidanei, astfel rezultnd intervalul n care se gsete mediana.
Mediana se calculeaz dup relaia urmtoare:
Me = x 0 + k
0,5(n + 1) np Me
n Me
, unde:
Me = 10 + 10
130 64
= 17,586 mii pers.
87
Mediala separ n dou pri egale suma produselor dintre valorile variabilei i frecvenele
corespunztoare. Mediala se aplic la repartiia valorilor globale ale variabilei analizate.
Ml = x 0 + k
locMl npMl
n Ml
Mo = x 0 + k
1
, unde:
2 + 3
Mo = 10 + 10
34
= 15,667 mii pers.
34 + 26
Chiar dac cele trei valori ale tendinei centrale ar fi fost foarte apropiate n
preocuparea economistului trebuie s se afle nu numai valorile tipice (cu caracter de
generalitate cu mediile) ci i variabilitatea n jurul mediei. Se pune problema de a
carcteriza mrimea, intensitatea i forma variaiei n jurul mediei.
Indicatorii variaiei i ai asimetriei
n funcie de numrul de variante luate n calcul i dup rolul ndeplinit n analiza
variaiei distingem:
indicatori simpli ai variaiei;
indicatori sintetici ai variaiei.
Indicatorii simpli ai variaiei:
a) abaterea fiecrei variante sau fiecrui centru de interval de grupare de la
medie, exprimat n mrimi absolute sau relative:
d i = xi x
d i % = (( x i x ) x ) 100
x max x min
100
x
n cazul nostru
398
100 = 937%
42,475
(x
d=
d=
(d )n
n
i
x)
Interpretare: populaia din cele 259 de localiti este cu 39,604 mii pers. mai mic sau mai
mare dect media calculat ca fiind egal cu 42,475 mii pers.
2 =
2 =
(x
x n
=
n
2
i
x ) 2 ni
(x) 2 =
(x
x)
n
=
1159524,5
= 4476,9285
259
1626791
(42,475) 2 = 4476,9285
259
= 2
Rezultatul este ntotdeuna mai mare dect d
100 =
66,91
100 = 157,5%
42,475
x Mo
C as [ 1,1]
sau
C as
3 ( x Me)
C as [ 3,+3]
x 0 = 50 min . Dispersia general a fost de o2 = 200 , abaterea medie ptratic: o=14,1421 iar
coeficientul de variaie a fost de v0 = 28,28%. Aceasta nseamn c timpul real de ateptare al celor
100 cltori este cu 14,14 min. sau cu 28,28% mai mare sau mai mic dect media general de 50 min.
Aceast intensitate a variaiei face ca media x o = 50 s fie reprezentativ.
Datele rezultate n urma studiului efectuat sunt urmtoarele:
Punct de observare
xi
Benzinaria Baneasa
Benzinaria Otopeni
Total
Total ni
40
60
100
yi =
y n
n
j
ij
y0 =
ij
y0 =
y1 =
y2 =
y n
n
j
5000
= 50 min
100
15 30 + 50 20 + 70 5
= 45 min
40
30 10 + 50 30 + 70 20 3200
=
= 53,3 min
60
60
=
2
i
(y
j
y i ) nij
ij
2
0
(y
=
y0 ) 2 n j
(y
=
y 0 ) ni
Disperisa rezidual arat influena factorilor reziduali (ali factori dect numrul de
staii). Se calculeaz ca o medie aritmetic ponderat a dispersiilor de grup:
2
n
=
n
2
i
02 = 2 + 2
R2 =
16,6
2
100 =
= 8,3%
2
200
0
Deci, n proporie de 8,3% variaia timpilor de ateptare poate fi explicat prin factorul
numrul de staii de ateptare.
coeficientul de nedeterminaie (k2) care este o valoare complementar fa de R2.
183,4
2
k = 2 100 =
100 = 91,7%
200
0
2
Deoarece coeficientul de determinaie este mai mic de 50% este necesar testarea statistic a
semnificaiei influenei factorului de grupare asupra variabilei cercetate.
Aceast testare statistic se face cu ajutorul testului Fisher-Snedecor (F). Acest test verific
consistena influenei factorului suplimentar de grupare comparnd cele dou pri ale dispersiei
generale. Mai precis, se iau n considerare numrtorii acestor dispersii (denumii variane sau
deviane) corectai cu un numr corespunztor al gradelor de libertate de variaie.
2 x 2 z
:
F=
r 1 n r
2x = ( y i y 0 ) 2 ni
z2 = variaia rezidual = numrtorul dispersiei reziduale
2z = i2 ni
n = numrul elementelor colectivitii
r = numrul de grupe constituite
F=
1653,4 18333,4
:
= 8,84
2 1 100 2
pentru = 0,05
coloana r-1 = 1
linia n-r = 98, rezult Ftabelat = 3,86934
Valoarea calculat a lui F se compar cu valoarea tabelat pentru (r-1) (n-r) grade de
libertate, tabelarea fcndu-se separat pentru diverse praguri de semnificaie a erorii. De exemplu
acceptm o eroare de = 0,05 atunci vom gsi n coloana r-1 pe linia n-r valoarea critic a lui F
pentru care factorul de grupare mai are semnificaia real (Ftabelat este o valoare minim).
Dac Fcalculat Ftabelat nseamn c factorul de grupare are o influen consistent (e o cauz
real) cu eroarea acceptat.
valoarea
atribuit
Frecvene
x1 = F
absolute (ni)
M
x2 = B
NM
relative (nxi)
M
N
NM
N
TOTAL
=p
= q =1 p
p+q=1
x=
x n
n
i
1 M + 0 (N M ) M
=
=p
N
N
Din totalul de N elemente ale unei colectiviti se noteaz cu M numrul de elemente care
posed starea care ne intereseaz (n cazul nostru n1 = M iar n2 = N-M, rezult n1 + n2 = N
P=
99032
= 0,46
215226
x = x i nix = 1 p + 0 q = p
Dispersia acestei caracteristici se calculeaz tot dup formula clasic:
2 =
(x x)
n
i
(1 p) 2 p + (0 p) 2 q q 2 p + p 2 q
=
= pq = 0,2484
p+q
p+q
Dispersia unei caracteristici alternative este produsul cotelor pri ale celor dou stri sau
vriante n colectivitatea general.
Media i dispersia caracteristicii alternative se folosesc n estimarea unor parametrii ai
colectivitii generale atunci cnd cercetarea se bazeaz pe eantioane reprezentative.
Activitatea economic
1
2
3
4
5
6
7
8
agricultur
silvicultur i expl. forestier
piscicultur i pescuit
industria extractiv
industria prelucrtoare
energie electric , term., gaze, ap
construcii
servicii
TOTAL
603,0
98,8
7,9
277,6
3188,1
152,3
482,6
2579,2
7389,5
% activ n total
salariai
8,2
1,3
0,,,1
3,8
43,,1
2,1
6,5
34,9
100,0
xi
xi
n g i2 1
n 1
0 < c < 1
c =
8 0,32 1
= 0,4728 , adic alterneaz la mijlocul intervalului de definire, ns nu
8 1
Probleme i aplicaii
4.1. Pentru a verifica reglarea unei maini de debitat, din producia realizat de-a lungul
unei zile (N = 600 piese) se prelev un eantion n = 65 piese, care msoar n mm:
90,9
95,5
70,5
92,4
89,4
93,2
76,1
83,3
88,6
92,4
72,4
78,8
91,7
92,4
93,2
91,7
97,0
93,9
97,7
88,6
93,2
65,2
91,7
7,9
87,1
67,4
77,8
84,1
95,5
97,0
75,0
86,4
85,6
87,1
96,2
83,3
87,1
87,9
91,7
86,1
75,0
76,1
89,4
96,2
90,9
90,2
86,4
85,6
92,4
87,9
99,2
96,2
84,1
86,4
98,5
88,6
83,3
100,0
81,8
98,5
62,8
87,9
80,3
76,5
81,8
cu frecvena
1
1
1
1
1
2
2
1
1
1
1
2
3
2
2
1
3
Varianta
87,1
87,9
88,6
89,4
90,2
90,9
91,7
92,4
93,2
93,9
95,5
96,2
97,0
97,7
98,5
99,2
100,0
cu frecvena
3
4
3
2
1
2
4
4
3
1
2
3
2
1
2
1
1
Media: x =
ni + 1 65 + 1
=
= 33;
2
2
Mediana este a 33-a variant n seria ordonat cresctor. Deci, Me = 87,9 mm.
Pentru a afla modul se va observa c frecvena maxim nregistrat este 4,
ntlnit la trei variante. Deci, seria de variante distincte ale caracteristicii
observate este o serie trimodal (cu trei moduri):
Mo = 87,9 mm; Mo = 91,7 mm;
Mo = 92,4 mm.
Indicatorii variaiei:
Amplitudinea absolut a variaiei:
A = x max x min = 100.0 62.8 = 37,2 mm
37,2
A
100 =
100 = 42,7%
87,1
x
= 2 = 8,42 mm
Cele 65 piese msurate sunt n medie cu 8,42 mm mai scurte sau mai lungi dect media
calculat (87,1 mm).
Coeficientul de variaie:
v=
100 = 9,67%
Intervale
de variaie a
lungimii piesei
(mm)
Pn la 65
65,1 70,0
70,1 75,0
75,1 80,0
80,1 85,0
85,1 90,0
90,1 95,0
95,1 100,0
Total
Numr piese n
fiecare grup
(ni)
1
2
4
5
8
18
15
12
65
62,5
67,5
72,5
77,5
82,5
87,5
92,5
97,5
---
xini
62,5
135,0
290,0
387,5
660,0
1575,0
1387,5
1170,0
5667,5
Locul medianei este tot 33, dar se va observa c aceast variant este cuprins
n intervalul (85,1 90,0). Prin interpolarea n acest interval, rezult mediana:
Me = x Me + k Me
0,5(n + 1) F
33 20
i
= 85,1 + 5
= 88,7 mm
Me
18
f
Mo = x Mo + k Mo
10
1
= 85,1 + 5
= 88,9 mm
+
10 + 3
1
2
Eroarea de estimare (e) indus de folosirea centrelor intervalelor de grupare, n locul variantelor reale, se
obine comparnd mediile din rezolvrile 1 i 2:
x x
87.2 87.1
e = 2 1 100 =
100 = +0,11% (o eroare neglijabil).
x1
87.1
Intervale de
variaie a lungimii
piesei (mm)
Pn la 65
65,1 70,0
70,1 75,0
75,1 80,0
80,1 85,0
85,1 90,0
90,1 95,0
95,1 100,0
Total
Numr
piese
(ni)
(xi)
xi x
1
2
4
5
8
18
15
12
65
62,5
67,5
72,5
77,5
82,5
87,5
92,5
97,5
---
-24,7
-19,7
-14,7
-9,7
-4,7
0,3
5,3
10,3
---
( xi x ) 2 ni
610,09
776,18
864,36
470,45
176,72
1,62
421,35
1273,08
4593,85
xi ni
3906,25
9112,50
21025,00
30031,25
54450,00
137812,50
128343,75
114075,00
498756,25
2 =
( xi x ) 2 ni 4593,85
=
= 70,6746 ,
65
n i
2 =
xi ni
49756,25
(x)2 =
87,2 2 = 69,3333
65
n i
Diferena dintre cele dou rezultate este cauzat de rotunjirile repetate la prima
versiune a calculului.
Abaterea medie ptratic este radicalul de ordinul doi din dispersie:
2 = 2 = 69.3333 = 8,3 mm ,
ceea ce arat c ntre lungimile reale ale celor 65 piese observate i media estimat exist
o distan medie de aproximativ 8,3 mm.
100 =
8,3
100 = 9,5%
87,2
8,3
Se observ o diferen de numai 1,7 mm ntre medie i mod, modul fiind mai
mare, ceea ce nseamn c seria prezint o moderat asimetrie de dreapta (-0,2048).
4.2. O anchet derulat n rndul salariailor unui lan de magazine conduce la
urmtoarea grupare a acestora n funcie de salariul lunar (milioane lei) i sex:
*)
Intervale de variaie
a salariului lunar (mil lei)
pn la 3,5*)
3,5 4,5
4,5 5,5
5,5 6,5
6,5 7,5
7,5 8,5
8,5 i peste
Total
Numr de
salariai
58
119
140
102
58
39
24
540
din care:
brbai
femei
31
71
112
92
55
37
22
420
27
48
28
10
3
2
2
120
Se cere:
S se determine indicatorii tendinei centrale i s se comenteze rezultatele
folosind indicatorii variaiei n jurul mediei i indicatorii asimetriei.
Rezolvare
Salariul mediu lunar al celor 540 salariai investigai este de:
x=
xi ni 28960
=
= 5,363 mil lei / luna
n i
540
Me = x Me + k Me
Mo = x Mo + k Mo
0,5(n + 1) F
270,5 177
i
= 4,5 + 1
= 5,168 mil lei / lun
140
f Me
21
1
= 4,5 + 1
= 4,856 mil lei / lun
21 + 38
+
1
2
A= x
x
= 90 30 = 60 mil lei
max
min
A
A % = 100 = 111,9%
x
ntruct amplitudinea variaiei comparat cu media colectivitii depete 100%,
se poate afirma c mrimea mprtierii este destul de mare.
Dispersia se determin cu ajutorul formulei de calcul simplificat astfel:
02 =
x i n i
16880
( x0 ) 2 =
5,363 2 = 2,4979
ni
540
0
x0
100 = 29,5%
1,58
x1 =
xi ni1 2368
=
= 5,638 mil lei
ni1
420
x2 =
xi ni 2 528
=
= 4,4 mil lei
n i 2
120
22 =
( xi x2 ) 2 ni 2
= 1,54
ni 2
=
2
( x j x 0 ) 2 n j
n j
2y / x
n j
43,0468
= 0,2649
540
Dispersia rezidual:
=
2
2j n j
n j
2y / z
n j
1205,778
= 0,2649
540
02 = 2 + 2
2,4779 0,2649 + 2,2329
Ca urmare a repetatelor rotunjiri, pot apare unele mici diferene, cum este i n
acest caz.
S se afle n ce msur influeneaz sexul salariailor variaia n jurul mediei (D)
i s se testeze dac diferena (disparitatea salarial) este statistic consistent (testul F i,
eventual, testul t).
Rezovare:
Coeficientul de determinaie:
0 ,2649
2
100 =
100 = 10 ,6%
2
2,979
0
Doar 10,6% din variaia total a salariilor poate fi explicat prin diferenierea
salariailor dup sex.
- Testul Fisher-Snedecor se aplic pentru a vedea dac o asemenea influen redus
este statistic semnificativ:
2y / x 2y / z 143,9468 1205,778 13,0468
F=
:
=
:
=
= 63,825
2 1
540 2
2,2412
r 1 n r
Pentru probabilitatea p = 0,95 (eroare acceptat = 0,05), F1, 538 (3,84; 3,92).
Cum Fcalculat > Ftabelat factorul de grupare (sexul) are o influen consistent
asupra variaiei salariilor lunare ale celor 540 angajai.
- Testul Student pentru verificarea semnificaiei diferenei ntre dou medii:
t=
x1 x 2
12
n1
22
n2
5,638 4,4
2,4309 1,54
+
420
120
1,238
= 9,0723
0,1365
Valoarea calculat este mult mai mare dect t = 1,96 (pentru o eroare acceptat
= 0,05) sau t = 2,58 (pentru o eroare acceptat = 0,01), ceea ce nseamn c mediile
difer consistent din punct de vedere statistic (grade de libertate n-r = 540-2 = 538).
S se prezinte grafic disparitatea ntre salarizarea femeilor i brbailor.
Rezovare:
Disparitatea salarizrii brbai-femei poate fi observat prin compararea
repartiiilor de frecvene relative pe intervale de variaie a salariului lunar brut,
determinate pe baza ultimelor dou coloane ale tabelului din enun:
Intervale de variaie a
salariului lunar (mil lei)
pn la 3,5
3,5 4,5
4,5 5,5
5,5 6,5
6,5 7,5
7,5 8,5
8,5 i peste
Total
9%
5%
7%
17%
13%
27%
22%
3% 2%2%
23%
23%
39%
93
284
560
552
385
296
198
2368
81
192
140
60
21
16
18
528
3,9
12,0
23,6
23,3
16,3
12,5
8,4
100,0
15,3
36,4
26,5
11,4
4,0
3,0
3,4
100,0
Numr filiale
2
3
7
2
1
Se cere:
1. s se determine indicatorii simplii ai variaiei;
2. s se determine indicatorii sintetici ai variaiei.
4.5. Fie x10 = 5 i 2 10 = 20 media i dispersia numerelor a1 ,..., a10 .
Presupunem c se adaug termenul urmtor este a11 = 16 .
1. Care va fi media aritmetic x11 a numerelor a1 ,..., a11 ?
2. Presupunem c a11 = 5 . Calculai x11 i 112 .
3. Determinai media aritmetic x n +1 a n+1 termeni ca o funcie de x n , a n +1 i de n.
4.6. Fie v coeficientul de variaie al n numere. Dac fiecare din aceste numere este
nmulit cu 2, s se precizeze care va fi noul coeficent de variaie?
Numr de persoane
30
60
100
70
40
300
Se cere:
1. s se caracterizeze gradul de omogenitate al repartiiei;
2. s se calculeze indicatorii tendinei centrale;
3. s se msoare gradul de asimetrie.