Você está na página 1de 22

Statistic teoretic i economic

CAPITOLUL 4.

ANALIZA STATISTIC A SERIILOR DE REPARTIIE


Cuvinte cheie:
- amplitudinea variaiei
- abaterea medie liniar
- abaterea medie ptratic (standard)
- coeficientul de variatie
- coeficientul de concentrare GINI
- dispersia
- dispersia explicata
- dispersia reziduala
- seria de repartiie
- variabila alternativ
Seria de repartiie sau seria de distribuie este rezultatul gruprii elementelor
unei colectiviti n funcie de variantele sau intervalele de variaie ale (unor)
caracteristici atributive, cantitative sau calitative.
Dac se folosete o singur caracteristic de grupare, seria de repartiie se numete
unicriterial sau unidimensional.
Dac caracteristica de grupare este numeric, seria de repartiie se numete i
serie de variaie.
O caracteristic de grupare calitativ (nenumeric) conduce la alctuirea unei serii
de repartiie numit serie de atribute sau serie nominativ.
Un caz particular al seriilor nenumerice l reprezint variabila alternativ: dou
strri sau variante nenumerice care se elimin reciproc.
Dac se folosete concomitent mai multe caractristici de grupare atributive rezult
o serie de repatiie multicriterial sau multidimensional.
4.1. Particularitile seriilor de repartiie.
omogenitatea termenilor, toate variantele au o esen, o determinare comun,
cauzat de factori hotrtori care genereaz nsi colectivitate cercetat;
independena termenilor seriei, n sensul c fiecare valoare este specific unui
element al colectivitii i nu depinde de valoarea nregistrat la celelalte
elemente;
variabilitatea termenilor seriei, cauzat de faptul c pe lng factorii hotrtori,
eseniali acioneaz i factori ntmpltori, accidentali care fac ca manifestarea
individual s fie divers;
concentrarea sau dispersarea termenilor, seriei n funcie de raportul de for
dintre factorii eseniali, hotrtori i factorii ntmpltori.
Reprezentarea grafic se face prin:
- histogram
- poligon de frecven
- diagram de benzi

Statistic teoretic i economic


-

diagram de structur
curb de concentrare
curba frecvenelor cumulate
ogiv
diagram de corelaii

4.2.Sistemul de indicatori pentru caracterizarea unei repartiii unidimensionale.


Acest sistem de indicatori cuprinde dou categorii:
a) indicatori ce caracterizeaz frecvenele de apariie ale unei uniti de acelai
fel;
b) indicatori ce caracterizeaz valorile sau variantele caracteristicii cercetate.
Din primul set de indicatori amintim urmatorii:
-frecvenele absolute (ni) = numrul de elemente cuprinse ntr-o grup;
= cota parte, greutatea specific a unei variante sau
- frecvenele relative (nix)
grup de variante;
- frecvenele cumulate
= n procesul analizei se cumuleaz treptat fie
frecvenele absolute, fie cele relative n sensul cresctor i/sau n sensul descresctor al
valorilor caracteristicii cercetate. Aceast cumulare servete la exprimarea nivelului de
concentrare n cadrul colectivitii i la determinarea indicatorilor tendinei centrale;
- densitatea de frecven,
= n analiza seriilor de repartiie la organizarea pe
intervale neegale de grupare, se calculeaz reportul ni/ki sau nix/ki (ki = mrimea
intervalelor de grupare). Marjoritatea variabilelor economice tind aceast densitate s se
diminueze cresctor sau descresctor simetric ctre capetele seriei.
Din cel de-al doilea set de indicatori din cadrul sistemului de indicatori care
caracterizeaza repartiiile unidimensionale fac parte:
-

indicatorii tendinei centrale;


indicatorii variaiei i ai asimetriei;
indicatorii concentrrii.

Indicatorii tendinei centrale.


Aceti indicatori au misiunea de a exprima printr-un numr ceea ce este comun,
esenial pentru elementele colectivitii cercetate i pentru c realitatea este att de
divers nu ne oprim doar la medie, ci vom aduga i mediana i modul, ca o modalitate
de a reda esena comun a elementelor unei colectiviti.
Dac seria de date statistice este organizat pe variante distincte atunci media,
mediana i modul se afl potrivit relaiilor daje studiate. Majoritatea seriilor este ns
organizat pe intervale (egale sau nu) de variaie ale unei caracteristici de grupare i n
acest context determinarea mediei, medianei i a modului mbrac unele particulariti pe
care le vom ilustra n exemplul urmtor:
Gruparea localitilor Romniei dup numrul populaiei la data de 7 ianuarie 1992 este
dat n tabelul urmtor:
Interv. de var. a
nr. pop. (mii
pers.)
sub 5

Nr. loc.
(ni)

Centr.
intera. xi

x i ni

Frecvene
cumulate

xi -x

(xi - x )2ni

11

3,5

38,5

11

-38,975

16709,556

Statistic teoretic i economic


5-10
10-20
20-50
50-100
100-200
200-300
300-400
TOTAL

53
87
61
23
13
4
7
259

7,5
15,0
35,0
75,0
150,0
250-0
350,0
-

397,5
1305
2135
1725
1950
1000
2450
11.001

64
151
212
235
248
252
259
-

-34,975
-27,475
-7,475
32,525
107,525
207,525
307,525
-

64832,281
65674,178
3408,413
24331,138
150301,12
172266,5
662001,37
1159524,3

Obs.1. din datele prezentate lipsete oraul Bucureti care avnd o populaie de peste 5 ori mai mare
dect limita superioar a ultimului interval de grupare se constituie ntr-un element atipic
al colectivitii localitilor urbane din Romnia;
Obs.2. intervalele de grupare folosite n statistica oficial a Romniei pentru aceste date sunt neegale.
Pentru calculul mediei este necesar stabilirea centrelor intervalelor de grupare (xi), ca
medii aritmetice simple ale limitelor fiecrui interval de grupare. Primul interval se consider nchis
la limita inferioar de 200 pers.

x=

11001
= 42,475 mii persoane
259

Media este varianta care mparte seria ordonat n dou pri egale.

Loc Me =

n +1
;
2

Loc Me

259 + 1
= 130 .
2

ntr-o serie organizat pe intervale de grupare, dup aflarea locului medianei se procedeaz
la identificarea intervalului ce conine mediana. Adunnd treptat frecvenele ajungem la un numr
mai mare sau egal cu cel al locului meidanei, astfel rezultnd intervalul n care se gsete mediana.
Mediana se calculeaz dup relaia urmtoare:

Me = x 0 + k

0,5(n + 1) np Me
n Me

, unde:

x0 = limita inferioar a intervalului ce conine mediana (n cazul nostru 10)


k = mrimea intervalului median
0,5 (n +1) = locul medianei
npMe = suma frecvenelor pn la intervalul ce conine mediana (n cazul nostru 11+53 =
64)
nMe = frecvena intervalului ce conine mediana

Me = 10 + 10

130 64
= 17,586 mii pers.
87

Mediala separ n dou pri egale suma produselor dintre valorile variabilei i frecvenele
corespunztoare. Mediala se aplic la repartiia valorilor globale ale variabilei analizate.

Ml = x 0 + k

locMl npMl
n Ml

Modul sau dominant, varianta cu frecvena cea mai mare.

Statistic teoretic i economic


ntr-o serie organizat pe intervale de grupare, valoarea modal se afl tot prin interpolare
n interiorul cu frecvena cea mai mare. Intervalul modal din tabel este (10-20) (nu este obligatoriu s
coincid cu cel al medianei).
Modul se calculeaz dup relaia:

Mo = x 0 + k

1
, unde:
2 + 3

x0 = limita inferioar a intervalului modal (10)


k = mrimea acestui interval (10)
1 = diferena dintre frecvena modal i frecvena intervalului imediat anterior
(87-53 = 34).
2 = diferena dintre frecvena modal i frecvena intervalului imediat urmtor
(87-61= 26).

Mo = 10 + 10

34
= 15,667 mii pers.
34 + 26

Prin faptul c mediana i modul sunt valori apropiate se confirmpresupunerea c x nu


reprezint o valoare tipic pentru colectivitatea celor 259 localiti urbane.

Chiar dac cele trei valori ale tendinei centrale ar fi fost foarte apropiate n
preocuparea economistului trebuie s se afle nu numai valorile tipice (cu caracter de
generalitate cu mediile) ci i variabilitatea n jurul mediei. Se pune problema de a
carcteriza mrimea, intensitatea i forma variaiei n jurul mediei.
Indicatorii variaiei i ai asimetriei
n funcie de numrul de variante luate n calcul i dup rolul ndeplinit n analiza
variaiei distingem:
indicatori simpli ai variaiei;
indicatori sintetici ai variaiei.
Indicatorii simpli ai variaiei:
a) abaterea fiecrei variante sau fiecrui centru de interval de grupare de la
medie, exprimat n mrimi absolute sau relative:

d i = xi x

d i % = (( x i x ) x ) 100

Aceti indicatori nu caracterizeaz variaia n cadrul colectivitii.


b) amplitudinea variaiei exprim mrimea cmpului de mprtiere n jurul mediei.
Se exprim n mrimi relative:
A = x max x min
A% =

x max x min
100
x

n cazul nostru 400-2 = 398 mii pers.

n cazul nostru

398
100 = 937%
42,475

Statistic teoretic i economic


n general se apreciaz c o amplitudine a variaiei care tinde la 100% este
specific unor colectiviti omogene i pe msur ce aceasta se ndeprteaz de 100%,
colectivitatea este din ce n cea mai eterogen.
Indicatorii sintetici ai variaiei sunt indicatorii care iau n calcul toate centrele de
grupare xi i n funcie de gradul de abstractizare i de relaia de calcul distingem patru
categorii de indicatori sintetici:
1 - abaterea medie liniar ( d )
2 dispersia (2)
3 abaterea medie ptratic (standard)
4 coeficientul de variatie (v).
1) abaterea medie liniara este media aritmetic a abaterilor variantelor sau a
centrelor de interval de grupare xi de la media colectivitii. Pentru c abaterile se
compenseaz se iau n calcul valorile absolute ale acestor diferene:

(x

d=

d=

(d )n
n
i

x)

( x x ) = 10257,375 = 39,604 mii pers.


259
n
i

Interpretare: populaia din cele 259 de localiti este cu 39,604 mii pers. mai mic sau mai
mare dect media calculat ca fiind egal cu 42,475 mii pers.

2) Dispersia poate fi definit ca medie aritmetic a ptratelor abaterilor de la


media colectivitii. Este o mrime abstract, adimensional ce nu servete direct analizei
variaiei.

2 =

2 =

(x

x n
=
n
2
i

x ) 2 ni

(x) 2 =

(x

x)

n
=

1159524,5
= 4476,9285
259

1626791
(42,475) 2 = 4476,9285
259

3) abaterea medie ptratic

= 2
Rezultatul este ntotdeuna mai mare dect d

= 4476,929 = 66,91 mii pers.

Statistic teoretic i economic


4) coeficientul de variaie este indicatorul cel mai sintetic care exprim ntr-o
form abstract intensitatea variaiei. Se calculeaz astfel:
v=

100 =

66,91
100 = 157,5%
42,475

Coeficientul de variaie se definete n domeniul numerelor pozitive. Dac v este


pn n 35% se consider c intensitatea variaiei este redus, colectivitatea este omogen
i n consecin media este reprezentativ. Cu ct depim 35% cu att intensitatea
variaiei crete i colectivitatea este eterogen iar media tinde s fie o mrime
nereprezentativ.
Forma variaiei n jurul mediei se exprim statistic prin mai muli indicatori dintre
care diferena ntre medie i mod care se numete asimetrie:
as = x Mo 0

- dac x = Mo atunci exist simetrie perfect


- dac x > Mo atunci exist asimetrie pozitiv sau de stnga
- dac x < Mo atunci exist asimetrie negativ sau de dreapta
Tot pentru msurarea asimetriei se folosete i un coeficient al lui PEARSON:
C as =

x Mo

C as [ 1,1]

sau

C as

3 ( x Me)

C as [ 3,+3]

n msura n care coeficientul de asimetrie se ncadreaz n intervalul (0; 0,3)


spunem c avem de-a face cu o asimetrie moderat i consecin indicatorii tendinei
centrale caracterizeaz corect colectivitatea.
Dac trecem de 0,3 asimetria este mai puternic iar indicatorii tendinei centrale
tind s fie nesemnificativi.
n exmplul nostru:
26,808
= +0,4007 rezult c media nu este caracteristic pentru c are loc
66,91
o asimetrie mic.
C as =

4.3.Indicatorii variaiei ntr-o colectivitate mpit pe grupe


Exemplu. Din studiul efectuat n dou staii de ateptare (benzinari) n rndul a 100 de
conductori auto a rezultat c timpul mediu de ateptare a celor 100 conductori a fost de:

x 0 = 50 min . Dispersia general a fost de o2 = 200 , abaterea medie ptratic: o=14,1421 iar
coeficientul de variaie a fost de v0 = 28,28%. Aceasta nseamn c timpul real de ateptare al celor
100 cltori este cu 14,14 min. sau cu 28,28% mai mare sau mai mic dect media general de 50 min.
Aceast intensitate a variaiei face ca media x o = 50 s fie reprezentativ.
Datele rezultate n urma studiului efectuat sunt urmtoarele:

Statistic teoretic i economic

Punct de observare
xi
Benzinaria Baneasa
Benzinaria Otopeni
Total

Timp de ateptare (min)


pn la 40 (30)
40-60 (50)
60-80 (70)
j=1
j=2
j=3
15
20
5
10
30
20
25
50
25

Total ni
40
60
100

linii i j coloane se noteaz cu nij


ni =
nj = nij = 100
suma
suma
Pentru a demonstra
n ce msur influeneaz punctul de ateptare (observare) variaia
ultimei
ultimei
coloane
timpilor
de ateptarelinii
se calculeaz pentru fiecare grup tipic media de grup x i i se observ
deosebirile dintre acestea i meida general.

yi =

y n
n
j

ij

y0 =

ij

y0 =
y1 =
y2 =

y n
n
j

5000
= 50 min
100

15 30 + 50 20 + 70 5
= 45 min
40

30 10 + 50 30 + 70 20 3200
=
= 53,3 min
60
60

se observ c x 2 se apropie mai mult de media general x o = 50


Calculm dispersiile de grup:

=
2
i

(y
j

y i ) nij

ij

(30 45) 2 15 + (50 45) 2 5 7000


=
=
= 175
40
40
2
1

2
0

(y
=

y0 ) 2 n j

(30 53,3) 2 10 + (50 53,3) 2 30 + (70 53,3) 2 20 188,89


=
=
= 188,89
60
60
2
2

Statistic teoretic i economic


Pe baza acestor indicatori se trece la determinarea n cadrul fiecrei grupe a abaterii medii
ptratice (i) i a coeficientului de variaie (vi).
Pentru a rezuma aceste consideraii sub forma unor indicatori statistici ce calculeaz
dispersia explicat de numrul de staii de ateptare (2) i dispersia rezidual (2) ca pri ale
dispersiei generale (2o).
Dispersia explicat 2 se calculeaz ca dispersia de grup fa de media general i se
numete explicat pentru c mediile de grup sunt determinate, condiionate de numrul de staii de
ateptare:

(y
=

y 0 ) ni

(45 50) 2 40 + (53,3 50) 2 60 1653,4


=
=
= 16,6
100
100

Disperisa rezidual arat influena factorilor reziduali (ali factori dect numrul de
staii). Se calculeaz ca o medie aritmetic ponderat a dispersiilor de grup:
2

n
=
n
2
i

175 40 + 188,89 60 18333,4


=
= 183,4
100
100

ntre aceste dispersii exist urmtoarea relaie:


dispersia general = dispersia explicat + dispersia rezidual, adic:
dispersia general este egal cu dispersia mediilor de grup i media dispersiilor de grup.

02 = 2 + 2

n cazul nostru: 200 = 16,6 + 183,4


Pe baza acestor relaii se pot calcula doi coeficieni:
coeficientul de determinare (R2) care exprim cota parte a variaiei explicate n totalul
variaiei:

R2 =

16,6
2
100 =
= 8,3%
2
200
0

Deci, n proporie de 8,3% variaia timpilor de ateptare poate fi explicat prin factorul
numrul de staii de ateptare.
coeficientul de nedeterminaie (k2) care este o valoare complementar fa de R2.

183,4
2
k = 2 100 =
100 = 91,7%
200
0
2

Deoarece coeficientul de determinaie este mai mic de 50% este necesar testarea statistic a
semnificaiei influenei factorului de grupare asupra variabilei cercetate.
Aceast testare statistic se face cu ajutorul testului Fisher-Snedecor (F). Acest test verific
consistena influenei factorului suplimentar de grupare comparnd cele dou pri ale dispersiei
generale. Mai precis, se iau n considerare numrtorii acestor dispersii (denumii variane sau
deviane) corectai cu un numr corespunztor al gradelor de libertate de variaie.

2 x 2 z
:
F=
r 1 n r

Statistic teoretic i economic


x2 = deviaia explicat = numrtorul dispersiei explicate

2x = ( y i y 0 ) 2 ni
z2 = variaia rezidual = numrtorul dispersiei reziduale

2z = i2 ni
n = numrul elementelor colectivitii
r = numrul de grupe constituite

F=

1653,4 18333,4
:
= 8,84
2 1 100 2

pentru = 0,05

coloana r-1 = 1
linia n-r = 98, rezult Ftabelat = 3,86934
Valoarea calculat a lui F se compar cu valoarea tabelat pentru (r-1) (n-r) grade de
libertate, tabelarea fcndu-se separat pentru diverse praguri de semnificaie a erorii. De exemplu
acceptm o eroare de = 0,05 atunci vom gsi n coloana r-1 pe linia n-r valoarea critic a lui F
pentru care factorul de grupare mai are semnificaia real (Ftabelat este o valoare minim).
Dac Fcalculat Ftabelat nseamn c factorul de grupare are o influen consistent (e o cauz
real) cu eroarea acceptat.

4.4.Media i dispersia unei variabile alternative.


Variabila alternativ este un caz particular al unei caracteristici atributive sau
nominative care nu prezint dect dou stri care se elimin reciproc. n felul acesta
elementele colectivitii se mpart n dou categorii distinctive de tipul Da/Nu,
Fem/Masc, Urban/Rural etc.
Exemplu. n anul universitar 1991/1992 au fost nmatriculai n nvmntul superior de
stat 215226 studeni, din care 99032 (46%) de sex feminin i 116194 (54%) de sex masculin. Cele
dou stri nu sunt exprimate numeric. Totui pentru a putea calcula media i dispersia unei
asemenea variabile se accept atribuirea valorii 1 pentru starea sau varianta care ne intereseaz n
procesul de analiz i o valoare (zero) pentru starea cealalt.
Varianta caracter.

valoarea
atribuit

Frecvene

x1 = F

absolute (ni)
M

x2 = B

NM

relative (nxi)
M
N

NM
N

TOTAL

=p

= q =1 p

p+q=1

pentru valaorea observat xi avem media

x=

x n
n
i

1 M + 0 (N M ) M
=
=p
N
N

Din totalul de N elemente ale unei colectiviti se noteaz cu M numrul de elemente care
posed starea care ne intereseaz (n cazul nostru n1 = M iar n2 = N-M, rezult n1 + n2 = N

Statistic teoretic i economic


prin urmare media unei caracteristici alternative este egal cu cota parte a elementelor care posed
varianta (starea) ce ne intereseaz n analiz.

P=

99032
= 0,46
215226

Dac se folosete frecvena relativ atunci:

x = x i nix = 1 p + 0 q = p
Dispersia acestei caracteristici se calculeaz tot dup formula clasic:

2 =

(x x)
n
i

(1 p) 2 p + (0 p) 2 q q 2 p + p 2 q
=
= pq = 0,2484
p+q
p+q

Dispersia unei caracteristici alternative este produsul cotelor pri ale celor dou stri sau
vriante n colectivitatea general.
Media i dispersia caracteristicii alternative se folosesc n estimarea unor parametrii ai
colectivitii generale atunci cnd cercetarea se bazeaz pe eantioane reprezentative.

4.5. Indicatorii statistici ai unei serii de atribute.


n exemplul de mai jos elementele colectivitii sunt grupate dup o caracteristic
nenumeric (atributiv sau nominativ) i n consecin nu mai putem folosi media,
mediana, modul indicatorii asimetriei i ai variaiei pentru a caracteriza aceast repartiie.
Cel mult s identificm care este starea sau forma cea mai frecvent (starea modal) n
colectivitate.
Exemplu: numrul mediu de slariai din Romnia pe activiti specifice ale economiei naionale n
1991 este urmtoprul: (n mii pers.)
Nr.

Activitatea economic

Nr. mediu salariai

1
2
3
4
5
6
7
8

agricultur
silvicultur i expl. forestier
piscicultur i pescuit
industria extractiv
industria prelucrtoare
energie electric , term., gaze, ap
construcii
servicii
TOTAL

603,0
98,8
7,9
277,6
3188,1
152,3
482,6
2579,2
7389,5

% activ n total
salariai
8,2
1,3
0,,,1
3,8
43,,1
2,1
6,5
34,9
100,0

Pentru a caracteriza o asemenea serie de repartiie pe atribute se pot folosi:


mrimi relative de coordonare
mrimi relative de structur
coeficieni de concentrare
Mrimile relative de coordonare rezult din compararea strilor sau atributelor
ntre ele. ns nu se admite orice fel de comparaie, ntre strile comparate trebuie s
existe o legtur logic.

Statistic teoretic i economic


Mrimile relative de stuctur exprim ponderea (cota parte) a diferitelor stri n
totalul colectivitii (vezi ultima coloan a tabelului). Suma mrimilor de structur trebuie
s fie egal cu 1 sau 100.
Coeficienii de concentrare sintetizeaz aceste mrimi relative de structur ntr-o
unic expresie numeric i constituie principalul instrument de analiz pentru
caracterizarea global a repartiiilor de felul acesta.
Coeficieni de concentrare
1. GINI (1922, fondat de coala statistic din Italia)
n
c = g i2 ,
gi = i ,
ni

xi
xi

gi = cota parte neprocentual a fiecrei stri n totalul colectivitii.


1
ci
n

n = numrul de stri specifice colectivitii (n = 8 n cazul exemplului nostru).


Interpretarea rezultatului este greoaie ntruct limita inferioar a intervalului
depinde de numrul strilor. n consecin s-au cutat diverse formule de normalizare
prin care coeficientul de concentrare s se nscrie n intervalul (0,1) pentru oricte stri.
2. GINI-STRUCK
c =

n g i2 1
n 1

0 < c < 1

Interpretarea devine foarte simpl. Cu ct C tinde ctre 1 cu att elementele


colectivitii se concentreaz mai intens pe cteva stri ale colectivitii (specifice ei).
Dac C tinde ctre 0 elemente se repartizeaz echilibrat sau uniform pe toate
strile specifice.
n cazul exemplului nostru:

c =

8 0,32 1
= 0,4728 , adic alterneaz la mijlocul intervalului de definire, ns nu
8 1

se poate vorbi de o repartiie echilibrat.

Probleme i aplicaii
4.1. Pentru a verifica reglarea unei maini de debitat, din producia realizat de-a lungul
unei zile (N = 600 piese) se prelev un eantion n = 65 piese, care msoar n mm:
90,9
95,5
70,5
92,4
89,4

93,2
76,1
83,3
88,6
92,4

72,4
78,8
91,7
92,4
93,2

91,7
97,0
93,9
97,7
88,6

93,2
65,2
91,7
7,9
87,1

67,4
77,8
84,1
95,5
97,0

75,0
86,4
85,6
87,1
96,2

83,3
87,1
87,9
91,7
86,1

75,0
76,1
89,4
96,2
90,9

90,2
86,4
85,6
92,4
87,9

99,2
96,2
84,1
86,4
98,5

88,6
83,3
100,0
81,8
98,5

62,8
87,9
80,3
76,5
81,8

Statistic teoretic i economic


Se cere descrierea acestui eantion prin indicatori specifici seriilor de distribuie de
frecvene.
Rezolvarea 1
Gruparea pieselor pe variante distincte de lungime reduce (comprim) seria de
lungimi observate ale celor 65 piese la 34 de variante distincte, cu urmtoarele frecvene:
Varianta
62,8
65,2
67,4
70,5
72,4
75,0
76,1
76,5
77,8
78,8
80,3
81,8
83,3
84,1
85,6
86,1
86,4

cu frecvena
1
1
1
1
1
2
2
1
1
1
1
2
3
2
2
1
3

Varianta
87,1
87,9
88,6
89,4
90,2
90,9
91,7
92,4
93,2
93,9
95,5
96,2
97,0
97,7
98,5
99,2
100,0

cu frecvena
3
4
3
2
1
2
4
4
3
1
2
3
2
1
2
1
1

Aceasta este o serie de distribuie de frecvene pe variante ale caracteristicii


lungimea pieselor msurate, seria putnd fi caracterizat prin indicatori ai tendinei
centrale, indicatori ai variaiei i asimetriei.
Indicatorii tendinei centrale sunt:
xi ni 5659
=
= 87,0615 87,1 mm
n i
65

Media: x =

Locul medianei: locMe =

ni + 1 65 + 1
=
= 33;
2
2

Mediana este a 33-a variant n seria ordonat cresctor. Deci, Me = 87,9 mm.
Pentru a afla modul se va observa c frecvena maxim nregistrat este 4,
ntlnit la trei variante. Deci, seria de variante distincte ale caracteristicii
observate este o serie trimodal (cu trei moduri):
Mo = 87,9 mm; Mo = 91,7 mm;
Mo = 92,4 mm.
Indicatorii variaiei:
Amplitudinea absolut a variaiei:
A = x max x min = 100.0 62.8 = 37,2 mm

Statistic teoretic i economic

Amplitudinea relativ a variaiei:


A% =

37,2
A
100 =
100 = 42,7%
87,1
x

Dispersia caracteristicii n jurul mediei:


( x i x ) 2 ni 4606,94
2
=
=
= 70,876
65
n i

Abaterea medie ptratic (abaterea standard):

= 2 = 8,42 mm
Cele 65 piese msurate sunt n medie cu 8,42 mm mai scurte sau mai lungi dect media
calculat (87,1 mm).
Coeficientul de variaie:
v=

100 = 9,67%

Intensitatea variaiei n jurul mediei este de numai 9,6%


Observaii: 1) n prima variant de rezolvarea a problemei, rezultatele sunt determinri
exacte, pe baza variantelor distincte ale caracteristicii observate.
2) Cele 65 piese msurate alctuiesc o colectivitate omogen, ntruct variaia
n jurul mediei este de numai 9,67%, cu mult sub nivelul de 35%. Altfel spus, media este
reprezentativ pentru toat colectivitatea.
Rezolvarea 2.
Dac variantele se grupeaz pe intervale egale de cte 5 mm, atunci toi indicatorii
ce descriu seria sunt estimri ale determinrilor obinute la Rezolvarea 1.

Intervale
de variaie a
lungimii piesei
(mm)
Pn la 65
65,1 70,0
70,1 75,0
75,1 80,0
80,1 85,0
85,1 90,0
90,1 95,0
95,1 100,0
Total

Numr piese n
fiecare grup
(ni)

Centre ale intervalelor de


grupare
(xi)

1
2
4
5
8
18
15
12
65

62,5
67,5
72,5
77,5
82,5
87,5
92,5
97,5
---

xini

62,5
135,0
290,0
387,5
660,0
1575,0
1387,5
1170,0
5667,5

Statistic teoretic i economic


Indicatorii tendinei centrale:
Media estimat pe baza centrelor intervalelor de grupare este:
x n 5667,5
x= i i =
= 87,1923 87,2 mm
n i
65

Locul medianei este tot 33, dar se va observa c aceast variant este cuprins
n intervalul (85,1 90,0). Prin interpolarea n acest interval, rezult mediana:
Me = x Me + k Me

0,5(n + 1) F
33 20
i
= 85,1 + 5
= 88,7 mm
Me
18
f

unde F este suma frecvenelor pn la intervalul care conine mediana.


Pentru estimarea modului, se va observa c intervalul (85,1 90,0) este cel
care are frecvena maxim (cuprinde cele mai multe elemente ale
colectivitii). Prin interpolare rezult modul:

Mo = x Mo + k Mo

10
1
= 85,1 + 5
= 88,9 mm
+
10 + 3
1
2

Se constat c cei trei indicatori ai tendinei centrale au valori estimate apropiate,


dar x < Me < Mo , ceea ce nseamn c seria prezint o uoar asimetrie de dreapta
(modul este mai mare dect media aritmetic a colectivitii cercetate).
Indicatorii variaiei:
Amplitudinea absolut a variaiei estimat pe baza centrelor intervalelor de
grupare:
A = 97,5 62,5 = 35 mm

Amplitudinea relativ a variaiei:


A% = (35:87,2)*100 = 40,14%

Se observ o amplitudine restrns a variaiei n jurul mediei estimate.


Pentru estimarea indicatorilor sintetici ai variaiei se poate folosi urmtorul tabel
de calcul:

Eroarea de estimare (e) indus de folosirea centrelor intervalelor de grupare, n locul variantelor reale, se
obine comparnd mediile din rezolvrile 1 i 2:
x x
87.2 87.1
e = 2 1 100 =
100 = +0,11% (o eroare neglijabil).
x1
87.1

Statistic teoretic i economic

Intervale de
variaie a lungimii
piesei (mm)
Pn la 65
65,1 70,0
70,1 75,0
75,1 80,0
80,1 85,0
85,1 90,0
90,1 95,0
95,1 100,0
Total

Numr
piese
(ni)

(xi)

xi x

1
2
4
5
8
18
15
12
65

62,5
67,5
72,5
77,5
82,5
87,5
92,5
97,5
---

-24,7
-19,7
-14,7
-9,7
-4,7
0,3
5,3
10,3
---

( xi x ) 2 ni

610,09
776,18
864,36
470,45
176,72
1,62
421,35
1273,08
4593,85

xi ni

3906,25
9112,50
21025,00
30031,25
54450,00
137812,50
128343,75
114075,00
498756,25

Dispersia colectivitii n jurul mediei poate fi determinat n dou moduri:


- fie folosind totalul penultimei coloane a tabelului:

2 =

( xi x ) 2 ni 4593,85
=
= 70,6746 ,
65
n i

-fie totalul din ultima coloan a tabelului pentru a nlocui n relaia:

2 =

xi ni
49756,25
(x)2 =
87,2 2 = 69,3333
65
n i

Diferena dintre cele dou rezultate este cauzat de rotunjirile repetate la prima
versiune a calculului.
Abaterea medie ptratic este radicalul de ordinul doi din dispersie:

2 = 2 = 69.3333 = 8,3 mm ,
ceea ce arat c ntre lungimile reale ale celor 65 piese observate i media estimat exist
o distan medie de aproximativ 8,3 mm.

Coeficientul de variaie este de:


v=

100 =

8,3
100 = 9,5%
87,2

Statistic teoretic i economic


Deci, intensitatea variaiei n jurul mediei este redus (sub 35%), colectivitatea
este omogen, bine caracterizat prin valoarea medie a lungimii pieselor.

Coeficientul de asimetrie exprim forma mprtierii:


as = x Mo = 87,2 88,9 = 1,7 mm
x Mo 1,7
C as =
=
= 0,2048

8,3
Se observ o diferen de numai 1,7 mm ntre medie i mod, modul fiind mai
mare, ceea ce nseamn c seria prezint o moderat asimetrie de dreapta (-0,2048).
4.2. O anchet derulat n rndul salariailor unui lan de magazine conduce la
urmtoarea grupare a acestora n funcie de salariul lunar (milioane lei) i sex:

*)

Intervale de variaie
a salariului lunar (mil lei)
pn la 3,5*)
3,5 4,5
4,5 5,5
5,5 6,5
6,5 7,5
7,5 8,5
8,5 i peste
Total

Numr de
salariai

58
119
140
102
58
39
24
540

din care:

brbai

femei

31
71
112
92
55
37
22
420

27
48
28
10
3
2
2
120

limita superioar nu este cuprins n interval

Se cere:
S se determine indicatorii tendinei centrale i s se comenteze rezultatele
folosind indicatorii variaiei n jurul mediei i indicatorii asimetriei.
Rezolvare
Salariul mediu lunar al celor 540 salariai investigai este de:
x=

xi ni 28960
=
= 5,363 mil lei / luna
n i
540

Me = x Me + k Me

Mo = x Mo + k Mo

0,5(n + 1) F
270,5 177
i
= 4,5 + 1
= 5,168 mil lei / lun
140
f Me

21
1
= 4,5 + 1
= 4,856 mil lei / lun
21 + 38
+
1
2

Deoarece Mo < Me < x , rezult c seria prezint o asimetrie de stnga (a se


vedea mai jos intensitatea asimetriei).

Statistic teoretic i economic


Intervalele marginale sunt deschise, ceea ce impune o estimare a amplitudinii
variaiei cu cu ajutorul centrelor intervalelor de grupare:

A= x

x
= 90 30 = 60 mil lei
max
min
A
A % = 100 = 111,9%
x
ntruct amplitudinea variaiei comparat cu media colectivitii depete 100%,
se poate afirma c mrimea mprtierii este destul de mare.
Dispersia se determin cu ajutorul formulei de calcul simplificat astfel:

02 =

x i n i
16880
( x0 ) 2 =
5,363 2 = 2,4979
ni
540

iar abaterea medie ptratic este:

0 = 02 = 1,58 mil lei


Coeficientul de variaie:
v0 =

0
x0

100 = 29,5%

Pentru c intensitatea mprtierii este sub 35%, putem accepta c, pe total,


colectivitatea salariailor este relativ omogen din punct de vedere al salariului lunar.
Indicatorii asimetriei propui de Pearson sunt:
Asimetria absolut: as = x Mo = 5,353 4,856 = +0,507 mil lei
x Mo 0 ,507
Coeficientul de asimetrie: C as =
=
= +0 ,3209 .

1,58

Valoarea coeficientului indic o asimetrie moderat de stnga (pozitiv).


S se determine x j i 2j pentru salariaii de sex masculin i feminin i s se
verifice regula de adunare a dispersiilor.
Rezovare:
Indicatorii specifici celor dou grupe de salariai se obin astfel:

Pentru salariaii de sex masculin:

x1 =

xi ni1 2368
=
= 5,638 mil lei
ni1
420

Statistic teoretic i economic


( xi x1 ) 2 ni1
=
= 2,4309
ni1
2
1

1 = 1,559 mil lei


v1 = 27,7%

Pentru salariaii de sex feminin:

x2 =

xi ni 2 528
=
= 4,4 mil lei
n i 2
120

22 =

( xi x2 ) 2 ni 2
= 1,54
ni 2

2 = 1,241 mil lei


v 2 = 28,2%

Dispersia explicat prin mprirea salariailor dup sex:

=
2

( x j x 0 ) 2 n j
n j

2y / x
n j

43,0468
= 0,2649
540

Dispersia rezidual:

=
2

2j n j
n j

2y / z
n j

1205,778
= 0,2649
540

Regula de adunare a dispersiilor:

02 = 2 + 2
2,4779 0,2649 + 2,2329
Ca urmare a repetatelor rotunjiri, pot apare unele mici diferene, cum este i n
acest caz.
S se afle n ce msur influeneaz sexul salariailor variaia n jurul mediei (D)
i s se testeze dac diferena (disparitatea salarial) este statistic consistent (testul F i,
eventual, testul t).
Rezovare:
Coeficientul de determinaie:

Statistic teoretic i economic


D=

0 ,2649
2
100 =
100 = 10 ,6%
2
2,979
0

Doar 10,6% din variaia total a salariilor poate fi explicat prin diferenierea
salariailor dup sex.
- Testul Fisher-Snedecor se aplic pentru a vedea dac o asemenea influen redus
este statistic semnificativ:
2y / x 2y / z 143,9468 1205,778 13,0468
F=
:
=
:
=
= 63,825
2 1
540 2
2,2412
r 1 n r
Pentru probabilitatea p = 0,95 (eroare acceptat = 0,05), F1, 538 (3,84; 3,92).
Cum Fcalculat > Ftabelat factorul de grupare (sexul) are o influen consistent
asupra variaiei salariilor lunare ale celor 540 angajai.
- Testul Student pentru verificarea semnificaiei diferenei ntre dou medii:

t=

x1 x 2

12
n1

22

n2

5,638 4,4
2,4309 1,54
+
420
120

1,238
= 9,0723
0,1365

Valoarea calculat este mult mai mare dect t = 1,96 (pentru o eroare acceptat
= 0,05) sau t = 2,58 (pentru o eroare acceptat = 0,01), ceea ce nseamn c mediile
difer consistent din punct de vedere statistic (grade de libertate n-r = 540-2 = 538).
S se prezinte grafic disparitatea ntre salarizarea femeilor i brbailor.
Rezovare:
Disparitatea salarizrii brbai-femei poate fi observat prin compararea
repartiiilor de frecvene relative pe intervale de variaie a salariului lunar brut,
determinate pe baza ultimelor dou coloane ale tabelului din enun:
Intervale de variaie a
salariului lunar (mil lei)

pn la 3,5
3,5 4,5
4,5 5,5
5,5 6,5
6,5 7,5
7,5 8,5
8,5 i peste
Total

Ponderea persoanelor cuprinse n diferite grupe de


salarizare fa de total
la brbai (%)
la femei (%)
7,4
22,5
16,9
40,0
26,7
23,3
21,9
8,3
13,1
2,5
8,8
1,7
5,2
1,7
100,0
100,0

n timp ce femeile se afl preponderent grupate n primele trei intervale de


salarizare, brbaii se repartizeaz mai unioform pe ntreaga gam de salarizare, iar cei
mai muli se afl n grupele 3, 4 i 5, potrivit ordinii de prezentare din enunul problemei.

Statistic teoretic i economic


Structura ctigurilor salariale ale
angajailor de sex masculin

9%

5%

7%
17%

13%

27%

22%

sub 3.5 mil


6.5 - 7.5 mil

3.5 - 4.5 mil


7.5 - 8.5 mil

4.5 - 5.5 mil


8.5 mil si peste

5.5 - 6.5 mil

Structura ctigurilor salariale ale


angajailor de sex feminin
8%

3% 2%2%

23%

23%
39%

sub 3.5 mil

3.5 - 4.5 mil

4.5 - 5.5 mil

6.5 - 7.5 mil

7.5 - 8.5 mil

8.5 mil si peste

5.5 - 6.5 mil

Disparitatea mai poate fi remarcat i prin observarea ponderii diferitelor grupe de


salarizare n totalul fondului de salarii achitat salariailor de sex masculin i, respectiv,
feminin. Fa de rezolvarea de mai sus (care are n vedere doar numrul de brbai i
femei cuprins n intervale de salarizare), aceast variant ia n considerare i salariile
pltite:

Statistic teoretic i economic


Fondul de salarii (mil lei)
brbai
femei
Intervale de variaie a
salariului lunar (mil lei)
pn la 3,5
3,5 4,5
4,5 5,5
5,5 6,5
6,5 7,5
7,5 8,5
8,5 i peste
Total

93
284
560
552
385
296
198
2368

81
192
140
60
21
16
18
528

Ponderea n total (%)


brbai
femei

3,9
12,0
23,6
23,3
16,3
12,5
8,4
100,0

15,3
36,4
26,5
11,4
4,0
3,0
3,4
100,0

Se constat c, n totalul salariilor ncasate de femei, salariile mici cuprinse n


primele dou intervale de grupare au ponderi considerabil mai mari dect n cazul
salariilor brbailor. Situaia se inverseaz la urmtoarele intervale de grupare (salarii
mijlocii i mari): ponderea acestor grupe de salarizare este mult mi mic n cazul femeilor
dect la brbai.
4.3. Calculai abaterea medie ptratic i dispersia din urmtoarele valori: 2, 5, 7, 9
i 10.
4.4. Se consider o firm de comer exterior care are 15 sucursale n orae diferite
grupate dup profitul obinut astfel:
(date convenionale)
Grupe dup profit (mil.$)
Sub 10
10-20
20-30
30-40
peste 40

Numr filiale
2
3
7
2
1

Se cere:
1. s se determine indicatorii simplii ai variaiei;
2. s se determine indicatorii sintetici ai variaiei.
4.5. Fie x10 = 5 i 2 10 = 20 media i dispersia numerelor a1 ,..., a10 .
Presupunem c se adaug termenul urmtor este a11 = 16 .
1. Care va fi media aritmetic x11 a numerelor a1 ,..., a11 ?
2. Presupunem c a11 = 5 . Calculai x11 i 112 .
3. Determinai media aritmetic x n +1 a n+1 termeni ca o funcie de x n , a n +1 i de n.
4.6. Fie v coeficientul de variaie al n numere. Dac fiecare din aceste numere este
nmulit cu 2, s se precizeze care va fi noul coeficent de variaie?

Statistic teoretic i economic


4.7. Pentru determinarea calitii unor produse destinate exportului au fost
examinate un numr de 1000 produse din care 850 au fost confirmate ca fcnd fa
cerinelor standardelor internaionale.
Se cere:
1. procentul mediu de produse bune;
2. dispersia colectivitii;
3. coeficientul de variaie.
4.8. n urma efecturii unei anchete statistice ntr-un ora de provincie n rndul a
300 de persoane privind timpul de deplasare zilnic rezult urmtoarea situaie:
Timp de deplasare zilnic (min.)
0-30
30-60
60-90
90-120
120-150
Total

Numr de persoane
30
60
100
70
40
300

Se cere:
1. s se caracterizeze gradul de omogenitate al repartiiei;
2. s se calculeze indicatorii tendinei centrale;
3. s se msoare gradul de asimetrie.

Você também pode gostar