Você está na página 1de 19

III – Variáveis Estatísticas

Unidimensionais
3. Medidas de Concentração

Tratamento de Dados 2º Semestre 2005/2006


Curva de Lorenz
Abcissas = pi
= frequências relativas 1

acumuladas do atributo 0.9


0.8
0.7
0 ≤ pi ≤ 1 0.6

qi
0.5
0.4

Ordenadas = qi 0.3
0.2
= valores relativos 0.1

acumulados do atributo 0
0 0.2 0.4 0.6 0.8 1

pi
0 ≤ qi ≤ 1

Tratamento de Dados 2º Semestre 2005/2006


Quadro III.1 - Distribuição dos salários mensais
dos trabalhadores da empresa A (euros)
Classes xj nj nj x j pi qi Freq. relativas
acumuladas
450-750 600 120 72,000 0.334 0.186 i

750-1,050 900 100 90,000 0.613 0.418 ∑n


j =1
j

1,050-1,350 1,200 70 84,000 0.808 0.634 pi =


N
1,350-1,650 1,500 30 45,000 0.891 0.750
1,650-2,150 1,900 20 38,000 0.947 0.848 Val. relativos
2,150-2,650 2,400 10 24,000 0.975 0.910 acumulados
i
2,650-3,950 3,300 6 19,800 0.992 0.961 ∑n
j =1
j xj
3,950-6,050 5,000 3 15,000 1.000 1.000 qi = k
(8 classes) ∑= 359 387,800 - - ∑n
j =1
j xj
xj: ponto médio da classe. nj: no de valores pertencentes à classe
Tratamento de Dados 2º Semestre 2005/2006
Curva de Lorenz
100%

90%

80%

% Total de Salários (q i)
70%

60%

50%

40%

30%

20%

10%

0%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

% Trabalhadores (pi)

Tratamento de Dados 2º Semestre 2005/2006


Relação entre pi e qi
Quando a variável de interesse x é positiva tem-se:

pi ≥ qi (Freq. rel. acum. ≥ Val rel. acum.)


Dem.
m
Temos N = ∑ n j
j =1

1 m
1 ⎡ i m ⎤
e x = ∑ n j x j = ⎢∑ n j x j + ∑ n j x j ⎥
N j =1 N ⎣ j =1 j =i +1 ⎦
Tratamento de Dados 2º Semestre 2005/2006
Relação entre pi e qi (cont. 1)

Se por hipótese fosse pi < qi

então
i i m m

∑n
j =1
j ∑n
j =1
j xj ∑nj =1
j xj − ∑n
j = i +1
j xj
[1] < m
= m
N
∑n
j =1
j xj ∑n
j =1
j xj

Tratamento de Dados 2º Semestre 2005/2006


Relação entre pi e qi (cont. 2)
i m m

∑n
j =1
j ∑n
j =i +1
j xj ∑n
j =i +1
j xj
[2] ⇒ < 1− m
= 1−
N Nx
∑n j =1
j xj

Como 0 < x1 < x 2 < ... < x k

então
m m

[3] ∑n
j =i +1
j xj > x ∑nj
j =i +1

Tratamento de Dados 2º Semestre 2005/2006


Relação entre pi e qi (cont. 3)
m m

m m ∑n j xj ∑n j

∑n xj > x ∑nj ⇒
j =i +1 j =i +1
j >
j =i +1 j =i +1 Nx N

De [2] temos
i m m

∑n
j =1
j ∑n x
j =i +1
j j ∑n
j = i +1
j

pi < qi ⇒ < 1− < 1−


N Nx N
Tratamento de Dados 2º Semestre 2005/2006
Relação entre pi e qi (cont. 4)
Mas a expressão i m

∑n
j =1
j ∑n
j = i +1
j

< 1−
N N
é absurda porque
i m

∑n
j =1
j ∑n
j = i +1
j

+ =1
N N
e portanto não pode ser pi< qi
c.q.d.
Tratamento de Dados 2º Semestre 2005/2006
Índice de Gini
m −1

∑ (p
j =1
i − qi )
G = m −1
=

j =1
pi

m −1
pi-qi
∑j =1
qi
=1− m −1
qi
∑j =1
pi qi

Tratamento de Dados 2º Semestre 2005/2006 pi


Valores do índice de Gini
0 ≤ G ≤ 1
m−1

∑q i
pi= qi ⇒ G = 1−
j =1
m−1
= 1−1 = 0
Concentração
mínima
∑p
j =1
i

m−1

m −1 ∑q i

∑ qi = 0 ⇒ G = 1−
j =1
m−1
= 1− 0 = 1 Concentração
máxima
j =1
∑p
j =1
i

Tratamento de Dados 2º Semestre 2005/2006


Valores do índice de Gini (cont.)
Se os somatórios fossem de j=1, ...,m
então no caso de máxima concentração
m

∑qj =1
i =1
1
m ⇒ G = 1− ≠ 1
∑p
j =1
i =1 1

Tratamento de Dados 2º Semestre 2005/2006


Exemplo Slide 3
Classes xj nj xj*nj Acum. nj Acum. xj*nj pi qi pi - qi
0.0% 0.0% -
450-750 600 120 72,000 120 72,000 33.4% 18.6% 0.149
750-1050 900 100 90,000 220 162,000 61.3% 41.8% 0.195
1050-1350 1,200 70 84,000 290 246,000 80.8% 63.4% 0.173
1350-1650 1,500 30 45,000 320 291,000 89.1% 75.0% 0.141
1650-2150 1,900 20 38,000 340 329,000 94.7% 84.8% 0.099
2150-2650 2,400 10 24,000 350 353,000 97.5% 91.0% 0.065
2650-3950 3,300 6 19,800 356 372,800 99.2% 96.1% 0.030
3950-6050 5,000 3 15,000 359 387,800 100.0% 100.0% -
Sum 359 387,800 sum 1...m-1 5.56 4.71 0.852
Gini 0.153 0.153

0.852 4.71
G= = 1− = 0.153
5.56 5.56
Tratamento de Dados 2º Semestre 2005/2006
Ex.: Pop. com Distribuição Uniforme

Classes xj nj xj*nj Acum. nj Acum. xj*nj pi qi pi - qi


0.0% 0.0% -
0-100 50 200 10,000 200 10,000 10.0% 1.0% 0.090
100-200 150 200 30,000 400 40,000 20.0% 4.0% 0.160
200-300 250 200 50,000 600 90,000 30.0% 9.0% 0.210
300-400 350 200 70,000 800 160,000 40.0% 16.0% 0.240
400-500 450 200 90,000 1,000 250,000 50.0% 25.0% 0.250
500-600 550 200 110,000 1,200 360,000 60.0% 36.0% 0.240
600-700 650 200 130,000 1,400 490,000 70.0% 49.0% 0.210
700-800 750 200 150,000 1,600 640,000 80.0% 64.0% 0.160
800-900 850 200 170,000 1,800 810,000 90.0% 81.0% 0.090
900-1000 950 200 190,000 2,000 1,000,000 100.0% 100.0%
Sum 2,000 1,000,000 sum 1...m-1 4.50 1.650
Gini 0.367

Tratamento de Dados 2º Semestre 2005/2006


Distribuição Uniforme (cont)

100%

90%

80%

% Total de Salários (q i)
70%

60%
250
50%

200 40%

150 30%

20%
100
10%
50
0%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
0
0-100 100- 200- 300- 400- 500- 600- 700- 800- 900-
200 300 400 500 600 700 800 900 1000 % Trabalhadores (p i)

Tratamento de Dados 2º Semestre 2005/2006


Ex.: Pop. com Distribuição Normal

Normal (500, Desv Pad) Media 500 Desv Pad 150


Classes xj nj xj*nj Acum. nj Acum. xj*nj pi qi pi - qi
0.0% 0.0% -
0-100 50 7.66 383 8 383 0.4% 0.0% 0.003
100-200 150 37.84 5,676 46 6,059 2.3% 0.6% 0.017
200-300 250 136.92 34,231 182 40,290 9.1% 4.0% 0.051
300-400 350 322.56 112,897 505 153,186 25.2% 15.3% 0.099
400-500 450 495.01 222,757 1,000 375,943 50.0% 37.6% 0.124
500-600 550 495.01 272,258 1,495 648,201 74.8% 64.8% 0.099
600-700 650 322.56 209,666 1,818 857,867 90.9% 85.8% 0.051
700-800 750 136.92 102,692 1,954 960,559 97.7% 96.1% 0.017
800-900 850 37.84 32,164 1,992 992,722 99.6% 99.3% 0.003
900-1000 950 7.66 7,278 2,000 1,000,000 100.0% 100.0%
Sum 2,000 1,000,000 sum 1...m-1 4.50 0.465
Gini 0.103

Tratamento de Dados 2º Semestre 2005/2006


Distribuição Normal (cont)
100%

90%

80%

% Total de Salários (q i)
70%

60%

600 50%

500 40%

400 30%

300 20%

200 10%

100 0%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
0
0-100 100- 200- 300- 400- 500- 600- 700- 800- 900-
200 300 400 500 600 700 800 900 1000 % Trabalhadores (p i)

Tratamento de Dados 2º Semestre 2005/2006


Ex.: Pop. com Distribuição LogNormal
miu 6.17 sigma 0.3
LogNormal (miu, sigma) Media 500.2 Desv Pad 153.5
Classes xj nj xj*nj Acum. nj Acum. xj*nj pi qi pi - qi
0.0% 0.0% -
0-100 50 0.00 0 0 0 0.0% 0.0% 0.000
100-200 150 3.67 550 4 550 0.2% 0.1% 0.001
200-300 250 116.51 29,126 120 29,676 6.0% 3.0% 0.030
300-400 350 431.59 151,058 552 180,734 27.6% 18.1% 0.095
400-500 450 566.44 254,898 1,118 435,632 55.9% 43.6% 0.123
500-600 550 432.41 237,823 1,551 673,455 77.5% 67.5% 0.101
600-700 650 245.40 159,511 1,796 832,965 89.8% 83.5% 0.063
700-800 750 117.71 88,284 1,914 921,250 95.7% 92.3% 0.034
800-900 850 51.24 43,558 1,965 964,807 98.2% 96.7% 0.016
900-1000 950 35.03 33,281 2,000 998,088 100.0% 100.0%
Sum 2,000 998,088 sum 1...m-1 4.51 0.463
Gini 0.103

Tratamento de Dados 2º Semestre 2005/2006


Distribuição LogNormal (cont)

100%

90%

80%

% Total de Salários (q i)
70%

60%
600
50%
500
40%
400
30%
300
20%
200 10%

100 0%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
0
0-100 100- 200- 300- 400- 500- 600- 700- 800- 900-
200 300 400 500 600 700 800 900 1000 % Trabalhadores (pi)

Tratamento de Dados 2º Semestre 2005/2006

Você também pode gostar