Você está na página 1de 26

1

Eine Auswertung der empirischen Berechnungsmethoden des


Gini-Koeffizienten
2
I. Einleitung, Ziele und Begründung
Wirtschaftliche Ungleichheit ist ein hartnäckiges und dringendes Problem, das die Potenz hat,
Ressentiments unter der Bevölkerung eines Landes zu wecken, soziale und wirtschaftliche
Umwälzungen hervorzurufen und starke Argumente über sein Ausmaß, seine Auswirkungen
und mögliche Lösungen hervorzurufen. Ich interessierte mich für das Thema globale
Ungleichheit erst, nachdem ich in und zwischen den Wohngebieten, die mein Leben dominiert
haben, unterschiedliche Grade von Armut erlebt hatte: Indien (verschiedene Bereiche
innerhalb) und Singapur. Es ist faszinierend zu sehen, dass solche drastischen Ungleichheiten
in der kleinen Umgebung von Städten bestehen könnten, wie in der folgenden Abbildung zu
sehen ist.

Abbildung 1: Indien: Armut und Wohlstand auf demselben Grundstück

Ich war neugierig, wie eine so entscheidende Maßnahme berechnet wurde, die verschiedene
Regierungspolitiken definierte, trotz der Einkommensunterschiede innerhalb einer
geografischen Region und der Fülle von Daten, die für eine genaue Berechnung in Ländern wie
Indien erforderlich sind. Dies führte zu meiner Grundlagenforschung auf dem Gebiet, aus dem
ich die Prävalenz der Mathematik bei der Verallgemeinerung von Formeln zur Darstellung
wirtschaftlicher Ungleichheit entdeckte. Durch den Unterricht in der Schule konnte ich die
Grundprinzipien hinter einigen dieser Formeln erkennen, die mich weiter untersuchten. Dies
liegt daran, dass ein zusätzlicher Wunsch von mir darin bestand, das tiefe Studium, das wir in
der Schule über Kalkül und Reihen gemacht haben, auf etwas Greifbareres und Realeres
anzuwenden.

Um den Prozess der Verlässlichkeit und Vertrauenswürdigkeit der Mathematik in Bezug auf
sozio-politische Situationen im wirklichen Leben zu verstehen, beschloss ich, mich auf die
Einkommensungleichheit zu konzentrieren und verschiedene Methoden zur Berechnung des
Gini-Koeffizienten (eines globalen Standards) zu vergleichen, insbesondere den von Indien.
3
Durch die Untersuchung soll ich die Gründe für die Unzuverlässigkeit (falls vorhanden)
identifizieren und verstehen, was ein perfektes Maß für wirtschaftliche Ungleichheit wäre.

II. Hintergrundinformationen
Der Gini-Koeffizient ist das bekannteste und am weitesten verbreitete Maß für Ungleichheit und
ein Standard in Regierungsberechnungen. Es ist nach seinem Gründer Corrado Gini benannt,
der es 1912 entdeckte. Der Wert des Gini-Koeffizienten einer Region liegt zwischen 0 und 1
und basiert auf dem Nettoeinkommen der Einwohner. Hier steht 0 für perfekte Gleichheit,
wobei jeder Einwohner das gleiche Einkommen verdient, und 1 steht für perfekte Ungleichheit,
bei der 1 Person das gesamte Einkommen verdient (Bourne). Daher würde ein höherer Gini-
Koeffizient eine größere Ungleichheit zwischen den Einkommen der reichsten und ärmsten
Verdiener in einer bestimmten Region bedeuten.

Es gibt verschiedene Möglichkeiten, den Gini-Koeffizienten zu berechnen. Dazu gehören


grafische Methoden, bei denen verschiedene Datenpunkte und Frequenzen wie die
Lorenzkurve und theoretischere wie die Pareto-Verteilungsfunktion kumuliert werden. Dies sind
die beiden Methoden, die ich analysieren und miteinander vergleichen werde.

Die Zuverlässigkeit basiert auf der Nähe der aus jeder Methode extrahierten Werte zu dem von
der indischen Regierung für das Jahr 2013 veröffentlichten Wert, der 2013 G=0,510 betrug
(Nair).

Methode 1: Verwenden der Lorenzkurve: Trapezregel


Die häufigste Betrachtungsweise des GINI-KOEFFIZIENTEN ist die verallgemeinerte
Lorenzkurve.

Abbildung 2: Die Linie des perfekten Eigenkapitals und eine willkürliche Lorenzkurve
4
In Bezug auf Abbildung 2 zeigt diese Kurve die Prozentsätze einer definierten Bevölkerung, die
von der ärmsten zur reichsten auf der horizontalen (x) -Achse angeordnet sind, und den
kumulativen Prozentsatz des Einkommens, das ein Segment der Bevölkerung eines Landes
genießt. Zum Beispiel zeigt Quintil 3 den kumulativen Prozentsatz des verdienten Einkommens
oder Vermögens durch das 1., 2. und 3. Quintil zusammen. Da 0% der Bevölkerung 0% des
Einkommens haben, verläuft die Kurve durch Punkt A (0, 0) und da 100% der Bevölkerung das
gesamte Einkommen genießen, verläuft die Kurve durch Punkt B (1,1), wie im Diagramm zu
sehen. So verläuft eine Lorenzkurve von einer Ecke der Einheit quadratisch zur diagonal
gegenüberliegenden Ecke. Dies dient als Maßstab für eine perfekt gleichmäßige
Einkommensverteilung, die durch die Kurve L0(x) angezeigt wird.

10x -
Abbildung 2 zeigt eine beliebige, aber mögliche Lorenzkurve L1(x) . Der Grad der
= 1023
einkommensungleichheit wird durch die Abweichung der Lorenzkurve von der Linie der
perfekten Ungleichung definiert. Diese Abweichung (Gini-Koeffizient) wird durch die Fläche
unter der Lorenzkurve gemessen, wie wir beobachten werden.

Mit einem Lorenzkurvendiagramm wie dem obigen können wir den Gini-Koeffizienten
messen. Die bei der Untersuchung zu verwendende allgemeine Formel wird durch das
folgende Integral dargestellt:

G=2 ∫ L (x)-L(x)dx
1
0 0

Diese berechnet die Fläche zwischen der Kurve der perfekten Ungleichung und einer
Lorenzkurve geteilt durch die Fläche unter der perfekten Ungleichungskurve. In Figur 1
wird beispielsweise der Gini-Koeffizient von L1 (x) als die Fläche LA (Lorenzfläche)
zwischen der Kurve und L0 (x) geteilt durch die Fläche unter L0 (x) als Hervorhebung in
Magenta bzw. Orange gemessen. Da im Punkt B die Koordinaten (1,1) sind, bildet dies ein
rechtwinkliges Dreieck, wobei der Punkt A und (1,0) die beiden anderen Eckpunkte sind,
die in einem hellen Orangeton hervorgehoben sind.
11 Daher ist
die Fläche unter der Eigenkapitalkurve die Fläche unter einem Dreieck, die 2×1×1= 2 ist.

Daher kann der Gini-Koeffizient im Allgemeinen wie folgt geschrieben werden:

G= LA = 2LA ←+→ LA = G

1/2 2

wobei LA die Fläche zwischen den beiden oben genannten Kurven ist und G der Gini-
Koeffizient von L2(x) ist, unter Bezugnahme auf Figur 2. Die allgemeine Formel ist jedoch in
realen Situationen schwer anzuwenden. Dies liegt daran, dass Nationen Rohdaten von
ihrer Bevölkerung in großer Zahl sammeln, die als verallgemeinerte Grafik schwer zu
formulieren sind. I
5
wird versuchen, dies unter Verwendung der Trapezregel mit einem begrenzten Datensatz
zu tun, der aus den offiziellen Volkszählungsdaten der Einkommensgruppen Indiens
gewonnen wurde, wie in der folgenden Tabelle zu sehen ist.

Anteil des
Bevölkerungsanteil
Einkommens
: (Umrechnung von
(Umrechnung von
% in
% in
Dezimalstellen) xi
Dezimalstellen yi
1 0 0
2 0,2 (erstes Quintil) 0.061
3 0.153
0,4 (zweites Quintil)
4 0,6 (drittes Quintil) 0.279
5 0.468
0,8 (viertes Quintil)

6 1 (fünftes Fünftel) 1.0

Tabelle 1: Kumulative Häufigkeitstabelle, die Indiens Abbildung 3: Indiens Quintil-Einkommensanteil


Einkommen in Quintilen darstellt Streudiagramm

Die Trapezregel bezieht sich auf eine Regel der numerischen Integration, die die Fläche
unter einer Kurve schätzt. Als solches ist es eine Möglichkeit, Integrale von Kurven zu
schätzen, indem die Fläche unter der Kurve in eine Reihe von Trapezen getrennt wird,
deren Flächen dann summiert werden. Um den Gini-Koeffizienten zu finden, können die
Datenpunkte in Tabelle 1 verwendet werden, um eine Reihe von Trapezen zu formulieren,
6
um eine geschätzte Lorenzkurve darzustellen, wie in der folgenden Abbildung zu sehen ist:
Abbildung 4: Fläche unter einer geschätzten Lorenzkurve, formuliert
mit der Trapezregel
7
Dabei stellt die summierte Fläche der Trapeze T1, T2, T3 und T4 und das Dreieck TR1 (in
rot) subtrahierend durch die Fläche von TR0 (in grün) die Fläche LA dar. Die Fläche von
TR0, das Dreieck unter L0 (x) ist 1/2. In Übereinstimmung mit der oben angegebenen
Formel ist der Gini-Koeffizient, der unter Verwendung der Trapezregel geschätzt wird:
=0,5-(0,01+0,02+0,04+0,07+0,15)=0,21=0,420
G

0.5 0.5

Dieser Wert ist eine große Unterschätzung des von der Regierung angegebenen Wertes des
Koeffizienten, der G=0,510 ist. Dies deutet darauf hin, dass die Trapezregel zu einem
negativen Bias für die Berechnung des Gini-Koeffizienten führt, was ihn zu einem weitgehend
ineffektiven Maß macht.
8
Methode 2: Verwenden der Lorenzkurve: Polynomiale Regression
Um diese Einschränkung zu korrigieren und eine genauere Lorenzkurve zu formulieren,
werde ich versuchen, einen Polynomgraphen unter Verwendung der Polynomregression zu
formulieren. Dies bezieht sich auf eine Methode der Kurvenanpassung, mit der ein
Datensatz unter Verwendung einer Polynomfunktion angenähert wird, die die Form f(x) = C
+C x +C x +...+ C xn annimmt, wobei C sich auf einen Satz von Koeffizienten bezieht und n 01 2
1 2

n
auf den Grad der Polynomfunktion. Dabei wird die Differenz zwischen dem Messwert von
yi und dem Istwert von yi als Restwert R bezeichnet.

Das allgemeine Modell für die Polynomregression kann mit der Methode der kleinsten
Quadrate erstellt werden. Diese Methode versucht, die Varianz zwischen den Werten zu
reduzieren, um die Datenpunkte genau anzupassen, indem die niedrigste Summe der
Residuen gefunden wird. Da lineare und polynomiale Regressionsmodelle oft
unzuverlässig sind und dazu neigen, die Daten unangemessen darzustellen, werden
Residuen verwendet, um ihre Genauigkeit zu überprüfen. Ein Restpunkt (e) bezieht sich
auf die Differenz zwischen dem tatsächlichen Wert der abhängigen Variablen (y) und dem
Wert, der durch die Punkte auf einer Regressionskurve (y1) vorhergesagt wird ("Restwerte
finden").

Dies ist in der folgenden Abbildung grafisch dargestellt:


9
Hier wird die Summe der quadrierten Residuen dargestellt durch:
1
n2 0
-
SSR (C0+C1xi+...+Cnxin =1 )
Um das Polynom zu minimieren, nehmen wir partielle Ableitungen dieser Funktion in
Bezug auf jede der Konstanten (C), wobei wir den Rest mit 0 gleichsetzen, um den
niedrigsten Wert von SR (Summe der Residuen) zu finden. Partielle Ableitungen beziehen
sich auf Ableitungen einer Funktion mit mehreren Variablen, wobei alle Variablen außer C
als fest angesehen werden (Weisstein).

Um die Lorenzkurve von Indien zu finden, werde ich die Untersuchung auf die quadratische
Regression beschränken, wobei die allgemeine Gleichung lautet:

yi = C2x + C1x+ C0
2

n2
wobei:
-
SSR (C0+C1xi+C2xi
=1
2
)
Die partiellen Ableitungen für diese quadratische Funktion lauten:

∂ =-2 √y-(C +Cx+Cx )√=0


(SSR)
n 2

∂(C ) ∑ 
0 ⎦ i=1 0 1 2

∂ (C) =-2 ∑ y-(C0 +C1x+C2x ) 2


x=0

∂ (C) = -2 ∑ y-(C0 +C1x+C2x ) 2


x = 0 2

Wenn wir beide Seiten durch 2 teilen und die Konstanten ausrechnen, kommen wir zu den
folgenden Gleichungen:

n nn

C0n+C1∑ ∑ ∑ i =1
xi +C2
i =1
xi =2

i=1
yi gleichung (a)

n n nn

C0 ∑ ∑ ∑ ∑ xi+C1
i=1
xi +C2
i=1
2
xi = 3

i=1 i=1
x iy i gleichung (b)

n n nn

C0 ∑ ∑ ∑ ∑ xi +C1
2

i=1
xi +C2
i=1
3
xi =
i=1 i=1
4
xi yi
2
gleichung (c)

die sich wie folgt ausdrücken lassen:


1
1

∑ ∑ ∑
n n n

yi
xi i=1 C0 i=1

∑ ∑ ∑
n n xn i 2
n


(1) C1
xi C2

∑ ∑ ∑
n xn i 2
x
n i3
x iy i
i=1
i=1 i=1 i=1
n
1
Die Erstellung der Matrix und ihre Darstellung der 3 obigen Gleichungen kann 2
beobachtet
werden, indem man die Multiplikation der Matrizen auf der rechten Seite von (1)
betrachtet. Um zwei Matrizen zu multiplizieren, müssen wir das Punktprodukt jeder Zeile
der ersten Matrix und die einzige Spalte der zweiten Matrix machen. Dies berechnet die
Summe aller Produkte von passenden Mitgliedern, wie unten zu sehen:

>x
i=1 i=1
x
nn n C
∑∑ xi xi 2 o

∑∑
n n n C
∑ ∑
xi 2
xi 3
xi
xi 3

4
,
nn
=C n+C x +C x 2

0 1 i2 i
i=1 i=1
n

= ∑ i =1
yi

Wie zu sehen ist, ergibt das Finden des Punktprodukts der ersten Reihe der ersten Matrix
und der zweiten Matrix Gleichung (a). Das Finden des Punktprodukts der nächsten zwei
Zeilen der ersten Matrix führt zu Gleichung (b) und (c). Daher können Matrizen verwendet
werden, um die Gleichungen (a), (b) und (c) darzustellen.

Wir können den Wert der Konstanten bestimmen, indem wir beide Seiten von (1) mit der
transponierte erste Matrix:
-1
∑∑ ∑
n n n
n
yi
C0 xi xi i=1

∑ ∑
2
n
i=1 n
i =1
C1

n


n

C2 x i
i=1 x
i2
xy
i =1 xi i=1
∑ ∑ ∑
n 3 i i

n i =1
n
n

Um die inverse Matrix einer 3 × 3-Matrix zu können wir den folgenden


berechnen, Prozess verwenden.
bc ef
Angenommen, eine allgemeine Matrix in hi wobei jeder Buchstabe einem
der Form: M=

reelle Zahl. Die inverse Matrix lautet:


1
3

ef
hi
-1
1 bc ac
hi gi
bc ab
ef de

wobei die beliebige = ad -


Nebenmatrix: bc
und die sogenannte Determinante:

df
IMI= -b +c = a(ei - fh)-b(di- fg)+c(dh-eg)
a gi

Durch Auflösen der Koeffizienten in der Matrix kann dann eine Kurve für eine quadratische
Funktion erzeugt werden. Im Fall von Indien haben wir die Informationen über den Anteil
des Einkommens, der von jedem Fünftel der Bevölkerung verdient wird, wie in Tabelle 1
dargestellt.

Wenn wir die in der Tabelle dargestellten xi - und yi -Werte in die Matrixgleichung 1
eingeben, erhalten wir Folgendes:

⎡6 3 ⎤ ⎡ 1.961
⎤ —1
C
0 3
2.29
C1
⎥ 2.29 1.8
⎥ 1.6152
C 2 ⎥ ⎣⎢ 1.5664 ⎦ ⎥ ⎣⎢
1.8

Um das Inverse der Matrix zu lösen, müssen wir zuerst ihre Determinante finden, die durch
Summieren des Produkts eines Kofaktors der ersten Zeile und ihrer jeweiligen
Nebenmatrix berechnet werden kann:

2.29 1.8 3 1.8 3 2.29


-3 + 2.29
1.8 1.5664 2.29 1.8
1.5664 2.29
= 6(3.59 - 3.24)- 3(4.70 - 4.12) + 2.29(5.4 - 5.24)
= 0.60347

Der Kehrwert davon kann mit der folgenden Matrix multipliziert werden, um uns die
Transposition der Matrix zu geben:
1
4

2.29 1.8 3 1.8 3 2.29
⎢ 1.8 1.5664 2.29 1.5664 2.29 1.8 ⎥⎥

1 ⎢ 3 2.29 6 2.29 63 ⎥
0.60347 1.8 1.5664 2.29 1.5664 2.29 1.8 ⎥

⎢ 3 2.29 6 2.29 63 ⎥⎥
2.29 1.8 3 1.8 3 2.29 ⎦⎥
⎣⎢ ⎥

⎡ 0.347 -0.577 0.156 ⎤


= 1
-0.577 4.154 -3.93 ⎥
0.60347 ⎥
⎣⎢ 0.156 -3.93 4.74 ⎦⎥

0.490 -0.815 0.220


-0.815 5.869 -5.553
0.220 -5.553 6.697

Wir können die wert der Koeffizienten, C! indem Sie diese in die
0,C1,C2
originalgleichung.
C0 -0.815
C1
0.490
0.220 ⎥⎡ 1.961
-5.553
-0.815 5.869
⎢⎢
C2
0.220 -5.553 ⎥⎥⎥⎣⎢
6.697

C0 -0.04139503523151611
C1
-0.04057415997524583
C2
1.0179444066877004

Dies würde uns die quadratische Gleichung geben:


y=C2x +C1x+C0 2

y= 1,02x - 0,041x - 0,041 2

In der obigen Gleichung wurden die Koeffizienten zur leichteren Beobachtung bis zu 3
signifikante Zahlen dargestellt. Die resultierende Lorenzkurve (L q) inmitten der Streupunkte
der Eingabe ist unten zu sehen:
Aus der Art der Kurve können wir ersehen, dass sie die in Tabelle 1 jubelnden
Datenpunkte nicht durchläuft. Dies deutet darauf hin, dass die Vorhersage der y-Werte für
alle x auf der Grundlage eines begrenzten Datensatzes den Einkommensanteil jedes
Bevölkerungssegments für Indien nicht genau darstellt. Aus den Abweichungen der
Datenpunkte (hervorgehoben durch die roten Punkte in Abbildung 6) von der Best-Fit-
Kurve können wir eine Tabelle formulieren, um jeden Restpunkt darzustellen:

y
x y1 e

0 0.00 -0.04 0.04

0.2 0.06 0.01 0.05

0.4 0.15 0.14 0.01

0.6 0.28 0.35 -0.07

0.8 0.47 0.64 -0.17

1.0 1.0 1.102 -0.102


Tabelle 2: Restplotdaten für Tabelle 1
1
6
Die Restsumme der Quadrate ist, wie bereits erläutert, ein Maß, das angibt, inwieweit ein
statistisches Modell gut zu einem Datensatz passt. Der Wert von SSR ist in diesem Fall SSR
= 0,048404, was darauf hindeutet, dass die quadratische Linie zwar eine geeignete Best-Fit-
Linie zeichnet, die Daten jedoch nicht perfekt darstellt. Noch wichtiger ist, dass es nicht die
Anforderungen einer Lorenzkurve erfüllt, die darin besteht, dass es den Ursprung und den
Punkt B (1,1) durchläuft. Dies war eine Einschränkung, die ich erst nach der Berechnung
der Daten und dem Zeichnen der Kurve mit einer Grafiksoftware erkannte. Mir wurde klar,
dass die Verwendung der quadratischen Regression möglicherweise keine geeignete
Methode ist, um eine Lorenzkurve zu skizzieren.

Um dieses Problem zu bekämpfen, habe ich mich entschieden, die Polynomregression zu


verwenden, um ein Polynom höheren Grades unter Verwendung der Datenpunkte in
Tabelle 1 zu definieren.

Da wir 6 Datenpunkte haben, kann eine Polynomgleichung fünften Grades konstruiert


werden, um die Lorenzkurve darzustellen. Ich habe mich dafür entschieden, hier ein
Polynom fünften Grades mit der allgemeinen Gleichung yi = C5x +C4x + C3x + C2x +C1x+C0 5 4 3 2

zu verwenden, da dies die maximale Ordnung eines Polynoms ist, das mit 6 Datenpunkten
erstellt werden kann, was vermutlich zu einer möglichst genauen Lorenzkurve führt. Die
vorgenannte Gleichung (1) kann alternativ geschrieben werden als:

⎡ ⎢ x1
x12 
⎥(
1 x2  
C
⎥ 1)
01
C
=
⎢⎢1!
2

2 C
⎢! ⎥

2
x!
⎣⎢x n
xn2 ⎦⎥ ??⎦
wobei n sich auf die Anzahl der x-und y-Koordinaten bezieht. Die erste Matrix in der obigen
Gleichung ist als Vandermonde-Matrix bekannt, eine Art Matrix, die in der polynomialen
Anpassung der kleinsten Quadrate (Weisstein) entsteht. Im Falle eines Polynoms fünften
Grades wird dies unter Verwendung der Werte aus Tabelle 1 wie folgt dargestellt:


C


C 0
⎡⎢
⎢ 0 00 0⎥⎡0⎤ ⎢ 0 1

1 0.21
0.04 0.008 ⎥0.061
0.0016 0.00032 ⎥

⎢⎢1 0.4 0.16 0.064


⎥ C 0.0256 0.01024
⎢ 0.153 ⎥

⎥ 2

0.6 0.36 0.216 0.1296 0.0776


⎢ 0.8 0.64 0.512 0.4096 0.32768 C ⎥⎢⎢

1
3

⎢1 1 11 1 1
⎥ ⎥⎢
⎥ 0.468 ⎥ C

⎣ ⎢1 ⎦⎢ ⎥⎣ 1⎦⎥ 4 ⎢

C ⎥ 5

-1 ⎡ 0 ⎤

⎥ ⎡1 0 0 ⎤
⎢ ⎥
C
⎥ ⎢ 1 0.2 0.04 0 0.008 0 0.0016 0.00032 ⎢ 0.061
0 0
C
C ⎥
C
1
⎥ ⎥
2
⎥⎢ 1 0.4 0.16 0.064 0.0256 0.01024
⎥ ⎢ 0.153 ⎥

C ⎥⎢⎢ 1 0.6 0.36 0.216


3
0.1296 0.0776
⎢⎢
C
⎥⎢ 1 0.8 0.64 0.512 0.4096 0.32768
⎥ ⎢ 0.468
1

⎢ ⎦⎥⎥ ⎣
7
1 1 1
4 ⎢11 1
⎦ ⎣⎢1

⎣⎢ ⎥ ⎥
1
8
Durch die Durchführung der oben genannten Schritte zur Inversion und Matrixmultiplikation
mit IT (einem Rechner) erhalten wir aufgrund der Größe der Matrix die folgende Matrix für
die Konstanten:

0
C0
0.363692946057596
C1 -1.30244640387085
C2 6.54629149376606
-10.1476054633385
C3 5.54006742737785
C4
C5 Aus diesen Werten ergibt sich für die Lorenzkurve
Indiens im Jahr 2013:

5,540x5 - 10,148x4 + 6,546x3 - 1,302x2 + 0,364x

wie die Lorenzkurve im folgenden Diagramm dargestellt, wobei die verschiedenen


Streupunkte Indiens Einkommensquintilen aus Tabelle 1 definieren.

Im Vergleich zur Lorenzkurve, die aus der quadratischen Regression abgeleitet wurde, wird

Abbildung 7: Die resultierende Lorenzkurve aus der


Polynomregression
beobachtet, dass die Verwendung eines Polynoms 5. Grades besser geeignet ist, um die
1
9
Lorenzkurve zu berechnen, da sie sowohl den Ursprung als auch den Punkt B durchläuft.

Der Gini-Koeffizient unter Verwendung der Integralformel gemäß unserer Kurve und Daten
lautet:

∫1
x - (5,540x5 - 10,148x4 + 6,546x3 - 1,302x2 + 0,364x)dx
= 0.443
Wie zu sehen ist, weist diese Lorenzkurve keine Abweichung von den Datenpunkten auf,
da sie alle 6 aus Tabelle 1 interessiert. Da es keine Restpunkte gibt, deutet dies darauf hin,
dass es sich um eine genauere Darstellung der Einkommensverteilung Indiens handelt, die
Lq mit polynomieller Regression erhalten hat.

Offiziellen Daten zufolge betrug der Gini-Koeffizient von Indien im Jahr 2013 G=0,510, was
nicht dem Gini-Koeffizienten entspricht, der aus der vorhergesagten Lorenzkurve L
berechnet wurde. Dies könnte auf eine begrenzte Bandbreite der verwendeten Daten
zurückzuführen sein, die die sozio-politische Durchführbarkeit der Berechnungen verringert
und den Gini-Koeffizienten nicht genau schätzt. In diesem Fall wäre eine polynomiale
Regression zur Skizze einer Lorenzkurve mit einem größeren Datensatz genauer.

Methode 3: Verwendung der Kovarianzformel


Die Berechnung des Gini-Koeffizienten unter Verwendung geometrischer Interpretationen
auf der Grundlage der Lorenzkurve ist nur eine der unzähligen Möglichkeiten, mit denen
der Index berechnet werden kann. Eine alternative Methode besteht darin, den Gini-Index
in Bezug auf die Kovarianz zwischen den Einkommensniveaus (Bevölkerungsanteil) und
der kumulativen Einkommensverteilung darzustellen. Wenn wir die allgemeine Formel des
Gini-Koeffizienten anhand der Lorenzkurve kennen, können wir sie wie folgt umschreiben:

G=2 ∫ 1
0 0 L (x)-L(x)dx

=1-2 ∫ L(x)dx
1

In diesem Fall sei angenommen, dass die kumulative Verteilungsfunktion F(x) den Anteil
der Bevölkerung mit einem Einkommensniveau unter oder gleich x angibt. Dies ist eine
nicht abnehmende Funktion, die den Prozentsatz der Personen mit einem Einkommen
unter x darstellt. Nennen wir diesen Anteil p. Zusätzlich sei angenommen, dass F(x) stetig
differenzierbar ist, so dass folgende Dichte vorliegt:


F (x)=f(x)

wobei für einen gegebenen Wert von xder Anteil p alternativ definiert werden kann als:
2
x 0


p= f(x)=F(x)
0

Unter Verwendung der geometrischen Darstellung der oben genannten allgemeinen


Formel für den Gini-Koeffizienten können wir ihn in Bezug auf die Kovarianz zwischen
Einkommensniveaus und der kumulativen Einkommensverteilung (Lubrano) darstellen.


G = 1 - 2 L(p)dx
0

. . 2 ... . . ...
wobei C ov ist die Kovarianz = Cov(x,F(x)) zwischen dem Einkommensniveau y und dem
kumulierte Verteilung der µ
das gleiche Einkommen F(y) und µ ist das Durchschnittseinkommen.

Die folgende Tabelle stellt das Haushaltseinkommen für jedes der indischen Fünftel als
Erweiterung von Tabelle 1 dar:

Anteil des Haushaltseinkommen


Bevölkerungsanteil: Einkommens (Rs/Annum) yi
(Umrechnung von % in (Umrechnung von %
Dezimalstellen) in Dezimalstellen
xi

1 0,2 (erstes Quintil) 0.061 19,041


2 0,4 (zweites Quintil) 0.153 29,353
3 0,6 (drittes Quintil) 0.279 41,220
4 0,8 (viertes Quintil) 0.468 65,235
5 1 (fünftes Fünftel) 1.0 153,872
Tabelle 3: Tabelle der mittleren Einkommensniveaus, die jedem Bevölkerungsquintil in Indien entsprechen

Dabei bezieht sich die kumulative Einkommensverteilung auf x-Koordinaten, während sich
die Einkommensniveaus auf das durchschnittliche persönliche Einkommen beziehen, das
dem x-Segment der Bevölkerung entspricht. Dies deutet darauf hin, dass der Gini-Koeffizient
proportional zur Kovarianz zwischen einer Variablen und ihrem Rang ist. Die Kovarianz
zweier Variablen gibt an, wie sie sich zusammen verändern. Als solches liefert es ein Maß
für den Grad der Korrelation zwischen Sätzen von Zufallsvariablen, wobei ein positiver
Kovarianzwert auf eine positive Beziehung und ein negativer Wert, eine inverse Beziehung,
hindeutet.

Das Verständnis der Idee der Kovarianz war für mich eine besondere Herausforderung, da
Statistik ein Thema war, das in keinem meiner Mathematikunterricht besucht wurde. Als
solches habe ich im Gegensatz zu einem formelhaften versucht, das Konzept schematisch
2
1
zu verstehen und zu erklären. Unter Verwendung der gepaarten Daten in Tabelle 3 ist
unten ein Streudiagramm zu sehen:
2
2

Abbildung 8: Schematische Darstellung der Kovarianz


Im Diagramm zeichnete ich alle möglichen Rechtecke, die zwischen den 5 Datenpunkten
existieren konnten, rot einfärbend. Hier wird die Kovarianz in der Kurve als Nettobetrag von
Rot dargestellt (was die durchschnittliche Kovarianz zwischen den Variablen
widerspiegelt), die aufgrund der dunkleren Rottöne dort ungefähr in der Mitte liegen würde.
Mathematisch wird dies mit der Formel dargestellt:
n

i=1
∑ (xi-x)(yi-y)
Cov(x,y)=
n-1
wobei: x = unabhängige Variable
y = abhängige Variable
n = Anzahl der Datenpunkte
x = Mittelwert der unabhängigen
Variablen, x
y = Mittelwert der abhängigen
Mit den Werten in Tabelle 3 können wir Variablen,
zuerst yx und y
berechnen.
5

x= ∑ xi
5 i=1
= = 0.6

3

55
yi 308, 721
=61.744,2=µ
y = i=1 = 5

Wenn wir diese Werte in die oben genannte Kovarianzformel einfügen,


erhalten wir:
5

∑ (xi-x)(yi-y)
Cov(x,y)= i =1
4

17081.28 + 6478.24 + 0 + 698.16 +


36851.12
=415277.2
2
3
2
Dividieren wir diesen Wert durch, können wir den Wert des Gini-Koeffizienten unter
Verwendung des µ
kovarianzformel:
G= 2 × 15277.2
61744.2
= 0.495
Wie zu sehen ist, entspricht der Wert von G=0,495 nicht dem offiziell angegebenen Wert
für den Gini-Koeffizienten von Indien im Jahr 2013 von G=0,510, der von der indischen
Regierung anhand ihrer vollständigen Daten berechnet und veröffentlicht wurde. Mit nur 5
verallgemeinerten Einkommensniveaus, die verwendet werden, um die Kovarianz
zwischen Einkommensniveaus und Bevölkerungsanteilen in Indien zu bestimmen, ist dies
unvermeidlich. Durch die Verwendung einer begrenzten Anzahl von Datenpunkten wurde
mir klar, dass ich verschiedene Eigenheiten ignoriere, die in der Einkommensverteilung
jedes einzelnen Segments vorhanden sein können. Dies hat zu einer Unterschätzung des
Gini-Koeffizienten von Indien geführt.

Wie bei dem Ergebnis der ersten Methode liegt der Grund für die Diskrepanz
höchstwahrscheinlich primär in dem eingeschränkten Zugang eines Zivilisten zu
Nationaleinkommensdaten. Dies stellt die Beobachtung der Wirksamkeit verschiedener
Methoden zur Berechnung des Gini-Koeffizienten vor Herausforderungen.

Diskussion und Analyse


In dieser Untersuchung habe ich versucht, eine Analyse von drei formelhaften Methoden
zur Berechnung des Gini-Koeffizienten vorzulegen; zwei basieren auf Flächenverhältnissen
unter einer Lorenzkurve und die andere auf Kovarianzformeln.

Die numerische Integrationsmethode der Trapezregel im Vergleich zu Methode 2 ist


äußerst unzuverlässig, da sie unweigerlich zu einer positiven Verzerrung für die
Lorenzkurve und einer negativen Verzerrung für den Gini-Koeffizienten führt. Dies liegt
daran, dass die Methode die Kurve mit geraden Liniensegmenten erstellt, die über
parabolischen Linien liegen würden, die die Datenpunkte verbinden (wie in Methode 2 zu
sehen). Dies führt zu einer größeren Fläche unterhalb der Lorenzkurve für Methode 1 und
damit zu einem kleineren Gini-Koeffizienten.

Beim Vergleich der Methoden 2 und 3 scheint die Methode 2 trotz der Tatsache, dass die
Werte des Gini-Koeffizienten unter Verwendung der Methoden 2 und 3 niedriger waren als
der staatlich definierte Wert von G=0,510, bei der genauen Messung des Werts
unwirksamer zu sein, da der von ihr vorhergesagte Wert eine größere Abweichung vom
tatsächlichen Wert aufwies als der von der Kovarianzformel vorhergesagte. Ein Grund
dafür könnte sein, dass die Formulierung der Lorenzkurve L(x) aus einem Datensatz der
Größe n = 6 zu einer Kurve führt, die Einkommensanteile (y) für alle nicht spezifizierten
Segmente / Bevölkerungsanteile der indischen Gesellschaft schätzt (x). Im Falle meiner
2
4
Untersuchung, bei der die Datenpunkte auf Quintil-Einkommensdaten beschränkt waren,
gibt dies großen Raum für Unsicherheiten und ungenaue Schätzungen der
Einkommensunterschiede innerhalb dieser Quintilen. Da andererseits der auf der
Kovarianzformel basierende Gini-Koeffizient ausschließlich aus der Beziehung zwischen
den 5 x- und y-Koordinaten abgeleitet wurde, lag sein Wert von G=0,495 näher am
tatsächlichen Wert.

Mit empirischen Beweisen aus meiner Untersuchung scheint der Gini-Koeffizient am


genauesten mit der Kovarianz-basierten Methode berechnet zu werden. Da die meisten
Regierungen jedoch einen besseren Zugang zu einer Vielzahl von Einkommensanteilen
und Datenpunkten haben, entscheiden sie sich stattdessen für die Lorenzkurve, um den
Koeffizienten zu bestimmen (Methode 2). Der deutlichste Unterschied zwischen Methode 2
und Methode 3 besteht darin, dass die Lorenzkurve eine extrem kontextualisierte und
direkte Methode zur Berechnung des Gini ist. Dies liegt daran, dass es in erster Linie als
Grafik der kumulativen Häufigkeiten von Einkommensanteilen und Bevölkerungsanteilen
erstellt wurde, was zusammen mit den gut definierten Regeln für die Kurve darauf
hindeutet, dass es ausschließlich für diesen Zweck gedacht war. Auf der anderen Seite
wird die Kovarianzformel in Methode 3 als Rückschluss auf den Gini-Koeffizienten
verwendet, der im Allgemeinen die Art der Beziehungen zwischen zwei Zufallsvariablen
angibt. Dies ermöglicht es Methode 3, Messungen für verschiedene andere Bereiche von
Interesse bereitzustellen, wie zum Beispiel die Größenordnung der positiven oder
negativen Korrelation zwischen zwei beliebigen Variablen. Dieses Merkmal von Methode 3
kann verwendet werden, um den Grad der Ungleichheit in einem Land besser zu
verstehen, indem Schlupflöcher ausgefüllt werden, die möglicherweise bestehen, weil der
Koeffizient eine vereinfachte Betrachtung der Einkommensverteilung ist.

Insgesamt hat der Gini-Koeffizient Grenzen als Maß für Ungleichheit. Einer der wichtigsten
ist, dass der Koeffizient nicht über verschiedene Segmente einer Bevölkerung additiv ist
und die Nuancen der Einkommensunterschiede, die innerhalb jedes Segments bestehen
können, nicht ignoriert. Um den Ungleichheitsgrad einer Nation besser beurteilen zu
können, wird der Koeffizient in Verbindung mit anderen Indizes der
Einkommensungleichheit wie dem Theil-Index verwendet, der über verschiedene
Bevölkerungssegmente und -maße additiv ist. Es identifiziert den Anteil der Ungleichheit,
der auf die Komponenten zwischen den Regionen zurückzuführen ist, und ist eine
Messung basierend auf allgemeinen Entropieformeln, die einige der Einschränkungen des
Gini-Koeffizienten abmildert. /cite/

Annahmen und Einschränkungen


In der Untersuchung wurde die Verwendung des Gini-Koeffizienten als Instrument zum
Vergleich von Einkommensungleichheiten mehrerer Länder nicht untersucht. Dies hätte
eine mögliche Erweiterung der Untersuchung sein können, die auch zu einem tieferen
Verständnis ihrer Relevanz für die moderne wirtschaftliche Ungleichheit und ihrer
Zuverlässigkeit als solche beitragen könnte.
2
5
Darüber hinaus war der Umfang der Forschung aufgrund des eingeschränkten Zugangs zu
Volkszählungsdaten in Bezug auf die Einkommensanteile Indiens begrenzt. Zum Zwecke
des Vergleichs und der Exploration wurden die Ergebnisse jedoch als schlüssig
angenommen und mit dem tatsächlichen Wert des von der indischen Regierung
veröffentlichten Koeffizienten verglichen, um die Zuverlässigkeit jeder Methode zu
bestimmen.

Fazit
Die Untersuchung ermöglichte es uns, die verschiedenen Implikationen und Berechnungen
der Gini-Koeffizienten zu bestimmen, die je nach den Nuancen der einzelnen Methoden
numerisch variieren können. Die Arbeit mit dem Gini-Koeffizienten und mit so vielen
Bereichen der Mathematik, die mir neu waren, hat es mir ermöglicht, die Idee der
Ungleichheit, des Teilens monetärer Ressourcen und der angewandten Mathematik in der
heutigen Zeit zu schätzen. Ich war erstaunt, wie drastisch der Unterschied zwischen dem
niedrigsten und dem höchsten Quintil der indischen Erwerbsbevölkerung war, eine
Erkenntnis, die nicht so aufschlussreich gewesen wäre, ohne sie mathematisch durch
Lorenz-Kurven abzuleiten. Die quantitative und empirische Analyse sozialer Fragen wie
Einkommensungleichheit ermöglichte es mir, meine Perspektive auf die Auswirkungen und
den Schweregrad dieses vorherrschenden Problems zu erweitern.
2
6
Literaturverzeichnis
Bourne, Murray. "Der Gini-Koeffizient der Vermögensverteilung." Intmathcom RSS. N.p.,
24. Februar 2010. Web. 07.03.2017.
Nair, Remya. "Der IWF warnt vor wachsender Ungleichheit in Indien und China."
Http://www.livemint.com/. Livemint, 03. Mai 2016. Web. 07.03.2017.
"Restbestände finden." Interaktivieren: Restbestände finden. CSERD, N.D. Web. 23. März
2017.
Weisstein, Eric W. „Vandermonde Matrix.“ Aus MathWorld--A Wolfram Web Resource.
http://mathworld.wolfram.com/VandermondeMatrix.html. 23. März 2017.
Lubrano, Michael. "The Econometrics of Inequality and Poverty." (n.d.): n. pag.
Http://www.vcharite.univ-mrs.fr/PP/lubrano/cours/Lecture-4.pdf. Sept. 2016. Web.
24. März
2017.

Você também pode gostar