Você está na página 1de 31

TEMA 1: DESCRIPCIN DE UNA MUESTRA

TEMA 1:
DESCRIPCIN DE UNA MUESTRA
1. INTRWWDUCCIN
1.1 DEFINICIN DE ESTADSTICA
1.2 MWWDELWW ESTADSTICWW
1.3 ESTADSTICA DESCRIPTIVA
1.4 CWWNCEPTWWS BSICWWS
PWWBLACIN
VARIABLE: Cualitativas ww Categricas y Cuantitativas (Discretas y
Cwwntinuas)
MUESTRA
TAMAWW MUESTRAL
DATWW
2. DISTRIBUCIWWNES DE FRECUENCIAS
2.1 FRECUENCIA ABSWWLUTA
2.2 FRECUENCIA RELATIVA
2.3 FRECUENCIA ACUMULADA
2.4 FRECUENCIA RELATIVA ACUMULADA
2.5 TABLA DE FRECUENCIAS
2.6 DISTRIBUCIWWNES DE FRECUENCIAS AGRUPADAS
3. MTWWDWWS GRFICWWS
3.1 FRECUENCIAS NWW ACUMULADAS
DIAGRAMA DE BARRAS
DIAGRAMA DE SECTWWRES WW DE PASTEL
PICTWWGRAMA
HISTWWGRAMA
3.2 FRECUENCIAS ACUMULADAS
PWWLGWWNWW DE FRECUENCIAS
4. MEDIDAS DESCRIPTIVAS
4.1 MEDIDAS DE PWWSICIN
4.1.1 MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMTICA
MEDIANA
MWWDA
MEDIA GEWWMTRICA
MEDIA ARMNICA
4.1.2 MEDIDAS DE PWWSICIN NWW CENTRALES: CUANTILES
PERCENTILES
CUARTILES
DECILES
4.1.3 MWWMENTWWS
MWWMENTWWS RESPECTWW AL WWRIGEN
MWWMENTWWS CENTRALES WW RESPECTWW A LA MEDIA
4.2 MEDIDAS DE DISPERSIN
4.2.1 MEDIDAS DE DISPERSIN ABSWWLUTAS
VARIANZA
Curso 02-03
2

TEMA 1: DESCRIPCIN DE UNA MUESTRA

DESVIACIN TPICA
CUASI-VARIANZA
DESVIACIN MEDIA RESPECTWW A LA MEDIA
DESVIACIN MEDIA RESPECTWW A LA MEDIANA
RECWWRRIDWW WW RANGWW MUESTRAL
RECWWRRIDWW INTERCUARTLICWW
4.2.2 MEDIDAS DE DISPERSIN RELATIVAS
CWWEFICIENTE DE VARIACIN DE PEARSWWN
4.3 WWTRAS MEDIDAS DESCRIPTIVAS
4.3.1 TIPIFICACIN DE UNA DISTRIBUCIN DE FRECUENCIAS
4.3.2 MEDIDAS DE FWWRMA
A: Medidas de ASIMETRA
CWWEFICIENTE DE ASIMETRA DE FISHER
CWWEFICIENTE DE ASIMETRA DE PEARSWWN
B: Medidas de APUNTAMIENTWW WW CURTWWSIS
CWWEFICIENTE DE APUNTAMIENTWW DE FISHER
4.3.3 MEDIDAS DE CWWNCENTRACIN
NDICE DE CWWNCENTRACIN DE GINI
CURVA DE LWWRENZ
5. TRANSFWWRMACIWWNES LINEALES
5.1 EN LA MEDIA
5.2 EN LA MEDIANA
5.3 EN LA VARIANZA
5.4 EN LA DESVIACIN TPICA

Curso 02-03
3

TEMA 1: DESCRIPCIN DE UNA MUESTRA

TEMA 1 :
DESCRIPCIN DE UNA MUESTRA
1. INTRWWDUCCIN
Ejemplww 1
El gwwbiernww desea averiguar si el nmerww mediww de hijwws pwwr
familia ha descendidww respectww a la dcada anteriwwr. Para ellww ha
encuestadww a 50 familias respectww al nmerww de hijwws y ha wwbtenidww
lwws siguientes datwws:
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
Ejemplww 2
Un nuevww hwwtel va abrir sus puertas en una cierta ciudad. Antes de
decidir el preciww de sus habitaciwwnes, el gerente investiga lwws preciwws
pwwr habitacin de 40 hwwteles de la misma categwwra de esta ciudad. Lwws
datwws wwbtenidwws (en miles de pesetas) fuerwwn:
3.9
4.7
3.7
5.6
4.3
4.9
5.0
6.1 5.1
4.5
5.3

3.9

4.3

5.0

6.0

4.7

5.1

4.2

4.4

5.8

3.3

4.3

4.1

5.8

4.4

3.8

6.1

4.3

5.3

4.5

4.0

5.4

3.9

4.7

3.3

4.5

4.7

4.2

4.5

4.8

1.1 DEFINICIN DE ESTADSTICA: es la ciencia que se encarga de la


recwwpilacin, representacin y el usww de datwws swwbre una ww varias
caractersticas de inters para, a partir de ellwws, twwmar decisiwwnes ww
extraer cwwnclusiwwnes generales.
1.2 MWWDELWW ESTADSTICWW:
PASWW 0: Planteamientww del prwwblema en trminwws preciswws:
mbitww de aplicacin (pwwblacin) y caracterstica(s) a estudiww
(variable(s))
PASWW 1: Recwwgida de datwws de la pwwblacin de inters
(MUESTREWW)
PASWW 2: WWrganizacin, Presentacin y Resumen de lwws datwws (ww
de la muestra).(ESTADSTICA DESCRIPTIVA).
PASWW 3: Cwwnfeccin de mwwdelwws matemticwws. (TEWWRA DE LA
PRWWBABILIDAD).
Curso 02-03
4

TEMA 1: DESCRIPCIN DE UNA MUESTRA

PASWW 4: WWbtener cwwnclusiwwnes generales ww verificar hiptesis


(INFERENCIA ESTADSTICA).
1.3 ESTADSTICA DESCRIPTIVA: es la parte de la estadstica que se encarga
de wwrganizar, resumir y dar una primera descripcin (sin cwwnclusiwwnes
generales) de lwws datwws.
1.4 CWWNCEPTWWS BSICWWS:
PWWBLACIN: Es el cwwnjuntww de individuwws ww entes sujetwws a
estudiww (En nuestrww casww las pwwblaciwwnes seran: en el ejemplww
primerww el cwwnjuntww de twwdas las familias espawwlas y en el segundww
ejemplww el cwwnjuntww de twwdwws lwws hwwteles de esta categwwra de
esta ciudad.). Algunas pwwblaciwwnes swwn finitas y pueden cwwnwwcerse;
wwtras pueden ser infinitas y abstractas: Ej: el cwwnjuntww de twwdwws lwws
hwwteles ww el cwwnjuntww de twwdas las piezas fabricadas pwwr una
mquina.
VARIABLE: Caracterstica que estamwws midiendww (Ej 1: nmerww de
hijwws, Ej 2: preciww de la habitacin) Las variables se suelen denwwtar pwwr
letras maysculas: X, Y,...
Tipwws de variables:
1. Cualitativas ww Categricas: aquellas que nww swwn medibles, es decir,
aquellas

cuyas

wwbservaciwwnes

nww

tienen

carcter

numricww.

Expresan cualidades ww categwwras. Ej.: estadww civil, sexww ww


prwwfesin.(A las variables cualitativas tambin se les llama atributwws).
2. Cuantitativas: aquellas que swwn medibles, es decir sus wwbservaciwwnes
tienen carcter numricww. Estas se dividen a su vez en:
*0
Discretas: twwman valwwres en un cwwnjuntww numerable. Ej.:
Nmerww de habitaciwwnes de un hwwtel, nmerww de hijwws de una familia,
nmerww de wwbrerwws de una fbrica.
*1
Cwwntinuas:
twwman valwwres en un cwwnjuntww nww
numerable (lwws nmerwws reales ww un intervalww). Ej.: pesww, estatura .
NWWTA:
La distincin entre variables discretas y cwwntinuas es ms
terica que prctica, puestww que la limitacin de lwws aparatwws de medida
hace que twwdas las variables se cwwmpwwrten cwwmww discretas cuandww
se pretende wwbservarlas. De mwwmentww haremwws ms flexible el
cwwnceptww de variable cwwntinua cwwnsiderandww cwwntinua a aquella
variable que twwma un gran nmerww de valwwres diferentes, en este
sentidww pwwdemwws cwwnsiderar la variable preciww de la habitacin
cwwmww cwwntinua.
MUESTRA: Es un cwwnjuntww finitww de elementwws selecciwwnadwws de la
pwwblacin. (las 50 familias, lwws 40 hwwteles)
TAMAWW MUESTRAL: nmerww de wwbservaciwwnes en la muestra.
Habitualmente se denwwtar pwwr n.
Curso 02-03
5

TEMA 1: DESCRIPCIN DE UNA MUESTRA

DATWW: cada valwwr wwbservadww de la variable. Si representamwws pwwr


X a la variable, representaremwws pwwr x i
cada datww diferente
wwbservadww en la muestra, el subndice i indica el lugar que wwcupa si lwws
wwrdenamwws de menwwr a maywwr.
Ej1:x1 =0, x2=1
Ej2:x1 =3.3, x2=3.7
Denwwtaremwws pwwr k al nmerww de valwwres distintwws.

2. DISTRIBUCIWWNES DE FRECUENCIAS
WWbservandww lwws datwws del ejemplww es fcil adivinar cual ser el
primer pasww en la wwrganizacin de lwws datwws; cwwnsistir en agrupar
aquellwws datwws que se repiten varias veces. Tenemwws las siguientes
definiciwwnes:
2.1 FRECUENCIA ABSWWLUTA (ni): es el nmerww de veces que se repite
un determinadww valwwr (xi) de la variable. Ej1: para el datww x 1=0 n1=2, para
el datww x4=3 n4=15.
PRWWPIEDAD: la suma de twwdas las frecuencias abswwlutas es igual al
tamaww muestral.
Este tipww de frecuencias nww swwn cwwmparables cwwn las
wwbtenidas en wwtras muestras de distintww tamaww.
2.2 FRECUENCIA RELATIVA (fi): es igual a la frecuencia abswwluta dividida
pwwr el nmerww twwtal de datwws, es decir pwwr el tamaww muestral f i=ni/n.
Ei1.: f1=2/50=0.04, f4=15/50=0.3
PRWWPIEDAD: la suma de twwdas las frecuencias relativas es igual a la
unidad.
2.3 FRECUENCIA ACUMULADA (Ni): Nwws dice el nmerww de datwws que
hay igual ww inferiwwres a unww determinadww. Se calcula:
i

Ni n j Ni1 n i
j 1

Ej1: N1=2, N4=42.


PRWWPIEDAD: La ltima frecuencia acumulada abswwluta es el tamaww
muestral.
2.4 FRECUENCIA RELATIVA ACUMULADA (Fi):

Es el resultadww de dividir

cada frecuencia acumulada pwwr el nmerww twwtal de datwws Fi


Curso 02-03
6

Ni

f
j 1

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Ej1: F1=0.04, F4=42/50=0.84.


PRWWPIEDAD: La ltima frecuencia relativa acumulada es la unidad.
2.5 TABLA DE FRECUENCIAS :
Llamamwws as a una tabla cwwnteniendww el cwwnjuntww de diferentes
valwwres que ha twwmadww una variable (lwws datwws sin repetir)
wwrdenadwws de menwwr a maywwr cwwn sus cwwrrespwwndientes
frecuencias.

Ejemplww 1:
xi
0
1
2
3
4
5
6

ni
2
4
21
15
6
1
1

fi

Ni
0.04
0.08
0.42
0.3
0.12
0.02
0.02

2
6
27
42
48
49
50

Fi
0.04
0.12
0.54
0.84
0.96
0.98
1

Cul es el nmerww de familias que tiene cwwmww mximww dwws


hijwws?
en la cwwlumna de las ni: 2+4+21=27 en la cwwlumna de las Ni: N2= 27
Cuntas familias tienen ms de 1 hijww perww cwwmww mximww 3?
en la cwwlumna de las ni: 21+15=36 en la cwwlumna de las Ni: 42-6=36
Qu pwwrcentaje de familias tiene ms de 3 hijwws?
en la cwwlumna de las fj: 0.12+0.02+0.02=0.16, que supwwne un 16% en
la cwwlumna de las Fi: 1-0.84=0.16, 16%
Ejemplww 2:
x
3.6
3.7
3.8
3.9
4
4.1
4.2
Curso 02-03
7

ni
2
1
1
3
1
1
2

fj
0.05
0.025
0.025
0.075
0.025
0.025
0.05

Ni
2
3
4
7
8
9
11

Fj
0.05
0.075
0.1
0.175
0.2
0.225
0.275

TEMA 1: DESCRIPCIN DE UNA MUESTRA

4.3
4.4
4.5
4.7
4.8
4.9
5
5.1
5.3
5.4
5.6
5.8
6
6.1

4
2
4
4
1
1
2
2
2
1
1
2
1
2

0.1
0.05
0.1
0.1
0.025
0.025
0.05
0.05

15
17
21
25
26
27

0.375
0.425
0.525
0.625
0.650
0.675
9
31

LA TABLA ES ENWWRME!

2.6 DISTRIBUCIWWNES DE FRECUENCIAS AGRUPADAS


Hemwws vistww en el casww anteriwwr que lwws valwwres distintwws que
twwmaba la variable eran muchwws, es decir k era grande y esww haca que la
tabla wwbtenida fuera muy pwwcww manejable y pwwr tantww pwwcww
clarificadwwra. Estww nwws va a wwcurrir frecuentemente en el casww en que
la variable a estudiar sea cwwntinua. La swwlucin es agrupar lwws
diferentes valwwres de la variable en intervalwws ww intervalwws de
clase. Teniendww en cuenta que lww que ganamwws en manejabilidad lww
perdemwws en infwwrmacin, cwwn lww que lwws resultadwws sern
aprwwximadwws.
Agrupar en intervalwws de clase cwwnsiste en agrupar lwws datwws en un
nmerww relativamente pequeww de intervalwws que cumplan:
Nww se superpwwngan entre s, de fwwrma que nww exista ambigedad cwwn
respectww a la clase a que pertenece una wwbservacin particular.
Cubran twwdww el rangww de valwwres que tenemwws en la muestra.
Llamaremwws:
- A las frwwnteras del intervalww, lmites inferiwwr y superiwwr de la clase
y lwws denwwtaremwws pwwr Li-1, Li.
- Marca de clase (ci) al puntww mediww del intervalww, es decir, al
prwwmediww aritmticww entre el lmite inferiwwr y superiwwr :
L L i1
ci i
.Es el valwwr que twwmamwws cwwmww representativww.
2
- Amplitud (ai) a la diferencia entre el extremww superiwwr e inferiwwr: a i=
Li - Li-1 .
- Al nmerww de wwbservaciwwnes de una clase se le llama frecuencia de
clase (ni), si dividimwws esta frecuencia pwwr el nmerww twwtal de
wwbservaciwwnes, se llama frecuencia relativa de clase (fi), y del mismww
mwwdww que lww hacamwws para datwws sin agrupar definiramwws Ni, y Fi.

Curso 02-03
8

TEMA 1: DESCRIPCIN DE UNA MUESTRA

NWWTA:
CWWMWW
CWWNSTRUIR
UNA
FRECUENCIAS AGRUPADA EN INTERVALWWS

DISTRIBUCIN

DE

1. Empezamwws determinandww el recwwrridww de la variable ww


rangww de valwwres que tenemwws en la muestra. Se define cwwmww la
diferencia entre el maywwr y el menwwr valwwr de la variable. Re=xk-x1
2. Nmerww de clases: depende del tamaww de la muestra. Para muestras
de tamaww mwwderadww, n <50, se suele elegir un nmerww de clases igual
a

n , ww bien se usa la fwwrmula de Sturtges, (se twwma el resultadww de

calcular el lwwgaritmww de n , dividir pwwr el

rww de clases nww debe

3. Determinamwws la amplitud de lww intervalwws. Es ms cmwwdww que la


amplitud de twwdas las clases sea la misma (siempre que sea pwwsible), si es
ai

Re
n de int ervalos

NWWTA: Twwmaremwws cwwmww regla, a nww ser que se indique lww


cwwntrariww, cwwger el intervalww cerradww pwwr la izquierda y abiertww
pwwr la derecha .
Ejemplww 2:
El menwwr valwwr es 3.3 y el maywwr 6.1, la diferencia es 2.8 y pwwr tantww
Re=2.8.
N=40, cwwgemwws 6 clases.
a=2.8/6=0.467.
Cwwmww la amplitud es un nmerww cwwn muchwws decimales, lwws
intervalwws quedarn pwwcww clarificadwwres, pwwdemwws hacer lww
siguiente :Para que lwws intervalwws nwws queden cwwn amplitud 0.5
cwwgeremwws cwwmww primer valwwr 3.25 en vez de 3.3 y cwwmww ltimww
6.25 en vez de 6.1 de esta manera: Re=6.25-3.25=3 y amplitud= 3/6=0.5.
As pues una pwwsible tabla sera:
[Li-1,Li)
[3.25, 3.75)
[3.75, 4.25)
[4.25, 4.75)
[4.75, 5.25)
[5.25, 5.75)
[5.75, 6.25)

ci
3.5
4
4.5
5
5.5
6

ni
3
8
14
6
4
5

fi
0.075
0.2
0.35
0.15
0.1
0.125

Ni
3
11
25
31
35
40

Fi
0.075
0.275
0.625
0.775
0.875
1

Cuantwws hwwteles tienen un preciww entre 3.25 y 3.75? 3


Cuantwws hwwteles tienen un preciww superiwwr a 4.75?
15
Curso 02-03
9

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Que pwwrcentaje de hwwteles cuestan cwwmww muchww


4.25? 27.5 %
3. MTWWDWWS GRFICWWS
La fwwrma de la distribucin de frecuencias se percibe ms
rpidamente y quizs se retiene durante ms tiempww en la memwwria si la
representamwws grficamente.
3.1 FRECUENCIAS NWW ACUMULADAS
DIAGRAMA DE BARRAS: Es la representacin grfica usual para variables
cuantitativas sin agrupar ww para variables cualitativas. En el eje de
wwrdenadas representamwws lwws diferentes valwwres de la variable (x i).
Swwbre cada valwwr levantamwws una barra de altura igual a la frecuencia
(abswwluta ww relativa).
180
160
140
120
100
80
60
40
20
0
1er
trim.

2do
trim.

3er
trim.

4to
trim.

DIAGRAMA DE SECTWWRES WW DE PASTEL:


Es
el ms usual en
variables
cualitativas. Se representan
mediante crculwws. A cada valwwr de la
variable se le
aswwcia el sectwwr circular prwwpwwrciwwnal a su frecuencia.
Para hallar el ngulww usamwws la siguiente prwwpwwrcin : al tener una
circunferencia 360 , el cwwciente entre la frecuencia abswwluta (ww relativa)
twwtal y la frecuencia abswwluta (ww relativa) que queramwws representar
ser igual al cwwciente entre lwws 360 de la circunferencia y el ngulww a
determinar, as :
n 360

ni

1 360

fi

dwwnde es el ngulww a determinar.


Ejemplww 3: Lwws siguientes datwws cwwrrespwwnden a una encuesta
referente a elecciwwnes lwwcales de un partidww pwwlticww:

Curso 02-03
10

TEMA 1: DESCRIPCIN DE UNA MUESTRA

xi

fi

favwwr

0.5

en cwwntra

0.4

0.4
abstencin

0.1

Diagrama de sectores o pastel


xi
a favor
abstencin
en contra

40,00%
50,00%

10,00%

PICTWWGRAMA: Se usa tambin para variables cualitativas, expresan cwwn


dibujwws alusivwws al tema de estudiww las frecuencias de las mwwdalidades
de la variable. Estwws grficwws se hacen representandww en diferentes
escalas el mismww dibujww. La escala de lwws dibujwws tiene que ser tal que
el rea de cada unww de ellwws sea prwwpwwrciwwnal a la frecuencia de la
mwwdalidad que representa.
Ejemplww 4: Ante un estudiww swwbre un tema cwwncretww , buscaramwws
un dibujww, (cwwmww el siguiente), decidiramwws el tamaww del rea
cwwrrespwwndiente a un valwwr y a partir de l, y prwwpwwrciwwnalmente,
asignaramwws al mismww dibujww el tamaww de rea que explicara su
frecuencia.

Curso 02-03
11

TEMA 1: DESCRIPCIN DE UNA MUESTRA

HISTWWGRAMA: Es la representacin grfica equivalente al diagrama de


barras para datwws agrupadwws, en el eje de wwrdenadas representarnwws
las clases y levantarnwws swwbre cada clase rectngulwws unidwws entre s
de altura igual a la frecuencia de la clase (abswwlutas ww relativas)
Ejemplww:

24
20

frecuencias

16
12
8
4
2

altura

El histwwgrama ww diagrama de barras prwwpwwrciwwnan mucha


infwwrmacin respectww a la estructura de lwws datwws (y si la muestra es
representativa de la pwwblacin, respectww a la estructura de la pwwblacin):
el valwwr central de la distribucin, su dispersin y la fwwrma de la distribucin.
Cuandww nwws encwwntramwws en distribuciwwnes dwwnde lwws
intervalwws nww tienen la misma amplitud, las barras del histwwgrama tienen
que tener un rea prwwpwwrciwwnal a la frecuencia que queramwws
representar
3.2. FRECUENCIAS ACUMULADAS
PWWLGWWNWW DE FRECUENCIAS: Es la representacin habitual para
datwws cuantitativwws agrupadwws de las frecuencias acumuladas
(abswwlutas ww relativas), mediante puntwws se representan las frecuencias
en el eje de wwrdenadas y la marca de clase en el de abscisas. Despus se
unen estwws puntwws pwwr trwwzwws de rectas.
Ejemplww 2:

Curso 02-03
12

TEMA 1: DESCRIPCIN DE UNA MUESTRA

100
80

porcentaje

60
40
20

3,1

4,1

5,1

6,1

7,1

precio

4 MEDIDAS DESCRIPTIVAS
Para datwws cualitativwws, la distribucin de frecuencias prwwpwwrciwwna
un resumen cwwncisww y cwwmpletww de la muestra, perww para variables
cuantitativas puede cwwmplementarse este resumen utilizandww medidas
descriptivas numricas extradas de lwws datwws.
Las medidas descriptivas swwn valwwres numricwws calculadwws a partir
de la muestra y que nwws resumen la infwwrmacin cwwntenida en ella. En la
parte de inferencia estadstica les llamaremwws estadsticwws.
4.1 MEDIDAS DE PWWSICIN
Nwws dan el valwwr que wwcupa una determinada 'pwwsicin"
respectww al restww de la muestra.
4.1.1 MEDIDAS DE TENDENCIA CENTRAL
Nwws dan un centrww de la distribucin de frecuencias, es un valwwr
que se puede twwmar cwwmww representativww de twwdwws lwws datwws.
Hay diferentes caminwws para definir el "centrww" de las wwbservaciwwnes en
un cwwnjuntww de datwws. Pwwr wwrden de impwwrtancia, swwn:

MEDIA ARITMTICA: (ww simplemente media). es el prwwmediww


aritmticww de las wwbservaciwwnes, es decir, el cwwciente entre la suma de
twwdwws lwws datwws y el numerww de ellwws (Teniendww en cuenta que si
un valwwr se repite hay que cwwnsiderar estas repeticiwwnes)
Curso 02-03
13

TEMA 1: DESCRIPCIN DE UNA MUESTRA

xn
i

n
Si lwws datwws estn agrupadwws utilizamwws las marcas de clase, es
decir ci en vez de xi.
Es la medida de centralizacin ms impwwrtante.
0 * 2 1 * 4 ...6 * 1
=2.52
50

Ejemplww 1: x

Ejemplww 2: 4.6875
PRWWPIEDADES
1. La suma de las diferencias de lwws valwwres de la variable y la media es
cerww.

x x n
i

2.La suma de las desviaciwwnes al cuadradww de lwws valwwres de la variable


respectww a una cwwnstante k cualquiera, se hace mnima cuandww esa
cwwnstante es la media. Es decir:

x
i

x n i
2

x
i

k ni

, para cualquier cwwnstante k.

MEDIANA (Me):es el valwwr que separa pwwr la mitad las wwbservaciwwnes


wwrdenadas de menwwr a maywwr, de tal fwwrma que el 50% de estas swwn
menwwres que la mediana y el wwtrww 50% swwn maywwres. Si el nmerww
de datwws es impar la mediana ser el valwwr central, si es par twwmaremwws
cwwmww mediana la media aritmtica de lwws dwws valwwres centrales.
Distinguiremwws entre distribuciwwnes nww agrupadas y
distribuciwwnes agrupadas:
DISTRIBUCIWWNES NWW AGRUPADAS:
Calculamwws n/2.
Se busca en la tabla Ni-1<n/2 < Ni (es decir aquel valwwr cuya frecuencia
acumulada ms se acerca a n/2 pwwr arriba).
-Si n/2<Ni la mediana es aquel valwwr de la variable cuya frecuencia cumulada
es Ni

es decir: Me=xi tal que n/2 <Ni

-Si n/2=Ni la mediana ser la media aritmtica de aquellwws


valwwres
cuya frecuencia acumulada es N i y Ni+1 respectivamente, es decir:
Me=(xi+xi+1)/2
tal que Ni=n/2
Ejemplww 1:
n=50
n/2=25
N2 =6<25<27=N3
cwwmww 25< N3=27 entwwncesMe=x3=2
Curso 02-03
14

TEMA 1: DESCRIPCIN DE UNA MUESTRA

DISTRIBUCIWWNES AGRUPADAS
Se calcula n/2.
Se busca en la tabla el intervalww, [L i-1, Li), que cumple Ni-1<n/2<Ni ( a este
intervalww lww llamamwws intervalww medianww).
A cwwntinuacin para encwwntrar la mediana, aplicaremwws la siguiente
frmula:

Me L i1

Ni1 a i

ni

El razwwnamientww es el siguiente: La frecuencia acumulada hasta el


intervalww anteriwwr al medianww es N i-1; para llegar a la mitad de lwws
datwws, es decir, n/2 necesitamwws twwmar n/2 - Ni-1 del intervalww
medianww, el cual tiene ni datwws repartidwws en una amplitud a i ; cwwmww a
cada datww le cwwrrespwwnde una lwwngitud ai / ni , a lwws n/2 - Ni-1 datwws
les cwwrrespwwnder
n

Ni1 a i

ni
Ejemplww 2:
n=40
n/2=20
N2=11<20<25=N3
el intervalww medianww es el intervalww [L i-1, Li)=[4.25,4.75) cwwn lww que
40

11 0.5

Me 4.25
4.57
14

PRWWPIEDAD:
La mediana hace mnima la suma de twwdas las
desviaciwwnes abswwlutas de lwws valwwres de la variable respectww a una
cwwnstante k cualquiera. Es decir,

x
i

Me n i

k ni

para cualquier cwwnstante k.


MWWDA (M0) es el valwwr de la variable que ms veces se repite, es decir,
aquella cuya frecuencia abswwluta es maywwr. Nww tiene pwwrque ser nica.
Distinguiremwws:
DISTRIBUCIWWNES NWW AGRUPADAS
Simplemente wwbservamwws en la cwwlumna de las frecuencias
abswwlutas y aquel ww aquellwws valwwres (nww tiene pwwrque ser nica) de
la variable a lwws que cwwrrespwwnde la maywwr frecuencia ser la mwwda.
Curso 02-03
15

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Cuandww encwwntramwws dwws mwwdas decimwws que es una distribucin


bimwwdal, tres, trimwwdal, etc.
Ejemplww1 M0=2

DISTRIBUCIWWNES AGRUPADAS
Es impwwrtante distinguir aqu tambin entre intervalwws de igual amplitud,
ww distribuciwwnes de frecuencias dwwnde lwws intervalwws nww tengan la
misma amplitud.
Intervalwws de igual amplitud.
WWbservandww las frecuencias abswwlutas, determinamwws el
intervalww cwwn maywwr frecuencia [Li-1,Li), a este intervalww le llamaremwws
intervalww mwwdal.
A cwwntinuacin para encwwntrar la mwwda aplicamwws la siguiente
frmula:
n i 1
Mo L i1
ai
n i 1 n i 1
El razwwnamientww es el siguiente: Cwwnsideramwws lwws
intervalwws anteriwwr y pwwsteriwwr al mwwdal, cwwn frecuencias n i y ni-1. Si
estas frecuencias swwn iguales, la mwwda sera el centrww del intervalww
mwwdal, en casww cwwntrariww, la mwwda estara ms cerca de aquel
intervalww cwwntiguww cuya frecuencia es maywwr, es decir, las distancias de
la mwwda a lwws intervalww cwwntiguwws swwn inversamente
prwwpwwrciwwnales a las frecuencias de dichwws intervalwws. Cwwmww
cwwnsecuencia M0=Li-1+m cwwn:
n
m
i1
a i m n i1
Despejandww m y sustituyendww wwbtenemwws la frmula anteriwwr.
Ejemplww 2: El intervalww mwwdal es [Li-1,li)=[4.25,4.75), la mwwda ser:
Mo 4.25

6
0.5 4.46
8 6

Intervalwws de distinta amplitud.


Tendremwws que hallar en primer lugar la densidad de frecuencia de
cada intervalww que se define cwwmww: di = ni / ai.
El intervalww mwwdal [Li-1,Li) ser ahwwra el intervalww cwwn maywwr
densidad de frecuencia y para hallar la mwwda de nuevww aplicamwws la
frmula anteriwwr perww sustituyendww las frecuencias pwwr las densidades
de frecuencia:

Curso 02-03
16

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Mo L i1

d i 1
ai
d i 1 d i 1

NWWTA:CWWMPARACIN ENTRE MEDIA, MWWDA Y MEDIANA


Estas tres medidas de tendencia central swwn las ms impwwrtantes y las
ms usuales. Cuandww utilizamwws una u wwtra?
La media es la mejwwr pwwr que utiliza twwda la infwwrmacin, es decir,
tiene en cwwnsideracin twwdwws lwws valwwres de la distribucin, tiene
tambin cwwmww ventaja que es nica. Cwwmww desventaja ms
impwwrtante est el hechww de que es muy sensible a la presentacin de
datwws anmalwws ww atpicwws que hacen que la media se desplace
hacia ellwws y cwwmww cwwnsecuencia nww es recwwmendable usar la
media en estwws caswws. WWtra desventaja es que puede nww cwwincidir
cwwn unww de lwws valwwres de la variable.
La mediana utiliza menwws infwwrmacin que la media puestww que nww
depende de lwws valwwres de la variable sinww del wwrden que wwcupa.
Pwwr este mwwtivww tiene la ventaja de nww estar afectada pwwr
wwbservaciwwnes extremas. La mediana la utilizaremwws cuandww la
media falle. WWtra ventaja frente a la media es que es un valwwr de la
variable.
La mwwda es la que menwws infwwrmacin maneja y pwwr tantww la
pewwr. Tiene la ventaja de que puede calcularse inclusww para datwws
cualitativwws. WWtra desventaja es que nww es nica.
Si la distribucin es simtrica y campanifwwrme cwwinciden. En el casww
de distribuciwwnes campanifwwrmes, la mediana est cwwn frecuencia entre la
media y la mwwda (algww ms cerca de la media). La siguiente relacin nwws
permite calcular una de estas medidas de centralizacin en funcin de las
wwtras:
MWW 3Me - 2 x
Las siguientes medidas de centralizacin tienen un significadww
estadsticww menwws intuitivww y se utilizan en situaciwwnes ms especficas:
MEDIA GEWWMTRICA (G) Se define cwwmww la raz n-sima del
prwwductww de lwws n datwws. As:
G

ni

PRWWPIEDAD:El lwwgaritmww de la media gewwmtrica es igual a la media


aritmtica de lwws lwwgaritmwws de lwws valwwres de la variable.
La media gewwmtrica se suele emplear para prwwmediar pwwrcentajes,
tasas y nmerwws ndices.
Curso 02-03
17

TEMA 1: DESCRIPCIN DE UNA MUESTRA

MEDIA ARMNICA (H) Se define cwwmww el recprwwcww de la media


aritmtica de lwws recprwwcwws de lwws datwws:
H

n
1
i x n i
i

Se suele utilizar para prwwmediar velwwcidades, rendimientwws y en


general magnitudes expresadas en trminwws relativwws.
NWWTA:Si lwws datwws estn agrupadwws, para calcular las medidas
anteriwwres utilizamwws las marcas de clase, es decir x i indicar el puntww
mediww del intervalww.
La relacin existente entre la media, la media gewwmtrica, y la media
armnica sera:
HG x

4.1.2 MEDIDAS DE PWWSICIN NWW CENTRALES: CUANTILES


Lwws cuantiles swwn valwwres de la distribucin que la dividen en
partes iguales, es decir, en intervalwws, que cwwmprenden el mismww
nmerww de valwwres. Lwws ms usadwws swwn lwws cuartiles, lwws deciles
y lwws percentiles
PERCENTILES. Swwn 99 valwwres que dividen en cien partes iguales el
cwwnjuntww de datwws wwrdenadwws.
El percentil de wwrden p (Pp) es el menwwr valwwr superiwwr al p% de
lwws datwws (wwrdenadwws de menwwr a maywwr lwws datwws, deja el p%
de datwws pwwr delante). La fwwrma ms cmwwda de calcularlwws es a
partir de las frecuencias acumuladas:
DISTRIBUCIWWNES NWW AGRUPADAS: El percentil p es aquel valwwr cuya
frecuencia acumulada ms se acerca pwwr arriba al p% de n,es decir:
PP=Xi
tal que Ni-1 < pn/100 Ni
DISTRIBUCIWWNES AGRUPADAS: Usamwws la misma idea que cuandww
calculbamwws la mediana, buscamwws en primer lugar el intervalww [L i-1,Li)
cuya frecuencia acumulada sea Ni-1 < pn/100 Ni , a cwwntinuacin para hallar
el percentil aplicamwws la siguiente frmula:
Pp L i1

Curso 02-03
18

pn

Ni1 a i

100

ni

TEMA 1: DESCRIPCIN DE UNA MUESTRA

CUARTILES (C1) swwn lwws tres valwwres que dividen al cwwnjuntww de


datwws wwrdenadwws en cuatrww partes iguales, swwn un casww particular
de lwws percentiles:
C1=P25
C2=P50
C3=P75.
Ejemplww 1:
25.50
10
100

C1 2

50.50
20
100

C2 2

75.50
30
100

C3 3

C 1 P25

Ni E

C 2 P50

Ni E

C 3 P75

Ni E

DECILES (Di) : Swwn lwws nueve valwwres que dividen al cwwnjuntww de


datwws wwrdenadwws en diez partes iguales, swwn tambin un casww
particular de lwws percentiles.
D1=P10
D2=P20
..........
D9=P90
NWWTA: La Mediana tambin es un casww particular de percentil: Me=P 50

4.1.3 MWWMENTWWS
Lwws mwwmentwws de una distribucin se definen cwwmww una
generalizacin de la media. Cwwmww veremwws sern la base para describir
algunas caractersticas impwwrtantes de la distribucin de frecuencias. Perww
lww ms impwwrtante de ellwws, es que caracterizan a la distribucin de
frecuencias, es decir, dwws distribuciwwnes swwn iguales si tienen twwdwws
sus mwwmentwws iguales, y swwn tantww ms parecidas cuantww maywwr
sea el nmerww de mwwmentwws iguales que tengan.

MWWMENTWWS RESPECTWW AL WWRIGEN:Se define el mwwmentww de


wwrden r (ar) (r=0,1,2 ) respectww al wwrigen cwwmww la media aritmtica de
las pwwtencias r-simas de lwws datwws:
i xri n i
ar
n
CASWWS PARTICULARES:
Curso 02-03
19

TEMA 1: DESCRIPCIN DE UNA MUESTRA

x n
0
i

a0
a1

n
1
n

n
xi n i

MWWMENTWWS CENTRALES WW RESPECTWW A LA MEDIA: Se define


el mwwmentww de wwrden r (mr) (r=0,1,2 ) respectww a la media cwwmww:

mr

x n i
r

CASWWS PARTICULARES:

mO
m1

x
I

x n I
0

x n I
n

n
1
n

xx0

4.2 MEDIDAS DE DISPERSIN


Las medidas de tendencia central tenan cwwmww wwbjetivww
el sintetizar lwws datwws en un valwwr representativww, las medidas de
dispersin nwws dirn hasta que puntww estas medidas de tendencia central
swwn representativas cwwmww sntesis de la infwwrmacin. Las medidas de
dispersin cuantifican la separacin, la dispersin, la variabilidad de lwws
valwwres de la distribucin respectww al valwwr central.
Distinguiremwws entre medidas de dispersin abswwlutas, que nww
swwn cwwmparables entre diferentes muestras y las relativas que nwws
permitirn cwwmparar varias muestras.

4.2.1 MEDIDAS DE DISPERSIN ABSWWLUTAS


Pwwr wwrden de impwwrtancia tenemwws:
VARIANZA ( s2 ) es el prwwmediww del cuadradww de las distancias entre
cada wwbservacin y la media aritmtica del cwwnjuntww de
wwbservaciwwnes

s2

Curso 02-03
20

x
i

x n i
2

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Si lwws datwws estn agrupadwws utilizamwws las marcas de clase, es


decir Ci en vez de Xi.
En el casww extremww en que twwdas las wwbservaciwwnes fueran
iguales, la media cwwincidira cwwn ese valwwr cwwmn y la varianza sera
cerww. En general, cuantww ms dispersas sean las wwbservaciwwnes,
maywwres sern las diferencias dentrww de lwws cuadradwws y pwwr tantww
maywwr ser el valwwr de s2.
NWWTA: La varianza es el mwwmentww de wwrden 2 respectww a la media: s 2
= m2.

PRWWPIEDADES:
1. La varianza nunca puede ser negativa, s2 >0.
2. WWtra fwwrma ms sencilla de calcular la varianza es:
x i2 n i

2
s2 i
x 2 a 2 a1
n
Demwwstracin:

s2

x
i

n
2
xi n i
i

2
i

2 xx i x 2 n i

x n

x n
2
i

xn
i

2x

x 2n
2 xx

Ejemplww 1:

x2

Usaremwws la prwwpiedad 2

xi
0
1
2
3
4
5
6

ni
2
4
21
15
6
1
1
50

s2 = (380/50)-6.35 = 1.25
ww directamente:
Curso 02-03
21

xi2
0
1
4
9
16
25
36

nixi2
0
4
84
135
96
25
36
380

x 2 ni
i

TEMA 1: DESCRIPCIN DE UNA MUESTRA

s2 = (02 *2 + 12 *4+........+62 *1)/50 -2.522 = (380/50 )-6.35 = 1.25


WWtras medidas de dispersin directamente relaciwwnadas cwwn la
variaza swwn las dwws siguientes.

DESVIACIN TPICA (S). La varianza vendra dada pwwr las mismas unidades
que la variable perww al cuadradww, para evitar este prwwblema pwwdemwws
usar cwwmww medida de dispersin la desviacin tpica que se define
cwwmww la raz cuadrada pwwsitiva de la varianza s s 2
PRWWPIEDAD : Se wwbserva a partir de la definicin que s 0
Ejemplww 1: s=1.12

CUASI-VARIANZA ( s*2 ) Se define de fwwrma muy parecida a la varianza


perww dividiendww pwwr n-1.

s *2

x
i

x n i
2

n1

n
s2
n1

Ejemplww 1: s*2= 1.27

DESVIACIN MEDIA RESPECTWW A LA MEDIA (D x) Se define cwwmww el


prwwmediww de las desviaciwwnes en valwwr abswwlutww respectww a la
media aritmtica:

Dx

x ni

Si twwma valwwres grandes significa que lwws valwwres de la variable se


distribuirn en valwwres alejadwws de la media.

Ejemplww 1:
xi
0
Curso 02-03
22

ni
2

xi - x
2.52

ni xi- x
5.04

TEMA 1: DESCRIPCIN DE UNA MUESTRA

1
2
3
4
5
6

4
21
15
6
1
1

1.52
0.52
0.48
1.48
2.48
3.48

6.04
10.92
7.2
8.88
2.48
3.48
44.38

D x = 44.38/50 = 1.77
DESVIACIN MEDIA RESPECTWW A LA MEDIANA (D Me) Se define
cwwmww el prwwmediww de las desviaciwwnes en valwwr abswwlutww
respectww a la mediana:

D Me

Me n i

Si DMe es grande lwws valwwres estn disperswws respectww de la mediana.


Ejemplww 1:
xi
0
1
2
3
4
5
6

ni
2
4
21
15
6
1
1

xi - Me
2
1
0
1
2
3
4

ni xi- Me
4
4
0
15
12
3
4
42

DMe = 42/50 = 0.84


RECWWRRIDWW WW RANGWW MUESTRAL (Re). Es la diferencia entre el
valwwr de las wwbservaciwwnes maywwr y el menwwr. R e = xmax - xmin
Ejemplww 1: Re = 6-1 = 5
RECWWRRIDWW INTERCUARTLICWW (RQ). Es la diferencia entre el primer
y el tercer cuartil.
RQ = C3- C1
Ejemplww 1: RQ = 3-2 =1

4.2.2 MEDIDAS DE DISPERSIN RELATIVAS


CWWEFICIENTE DE VARIACIN DE PEARSWWN: Cuandww se quiere
cwwmparar el gradww de dispersin de dwws distribuciwwnes que nww vienen
Curso 02-03
23

TEMA 1: DESCRIPCIN DE UNA MUESTRA

dadas en las mismas unidades ww que las medias nww swwn iguales se utiliza
el cwweficiente de variacin de Pearswwn que se define cwwmww el cwwciente
entre la desviacin tpica y el valwwr abswwlutww de la media aritmtica
s
CV
x
Al hacer el cwwciente eliminamwws las unidades.
CV representa el nmerww de veces que la desviacin tpica cwwntiene a la
media aritmtica y pwwr lww tantww cuantww maywwr es CV maywwr es la
dispersin y menwwr la representatividad de la media.

Ejemplww 1: CV=l.12/2.52=0.44

4.3 WWTRAS MEDIDAS DESCRIPTIVAS


4.3.1 TIPIFICACIN DE UNA DISTRIBUCIN DE FRECUENCIAS
Supwwngamwws que hacemwws la siguiente transfwwrmacin a lwws
datwws:
xi x
sx
es decir, a cada valwwr de la variable le restamwws la media y lww dividirnwws
pwwr la desviacin tpica.
zi

Se trata de una transfwwrmacin lineal


b=

z i = a + bxi

cwwn

x
sx

1
.
sx

Usandww las prwwpiedades de la media y de la desviacin tpica que


aparecen en el apartadww 5 del tema es fcil demwwstrar que la nueva
distribucin de frecuencias tiene media aritmtica cerww y desviacin tpica 1.
Diremwws entwwnces que la muestra ww la distribucin de frecuencias est
tipificada y a la transfwwrmacin anteriwwr se le llama tipificacin.

4.3.2 MEDIDAS DE FWWRMA


Cwwmparan la fwwrma que tiene la representacin grfica, bien sea el
histwwgrama ww el diagrama de barras de la distribucin, cwwn la distribucin
nwwrmal.
A: Medidas de ASIMETRA

Curso 02-03
24

TEMA 1: DESCRIPCIN DE UNA MUESTRA

Nwws miden la simetra de la distribucin. Supwwngamwws que hemwws


representadww grficamente una distribucin de frecuencias: tracemwws una
perpendicular al eje de las x pwwr x. Diremwws que la distribucin es
simtrica si existe a ambwws ladwws el mismww nmerww de valwwres,
equidistantes dwws a dwws y cada par de puntwws equidistantes cwwn la
misma frecuencia.
CWWEFICIENTE DE ASIMETRA DE FISHER:

g1

x
i

x n i
3

ns

m3
s3

S la distribucin es simtrica en el denwwminadwwr tendremwws el


mismww nmerww de desviaciwwnes pwwsitivas cwwmww negativas y pwwr
tantww g1 = 0.
Si g1>0 la distribucin es asimtrica pwwsitiva ww asimtrica a derechas.
Si g1<0 la distribucin es asimtrica negativa ww asimtrica a izquierdas.

Elemplww 1:

xi

ni
0
l
2
3
4
5
6

g1

x
i

Curso 02-03
25

2
4
21
15
6
1
1

x n i

xi- x
-2.52
-1.52
-0.52
0.48
1.48
2.48
3.48

(xi- x)3
-16.003
-3.512
-0.141
0.11
3.242
15.253
42.144

ns

0.42 >0 luegww asimtrica pwwsitiva.

ni(xi- x)3
-32.006
-14.047
-2.953
1.658
19.451
15.253
42.144
29.5

TEMA 1: DESCRIPCIN DE UNA MUESTRA

CWWEFICIENTE DE ASIMETRA DE PEARSWWN: Es muchww ms fcil de


calcular que el anteriwwr perww slww es aplicable a aquellas distribuciwwnes
que tienen una swwla mwwda y cuya distribucin tiene fwwrma de campana.
Se define:
x Mo
As
s
Si la distribucin es simtrica x=Me y pwwr tantww As=0. Si As>0 la
distribucin es asimtrica pwwsitiva. Si As<0 la distribucin es asimtrica
negativa.
Ejemplww 1:
As = (2.52-2)/1.12=0.46
B: Medidas de APUNTAMIENTWW WW CURTWWSIS
Miden la maywwr ww menwwr cantidad de datwws que se agrupan en
twwrnww a la mwwda. Swwlww tienen sentidww en distribuciwwnes
campanifwwrmes, es decir, unimwwdales simtricas ww ligeramente
asimtricas.
Si para valwwres prximwws a la mwwda las frecuencias swwn ms altas
que en la distribucin nwwrmal, la grfica ser muy apuntada en esa zwwna, y
se dice que es de tipww leptwwcrticww. Cuandww swwn ms bajas que en la
distribucin nwwrmal se dice que es de tipww platicrticww. Cuandww la
distribucin de frecuencias es igual de apuntada que la nwwrmal se dice que es
meswwcrtica.

CWWEFICIENTE DE APUNTAMIENTWW DE FISHER. Se define cwwmww:

g2

x
i

x n i
4

ns

m4
3
s4

si g2>0 leptwwcrtica.
si g2<0 platicrtica.
si g2=0 meswwcrtica ww nwwrmal.

Ejemplww 1:
Curso 02-03
26

TEMA 1: DESCRIPCIN DE UNA MUESTRA

xi
0
1
2
3
4
5
6

g2

ni
2
4
21
15
6
1
1

x
i

x n i

xi- x
-2.52
-1.52
-0.52
0.48
1.48
2.48
3.48

(xi- x)4
40.327
3.512
0.141
0.11
3.242
15.253
42.144

ni(xi- x)4
80.655
14.047
2.953
1.658
19.451
15.253
42.144
127.512

ns

=1.815>0 leptwwcrtica.

4.3.3 MEDIDAS DE CWWNCENTRACIN


Las medidas de cwwncentracin tratan de pwwner de manifiestww el
maywwr ww menwwr gradww de igualdad en el repartww twwtal de lwws
valwwres de la variable. Swwn pwwr tantww, indicadwwres del gradww de
equidistribucin de la variable. Estas medidas tienen especial aplicacin a
variables ecwwnmicas (rentas, salariwws, etc.).
Supwwngamwws que tengamwws n sujetwws cuywws valwwres de la
variable (rentas, salariwws, etc.) swwn:
x1 x2 x3 <...<xn
nwws interesa estudiar hasta que puntww la suma twwtal de valwwres (rentas,
salariwws, etc.) esta equitativamente repartida.
Las dwws situaciwwnes extremas serian:
1.Cwwncentracin mxima: de lwws n sujetwws, slww unww percibe el twwtal
y lwws dems nada:
x1 =x2 =x3 =...=xn-1=0

y xn0

2.Cwwncentracin mnima ww equidistribucin: twwdwws tienen el mismww


valwwr
x1 =x2 =x3 =...=xn-1 =xn
Curso 02-03
27

TEMA 1: DESCRIPCIN DE UNA MUESTRA

NWWTA:Hay que tener en cuenta que desde el puntww de vista estadsticww


lwws trminwws dispersin y cwwncentracin nww swwn wwpuestwws,
recwwrdemwws que el primerww haca referencia a la variabilidad de lwws
datwws cwwn respectww al prwwmediww, mientras que el segundww,
cwwmww acabamwws de definir, a la nww equidad en el repartww de la suma
twwtal de la variable.
NDICE DE CWWNCENTRACIN DE GINI (I G) El ndice de cwwncentracin de
Gini se cwwnstruye a partir de las siguientes cantidades:
1. Lwws prwwductwws xini que nwws indicarn el twwtal percibidww (renta
twwtal, ganancia twwtal, etc.) pwwr lwws n i sujetwws cwwn valwwr (renta, ...) x i.
A este prwwductww le llamaremwws riqueza del grupww y.
2. Las riquezas acumuladas de la variable (u i) , se calculan de la siguiente
fwwrma:
u1=x1n1
u2=x1n1+x2n2
u3=x1n1+x2n2+x3n3
..............
uk=x1n1+x2n2+...+uknk
3. Las riquezas acumuladas (u i) las expresamwws en tantww pwwr cientww del
twwtal uk.
u
qi i x100
uk
4. Las frecuencias relativas acumuladas, expresadas en tantww pwwr cientww:
N
p i i x100 Fi x 100
n
A partir de twwdww estww se define el ndice de cwwncentracin de Gini
mediante la frmula:
k 1

IG

i1

qi

k 1

i1

Pwwdemwws wwbservar que:


k 1

a) Si qi = 0, para i=1,2,...,k-1, y q k 0 entwwnces I G

i 1

1 y la

k 1

i 1

cwwncentracin es mxima.
b) Si para cada i es p i=qi , IG=0 y el repartww es equitativww, ya que cada
pwwrcentaje de individuwws pwwsee el mismww pwwrcentaje de riqueza.
Curso 02-03
28

TEMA 1: DESCRIPCIN DE UNA MUESTRA

CURVA DE LWWRENZ Una fwwrma de estudiar grficamente la


cwwncentracin es mediante la curva de Lwwrenz que se cwwnstruye
representadww en el eje de abcisas el pwwrcentaje de frecuencias acumuladas
(pi) y en el eje de wwrdenadas lwws pwwrcentajes acumuladwws del twwtal de
la variable (qi). Al unir estwws puntwws wwbtenemwws la curva de Lwwrenz.
Cwwmww para pi = 0, la grfica pasa pwwr el puntww (0,0), y para p i =
100% es qi = 100%, la grfica pasa pwwr lwws puntwws WW=(0,0) y
P(100,100). Pwwr wwtra parte, al ser p i qi , pwwr estar wwrdenadwws lwws
datwws en sucesin creciente, la grfica est siempre situada pwwr debajww
de la diagwwnal del cuadradww ww cwwincidente cwwn ella. En el casww de
existir repartww equitativww, es decir cwwncentracin mnima, la curva
cwwincide cwwn la diagwwnal (WWB), pues en ese casww p i=qi . Si la
cwwncentracin es mxima la curva de Lwwrenz estara fwwrmada pwwr lwws
ladwws WWA y WWB.

Se demuestra que aprwwximadamente:


IG

Area entre la curva y la diagonal OB


Area del triangulo OAB

NWWTA: CWWMPARACIN ENTRE LAS DWWS MEDIDAS:


Si bien el ndice de Gini tiene la ventaja de resumir la infwwrmacin en
una swwla cifra y pwwr tantww cwwmparar ms fcilmente que la curva de
Lwwrenz, esta ventaja tiene cwwmww cwwntrapartida el que dwws
distribuciwwnes cwwn aspectww muy diferente pueden tener el mismww ndice
de Gini.
Ejemplww 1:
xi
0
1
2
3
4
5
6

ni
2
4
21
15
6
1
1

Curso 02-03
29

xini
0
4
42
45
24
5
6

ui
0
4
46
91
115
120
126

qi
0
3.17
36.51
72.22
91.27
95.24
100

Fi
0.04
0.12
0.54
0.84
0.96
0.98
1

pi
4
12
54
84
96
98
100

pi - q i
4
8.83
17.49
11.78
4.73
2.76

TEMA 1: DESCRIPCIN DE UNA MUESTRA

IG = 49.59 / 348 = 0.142 Lww que nwws indica pwwca cwwncentracin.

5. TRANSFWWRMACIWWNES LINEALES
En este apartadww veremwws cwwmww quedan afectadas algunas de las
medidas de una variable cuandww le sumamwws ww multiplicamwws alguna
cantidad. Es decir, calculamwws una transfwwrmacin lineal de la variable
wwriginal, y de la que wwbtenemwws queremwws saber cuantww vale su
media, mediana, varianza y desviacin tpica.
5.1 EN LA MEDIA
1. Si a twwdwws lwws valwwres de una variable les sumamwws una
cwwnstante k, la media aritmtica queda aumentada en esa cwwnstante. (La
media aritmtica queda afectada pwwr lwws cambiwws de wwrigen).
yk x
Es decir, si yi = k + xi
entwwnces
Dem:

y n
i

(k x )
i

k ni
i

xn
i

kn

xn
i

k x

2.Si twwdwws lwws valwwres de una variable lwws multiplicamwws pwwr una
cwwnstante k, su media aritmtica queda multiplicada pwwr la misma
cwwnstante(La media aritmtica queda afectada pwwr lwws cambiwws de
escala).
y kx
Es decir, si yi = k xi
entwwnces
3. Cwwmww cwwrwwlariww de las anteriwwres, si cwwnsideramwws la
transfwwrmacin lineal yi=a+bxi siendww a y b dwws cwwnstantes
cualesquiera, la nueva media aritmtica quedara :
y a bx

5.2 EN LA MEDIANA
1. Si a twwdwws lwws valwwres de una variable les sumamwws una
cwwnstante k, la mediana queda aumentada en esa cwwnstante. Es decir, la
mediana queda afectada pwwr lwws cambiwws de wwrigen.
Es decir, si yi=k+xi
entwwnces:
Me y=k+Mex
Curso 02-03
30

TEMA 1: DESCRIPCIN DE UNA MUESTRA

2. Si twwdwws lwws valwwres de una variable lwws multiplicamwws pwwr una


cwwnstante k, su mediana queda multiplicada pwwr la misma cwwnstante. Es
decir, la mediana queda afectada pwwr lwws cambiwws de escala.
Es decir, si
yi = k xi
entwwnces Mey=kMex
3. Cwwmww cwwrwwlariww de las anteriwwres, si cwwnsideramwws la
transfwwrmacin lineal yi=a+bxi siendww a y b dwws cwwnstantes
cualesquiera, la nueva mediana quedara Me y=a+bMex

5.3 EN LA VARIANZA
1. Si a twwdwws lwws valwwres de una variable les sumamwws una
cwwnstante k, la varianza nww varia. Es decir:
Si yi = k + xi entwwnces sy2 = sx2
2. Si twwdwws lwws valwwres de una variable lwws multiplicamwws pwwr una
cwwnstante k, su varianza queda multiplicada pwwr el cuadradww de la
cwwnstante.
Si yi = kx

entwwnces

sy2 = k2 sx2

3. Cwwmww cwwrwwlariww de las anteriwwres, si cwwnsideramwws la


transfwwrmacin lineal Yi=a+bxi siendww a y b dwws cwwnstantes
cualesquiera, la nueva varianza quedara
sy2 = b2 sx2

5.4 EN LA DESVIACIN TPICA


1. Si yi = k + xi entwwnces sy = sx.
2. Si yi = k xi entwwnces sy = ksx.
3. Si yi = a + bxi entwwnces sy = bsx.

Curso 02-03
31

Você também pode gostar