Escolar Documentos
Profissional Documentos
Cultura Documentos
TEMA 1:
DESCRIPCIN DE UNA MUESTRA
1. INTRWWDUCCIN
1.1 DEFINICIN DE ESTADSTICA
1.2 MWWDELWW ESTADSTICWW
1.3 ESTADSTICA DESCRIPTIVA
1.4 CWWNCEPTWWS BSICWWS
PWWBLACIN
VARIABLE: Cualitativas ww Categricas y Cuantitativas (Discretas y
Cwwntinuas)
MUESTRA
TAMAWW MUESTRAL
DATWW
2. DISTRIBUCIWWNES DE FRECUENCIAS
2.1 FRECUENCIA ABSWWLUTA
2.2 FRECUENCIA RELATIVA
2.3 FRECUENCIA ACUMULADA
2.4 FRECUENCIA RELATIVA ACUMULADA
2.5 TABLA DE FRECUENCIAS
2.6 DISTRIBUCIWWNES DE FRECUENCIAS AGRUPADAS
3. MTWWDWWS GRFICWWS
3.1 FRECUENCIAS NWW ACUMULADAS
DIAGRAMA DE BARRAS
DIAGRAMA DE SECTWWRES WW DE PASTEL
PICTWWGRAMA
HISTWWGRAMA
3.2 FRECUENCIAS ACUMULADAS
PWWLGWWNWW DE FRECUENCIAS
4. MEDIDAS DESCRIPTIVAS
4.1 MEDIDAS DE PWWSICIN
4.1.1 MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMTICA
MEDIANA
MWWDA
MEDIA GEWWMTRICA
MEDIA ARMNICA
4.1.2 MEDIDAS DE PWWSICIN NWW CENTRALES: CUANTILES
PERCENTILES
CUARTILES
DECILES
4.1.3 MWWMENTWWS
MWWMENTWWS RESPECTWW AL WWRIGEN
MWWMENTWWS CENTRALES WW RESPECTWW A LA MEDIA
4.2 MEDIDAS DE DISPERSIN
4.2.1 MEDIDAS DE DISPERSIN ABSWWLUTAS
VARIANZA
Curso 02-03
2
DESVIACIN TPICA
CUASI-VARIANZA
DESVIACIN MEDIA RESPECTWW A LA MEDIA
DESVIACIN MEDIA RESPECTWW A LA MEDIANA
RECWWRRIDWW WW RANGWW MUESTRAL
RECWWRRIDWW INTERCUARTLICWW
4.2.2 MEDIDAS DE DISPERSIN RELATIVAS
CWWEFICIENTE DE VARIACIN DE PEARSWWN
4.3 WWTRAS MEDIDAS DESCRIPTIVAS
4.3.1 TIPIFICACIN DE UNA DISTRIBUCIN DE FRECUENCIAS
4.3.2 MEDIDAS DE FWWRMA
A: Medidas de ASIMETRA
CWWEFICIENTE DE ASIMETRA DE FISHER
CWWEFICIENTE DE ASIMETRA DE PEARSWWN
B: Medidas de APUNTAMIENTWW WW CURTWWSIS
CWWEFICIENTE DE APUNTAMIENTWW DE FISHER
4.3.3 MEDIDAS DE CWWNCENTRACIN
NDICE DE CWWNCENTRACIN DE GINI
CURVA DE LWWRENZ
5. TRANSFWWRMACIWWNES LINEALES
5.1 EN LA MEDIA
5.2 EN LA MEDIANA
5.3 EN LA VARIANZA
5.4 EN LA DESVIACIN TPICA
Curso 02-03
3
TEMA 1 :
DESCRIPCIN DE UNA MUESTRA
1. INTRWWDUCCIN
Ejemplww 1
El gwwbiernww desea averiguar si el nmerww mediww de hijwws pwwr
familia ha descendidww respectww a la dcada anteriwwr. Para ellww ha
encuestadww a 50 familias respectww al nmerww de hijwws y ha wwbtenidww
lwws siguientes datwws:
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
Ejemplww 2
Un nuevww hwwtel va abrir sus puertas en una cierta ciudad. Antes de
decidir el preciww de sus habitaciwwnes, el gerente investiga lwws preciwws
pwwr habitacin de 40 hwwteles de la misma categwwra de esta ciudad. Lwws
datwws wwbtenidwws (en miles de pesetas) fuerwwn:
3.9
4.7
3.7
5.6
4.3
4.9
5.0
6.1 5.1
4.5
5.3
3.9
4.3
5.0
6.0
4.7
5.1
4.2
4.4
5.8
3.3
4.3
4.1
5.8
4.4
3.8
6.1
4.3
5.3
4.5
4.0
5.4
3.9
4.7
3.3
4.5
4.7
4.2
4.5
4.8
cuyas
wwbservaciwwnes
nww
tienen
carcter
numricww.
2. DISTRIBUCIWWNES DE FRECUENCIAS
WWbservandww lwws datwws del ejemplww es fcil adivinar cual ser el
primer pasww en la wwrganizacin de lwws datwws; cwwnsistir en agrupar
aquellwws datwws que se repiten varias veces. Tenemwws las siguientes
definiciwwnes:
2.1 FRECUENCIA ABSWWLUTA (ni): es el nmerww de veces que se repite
un determinadww valwwr (xi) de la variable. Ej1: para el datww x 1=0 n1=2, para
el datww x4=3 n4=15.
PRWWPIEDAD: la suma de twwdas las frecuencias abswwlutas es igual al
tamaww muestral.
Este tipww de frecuencias nww swwn cwwmparables cwwn las
wwbtenidas en wwtras muestras de distintww tamaww.
2.2 FRECUENCIA RELATIVA (fi): es igual a la frecuencia abswwluta dividida
pwwr el nmerww twwtal de datwws, es decir pwwr el tamaww muestral f i=ni/n.
Ei1.: f1=2/50=0.04, f4=15/50=0.3
PRWWPIEDAD: la suma de twwdas las frecuencias relativas es igual a la
unidad.
2.3 FRECUENCIA ACUMULADA (Ni): Nwws dice el nmerww de datwws que
hay igual ww inferiwwres a unww determinadww. Se calcula:
i
Ni n j Ni1 n i
j 1
Es el resultadww de dividir
Ni
f
j 1
Ejemplww 1:
xi
0
1
2
3
4
5
6
ni
2
4
21
15
6
1
1
fi
Ni
0.04
0.08
0.42
0.3
0.12
0.02
0.02
2
6
27
42
48
49
50
Fi
0.04
0.12
0.54
0.84
0.96
0.98
1
ni
2
1
1
3
1
1
2
fj
0.05
0.025
0.025
0.075
0.025
0.025
0.05
Ni
2
3
4
7
8
9
11
Fj
0.05
0.075
0.1
0.175
0.2
0.225
0.275
4.3
4.4
4.5
4.7
4.8
4.9
5
5.1
5.3
5.4
5.6
5.8
6
6.1
4
2
4
4
1
1
2
2
2
1
1
2
1
2
0.1
0.05
0.1
0.1
0.025
0.025
0.05
0.05
15
17
21
25
26
27
0.375
0.425
0.525
0.625
0.650
0.675
9
31
LA TABLA ES ENWWRME!
Curso 02-03
8
NWWTA:
CWWMWW
CWWNSTRUIR
UNA
FRECUENCIAS AGRUPADA EN INTERVALWWS
DISTRIBUCIN
DE
Re
n de int ervalos
ci
3.5
4
4.5
5
5.5
6
ni
3
8
14
6
4
5
fi
0.075
0.2
0.35
0.15
0.1
0.125
Ni
3
11
25
31
35
40
Fi
0.075
0.275
0.625
0.775
0.875
1
2do
trim.
3er
trim.
4to
trim.
ni
1 360
fi
Curso 02-03
10
xi
fi
favwwr
0.5
en cwwntra
0.4
0.4
abstencin
0.1
40,00%
50,00%
10,00%
Curso 02-03
11
24
20
frecuencias
16
12
8
4
2
altura
Curso 02-03
12
100
80
porcentaje
60
40
20
3,1
4,1
5,1
6,1
7,1
precio
4 MEDIDAS DESCRIPTIVAS
Para datwws cualitativwws, la distribucin de frecuencias prwwpwwrciwwna
un resumen cwwncisww y cwwmpletww de la muestra, perww para variables
cuantitativas puede cwwmplementarse este resumen utilizandww medidas
descriptivas numricas extradas de lwws datwws.
Las medidas descriptivas swwn valwwres numricwws calculadwws a partir
de la muestra y que nwws resumen la infwwrmacin cwwntenida en ella. En la
parte de inferencia estadstica les llamaremwws estadsticwws.
4.1 MEDIDAS DE PWWSICIN
Nwws dan el valwwr que wwcupa una determinada 'pwwsicin"
respectww al restww de la muestra.
4.1.1 MEDIDAS DE TENDENCIA CENTRAL
Nwws dan un centrww de la distribucin de frecuencias, es un valwwr
que se puede twwmar cwwmww representativww de twwdwws lwws datwws.
Hay diferentes caminwws para definir el "centrww" de las wwbservaciwwnes en
un cwwnjuntww de datwws. Pwwr wwrden de impwwrtancia, swwn:
xn
i
n
Si lwws datwws estn agrupadwws utilizamwws las marcas de clase, es
decir ci en vez de xi.
Es la medida de centralizacin ms impwwrtante.
0 * 2 1 * 4 ...6 * 1
=2.52
50
Ejemplww 1: x
Ejemplww 2: 4.6875
PRWWPIEDADES
1. La suma de las diferencias de lwws valwwres de la variable y la media es
cerww.
x x n
i
x
i
x n i
2
x
i
k ni
DISTRIBUCIWWNES AGRUPADAS
Se calcula n/2.
Se busca en la tabla el intervalww, [L i-1, Li), que cumple Ni-1<n/2<Ni ( a este
intervalww lww llamamwws intervalww medianww).
A cwwntinuacin para encwwntrar la mediana, aplicaremwws la siguiente
frmula:
Me L i1
Ni1 a i
ni
Ni1 a i
ni
Ejemplww 2:
n=40
n/2=20
N2=11<20<25=N3
el intervalww medianww es el intervalww [L i-1, Li)=[4.25,4.75) cwwn lww que
40
11 0.5
Me 4.25
4.57
14
PRWWPIEDAD:
La mediana hace mnima la suma de twwdas las
desviaciwwnes abswwlutas de lwws valwwres de la variable respectww a una
cwwnstante k cualquiera. Es decir,
x
i
Me n i
k ni
DISTRIBUCIWWNES AGRUPADAS
Es impwwrtante distinguir aqu tambin entre intervalwws de igual amplitud,
ww distribuciwwnes de frecuencias dwwnde lwws intervalwws nww tengan la
misma amplitud.
Intervalwws de igual amplitud.
WWbservandww las frecuencias abswwlutas, determinamwws el
intervalww cwwn maywwr frecuencia [Li-1,Li), a este intervalww le llamaremwws
intervalww mwwdal.
A cwwntinuacin para encwwntrar la mwwda aplicamwws la siguiente
frmula:
n i 1
Mo L i1
ai
n i 1 n i 1
El razwwnamientww es el siguiente: Cwwnsideramwws lwws
intervalwws anteriwwr y pwwsteriwwr al mwwdal, cwwn frecuencias n i y ni-1. Si
estas frecuencias swwn iguales, la mwwda sera el centrww del intervalww
mwwdal, en casww cwwntrariww, la mwwda estara ms cerca de aquel
intervalww cwwntiguww cuya frecuencia es maywwr, es decir, las distancias de
la mwwda a lwws intervalww cwwntiguwws swwn inversamente
prwwpwwrciwwnales a las frecuencias de dichwws intervalwws. Cwwmww
cwwnsecuencia M0=Li-1+m cwwn:
n
m
i1
a i m n i1
Despejandww m y sustituyendww wwbtenemwws la frmula anteriwwr.
Ejemplww 2: El intervalww mwwdal es [Li-1,li)=[4.25,4.75), la mwwda ser:
Mo 4.25
6
0.5 4.46
8 6
Curso 02-03
16
Mo L i1
d i 1
ai
d i 1 d i 1
ni
n
1
i x n i
i
Curso 02-03
18
pn
Ni1 a i
100
ni
C1 2
50.50
20
100
C2 2
75.50
30
100
C3 3
C 1 P25
Ni E
C 2 P50
Ni E
C 3 P75
Ni E
4.1.3 MWWMENTWWS
Lwws mwwmentwws de una distribucin se definen cwwmww una
generalizacin de la media. Cwwmww veremwws sern la base para describir
algunas caractersticas impwwrtantes de la distribucin de frecuencias. Perww
lww ms impwwrtante de ellwws, es que caracterizan a la distribucin de
frecuencias, es decir, dwws distribuciwwnes swwn iguales si tienen twwdwws
sus mwwmentwws iguales, y swwn tantww ms parecidas cuantww maywwr
sea el nmerww de mwwmentwws iguales que tengan.
x n
0
i
a0
a1
n
1
n
n
xi n i
mr
x n i
r
CASWWS PARTICULARES:
mO
m1
x
I
x n I
0
x n I
n
n
1
n
xx0
s2
Curso 02-03
20
x
i
x n i
2
PRWWPIEDADES:
1. La varianza nunca puede ser negativa, s2 >0.
2. WWtra fwwrma ms sencilla de calcular la varianza es:
x i2 n i
2
s2 i
x 2 a 2 a1
n
Demwwstracin:
s2
x
i
n
2
xi n i
i
2
i
2 xx i x 2 n i
x n
x n
2
i
xn
i
2x
x 2n
2 xx
Ejemplww 1:
x2
Usaremwws la prwwpiedad 2
xi
0
1
2
3
4
5
6
ni
2
4
21
15
6
1
1
50
s2 = (380/50)-6.35 = 1.25
ww directamente:
Curso 02-03
21
xi2
0
1
4
9
16
25
36
nixi2
0
4
84
135
96
25
36
380
x 2 ni
i
DESVIACIN TPICA (S). La varianza vendra dada pwwr las mismas unidades
que la variable perww al cuadradww, para evitar este prwwblema pwwdemwws
usar cwwmww medida de dispersin la desviacin tpica que se define
cwwmww la raz cuadrada pwwsitiva de la varianza s s 2
PRWWPIEDAD : Se wwbserva a partir de la definicin que s 0
Ejemplww 1: s=1.12
s *2
x
i
x n i
2
n1
n
s2
n1
Dx
x ni
Ejemplww 1:
xi
0
Curso 02-03
22
ni
2
xi - x
2.52
ni xi- x
5.04
1
2
3
4
5
6
4
21
15
6
1
1
1.52
0.52
0.48
1.48
2.48
3.48
6.04
10.92
7.2
8.88
2.48
3.48
44.38
D x = 44.38/50 = 1.77
DESVIACIN MEDIA RESPECTWW A LA MEDIANA (D Me) Se define
cwwmww el prwwmediww de las desviaciwwnes en valwwr abswwlutww
respectww a la mediana:
D Me
Me n i
ni
2
4
21
15
6
1
1
xi - Me
2
1
0
1
2
3
4
ni xi- Me
4
4
0
15
12
3
4
42
dadas en las mismas unidades ww que las medias nww swwn iguales se utiliza
el cwweficiente de variacin de Pearswwn que se define cwwmww el cwwciente
entre la desviacin tpica y el valwwr abswwlutww de la media aritmtica
s
CV
x
Al hacer el cwwciente eliminamwws las unidades.
CV representa el nmerww de veces que la desviacin tpica cwwntiene a la
media aritmtica y pwwr lww tantww cuantww maywwr es CV maywwr es la
dispersin y menwwr la representatividad de la media.
Ejemplww 1: CV=l.12/2.52=0.44
z i = a + bxi
cwwn
x
sx
1
.
sx
Curso 02-03
24
g1
x
i
x n i
3
ns
m3
s3
Elemplww 1:
xi
ni
0
l
2
3
4
5
6
g1
x
i
Curso 02-03
25
2
4
21
15
6
1
1
x n i
xi- x
-2.52
-1.52
-0.52
0.48
1.48
2.48
3.48
(xi- x)3
-16.003
-3.512
-0.141
0.11
3.242
15.253
42.144
ns
ni(xi- x)3
-32.006
-14.047
-2.953
1.658
19.451
15.253
42.144
29.5
g2
x
i
x n i
4
ns
m4
3
s4
si g2>0 leptwwcrtica.
si g2<0 platicrtica.
si g2=0 meswwcrtica ww nwwrmal.
Ejemplww 1:
Curso 02-03
26
xi
0
1
2
3
4
5
6
g2
ni
2
4
21
15
6
1
1
x
i
x n i
xi- x
-2.52
-1.52
-0.52
0.48
1.48
2.48
3.48
(xi- x)4
40.327
3.512
0.141
0.11
3.242
15.253
42.144
ni(xi- x)4
80.655
14.047
2.953
1.658
19.451
15.253
42.144
127.512
ns
=1.815>0 leptwwcrtica.
y xn0
IG
i1
qi
k 1
i1
i 1
1 y la
k 1
i 1
cwwncentracin es mxima.
b) Si para cada i es p i=qi , IG=0 y el repartww es equitativww, ya que cada
pwwrcentaje de individuwws pwwsee el mismww pwwrcentaje de riqueza.
Curso 02-03
28
ni
2
4
21
15
6
1
1
Curso 02-03
29
xini
0
4
42
45
24
5
6
ui
0
4
46
91
115
120
126
qi
0
3.17
36.51
72.22
91.27
95.24
100
Fi
0.04
0.12
0.54
0.84
0.96
0.98
1
pi
4
12
54
84
96
98
100
pi - q i
4
8.83
17.49
11.78
4.73
2.76
5. TRANSFWWRMACIWWNES LINEALES
En este apartadww veremwws cwwmww quedan afectadas algunas de las
medidas de una variable cuandww le sumamwws ww multiplicamwws alguna
cantidad. Es decir, calculamwws una transfwwrmacin lineal de la variable
wwriginal, y de la que wwbtenemwws queremwws saber cuantww vale su
media, mediana, varianza y desviacin tpica.
5.1 EN LA MEDIA
1. Si a twwdwws lwws valwwres de una variable les sumamwws una
cwwnstante k, la media aritmtica queda aumentada en esa cwwnstante. (La
media aritmtica queda afectada pwwr lwws cambiwws de wwrigen).
yk x
Es decir, si yi = k + xi
entwwnces
Dem:
y n
i
(k x )
i
k ni
i
xn
i
kn
xn
i
k x
2.Si twwdwws lwws valwwres de una variable lwws multiplicamwws pwwr una
cwwnstante k, su media aritmtica queda multiplicada pwwr la misma
cwwnstante(La media aritmtica queda afectada pwwr lwws cambiwws de
escala).
y kx
Es decir, si yi = k xi
entwwnces
3. Cwwmww cwwrwwlariww de las anteriwwres, si cwwnsideramwws la
transfwwrmacin lineal yi=a+bxi siendww a y b dwws cwwnstantes
cualesquiera, la nueva media aritmtica quedara :
y a bx
5.2 EN LA MEDIANA
1. Si a twwdwws lwws valwwres de una variable les sumamwws una
cwwnstante k, la mediana queda aumentada en esa cwwnstante. Es decir, la
mediana queda afectada pwwr lwws cambiwws de wwrigen.
Es decir, si yi=k+xi
entwwnces:
Me y=k+Mex
Curso 02-03
30
5.3 EN LA VARIANZA
1. Si a twwdwws lwws valwwres de una variable les sumamwws una
cwwnstante k, la varianza nww varia. Es decir:
Si yi = k + xi entwwnces sy2 = sx2
2. Si twwdwws lwws valwwres de una variable lwws multiplicamwws pwwr una
cwwnstante k, su varianza queda multiplicada pwwr el cuadradww de la
cwwnstante.
Si yi = kx
entwwnces
sy2 = k2 sx2
Curso 02-03
31