Você está na página 1de 41

UNIVERSIDAD NACIONAL DE HUANCAVELICA

INGENIERA CIVIL - LIRCAY

MEDIDAS DE DISPERSION

CURSO DE ESTADISTICA Y
PROBABILIDADES

ING. CARLOS POMA RAMOS


MEDIDAS DE DISPERSION
DATOS NO AGRUPADOS:
Recorrido
Desviacin media absoluta
Varianza y desviacin tpica
Percentiles
DATOS AGRUPADOS:
Percentiles
Varianza y desviacin tpica
Medidas de dispersin a partir de datos no agrupados
Desviacin media
DM (X i X)
n
Nota de 8 estudiantes: 73,82,64,61,63,68,52 y 73. La media es X 67
se utiliza para calcular la desviacin media. El resultado es cero.
Xi Xi X

73 73 - 67 = 6

82 82 - 67 = 15

64 64 - 67 = -3

61 61 - 67 = -6

63 63 - 67 = -4

68 68 - 67 = 1

52 52 - 67 = -15

73 73 - 67 = 6
0= ( X i X)
Medidas de dispersin a partir de datos no agrupados
Desviacin media absoluta
DMA X i X

56
7
n 8
La DMA toma el valor absoluto de las diferencias. El valor 7 indica la cantidad en que
las observaciones individuales estn dispersas en torno a su MA. Cuanto mayor sea la
MAD, mayor ser la dispersin.
Xi Xi X Xi X
73 73 - 67 = 6 6

82 82 - 67 = 15 15

64 64 - 67 = -3 3

61 61 - 67 = -6 6

63 63 - 67 = -4 4

68 68 - 67 = 1 1

52 52 - 67 = -15 15

73 73 - 67 = 6
0=
( X i X)
6
56 = X i X
Medidas de dispersin a partir de
datos no agrupados
Varianza y desviacin tpica de una poblacin
Julio, directivo de JVC, una empresa de
planificacin financiera que asesora a quienes
quieren establecer sus carteras de inversin
personales. Hace poco, Julio estaba interesado en
las tasas de rendimiento que haban ofrecido dos
fondos de inversin diferentes a lo largo de los
ltimos cinco aos, Megatron y Dinamics
Medidas de dispersin a partir de
datos no agrupados
Varianza y desviacin tpica de una poblacin
Megatrn, presentaba tasas de retorno a lo largo
de ese periodo de 12, 10, 13, 9 y 11%, mientras
que Dinamics haba producido 13, 12, 14, 10 y
6%. Un cliente se puso en contacto con Julio y
expres su inters por uno de estos fondos de
inversin. Cual de ellos debera elegir Julio
para su cliente?.
Medidas de dispersin a partir de
datos no agrupados
Varianza y desviacin tpica de una poblacin
Solucin:Ambos fondos ofrecen un rendimiento
medio de 11%. La inversin mas segura ser la
que entrae menor riesgo, medido por la
desviacin tpica. Julio calcula la varianza y halla
la raz cuadrada para obtener la desviacin tpica
de cada valor.
Medidas de dispersin a partir de
datos no agrupados
Varianza y desviacin tpica de una poblacin
Para Megatrn:

2
12 112
10 112
13 112
9 112
11 112
2
5

La desviacin tpica es:

2 1.41%
Medidas de dispersin a partir de
datos no agrupados
Varianza y desviacin tpica de una poblacin
Para Dinamics:

2
13 112
12 112
14 112
10 112
6 112
8
5

La desviacin tpica es:

8 2.83%
Medidas de dispersin a partir de
datos no agrupados
Varianza y desviacin tpica de una poblacin

Interpretacin: Megatrn tiene menos


variabilidad en sus rendimientos y ofrece la
misma tasa media que Dinamics. Megatrn
representa la inversin ms segura de los dos, por
lo que es la preferida.
Medidas de dispersin a partir de
datos no agrupados
Varianza y desviacin tpica de una muestra
Julio desea determinar la estabilidad del precio
de cierto valor cotizado en bolsa. Decide basar
su juicio sobre la estabilidad de la desviacin
tpica del precio diario de cierre de dicho valor.
Julio consulta las pginas financieras y ve que el
valor viene siendo negociado en bolsa desde
hace bastante tiempo y que hay muchas
cotizaciones al cierre que datan incluso de hace
varios meses
Medidas de dispersin a partir de
datos no agrupados
Varianza y desviacin tpica de una muestra

En lugar de utilizar todos estos precios, Julio


decide simplificar sus clculos y selecciona una
muestra al azar de n=7 das.
Las cotizaciones de cierre son:
87, 120, 54, 92, 73, 80 y 63 soles
Medidas de dispersin a partir de
datos no agrupados
Varianza y desviacin tpica de una muestra
Solucin:
X 81.29 soles

s 2

( X X)
i
2

87 81.29 120 81.29 54 81.29 92 81.29 73 81.29 80 81.29 63 81.29
2 2 2 2 2 2 2

n 1 7 1

s 2 465.9 (cuadrado de soles)

s 465.9 21.58 soles


Medidas de dispersin a partir de
datos no agrupados
Varianza y desviacin tpica de una muestra

Interpretacin: Julio ha estimado que la


cotizacin media del valor de cierre es de 81.29
soles, con tendencia a variar en 21.58 soles por
encima y por debajo de ese precio.
MEDIDAS DE DISPERSIN A PARTIR DE
DATOS AGRUPADOS
El director de vuelo de LAN necesita informacin
sobre la dispersin del nmero de pasajeros. Las
decisiones en relacin con los horarios y el
tamao ms eficiente de los aviones dependen de
las fluctuaciones de la carga de pasajeros.Si esta
variacin del nmero de pasajeros es grande,
pueden hacer falta aviones mayores para evitar
congestiones los das en que los pasajeros son
muchos..
MEDIDAS DE DISPERSIN A PARTIR DE
DATOS AGRUPADOS

Tabla de frecuencias de LAN


Clase f (das) M fM M2 f M2
50-58 2 54 108 2916 5,832
59-67 5 63 315 3969 19,845
68-76 14 72 1008 5184 72,576
77-85 18 81 1458 6561 118,098
86-94 7 90 630 8100 56,700
95-103 4 99 396 9801 39,204
n=50
3915 312,255
Medidas de dispersin a partir de
datos agrupados
Solucin: fM 3915
Xg 78.3
n 50

s2
fM 2 nX 2
n 1

312,255 50(78.3) 2
s
2
116.54 cuadrado de pasajeros
49

s 116.54 10.80 pasajeros


Medidas de dispersin a partir de
datos agrupados
Interpretacin: El director de vuelo puede
decidir ahora si los aviones que se utilizan en la
actualidad pueden absorver las fluctuaciones del
nmero de pasajeros medidos por una desviacin
tpica de 10.8. Si no es as, quiz haya que
utilizar aviones ms grandes para acomodar el
exceso, de otro modo, se producira los das de
trfico ms intenso.
Otras medidas de dispersin:
cuartiles, deciles y percentiles

Todo conjunto de datos tiene tres cuartiles que lo


dividen en cuatro partes iguales.

Subconjunto 1 Subconjunto 2 Subconjunto 3 Subconjunto 4

Q1 Q2 Q3
Otras medidas de dispersin:
cuartiles, deciles y percentiles
El primer cuartil es el valor por debajo del cual se
sitan a lo sumo el 25% de las observaciones y por
encima del cual se encuentra el 75%.
El segundo cuartil est justo en el centro. La mitad
de las observaciones estn por debajo de l y la otra
mitad por encima; en este sentido es igual que la
mediana.
El tercer cuartil es el valor por debajo del cual se
encuentra como mximo el 75% de las observaciones
y por encima del cual se halla el 25% restante.
OTRAS MEDIDAS DE DISPERSIN:
CUARTILES, DECILES Y PERCENTILES

Los deciles dividen un conjunto de datos en 10


subconjuntos iguales, y los percentiles dan lugar
a 100 partes.
El primer decil es la observacin por debajo de
la cual se encuentran a lo mximo el 10% de las
observaciones mientras que el 90% restante se
sitan por encima de l.
OTRAS MEDIDAS DE DISPERSIN:
CUARTILES, DECILES Y PERCENTILES

El primer percentil es el valor por debajo


del cual se localizan no ms del 1% de las
observaciones, y el resto por encima.
Un percentil y su localizacin en una serie
ordenada se indica por medio de subndices.
Ejm. El percentil 15 se indica como P15, y
su localizacin en la serie ordenada es L15.
OTRAS MEDIDAS DE DISPERSIN:
CUARTILES, DECILES Y PERCENTILES
La localizacin del percentil P-simo se
determina as:
L p n 1
P
100
donde: Lp es el emplazamiento del percentil
deseado en la serie ordenada
n es el nmero de observaciones
P es el percentil deseado
OTRAS MEDIDAS DE DISPERSIN:
CUARTILES, DECILES Y PERCENTILES
Nmero de acciones negociadas en la Bolsa de Valores de Lima
3 10 19 27 34 38 48 57 67 74
4 12 20 29 34 39 48 59 67 74
7 14 21 31 36 43 52 62 69 76
9 15 25 31 37 45 53 63 72 79
10 17 27 34 38 47 56 64 73 80
Calcular el percentil 25, P25, de las acciones de la tabla.

50 1
25
L25 12.75
100

El valor resultante 12.75, nos dice que el percentil 25 est situado en el


75% del camino entre la observacin 12a (20) y la observacin 13a (21),
o bien P25 = 20.75.
OTRAS MEDIDAS DE DISPERSIN:
CUARTILES, DECILES Y PERCENTILES
Calcular el percentil 35, encontramos:

50 1
35
L35 17.85
100
El percentil 35 est en el 85% del camino entre la
observacin 17a de 29 y la 18a de 31, o sea
P35 = 29 + (0.85)(31 - 29) = 30.7; as pues el 35%
de las observaciones estarn por debajo de 30.7 y
el 65% restante por encima de 30.7
OTRAS MEDIDAS DE DISPERSIN:
CUARTILES, DECILES Y PERCENTILES
Calculo de cuartiles: Como analista
financiero de una empresa, determinar que
valores de la tabla deben ser designados
como ganadores potenciales de acuerdo
con su actividad en el mercado.
Decide usted tomar los valores por encima
del tercer cuartil (P75)

50 1
75
L75 38.25
100
OTRAS MEDIDAS DE DISPERSIN:
CUARTILES, DECILES Y PERCENTILES

El tercer cuartil se sita en el 25% del camino entre


las observaciones 38 y 39. Es decir 62 + (0.25)(63 -
62) = 62.25, o bien 6,225 acciones, por la expresin
de los datos en centenares de acciones.
OTRAS MEDIDAS DE DISPERSIN:
CUARTILES, DECILES Y PERCENTILES

Interpretacin: De los 50 valores citados, el 75%


negociaron menos de 6,225 acciones, y el 25%
restante tuvieron una actividad grande que
negociaron ms de 6,225 acciones. Ud. Informa a
su jefe de que cualquier valor que haya negociado
ms de 6,225 acciones tiene actividad suficiente
para merecer su atencin. Hay 12 valores en este
grupo.
OTRAS MEDIDAS DE DISPERSIN:
CUARTILES, DECILES Y PERCENTILES
Calculo de deciles: Sus superiores no estn
satisfechos con su informe. Arguyen que debe ser
ms excluyente en su seleccin. El nmero de
opciones ha de ser reducido. Por tanto, usted decide
que los nicos valores que sern asignados a esta
situacin privilegiada sern los pertenecientes a los
dos deciles superiores; es decir, los del 20% que
presentan ms actividad. Calculamos el P80, porque
la serie ordenada va de menor a mayor.
OTRAS MEDIDAS DE DISPERSIN:
CUARTILES, DECILES Y PERCENTILES
Debe seguirse el procedimiento para localizar el
percentil 80.
50 1
80
L80 40.80
100

El percentil 80 est en el 80% del camino entre la


observacin 40 (64) y la 41 (67). As pues,
P80, = 64 + (0.80)(67 - 64) = 66.4.
OTRAS MEDIDAS DE DISPERSIN:
CUARTILES, DECILES Y PERCENTILES

Interpretacin: De las 50 inversiones


posibles, el 80% negociaron menos de 6,640
acciones, el resto, las que negociaron ms de
6,640, se seala como oportunidades
preferentes de inversin. Slo 10 valores
pertenecen a esta categora.
SESGO
No todas las distribuciones son normales. Algunas
estn sesgadas a la izquierda o a la derecha.

P

3 X mediana
s
Si P < 0, los datos estn sesgados a la izquierda
Si P > 0, los datos estn sesgados a la derecha
Si P = 0, estn distribuidos normalmente.
SESGO

Con X 78.3 , s = 10.8, y mediana = 77.9, el


director ejecutivo puede ver fcilmente que los
datos estn sesgados a la derecha puesto que la
media aritmtica supera a la mediana. Adems
calcula una medida del coeficiente o grado de
sesgo.
378.3 77.9
P 0.11
10.8
SESGO

Interpretacin: Como P>0, los datos de LAN


estn, como se supona, sesgados a la derecha.
El grado en que estn sesgados se refleja en el
valor del coeficiente de Pearson.
DISTRIBUCION NORMAL

Es una distribucin de datos continuos


(no discretos) que produce una curva
simtrica en forma de campana.

En una distribucin normal, la media, la


mediana y la moda son todas iguales.
DISTRIBUCION NORMAL

La mitad de las observaciones est por


encima de la media y la mitad est por
debajo. Significa que la mitad del rea
que est bajo la curva est a la izquierda
de la media y la otra mitad del rea que
est debajo de la curva est a la derecha
de la media.
DISTRIBUCION NORMAL Y LA
REGLA EMPIRICA
La regla emprica especifica que:
68.3% de las observaciones estn dentro de
+/- una desviacin estndar de la media.
95.5% de las observaciones estn dentro de
+/- dos desviaciones estndar de la media.
99.3% de las observaciones estn dentro de
+/- tres desviaciones estndar de la media.
COEFICIENTE DE VARIACION
(CV)
Cuando se consideran dos o ms
distribuciones que tienen medias
significativamente diferentes, o estn
medidas en unidades distintas, es peligroso
sacar conclusiones respecto a la dispersin
slo con base en la desviacin estndar. En
este caso se utiliza el CV, el cual sirve como
medida relativa de dispersin
COEFICIENTE DE VARIACION
(CV)

s
CV (100)
X
El CV determina el grado de dispersin
de un conjunto de datos relativo a su media.
COEFICIENTE DE VARIACION (CV)
Los datos agrupados de LAN reportaron una media
de 78.8 pasajeros por da, con una desviacin
estndar de 12.14 pasajeros. Se supone que LAN
tambin recolecta datos sobre el mismo periodo para
el nmero de millas que la aerolnea vol y dicha
media y desviacin estndar es de 1,267.5 y 152.7,
respectivamente.

La desviacin estndar ms alta para las millas


voladas puede sugerir que estos datos presentan una
variacin mucho mayor.
COEFICIENTE DE VARIACION (CV)
Si calculamos el CV para pasajeros, esto es
12.14
CV (100) 15.43
78.70
Mientras que para las millas es solamente
152.7
CV (100) 12.05
1267.5
Es claro que al comparar la variacin en dos
conjuntos de datos muy diferentes, es sabio
utilizar el CV y no slo P.

Você também pode gostar