Escolar Documentos
Profissional Documentos
Cultura Documentos
II
Unidad: I Semana: 03
SEMANA 3:
MEDIDAS DE DISPERSION
ORIENTACIONES
1. MEDIDAS DE DISPERSIÓN
1.1 Rango
1.2 Rango intercuartílico
1.3 Varianza
1.4 Desviación estándar
1.5 Coeficiente de variabilidad
4
OBJETIVOS
Al finalizar el Tema 6, el participante será capaz de:
1. Calcular e interpretar las principales medidas de
dispersión:
A) Rango
B) Rango intercuartílico
C) Varianza
D) Desviación estándar
E) Coeficiente de variabilidad
6
Las Medidas de Dispersión
r xmax xmin
8
Ejemplo:
En los últimos seis meses la empresa
“BARATURA” tuvo ventas de S/. 5, 17, 17, 19, 20,
20. La empresa “LOCURA” vendió aprox. S/. 9,
12, 15, 17, 19 y 20.
Para encontrar la amplitud se hace lo siguiente:
A= Valor Max - Valor Mínimo
Ax= 20 - 5 = 15 Ay= 20 - 9 = 11
• Aunque es una medida muy fácil de calcular,
ignora toda la información de la muestra
entre las observaciones más grande y más
pequeña.
• Sin embargo, vale la pena resaltar que el
rango se utiliza mucho en aplicaciones
estadísticas al control de calidad, donde lo
común es emplear muestras con
tamaños
• n=4 ó n=5
Ejemplo :
Los siguientes datos representan el peso de 10
niños al nacer, (en Kg.). Calcule e interprete el
rango.
2,860 3,150 3,450 2,950 3,780
4,170 3,920 3,280 4,050 3,120
11
b) Interpretación :
La diferencia entre el bebe de mayor peso y el
bebe menor peso es 1,311 Kg.
c) Cálculo : a partir de datos agrupados, se utiliza
la siguiente fórmula:
R= (Ls - Li ) + 1
donde:
L : Límite superior de la
s
última clase
: Límite inferior de la
L primera clase
i
12
Ejemplo :
La distribución de frecuencias siguiente representa el tiempo
que espera un paciente para ser atendido, en un consultorio
externo. Calcule e interprete el rango
Rango = (36-12) + 1
R = 25 minutos
13
f) Ventajas y desventajas : del rango
Ventajas:
fácil de calcular
fácil de entender e interpretar
Desventajas:
sólo considera los valores extremos
no toma en cuenta ni el número de
datos ni el valor de estos
no es posible calcular en tablas con
extremos abiertos.
14
El Rango Intercuartílico
Permite ubicar el
50% de los datos
que se encuentran
en el centro de la
distribución, es
decir, el 25% de los
datos son menores
al primer cuartil y
también 25% de los
datos son mayores
al tercer cuartil.
15
50 %
25 25 %
Q1 Q3
Rango
Intercuartílico
25(334)
Lugar Q1 P25 83.5o se ubica en la 3ra clase
100
25(334) 60 1
100 Q 8.82 años
Q 7.5 4
1 68 1
16
75(334 )
Lugar Q 3 P75 250 .5o se ubica en la 5ta clase
100
75(334) 248 1
100
Q 15.5 4 Q 15.65 años
3 40 3
17
Ejemplo:
Interpretación:
50% central de las observaciones varía en 3,1 con
respecto a la mediana.
18
• MEDIDAS DE DISPERSION
Se denomina Medidas de dispersión, a los
parámetros estadísticos que miden cómo de
diseminados se encuentran los datos de una
distribución.
Los más utilizados se refieren al grado de
lejanía de los datos respecto a la media y
son la Desviación Media (D. M.), la Varianza
( S 2 ) , la Desviación Típica ( S ), y el
Coeficiente de Variación ( C V ).
•
DESVIACION MEDIA
La Desviación Media ( D.M. ), es un
promedio de los valores absolutos de las
desviaciones | xi – x |, de cada elemento xi,
de la distribución respecto a su media x
Para datos sin agrupar :
n
∑ │X - X │
i=1
DM = --------------------------------
n
• Para datos agrupados :
n
∑ ( ni │X - X │ )
i=1
DM = ---------------------------------------
n
• VARIANZA
La Varianza de un conjunto de datos
se define como el cuadrado de la
desviación Típica y viene dada por S 2
n
∑ ( ni │X - X │2 )
i=1
S2 = ---------------------------------------
n
• DESVIACION TIPICA O ESTANDAR
n
∑ │X - X │ 2
i=1
S = ----------------------------
n
• Para datos agrupados :
n
∑ ( ni │X - X │2 )
i=1
S = ---------------------------------------
n
• COEFICIENTE DE VARIACION
El coeficiente de variación, C.V., es el
cociente entre la desviación típica (σ ) y la
media de la distribución X :
σ
CV = ---------------
X
Este parámetro sirve para relativizar el valor
de la desviación típica y así poder
comparar la dispersión de dos poblaciones
estadísticas con gamas de valores muy
discretas.
Su principal desventaja de esta medida de
Variación es que no nos indica nada acerca de la
dispersión de los valores que caen entre los
extremos.
2.- La Varianza y la Desviación Estándar:
Mide de la dispersión de los valores alrededor
de la media. Se calcula como la Suma de
cuadrados (SS) de las desviaciones respecto a la
media dividida por el número total de
observaciones válidas menos 1.
Varianza de la muestra (S2)
S2 S(X - X)2
n - 1
Método abreviado:
S2 SX2 -nX2
n - 1
2.2. Desviación Estándar
de la muestra (S)
S(X -X)2
S
n - 1
Método abreviado:
S S X2 - nX2
n-1
Ejemplo:
En la empresa “Vida Feliz” el
jefe de personal ha detectado la
tardanza (en minutos) de 7
empleados durante la hora de
entrada : 15, 10, 20, 7, 10, 17,
15
Calcular la S2 y la S.
¿Existe razones suficientes para
pensar que las tardanzas (en
minutos) se encuentran dispersas o
varían mucho?.
Procedimiento:
Paso 1:
Calcular la media
Fórmula:
S Xi
X
n
15+10+20+7+10+17+15
X =
7
X 13.43 minutos
Paso 2:
Calcular la Varianza
(método abreviado):
S2 1388 - 7(13.43)2
7-1
S2 = 20.91 tardanzas 2
Paso 3:
Calcular la Desviación
estándar:
S = 20.91
S = 4.57 tardanzas
La Varianza
Es una medida de desviación promedio con
respecto a la media aritmética
S i 1
n 1
N 2
para un población 2
(X ) i
i 1
37
La Desviación Estándar
Llamada también desviación típica representa la
variabilidad (o desviaciones) promedio de los
datos con respecto a la media aritmética. Es la raíz
cuadrada de la varianza, sea poblacional o
muestral.
a) Cálculos : a partir de datos no agrupados
n
(X i x )
2
para la muestra
2
S s i 1
n 1
N
( X i )
2
para la población
2
i 1
N
38
Ejemplo :
A continuación se presentan las tarifas (en unidades
monetarias) de dos laboratorios de análisis clínicos.
El laboratorio I tiene sus tarifas en soles y el
laboratorio II en dólares ¿Cuál de ellos tiene un plan
tarifario más homogéneo o estable?.
Laboratorio I (soles) Laboratorio II (dólares)
40,70,60,48,52,65,58 70,35,150,140,82,110,140,120
39
Laboratorio I
n
Xi 393
x i 1
n
7
56.14
x Xi x Xi x 2
X 393 Xi x 0 Xi x
2
632,86
40
Si X i x 632.86
2
n
(X i x )2 632 .86
S i 1
10 .27
n 1 7 1
S
CV 100
x
10.27
CV 100 18 .29
56.14
41
Laboratorio II
x Xi x Xi x 2
X 847 Xi x 0,04 Xi x 2
11372,88
42
n
Si X i x 2
11372 .88
i 1
n
(X i x ) 2
11372 ,88
S i 1
40 . 30
n 1 8 1
S 40,30
CV 100 CV 100 30 ,06
x 105,87
Valores posibles
3 asimetría negativa
S kp
3 asimetría positiva
44
Si Skp tiende a 3 la distribución es asimétrica hacia la
derecha o asimetría positiva.
45
Coeficiente de Curtósis
Es una medida del grado de apuntalamiento,
generalmente comparada con el apuntalamiento
de la distribución normal.
0 , 5 ( P0 , 75 P0 , 25 )
Ku
P0 , 9 P0 ,1
46
Valores posibles
a) Leptocúrtica (concentración al centro): Si el grado de
apuntalamiento de una distribución es mayor que el de
la distribución normal. Kμ 0,5
b) Mesocúrtica (distribuidos simétricamente): Si el
grado de apuntalamiento de una distribución es igual
que el de la distribución normal. Kμ 0,25
c) Platicúrtica (aplanada).Si el grado de apuntalamiento
de una distribución es menor que el de la distribución
normal. 0 ≤ Kμ ≤ 0,25
Platicurtica Mesocurtica Leptocúrtica
0,0 0,25 0,50
3(14,27 13,50 )
S kp 0,202
11,42
0,5(17,00 7,00)
Ku 0,263
23,00 4,00
49
Asimetría negativa a la
izquierda
As<0
50
Simétrica
51
Asimetría positiva a la
Derecha.
Asimetría Positiva a la Derecha.
52
Curtosis Negativa
Curtosis Negativa
Platicúrtica
53
Curtosis Nula
Curtosis nula
Mesocúrtica
54
Curtosis Positiva
Curtosis Positiva
Leptocúrtica
55
GRACIAS