Escolar Documentos
Profissional Documentos
Cultura Documentos
AREA DE ESTADISTICA
PROBABILIDAD Y ESTADISTICA
MEDIDAS DE DISPERSION
Para calcular la variabilidad que una distribución tiene respecto de su media, se puede
utilizar la desviación estándar.
13.1, 14.8, 17.1, 19.0, 10.2, 18.0, 19.8, 15.0, 17.3, 10.8, 20.3, 14.5, 17.1, 14.9, 17.1
Actividades a desarrollar
x
n 2
i x
i 1
S2 (1)
n 1
La varianza tiene algunas desventajas, entre las cuales podemos mencionar: su no fácil
interpretación directa, debido a que sus unidades no coinciden con las unidades de la
variable xi en estudio, así por ejemplo si x está en metros, su varianza estará dada en
metros cuadrados. Esta última desventaja se pretende remediar extrayendo la raíz
cuadrada a la varianza para obtener la que se conoce como desviación estándar (S),
que será:
x
n 2
i x
S
i 1
(2)
n 1
Para los datos tenemos una media X 15,93 y una desviación estándar S 3,00
entonces:
3,0
C.V * 100% 18,83%
15,93
Significado del coeficiente de variación. Como el valor de C.V está próximo a 20%,
indica que existe una dispersión relativamente grande, es decir, que los datos son poco
homogéneos.
hx ks , x ks 1
1
(4)
k2
hx s , x s 1
1
Así por ejemplo si k = 1, dice que: 0
12
hx 2s , x 2s 1
1
Si k = 2, dice que: 0,75
22
hx 3s , x 3s 1 2 0,888
1
Si k = 3, dice que:
3
1
h x 2s , x 2s 1 0, 75 75%
22
De acuerdo con los datos del problema 1, podemos ver que todos los datos
caen dentro del intervalo 9,93 ; 21,93 , es decir, se encuentra el 100%.
Aplicamos la formula (4) para encontrar un intervalo que contiene por lo menos el
60% de los datos:
hx ks , x ks 1
1 1
2
1 2 0,60 al despejar k tenemos:
k k
1
k 1,58
1 0,60
( x 1,58s) 15,93 1,58 * 3,00 11,19 ( x 1,58s) 15,93 1,58 * 3,00 20,67
Actividades a desarrollar
n x
m 2
i
'
i x
S2
i 1
(5)
n 1
Para los datos de la tabla de frecuencias tenemos una media x = 15,618 y una
desviación estándar S = 4,47 entonces:
4,47
C.V * 100% 28,62%
15,618
Significado del coeficiente de variación. Como el valor de C.V es mayor del 20%,
indica que existe una dispersión muy grande, es decir, que los datos son muy
heterogéneos.
Aplicamos la formula (4) para encontrar un intervalo que contiene por lo menos el
65% de los datos:
hx ks , x ks 1
1 1
2
1 2 0,65 al despejar k tenemos:
k k
1
k 1,69
1 0,65
( x 1,69s) 15,618 1,69 * 4,47 8,06 ( x 1,69s) 15,618 1,69 * 4,47 23,17