Você está na página 1de 23

Estadística descriptiva

Medidas de dispersión
• Si consideramos únicamente el valor central de un conjunto
de datos, o si comparamos varios conjuntos de datos usando
los valores centrales, podemos llegar a conclusiones erróneas.

Por ejemplo, si la guía turística le dice que el río que se


encuentra adelante tiene en promedio 1,5 metros de
profundidad, ¿querrías cruzarlo a pie sin más información?
Desearías saber algo sobre la variación de la profundidad. ¿Mide
1.75 pies la máxima profundidad y 0.25 pies la mínima? En dicho
caso, estaríamos de acuerdo en cruzarlo. ¿Qué hay si nos
enteramos de que la profundidad del río variaba de 0.10 metros
a 1.9 metros? La decisión probablemente sería no cruzar.
Antes de tomar una decisión sobre cruzar el río, usted desea
información tanto de la profundidad típica como de la dispersión
de la profundidad del río.
Medidas de dispersión
• Las medidas de dispersión son aquellas que permiten retratar
la distancia de los valores de la variable a un cierto valor
central, es decir, permiten identificar la concentración de los
datos en un cierto sector del recorrido de la variable.

• Un valor pequeño en una medida de dispersión indica que los


datos se acumulan con proximidad alrededor de la media
aritmética. Por consiguiente, la media se considera
representativa de los datos.

• Por lo contrario, una medida grande de dispersión indica que


la media no es confiable.
Líneas de producción de cierto producto

Las dos distribuciones tienen la misma media pero…


Rango
• El rango de una distribución es la diferencia entre el valor
máximo y el valor mínimo de la variable. Para su cálculo basta
con ordenar los valores de menor a mayor, luego se restan los
valores de los extremos.

Es de utilidad cuando:
Se sabe que el valor promedio de días de espera para obtener
una licencia de conducir es de 5 días en la oficina A y de 7 días
en la oficina B.
También se sabe que en la oficina A el número mínimo de días
de espera es de 3 y el máximo es de 15, mientras que en la
oficina B, los valores son 3 y 8 respectivamente.
Con esta información se podrá tomar una decisión mas
adecuada.
Rango
• Características del Rango:
• A medida que el rango es menor, el grado de representatividad
de los valores centrales se incrementa.
• A medida que el rango es mayor, la distribución es más dispersa
(está menos concentrada)
• Su cálculo es extremadamente sencillo
• Tiene gran aplicación en procesos de control de calidad
• Tiene el inconveniente que sólo depende de los valores extremos
por lo que basta que sólo uno de ellos se separe mucho para que
el recorrido se vea sensiblemente afectado
Desviación media

• La desviación media es la división de la sumatoria del valor


absoluto de las distancias existentes entre cada dato y su
media.
• Este indicador muestra que tan disperso se encuentran un
conjunto de datos a un punto de concentración.

σ 𝑋 − 𝑋ത
𝐷𝑀 =
𝑛
Desviación media
Sean los datos: 4, 5, 3, 5, 3, 2, 2, 2, 2, 3, 5, 1, 4, 1, 4.
Obtenga su desviación media.
σ𝑛𝑖=1 𝑥𝑖 − 𝑋ത
𝐷𝑀 =
𝑛

𝑋 = 3.0666

σ15
𝑖=1 4 − 3.0666 + 5 − 3.0666 + 3 − 3.0666 + 5 − 3.0666 + 3 − 3.0666 +
𝐷𝑀 =
15
2 − 3.0666 + 2 − 3.0666 + 2 − 3.0666 + 2 − 3.0666 + 3 − 3.0666 +
15
5 − 3.0666 + 1 − 3.0666 + 4 − 3.0666 + 1 − 3.0666 + 4 − 3.0666
= 1.1466
15
Media geométrica
• Resulta útil para determinar el cambio promedio de
porcentajes, razones, índices o tasas de crecimiento. Permite
por ejemplo determinar cambios porcentuales de ventas,
salarios o cifras económicas como el PIB.

𝑛
𝐺𝑀 = 𝑋1 ∙ 𝑋2 ⋯ 𝑋𝑛
• Otra aplicación es la determinación del cambio porcentual
promedio durante cierto periodo

𝑛 𝑣𝑎𝑙𝑜𝑟 𝑎𝑙 𝑓𝑖𝑛𝑎𝑙 𝑑𝑒𝑙 𝑝𝑒𝑟𝑖𝑜𝑑𝑜


𝐺𝑀 = −1
𝑣𝑎𝑙𝑜𝑟 𝑎𝑙 𝑖𝑛𝑖𝑐𝑖𝑜 𝑑𝑒𝑙 𝑝𝑒𝑟𝑖𝑜𝑑𝑜
Ejercicio 1
• El número de capuchinos vendidos en Café San Lucas, en su
local del centro es 20, 40, 50, 60 y 80. En su local de Villa
Morra es de 20, 49, 50, 51 y 80. Determine la media, la
mediana, el rango y la desviación media de cada local.
Finalmente compare las diferencias.
Ejercicio 1
Local Centro Local VM
Estadístico Valor Estadístico Valor
Media 50 Media 50
Mediana 50 Mediana 50
Rango 60 Rango 60

DM = 16 DM = 12,4

La desviación media es de 16 Sobre la base de la desviación media,


capuchinos al día: el numero de es posible decir que la dispersión de
capuchinos vendidos se desvía, la distribución de ventas de VM se
en promedio, 16 unidades de la encuentra mas concentrada cerca de
media de 50 capuchinos al día. la media de 50 que en la tienda del
Centro.
DM para una distribución
clases f
8-10 3
11-13 6
14-16 9
17-19 11
20-22 5
Total 34

σ𝑛𝑖=1 𝑓 · 𝑥𝑖 − 𝑋ത
𝐷𝑀 =
𝑛
Para una distribución
clases f Xi f·x
8-10 3 9 27
11-13 6 12 72
14-16 9 15 135
17-19 11 18 108
20-22 5 21 105
Total 34 537

σ𝑛𝑖=1 𝑓 · 𝑥𝑖 − 𝑋ത
𝐷𝑀 =
𝑛

3 9−15.794 +6 12−15.794 +9 15−15.794


σ15
𝑖=1 +11 18−15.794 +5 21−15.794 +
𝐷𝑀 = =2.958
15
Desviación media
• La desviación media posee dos ventajas. Primero, incluye
todos los valores de los cálculos. El rango sólo incluye los
valores máximo y mínimo.
• Segundo, es fácil de definir: es la cantidad promedio que los
valores se desvían de la media.
• Sin embargo, su inconveniente es el empleo de valores
absolutos. Por lo general, es difícil trabajar con valores
absolutos, así que la desviación media no se emplea con tanta
frecuencia como otras medidas de dispersión, como la
desviación estándar.
Varianza y desviación estándar
• La varianza y la desviación estándar también se fundamentan
en las desviaciones de la media.
• Sin embargo, en lugar de trabajar con el valor absoluto de las
desviaciones, la varianza y la desviación estándar lo hacen con
el cuadrado de las desviaciones.

• La Varianza es la media aritmética de las desviaciones de la


media elevadas al cuadrado.

• La Desviación Estándar es la raíz cuadrada de la varianza.


Varianza
• La varianza mide la mayor o menor dispersión de los valores
de la variable respecto a la media aritmética.
• Cuanto mayor sea la varianza, mayor dispersión existirá y por
tanto, menor representatividad tendrá la media aritmética.

• Varianza poblacional (tiene en cuenta TODAS las


observaciones estudiadas)
σ(𝑋 − 𝜇)2
𝜎=
𝑛

• Varianza muestral
ത 2
σ(𝑋 − 𝑋)
𝑠=
𝑛−1
Desviación estándar
• La desviación estándar o desviación típica se define como la
raíz cuadrada de los cuadrados de las desviaciones de los
valores de la variable respecto a su media.
• Es una medida estadística de la dispersión de un grupo de
población.

σ 𝑋 − 𝑋ത 2
𝜎= 𝑠=
𝑛−1

σ 𝑓 · 𝑥𝑖 − 𝑋ത 2 (para datos agrupados)


𝜎=
𝑛−1
Regla empírica
• En cualquier distribución de frecuencias simétrica con forma
de campana, aproximadamente el 68% de las observaciones
se encontrarán entre más y menos una desviación estándar de
la media; cerca del 95% de las observaciones se encontrarán
entre más y menos dos desviaciones estándares de la media y,
de hecho, todas (99.7%) estarán entre más y menos tres
desviaciones estándares de la media.
Aplicaciones
• La desviación estándar nos permite determinar, con un buen
grado de precisión, dónde están localizados los valores de una
distribución de frecuencias con relación a la media.
• Para curvas cualesquiera, el teorema de Chebyshev asegura
que al menos el 75% de los valores caen dentro de ± 2σ (2
desviaciones estándar) a partir de la media, y al menos el 89%
de los valores caen dentro de ± 3 σ.
Ejemplo
Los siguientes datos representan una muestra de la cantidad de
pedidos diarios entregados :
17 25 28 27 16 21 20 22 18 23
Se pide:
a) Hallar el rango, la varianza y la desviación estándar e
interpretar.
b) Hallar el porcentaje de observaciones que están alrededor de
la media a una distancia de 2 desviaciones estándar.
x ഥ
𝑿 ഥ
𝒙−𝑿 ഥ
𝒙−𝑿 𝟐 x2
16 21,7 -5,7 32,49 256 𝑅𝑎𝑛𝑔𝑜 = 28 − 16 = 12
17 21,7 -4,7 22,09 289
18 21,7 -3,7 13,69 324
20 21,7 -1,7 2,89 400 σ𝑛𝑖=1 𝑥𝑖 − 𝑋ത 2
152,1
21 21,7 -0,7 0,49 441 𝜎= = = 16,9
𝑛−1 9
22 21,7 0,3 0,09 484
23 21,7 1,3 1,69 529
25 21,7 3,3 10,89 625
27 21,7 5,3 28,09 729 𝑣 = 𝜎 = 4,11

28 21,7 6,3 39,69 784


217 152,1 4861
Media = 21,7

Media + 2σ = 21,7 + 2*4,11 = 21,7 + 8,44 = 30,14


Media - 2σ = 21,7 - 2*4,11 = 21,7 - 8,44 = 13,26

Podemos concluir que el 100% de los datos están en ±σ

Você também pode gostar