Você está na página 1de 31

Medidas de Variación o

Dispersión
Profesora Sharon González
Medidas de Dispersión o Variación

Se refiere a la extensión de los datos de una distribución, es decir el grado


en que las observaciones se distribuyen.

Usamos el término variación como una descripción general de la cantidad


que varían los valores entre sí. (En ocasiones se aplica el término dispersión
en vez de variación).
Tiempo de Espera de Clientes en 3 Bancos Diferentes

• En el primer banco, el gerente controla de forma muy cuidadosa los tiempos de


espera modificando el número de cajeros según sea necesario.
• En el segundo banco, todos los clientes esperan en una sola fila y son atendidos por
los cajeros disponibles.
• En el tercer banco hay una fila para cada ventanilla. A continuación se muestran los
tiempos de espera (en minutos) específicos delos clientes, que se describen en la
figura:
Rango

Es la diferencia entre el mayor valor y el menor valor de los datos de


la muestra.
Desviación Estándar

La desviación estándar es una medida de variación de todos los valores con


respecto a la media.
El valor de la desviación estándar s generalmente es positivo. Sólo es igual a
cero cuando todos los valores de los datos son el mismo número. (Nunca es
negativa). Además, valores grandes de s implican mayores cantidades de
variación.
El valor de la desviación estándar s puede aumentar de manera drástica con
la inclusión de uno o más valores extremos (valores de datos que se
encuentran muy lejos de los demás).
Desviación Estándar (procedimiento)

Paso 1: Calcule la media


Paso 2: Reste la media de cada valor individual para obtener una lista de
desviaciones de la forma
Paso 3: Eleve al cuadrado cada una de las diferencias obtenidas en el paso 2.
Paso 4: Sume todos los cuadrados obtenidos en el paso 3.
Paso 5: Divida el total del paso 4 entre el número (n - 1); es decir, 1 menos
que el total de valores presentes.
Paso 6: Calcule la raíz cuadrada del resultado del paso 5.
Desviación Estándar para una Población

Para calcular la desviación estándar s (sigma minúscula) de una


población, se utiliza una fórmula ligeramente diferente: en vez de
dividir entre n 1, se divide entre el tamaño N de la población,
como en la siguiente expresión:
Desviación Estándar para datos agrupados
Varianza

La varianza de un conjunto de valores es una medida de variación igual al


cuadrado de la desviación estándar.
• Varianza muestral: s2 el cuadrado de la desviación estándar s.
• Varianza poblacional: 𝜎2 el cuadrado de la desviación estándar poblacional 𝜎.

Se dice que la varianza muestral s2 es un estimador sin sesgo de la varianza


Poblacional 𝜎2, lo que significa que los valores de s2 tienden a igualar el valor
de 𝜎 2, en lugar de tender, de manera sistemática, a sobreestimar o
subestimar 𝜎2.
Regla práctica del intervalo
Práctica
Mediciones de la presión sanguínea.
Catorce estudiantes del segundo año de medicina de Bellevue
Hospital midieron la presión sanguínea de la misma persona. A
continuación, se listan las lecturas sistólicas (en mmHg).
Si la presión sanguínea del sujeto permanece constante y los
estudiantes de medicina aplican correctamente la misma
técnica de medición, ¿cuál debería ser el valor de la desviación
estándar?
138 130 135 140 120 125 120 130 130 144 143 140 130 150
Práctica

Llueven gatos. A veces se utiliza la estadística para comparar o


identificar autores de distintos trabajos. A continuación, se incluye
una lista con la longitud de las primeras 20 palabras que escribió
Tennessee Williams en el prefacio de The cat on a Hot Tin Roof,
junto con las primeras 20 palabras de The Cat in the Hat, del
doctor Seuss.
¿Parece haber una diferencia en la variación?
Cat on a Hot Tin Roof: 2 6 2 2 1 4 4 2 4 2 3 8 4 2 2 7 7 2 3 11
The Cat in the Hat: 3 3 3 3 5 2 3 3 3 2 4 2 2 3 2 3 5 3 4 4

Calcular rango, varianza y desviación estándar


Práctica

1. Calcular desviación estándar y varianza


2. Calcular la desviación estándar con la regla práctica del intervalo
3. Construya una distribución de frecuencia de los datos
4. Calcule desviación estándar basados en los datos de la distribución de
frecuencia
EJEMPLO Edades de las mejores actrices Utilice la regla práctica del intervalo
para calcular un estimado de la desviación estándar con la muestra de las 76
edades de las actrices que ganaron un Óscar en la categoría de mejor actriz. Las
edades se presentan en la tabla 2-1, que viene incluida en el problema del capítulo
2.
SOLUCIÓN Al emplear la regla práctica del intervalo para estimar la desviación
estándar de datos muestrales, calculamos el rango y lo dividimos entre 4. Si
observamos la lista de las edades de las actrices, notaremos que el valor máximo
es de 80 y el valor mínimo de 21; por lo tanto, la regla práctica del intervalo para
estimar la desviación estándar s se utiliza de la siguiente manera:

INTERPRETACIÓN Este resultado se acerca al valor correcto de 11.1, que se obtiene al


calcular el valor exacto de la desviación estándar con las fórmulas 3-4 o 3-5,
aunque el resultado de 15 se aleja de la desviación estándar real de forma
considerable. Esto demuestra que la regla práctica del intervalo produce un
estimado “burdo” que puede alejarse mucho del resultado real.
Regla Empírica
Teorema de Chebyshev
EJEMPLO Puntuaciones de CI Las puntuaciones de CI tienen una media de
100 y una desviación estándar de 15. ¿Qué podemos concluir a partir del
teorema de Chebyshev?
SOLUCIÓN Si aplicamos el teorema de Chebyshev con una media de 100 y
una desviación estándar de 15, podemos llegar a las siguientes
conclusiones:
Al menos 3>4 (o el 75%) de las puntuaciones de CI están dentro de 2
desviaciones estándar de la media (entre 70 y 130).
Al menos 8>9 (o el 89%) de las puntuaciones de CI están a 3 desviaciones
estándar de la media (entre 55 y 145).
Coeficiente de Variación (CV)

Anteriormente afirmamos que, como las unidades de la desviación estándar


son las mismas que las unidades de los datos originales, es más fácil
comprender la desviación estándar que la varianza. Sin embargo, esta
misma propiedad dificulta comparar la variación de valores tomados de
distintas poblaciones. Como el resultado es un valor libre de unidades de
medida específicas, el coeficiente de variación resuelve esta desventaja.
Percentiles

Así como existen tres cuartiles que separan un conjunto de datos en cuatro partes, también
existen 99 percentiles, que se denotan P1, P2, …, P99, los cuales separan los datos en 100
grupos, con aproximadamente el 1% de los valores en cada grupo. (Los cuartiles y percentiles
son ejemplos de cuantiles o fractiles, que separan los datos en grupos con aproximadamente
el mismo número de valores).

El proceso para calcular el percentil que corresponde a un valor x específico es bastante


sencillo, tal como se indica en la siguiente expresión:
Calcule el percentil correspondiente a una edad de 30 años.
Identificar el valor correspondiente a un percentil
Calcule el valor del percentil 20, P20.

SOLUCIÓN

En este cálculo utilizamos k = 20 porque estamos tratando de calcular el valor del percentil 20. Usamos n = 76 porque
tenemos 76 valores de datos.

Después, nos preguntamos si L es un número entero. La respuesta es no, por lo que procedemos al siguiente recuadro
inferior, donde modificamos L redondeando su valor al entero más alto, de 15.2 a 16. (éste es uno de los dos casos en que
redondeamos hacia arriba en vez de redondear hacia el entero más cercano).
Por último, el recuadro inferior muestra que el valor de P20 es el decimosexto valor, contando del más bajo al más alto. En
la tabla 3-4 el valor 16º es 27. Es decir, P20 27 años de edad.
Cuartiles

Q1 (primer cuartil): Separa el 25% inferior de los valores ordenados del 75%
superior. (Para ser más precisos, al menos el 25% de los valores ordenados son
menores o iguales que Q1, y al menos el 75% de los valores son mayores o iguales
que Q1).

Q2 (segundo cuartil): Igual a la mediana; separa el 50% inferior de los valores


ordenados del 50% superior.

Q3 (tercer cuartil): Separa el 75% inferior de los valores ordenados del 25% superior.
(Para ser más precisos, al menos el 75% de los valores ordenados son menores o
iguales que Q3, y al menos el 25% de los valores son mayores o iguales que Q3).
Calcular el valor de Q3
Gráfica de Caja o de Cuadro
Ejemplo de uso – escala salarial de una empresa
A continuación, se detalla los datos resumidos generados por la herramienta Estadística Descriptiva:

• Media = Representa el promedio de los argumentos

• Error típico = Devuelve el error típico del valor de y previsto para cada x de la regresión. El error típico es una medida de la cuantía de error en el pronóstico del valor de y para un
valor individual de x.

• Mediana = Es el número intermedio de un grupo de números; es decir, la mitad de los números son superiores a la mediana y la mitad de los números tienen valores menores que la
mediana. Por ejemplo, la mediana de 2, 3, 3, 5, 7 y 10 es 4.

• Moda = Es el número que aparece más frecuentemente en un grupo de números. Por ejemplo, la moda de 2, 3, 3, 5, 7 y 10 es 3.

• Desviación estándar= La desviación estándar es la medida de la dispersión de los valores respecto a la media (valor promedio)

• Varianza de la muestra = Parte de la hipótesis de que los argumentos representan una muestra de la población. Si sus datos representan la población total, utilice VARP para calcular
la varianza.

• Curtosis = Devuelve la curtosis de un conjunto de datos. La curtosis caracteriza la elevación o el achatamiento relativos de una distribución, comparada con la distribución normal. Una
curtosis positiva indica una distribución relativamente elevada, mientras que una curtosis negativa indica una distribución relativamente plana.

• Coeficiente de asimetría = Devuelve la asimetría de una distribución. Esta función caracteriza el grado de asimetría de una distribución con respecto a su media. La asimetría positiva
indica una distribución unilateral que se extiende hacia valores más positivos. La asimetría negativa indica una distribución unilateral que se extiende hacia valores más negativos.

• Rango = Se obtiene de la diferencia entre el valor máximo y el valor mínimo; por ello, comparte unidades con los datos.

• Mínimo = Devuelve el valor mínimo de un conjunto de valores de un campo especificado en una consulta.

• Máximo = Devuelve el valor máximo de un conjunto de valores de un campo especificado en una consulta.

• Suma = Suma todos los números que especifica como argumentos. Cada argumento puede ser un rango, una referencia de celda, una matriz, una constante, una matriz, o el resultado
de otra función.

• Cuenta = Calcula el número de registros devueltos por una consulta.

Você também pode gostar