Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTADÍGRAFOS
MEDIDAS DE POSICIÓN, DISPERSIÓN Y DE FORMA
Descripción breve
Contiene los conceptos fundamentales y su significado en estadística de las principales medidas
Estadísticas.
Suma
Media
3 + 2 + 4 + 1 + 2 + 12
= = 2,4 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
5 5
Debido a que la media depende de igual manera de todos los datos, incluyendo
los valores extremos, pudiera no ser representativa del centro en el caso de los
datos asimétricos.
Mediana
El centro del rango de datos: la mitad de las observaciones es menor que o igual
al valor y la mitad de las observaciones es mayor que o igual al valor.
Por ejemplo, para el análisis de salarios en una compañía, la media pudiera no ser
una herramienta estadística satisfactoria. Los salarios relativamente altos de un
número reducido de empleados con sueldos elevados tienden a inflar el promedio
general, con lo cual se obtiene una falsa impresión sobre los salarios de la
compañía. En este caso, la mediana aporta más información. La mediana es
equivalente al segundo cuartil o al percentil 50.
2
Página
3
Página
Desviación estándar
La medida de dispersión más común, que indica cuán separados de la media está
los datos. Mientras el rango estima la dispersión de los datos restando el valor
mínimo al valor máximo, la desviación estándar estima aproximadamente la
distancia "promedio" de las observaciones individuales con respecto a la media.
Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos.
Aproximadamente el 68% de
las observaciones están
dentro de una 1 desviación
estándar de la media (-1 a
+1), y alrededor del 99.7% de
las observaciones estarían
dentro de 3 desviaciones
estándar de la media (-3 a
+3).
como ruido.
Coeficiente de la variación
Medida de variabilidad relativa, igual a la desviación estándar dividida entre la media
(Minitab multiplica el cociente por 100). Debido a que se trata de un número sin
dimensiones, es útil para comparar la dispersión de poblaciones con medias
significativamente diferentes.
COV = 100 * 0.4 tazas / 16 tazas = 2.5 COV = 100 * 0.08 tazas / 1 taza = 8
6
Página
El coeficiente de variación del recipiente pequeño es más de tres veces mayor que el
coeficiente de variación del recipiente grande. En otras palabras, aunque el recipiente
grande presenta una mayor desviación estándar, el recipiente pequeño presenta una
variabilidad mucho mayor con respecto a su media.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los
datos, sobre un rectángulo, alineado horizontal o verticalmente.
Construcción:
Comparar distribuciones
Diagrama de Caja a través de Excel
Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran
el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica
donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y
tercero(recordemos que el segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y
máximo de la variable. Las lineas que sobresalen de la caja se llaman bigotes. Estos bigotes
tienen tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre
dentro de este rango es marcado e identificado individualmente
Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la edad de
un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
7
Página
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40
41 45
CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N =
20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:
Q2=(39 + 39) / 2 = 39
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las
edades comprendidas entre el 25% y el 50% de la población está más dispersa que
entre el 50% y el 75%.
El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25%
de los más jóvenes están más concentrados que el 25% de los mayores.
El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está
comprendido en 14,5 años.
Comparar distribuciones
La mayor utilidad de los diagramas caja-bigotes es para comparar dos o más conjuntos de
datos.
Análogamente a lo realizado con los diagramas de tallo y hojas, comparamos, mediante estos
diagramas, esta distribución con la del otro ejemplo de distribución de edades.
35 38 32 28 30 29 27 19 48 40
39 24 24 34 26 41 29 48 28 22
Un corredor entrena para una determinada carrera y se toman los tiempos que necesita para
recorrer los 200 m, durante 10 días consecutivos (cada día se toman varios tiempos y se
calculan mediana, cuartiles, valores mínimo y máximo)
Observamos que el desplazamiento de las gráficas de caja hacia la izquierda indica que el
entrenamiento ha dado resultado, ya que se tardan menos segundos en recorrer la misma
distancia, siendo la diferencia entre el máximo y el mínimo menor, como así también la
diferencia intercuartílica.
Las puntuación de los equipos de la liga de futbol BBVA de las temporadas 10/110 y 11/12 se
pueden comparar con un diagrama caja y bigotes, como aparece aquí,
11
Página
ASIMETRÍA
Esta medida nos permite identificar si los datos se distribuyen de forma
uniforme alrededor del punto central (Media aritmética). La asimetría
presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de
forma concisa como están distribuidos los datos respecto al eje de
asimetría. Se dice que la asimetría es positiva cuando la mayoría de los
datos se encuentran por encima del valor de la media aritmética, la curva
es Simétrica cuando se distribuyen aproximadamente la misma cantidad de
valores en ambos lados de la media y se conoce como asimetría
negativa cuando la mayor cantidad de datos se aglomeran en los valores
menores que la media.
Figura 5-1
El Coeficiente de asimetría, se representa mediante la ecuación
matemática,
Ecuación 5-9
Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno
de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor.
Los resultados de esta ecuación se interpretan:
(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe
aproximadamente la misma cantidad de valores a los dos lados de la media.
Este valor es difícil de conseguir por lo que se tiende a tomar los valores
que son cercanos ya sean positivos o negativos (± 0.5).
(g1 > 0): La curva es asimétricamente positiva por lo que los valores se
12
(g1 < 0): La curva es asimétricamente negativa por lo que los valores se
tienden a reunir más en la parte derecha de la media.
Desde luego entre mayor sea el número (Positivo o Negativo), mayor será la
distancia que separa la aglomeración de los valores con respecto a la
media.
2. CURTOSIS
Esta medida determina el grado de concentración que presentan los valores
en la región central de la distribución. Por medio del Coeficiente de Curtosis,
podemos identificar si existe una gran concentración de valores
(Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja
concentración (Platicúrtica).
Figura 5-2
Para calcular el coeficiente de Curtosis se utiliza la ecuación:
Ecuacion 5-10
Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los
valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los
resultados de esta fórmula se interpretan:
(g2 = 0) la distribución es Mesocúrtica: Al igual que en la asimetría es
bastante difícil encontrar un coeficiente de Curtosis de cero (0), por lo que
se suelen aceptar los valores cercanos (± 0.5 aprox.).
(g2 > 0) la distribución es Leptocúrtica
(g2 < 0) la distribución es Platicúrtica
Cuando la distribución de los datos cuenta con un coeficiente de asimetría
(g1 = ±0.5) y un coeficiente de Curtosis de (g2 = ±0.5), se le denomina
Curva Normal. Este criterio es de suma importancia ya que para la mayoría
de los procedimientos de la estadística de inferencia se requiere que los
datos se distribuyan normalmente.
13
Figura 5-3
Desde luego, los conceptos vistos hasta aquí, son sólo una
pequeña introducción a las principales medidas de Estadística Descriptiva;
es de gran importancia que los lectores profundicen en estos temas ya que
la principal dificultad del paquete SPSS radica en el desconocimiento de los
conceptos estadísticos.
Las definiciones plasmadas en este capítulo han sido extraídas de los
libros Estadística para administradores escrito por Alan Wester de la
editorial McGraw-Hill y el libro Estadística y Muestreo escrito por Ciro
Martínez editorial Ecoe editores (Octava edición). No necesariamente tienes
que guiarte por estos libros ya que en las librerías encontraras una gran
variedad de textos que pueden ser de bastante utilidad en la introducción a
esta ciencia.
14
Página
1) ASIMETRÍA
Es una medida de forma de una distribución que permite identificar y describir la manera como
los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución. Permite
identificar las características de la distribución de datos sin necesidad de generar el gráfico.
1.1) TIPOS DE ASIMETRÍA
La asimetría presenta las siguientes formas:
Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está en la
parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia la izquierda, es
decir, la distribución de los datos tiene a la izquierda una cola más larga que a la derecha. También se dice
que una distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética
es menor que la mediana y éste valor de la mediana a su vez es menor que la moda,
en símbolos
Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la simetría.
Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los datos
a ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa por una curva normal en
forma de campana llamada campana de Gauss (matemático Alemán 1777-1855) o también conocida como
de Laplace (1749-1827).También se dice que una distribución es simétrica cuando su media aritmética, su
mediana y su moda son iguales, en símbolos Md=Mo
Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está en la parte
derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o sesgo hacia la derecha,
es decir, la distribución de los datos tiene a la derecha una cola más larga que a la izquierda.
También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando el valor de la
media aritmética es mayor que la mediana y éste a valor de la mediana a su vez es mayor que la moda, en
símbolos
Donde:
= media aritmética.
Md = Mediana.
s = desviación típica o estándar.
Nota:
15
Donde:
Nota:
Medida de Fisher
Donde:
= cada uno de los valores; n = número de datos; = media aritmética; f = frecuencia absoluta
= cubo de la desviación estándar poblacional; xm = marca de clase
Nota:
Si As < 0 ?Indica que existe presencia de la minoría de datos en la parte izquierda de la media, aunque en
algunos casos no necesariamente indicará que la distribución sea asimétrica negativa
Si As = 0 ? la distribución será simétrica
Si As > 0 ? Indica que existe presencia de la minoría de datos en la parte derecha de la media, aunque en
algunos casos no necesariamente indicará que la distribución sea asimétrica positiva
Ejemplo ilustrativo:
Calcular el Coeficiente de Pearson, Medida Cuartílica y la Medida de Fisher dada la siguiente distribución: 6,
9, 9, 12, 12, 12, 15 y 17
Solución:
Calculando la media aritmética se obtiene:
6 9 9 12 12 12 15 17
Página
15 42,875
17 166,375
Página
Total 12
2) CURTOSIS O APUNTAMIENTO
La curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la distribución normal,
es decir, mide cuán puntiaguda es una distribución.
La curtosis determina el grado de concentración que presentan los valores en la región central de la
distribución. Así puede ser:
Leptocúrtica.- Existe una gran concentración.
Mesocúrtica.- Existe una concentración normal.
Platicúrtica.- Existe una baja concentración.
Medida de Fisher
Donde: = cada uno de los valores; n = número de datos; = media aritmética; = Cuádruplo de la
desviación estándar poblacional; f = frecuencia absoluta; xm = marca de clase
Nota:
Nota:
Si < 0,263 la distribución es platicúrtica
Si = 0,263 la distribución es normal o mesocúrtica
Si > 0,263 la distribución es leptocúrtica
Ejemplo ilustrativo: Determinar qué tipo de curtosis tiene la siguiente distribución: 6, 9, 9, 12, 12, 12, 15 y 17.
Emplear la medida de Fisher y el coeficiente percentil de curtosis.
Solución: Calculando la media aritmética se obtiene
Datos
6 915,0625
9 39,0625
9 39,0625
12 0,0625
12 0,0625
12 0,0625
15 150,0625
17 915,0625
Total 2058,5
Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:
6 9 9 12 12 12 15 17
21
Página
REFERENCIAS BIBLIOGRÁFICAS
BENALCÁZAR, Marco, (2002), Unidades para Producir Medios Instruccionales en Educación, SUÁREZ, Mario
Ed. Graficolor, Ibarra, Ecuador.
DAZA, Jorge, (2006), Estadística Aplicada con Microsoft Excel, Grupo Editorial Megabyte,
Lima, Perú.
SUÁREZ, Mario, (2004), Interaprendizaje Holístico de Matemática, Ed. Gráficas Planeta,
Ibarra, Ecuador.
SUÁREZ, Mario, (2011), Interaprendizaje de Estadística Básica
TAPIA, Fausto Ibarra, Ecuador.
22
Página