Escolar Documentos
Profissional Documentos
Cultura Documentos
Las medidas de tendencia central son medidas estadsticas que pretenden resumir en un solo valor a un
conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos.
Las medidas de tendencia central ms utilizadas son: media, mediana y moda. Las medidas de
dispersin en cambio miden el grado de dispersin de los valores de la variable. Dicho en otros trminos
las medidas de dispersin pretenden evaluar en qu medida los datos difieren entre s. De esta forma,
ambos tipos de medidas usadas en conjunto permiten describir un conjunto de datos entregando
informacin acerca de su posicin y su dispersin.
Los procedimientos para obtener las medidas estadsticas difieren levemente dependiendo de la forma en
que se encuentren los datos. Si los datos se encuentran ordenados en una tabla estadstica diremos que se
encuentran agrupados y si los datos no estn en una tabla hablaremos de datos no agrupados.
Segn este criterio, haremos primero el estudio de las medidas estadsticas para datos no agrupados y
luego para datos agrupados.
Promedio o media
La medida de tendencia central ms conocida y utilizada es la media aritmtica o promedio aritmtico. Se
representa por la letra griega cuando se trata del promedio del universo o poblacin y por (lase Y
barra) cuando se trata del promedio de la muestra. Es importante destacar que es una cantidad fija
mientras que el promedio de la muestra es variable puesto que diferentes muestras extradas de la misma
poblacin tienden a tener diferentes medias. La media se expresa en la misma unidad que los datos
originales: centmetros, horas, gramos, etc.
Desviaciones: Se define como la desviacin de un dato a la diferencia entre el valor del dato y la media:
Ejemplo de desviaciones:
Una propiedad interesante de la media aritmtica es que la suma de las desviaciones es cero.
Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que ocupa la
posicin central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las
observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o
superiores a la mediana.
Si el nmero de observaciones es par, la mediana corresponde al promedio de los dos valores centrales.
Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.
Moda
La moda de una distribucin se define como el valor de la variable que ms se repite. En un polgono de
frecuencia la moda corresponde al valor de la variable que est bajo el punto ms alto del grfico. Una
muestra puede tener ms de una moda.
Medidas de dispersin
Las medidas de dispersin entregan informacin sobre la variacin de la variable. Pretenden resumir en
un solo valor la dispersin que tiene un conjunto de datos. Las medidas de dispersin ms utilizadas son:
Rango de variacin, Varianza, Desviacin estndar, Coeficiente de variacin.
Rango de variacin
Se define como la diferencia entre el mayor valor de la variable y el menor valor de la variable.
Frmulas
Donde es el promedio de la poblacin.
Segn la frmula el promedio calculado es 7, veamos ahora el clculo de las medidas de dispersin:
Interpretacin de la varianza (vlida tambin para la desviacin estndar): un alto valor de la varianza
indica que los datos estn alejados del promedio. Es difcil hacer una interpretacin de la varianza
teniendo un solo valor de ella. La situacin es ms clara si se comparan las varianzas de dos muestras, por
ejemplo varianza de la muestra igual 18 y varianza de la muestra b igual 25. En este caso diremos que los
datos de la muestra b tienen mayor dispersin que los datos de la muestra a. esto significa que en la
muestra a los datos estn ms cerca del promedio y en cambio en la muestra b los datos estn ms
alejados del promedio.
Coeficiente de variacin
Es una medida de la dispersin relativa de los datos. Se define como la desviacin estndar de la muestra
expresada como porcentaje de la media muestral.
Es de particular utilidad para comparar la dispersin entre variables con distintas unidades de medida.
Esto porque el coeficiente de variacin, a diferencia de la desviacin estndar, es independiente de la
unidad de medida de la variable de estudio.
Se identifica como datos agrupados a los datos dispuestos en una distribucin de frecuencia. En tal caso
las frmulas para el clculo de promedio, mediana, modo, varianza y desviacin estndar deben incluir
una leve modificacin. A continuacin se entregan los detalles para cada una de las medidas.
Promedio en datos agrupados
La frmula es la siguiente:
Donde ni representa cada una de las frecuencias correspondientes a los diferentes valores de Yi.
Consideremos como ejemplo una distribucin de frecuencia de madres que asisten a un programa de
lactancia materna, clasificadas segn el nmero de partos. Por tratarse de una variable en escala discreta,
las clases o categoras asumen slo ciertos valores: 1, 2, 3, 4, 5.
Si la variable de inters es de tipo continuo ser necesario determinar, para cada intervalo, un valor medio
que lo represente. Este valor se llama marca de clase (Yc) y se calcula dividiendo por 2 la suma de los
lmites reales del intervalo de clase. De ah en adelante se procede del mismo modo que en el ejercicio
anterior, reemplazando, en la formula de promedio, Yi por Yc.
Si la variable es de tipo continuo es necesario, primero, identificar la frecuencia acumulada que supere en
forma inmediata a n/2, y luego aplicar la siguiente frmula:
Donde:
Ms adelante se presenta un ejemplo integrado para promedio, mediana, varianza y desviacin estndar
en datos agrupados con intervalos.
Con los datos del ejemplo y recordando que el promedio (Y) result ser 2,78 partos por madre,
Cuando los datos estn agrupados en intervalos de clase, se trabaja con la marca de clase (Yc), de tal
modo que la frmula queda:
Donde Yc es el punto medio del intervalo y se llama marca de clase del intervalo
Percentiles
Los percentiles son valores de la variable que dividen la distribucin en 100 partes iguales. De este modo
si el percentil 80 (P80) es igual a 35 aos de edad, significa que el 80% de los casos tiene edad igual o
inferior a 35 aos.
El percentil j (Pj) corresponde al valor de la variable (Yi ) cuya frecuencia acumulada supera
inmediatamente al j % de los casos (jxn/100).
El percentil 80, en los datos de la tabla, ser el valor de la variable cuyo Ni sea inmediatamente superior a
33,6 ((80x42) /100).
El primer Ni que supera a 33,6 es 39. Por lo tanto al percentil 80 le corresponde el valor 4. Se dice
entonces que el percentil 80 es 4 partos (P80=4). Este resultado significa que un 80% de las madres
estudiadas han tenido 4 partos o menos.
Si los datos estn agrupados en una tabla con intervalos, el procedimiento es levemente ms complejo ya
que se hace necesaria la aplicacin de una frmula.
Se aplica a los datos del intervalo cuya frecuencia acumulada ( Ni ) sea inmediatamente superior al j %
de los casos (jxn/100).
2. La mediana ser:
Esto significa que un 50% de las familias tiene ingreso mensual igual o inferior a $127.270.
3. El percentil 78 ser:
Por lo tanto se puede decir que 78% de las familias tienen ingreso igual o inferior a $174.660.
5. - La varianza ser:
Por ejemplo, el tiempo de espera (en minutos) de cinco clientes de un banco es: 3,
2, 4, 1 y 2. El tiempo medio de espera es:
Mediana
Utilice la mediana para describir un conjunto entero de observaciones con un solo
valor que representa el centro de los datos. La mitad de las observaciones est por
encima de la mediana y la otra mitad est por debajo de sta. Se determina al
jerarquizar los datos y hallar el nmero de observacin [N + 1] / 2. Si hay un
nmero par de observaciones, la mediana se extrapola como el valor que est justo
en el medio entre el valor de las observaciones N / 2 y [N / 2] + 1.
Para estos datos ordenados, la mediana es 13. Es decir, el 50% de los valores es menor que o
igual a 13 y el 50% de los valores es mayor que o igual a 13.
Moda
La moda es el valor que ocurre con ms frecuencia en un conjunto de
observaciones. Minitab tambin muestra cuntos puntos de los datos son iguales a
la moda. La moda se puede utilizar con la media y la mediana para proporcionar
una caracterizacin general de la distribucin de los datos. Mientras que la media y
la mediana requieren un clculo, la moda se obtiene simplemente contando el
nmero de veces que cada valor ocurre en un conjunto de datos.
multimodal.
Unimodal
Solo hay una moda, 8, que ocurre con ms frecuencia.
Bimodal
Hay dos modas, 4 y 16. Los datos parecen representar 2 poblaciones diferentes.
Media recortada
La media recortada es la media de los datos sin el 5% superior y el 5% inferior de
los valores. Utilice la media recortada para eliminar el impacto de los valores muy
grandes o muy pequeos sobre la media. Cuando los datos contienen valores
atpicos, la media recortada puede ser una mejor medida de la tendencia central
que la media.
La lnea azul representa la media original, la cual es influenciada notablemente por los valores
extremos que se encuentran ms a la derecha. La lnea roja representa la media recortada, que
se desplaza hacia la izquierda porque Minitab excluye los valores extremos en el 5% ms alto de
los datos.
Uso de las medidas de tendencia central para
describir distribuciones asimtricas
El centro de los datos es el rea donde se aglomera la mayora de los valores de un
conjunto de datos. La tendencia central se puede describir mediante varios
estadsticos diferentes, como la media, la media recortada, la mediana o la moda. El
conocer la tendencia central de los datos es un primer paso importante para
entenderlos.
Las representaciones grficas como los histogramas, las grficas de caja y las
grficas de puntos son tiles para visualizar la tendencia central de los datos y
pueden ayudar a decidir cul estadstico de la tendencia central es ms adecuado
con un conjunto de datos determinado.
En un conjunto de datos muy grande distribuido normalmente, las diferentes medidas del
centro son bsicamente iguales.
Sin embargo, a medida que las distribuciones se desvan de la normalidad, estos estadsticos
comienzan a diferenciarse. En este ejemplo, las lneas de referencia (de izquierda a derecha)
representan la mediana, la media recortada y la media. En este caso, la mediana es el estadstico
ms apropiado, pero podra no siempre ser as.
As mismo, a medida que las distribuciones se desvan de la normalidad y se
vuelven ms asimtricas, la desviacin estndar se diferencia ms de la distancia
entre la media y un valor tpico de los datos.
El rango intercuartil es una mejor medida de dispersinque la desviacin estndar
cuando se trata de datos muy asimtricos, porque el rango intercuartil no se ve
afectado por los rangos extremos.
Por ejemplo, esta distribucin presenta asimetra positiva. Observe que la media (X) se desplaza
hacia la derecha en la direccin de la asimetra. La mediana (Y) est ms hacia la izquierda, ms
cerca de la mayora de las observaciones. En este caso, la mediana podra ser una mejor manera
de describir el centro de los datos que la media.
https://image.slidesharecdn.com/medidasdetendenciacentralclasedeestadistica20131-
130415174131-phpapp02/95/medidas-de-tendencia-central-estadstica-2-
638.jpg?cb=1366048004