Escolar Documentos
Profissional Documentos
Cultura Documentos
PROMEDIOS
En estadstica al promedio se le conoce como medida de tendencia central, ya que est
localizado hacia el medio o centro de una distribucin, en la que la mayora de los valores
tendern a concentrarse. Entre los ms comunes se pueden mencionar: la media aritmtica, la
mediana y la moda
Media Aritmtica
MEDIDAS DE TENDENCIA CENTRAL Mediana
Moda
LA MEDIA ( X ).
La media aritmtica o simplemente media, es el promedio aritmtico de un conjunto de
observaciones y se obtiene al sumar todos los datos y dividir dicha suma entre el total de datos.
MEDIA ARITMTICA PARA DATOS NO AGRUPADOS.
Algebraicamente se representa como:
X =
Donde:
n
Xn X X X + + + + ... 3 2 1
X es la media aritmtica de la muestra
X
1 ,
X
2
, X
3
, ... X
n
son los datos de la muestra y
n es el total de los datos de la muestra.
Ejemplo: En la muestra siguiente la media aritmtica es:
X =
X =
20
696
= 34.8
Obsrvese que la media no necesariamente tiene que ser uno de los valores de la muestra.
Una manera ms sencilla de encontrar esta media aritmtica es multiplicando cada dato por su
frecuencia y continuar el proceso respectivo, como se ilustra a continuacin:
X =
X = X =
20
696
X = 34.8
Principales caractersticas de la media aritmtica:
1. El clculo de la media aritmtica est basado en todos los valores de un conjunto de datos.
El valor de cada elemento en los datos afecta el valor de la media.
2. Cuando algunos valores extremos son incluidos en los datos, la media puede llegar a ser
menos representativa del conjunto de valores.
20
40 38 38 38 36 36 36 36 36 34 34 34 34 34 34 32 32 32 32 30 + + + + + + + + + + + + + + + + + + +
20
) 40 ( 1 ) 38 ( 3 ) 36 ( 5 ) 34 ( 6 ) 32 ( 4 ) 30 ( 1 + + + + +
20
40 114 180 204 128 30 + + + + +
3. La media tienen dos propiedades matemticas importantes que proporcionan un anlisis
matemtico adicional, hacindola ms popular que cualquier otro tipo de promedio.
a. La suma algebraica de las desviaciones de los valores individuales respecto a la
media, es cero.
b. La suma del cuadrado de las desviaciones con respecto a la media es mnima.
c.
~
LA MEDIANA ( X ) (Me)
~
La mediana ( X ) de una muestra de n datos, se localiza en la mitad de la muestra o del
conjunto de elementos ordenados de mayor a menor o viceversa.
Su caracterstica principal es dividir el conjunto ordenado en 2 grupos iguales; la mitad de los
nmeros tendr valores que son menores que la mediana y la otra mitad alcanza valores
mayores que sta.
MEDIANA PARA DATOS NO AGRUPADOS
Si el nmero de elementos es impar, se toma el dato central; si es par la mediana est dada por el
promedio de los datos centrales, pudindose obtener un valor no dado en la muestra.
Ejemplo: Cul es la mediana aritmtica de 3, 4, 4, 5, 6, 8, 8, 10?
Como los nmeros estn ya ordenados, la mediana es Me = 5+6 / 2 = 5.5,
Otro ejemplo: 5.1, 6.5, 8.1, 9.1, 10.1, 15.5,
Como los nmeros estn ordenados, la mediana es Me = 8.1+9.1 / 2 = 8.6
Principales caractersticas de la mediana
1. La mediana es un promedio de posicin y por su forma de clculo no es afectada por
valores extremos.
2. La mediana no est definida algebraicamente como lo est la media aritmtica.
3. La mediana en algunos casos, no puede ser calculada exactamente como s puede serlo la
media.
4. Cuando el nmero de elementos incluidos en una serie de datos es par, la mediana es
aproximadamente el punto medio de los elementos centrales en una serie de datos.
LA MODA (
^
X ) (Mo)
La moda se define como el valor que tiene la mayor frecuencia (o que se repite mas) en un grupo
de datos,
Hay casos en que la moda no es nica, esto es, puede ser bimodal con dos modas, o trimodal con
tres modas. Tambin hay casos en que la moda no existe.
MODA PARA DATOS NO AGRUPADOS.
Ejemplo: Cul es la moda de la serie: 4, 5, 5, 6, 7, 7, 7, 8, 9, 1
La Moda es Mo = 7 porque es el nmero que ms se repite.
Otro ejemplo: 60, 74, 82, 85, 90, 95,
La moda no existe.
Otro ejemplo: 10,12, 14, 16, 17, 17, 18, 19, 20, 20, 21.
La moda es bimodal o sea, Mo = 17 y 20
Principales caractersticas de la Moda.
1. La moda representa ms elementos que cualquier otro valor dentro de un conjunto de
datos.
2. La moda no se calcula incluyendo todos los valores y no est definida algebraicamente
como si lo est la media.
3. La moda no es afectada por valores extremos.
4. Para una distribucin de frecuencias, la moda no puede ser calculada exactamente, como
si puede serlo la media.
En resumen, hagamos una comparacin de estas tres medidas de tendencia central.
COMPARACIN DE LA MEDIA, MEDIANA Y MODA.
En comparacin con la media y la mediana, la moda es la menos til para la mayora de los
problemas estadsticos, ya que no se inclina por un anlisis matemtico, en el mismo sentido que
lo hacen las otras dos. Sin embargo, desde un punto de vista puramente descriptivo, la moda es
indicativa del valor tpico en trminos del valor que se presenta con mayor frecuencia. La moda es
ms til cuando uno o dos valores, o un grupo de stos, ocurren con mayores frecuencias que
otros. Por el contrario, cuando la mayora o todos los valores se presentan casi con la misma
frecuencia, la moda no sirve para describir datos.
Comparacin entre la media, mediana y moda para datos no agrupados.
Medida Definicin Ventajas Limitaciones
Media
Aritmtica
Es la suma de los valores de
cierto nmero de cantidades,
dividido entre su nmero.
1. Refleja cada valor.
2. Tiene propiedades
matemticas atractivas.
3. Todos los valores afectan su
resultado.
4 Si se quiere calcular los
totales, es mejor usar la media.
1. Puede ser
excesivamente influida
por los valores
extremos.
Mediana
Es el valor que divide un
conjunto de datos
previamente ordenados.
1. La mitad de los valores son
mayores, la otra mitad son
menores.
2. Es menos sensible a valores
extremos que la media.
3. Si se quiere ubicar las
condiciones de una variable
categrica es mejor usar la
mediana.
1. Difcil de determinar
si hay gran cantidad de
datos.
2. Puede resultar falsa
si los datos son
irregulares y si hay
lagunas en los valores.
Moda
Es el valor que ocurre con
mayor frecuencia.
1. Es la de menor sensibilidad a
los valores extremos.
2. Tiene ms valores reunidos
en este punto que en cualquier
otro.
1. No se presta para
anlisis matemtico.
2. Puede no haber un
valor modal para
algunos conjuntos de
datos.
3. Puede tener varias
modas.
Finalmente, la medida de tendencia central que se debe utilizar depende de la informacin
disponible y el objetivo que se desea alcanzar.
Ahora analicemos la media, mediana y moda pero con DATOS
AGRUPADOS, o tambin llamada distribucin de frecuencias agrupadas.
Empecemos con la
MEDIA ARITMTICA PARA DATOS AGRUPADOS
Si los datos o valores han sido agrupados en intervalos de clase, entonces se considera que todos
los valores incluidos dentro de un determinado intervalo son iguales o estn representados por el
punto medio del intervalo o la marca de clase. En este caso se procede a multiplicar cada punto
medio por su respectiva frecuencia. Luego se suman estos productos, para finalmente dividir este
resultado entre el total de datos.
Es importante sealar que el valor de la media de la frecuencia agrupada es suficientemente
aproximado para trabajos de estadstica y que el valor de la media no ser suficientemente
aproximado si la distribucin de frecuencias agrupadas es muy irregular o demasiado asimtrica.
La frmula para la media aritmtica en datos agrupados es la siguiente:
Donde
f = Frecuencias absolutas de los intervalos.
X = Marca de clase o punto medio.
n = La suma de las frecuencias.
n
X f
X
=
) )( (
MEDIANA PARA DATOS AGRUPADOS
Cuando Los datos simples son agrupados en una distribucin de frecuencias, cada uno de los
valores pierde su identidad en la tabla, significando que la mediana de los datos simples puede no
ser igual a la mediana obtenida de una distribucin de frecuencias del mismo conjunto de datos.
Es importante mencionar, que la mediana de los datos agrupados es una aproximacin de la
verdadera mediana. La aproximacin puede ser obtenida mediante el uso de la siguiente frmula:
Donde:
Me = Mediana
Li = Lmite real inferior de la clase que contiene la mediana.
n = El nmero de datos o frecuencia total.
c = La frecuencia acumulada precisamente hasta la clase anterior a la clase mediana o la
suma de las frecuencias de los intervalos por debajo de la mediana.
fme = La frecuencia de la clase mediana.
i = Tamao del intervalo o amplitud de la clase mediana.
MODA PARA DATOS AGRUPADOS.
Cuando la moda se calcula a travs de la frmula para datos agrupados, los valores y frecuencia en
la clase modal y las frecuencias en las clases inmediatamente antes y despus de la clase modal,
son tambin empleadas. Por lo tanto se aplica la siguiente frmula.
) (
2
i
f me
c
n
Li Me
(
(
(
+ =
) (
2 1
1
i
d d
d
Li Mo
(
+
+ =
Donde:
Mo = Moda
L
1
= Lmite real inferior de la clase que contiene la moda
d
1
= Diferencia de la frecuencia de la clase modal y la frecuencia de la clase contigua
inferior.
d
2
= diferencia de la frecuencia de la clase modal y la frecuencia de la clase contigua
superio.
i = Tamao del intervalo o amplitud del intervalo de la clase modal.
CALCULO DE LA MODA para datos agrupados.
Para determinar el valor de la moda, habr que observar las columnas f y seleccionar el
intervalo que presenta la mayor frecuencia. En este caso, el intervalo que donde est incluida la
moda es:
42.5 45.5 44 16 .32 36 .72 704
La frmula que se utiliza para encontrar el valor de la moda es:
L
1
= Lmite real inferior de la clase que contiene la moda
d
1
= Diferencia de la frecuencia de la clase modal y la frecuencia de la clase contigua
inferior.
d
2
= diferencia de la frecuencia de la clase modal y la frecuencia de la clase contigua
superior.
i = Tamao del intervalo o amplitud del intervalo de la clase modal.
) (
2 1
1
i
d d
d
Li Mo
(
+
+ =
Para determinar los valores de cada trmino en esta expresin, se requiere adems del intervalo
donde est localizada la moda, de las celdas inmediata inferior y superior que queda como sigue:
39.5 - 42.5 41 11 .22 20 .40 451
42.5 - 45.5 44 16 .32 36 .72 704
45.5 - 48.5 47 9 .18 45 .90 423
A partir de estos intervalos se adquieren los valores requeridos y que son:
Li = 42.5
d
1
= 16 - 11 = 5
d
2
= 16 9 = 7
i = 3
Sustituyendo estos datos en la formula se obtiene:
Mo = 42.5 +
(
+ 7 5
5
( 3 ) Mo = 42.5 + |
.
|
\
|
12
5
( 3 )
Mo = 42.5 +
12
15
= 42.5 + 1.25 = 43.75
Finalmente la Moda = 43.75
CUARTILES, DECILES Y PERCENTILES:
La mediana no es ms que uno de muchos fractiles; stos dividen los datos en
dos o ms partes, tan iguales como sea posible. Entre ellos tambin
encontramos los cuartiles, deciles y percentiles, que pretenden dividir los datos
en cuatro, diez, y cien partes. Hasta hace poco, los fractiles se manejaban
principalmente para distribuciones de conjuntos numerosos de datos.
El cuartil se utiliza a fin de conocer los intervalos dentro de los cuales quedan
representados proporcionalmente los trminos de una distribucin, para esto, se
divide la distribucin de frecuencias en 4 partes iguales, cada una contiene IGUAL
NMERO DE OBSERVACIONES (el 25% del total). Los puntos de separacin de
los valores de X se llaman CUARTILES.
- El primer cuartil corresponde al 25% y se designa con Q
1
.
- El segundo cuartil se designa con Q
2
que representa el valor de 50% y
coincide con la mediana.
- El tercer cuartil es Q
3
representa el 75% de las observaciones.
Si en lugar de dividir en 4 partes iguales se hace con 10 partes, se tienen 9 puntos
de divisin, CORRESPONDIENDO A CADA PUNTO UN DECIL, de donde, el
primer decil es el valor por debajo del cual est el 10% de las observaciones, para
el segundo decil el 20% y as sucesivamente.
PRIMER EJEMPLO:
Consideremos las siguientes lecturas de temperaturas altas en doce ciudades
Europeas en un da de junio:
90, 75, 86, 77, 85, 72, 78, 79, 94, 82, 74, y 93 grados.
Ordenando estas cifras de acuerdo con su tamao, tenemos:
72 74 75 77 78 79 82 85 86 90 93 94 observa que son 12 datos
Para el clculo de los cuartiles dividimos los datos en CUATRO PARTES
IGUALES. Para ilustrar dicho procedimiento tenemos la siguiente figura:
n = 12
Se puede apreciar que las lneas punteadas dividen los datos en cuatro partes
iguales. Si determinamos que los puntos centrales entre 75 y 77, 79 y 82, y 86 y
90 sean los tres cuartiles, tenemos:
72 74 75 77 78 79 82 85 86 90 93 94
76
2
77 75
1
=
+
= Q 5 . 80
2
82 79
2
=
+
= Q 88
2
90 86
3
=
+
= Q
LA DESVIACION TIPICA
Y OTRAS MEDIDAS DE DISPERSION
Medidas de dispersion
A menudo escuchamos que en los pases latinoamericanos existe mucha
DIFERENCIA entre los ingresos que perciben por ejemplo los polticos y los
trabajadores de otra clase social de la poblacin. Esas diferencias tienen sus
races en distintos fenmenos sociales, polticos y econmicos; sin embargo, un
economista dira el ingreso per cpita en los pases latinoamericanos est
ms DISPERSO que el ingreso per cpita de los pases desarrollados.
El concepto de DISPERSIN resulta importante en casi todos los estudios, ya que puede
darse el caso de poblaciones con igual valor central (Media aritmtica, Mediana o Moda),
pero una puede estar ms DISPERSA que la otra, es decir, los promedios nos sirven
para describir los datos representados por la tendencia central del conjunto. Por lo tanto,
el promedio no logra por si mismo describir completamente a una coleccin de datos; se
necesitan otros valores que nos indiquen el grado en que las observaciones estudiadas se
apartan o VARAN con respecto al valor central, es decir, el GRADO DE VARIACIN O
DISPERSIN.
Por tal motivo las medidas de tendencia central, no dicen nada por s mismas, por
lo que se deben calcular las MEDIDAS DE DISPERSIN o LAS VARIACIONES
de los datos. Por su clculo las MEDIDAS DE DISPERSIN se dividen en
absolutas y relativas, an que existen mas, estudiaremos las siguientes:
DISPERSIN ABSOLUTA: Rango o recorrido
Rango intercuartilico o desviacin cuartil
Desviacin Media
Varianza
Desviacin Estndar
DISPERSIN RELATIVA: Coeficiente de variacin
RANGO O RECORRIDO:
Como se ha indicado con anterioridad, el rango o recorrido es la diferencia entre el
valor mayor y el valor menor de un grupo de datos o sea:
RANGO = Dato mayor Dato menor
El rango es una medida de dispersin que no se utiliza mucho, aunque su clculo
es muy rpido. Si analizamos el rango de los histogramas anteriores tenemos que;
En la primera poblacin A su rango es:
R = 8 1 = 8 (su rango o recorrido es 8)
En la segunda poblacin B se rango es:
R = 5 1 = 5 (su rango o recorrido es 5 )
Por lo tanto y como 8 > 5, podemos sealar con seguridad que los datos de la
primera poblacin A), est ms dispersa o desviados que los datos de la segunda
poblacin B).
MEDIDAS DE DISPERSIN PARA DATOS NO AGRUPADOS
DESVIACIN MEDIA, VARIANZA, DESVIACIN ESTANDAR O TPICA Y
COEFICIENTE DE VARIACIN, que son medidas de dispersin que tienen
relacin con la media aritmtica, y por sus propiedades algebraicas son las
de ms frecuente aplicacin y de mayor importancia.
PERO ANTES QUE NADA
QUE ES EL DESVO O DESVIACIN ?
El desvo de cada observacin (o dato) es la DIFERENCIA ENTRE LA
OBSERVACIN (o el dato) Y LA MEDIA ARITMTICA. El desvo es un concepto
fundamental que nos permitir comprender posteriormente otras medidas de
dispersin.
DESVIACIN MEDIA.:
La desviacin media es la media aritmtica de los valores absolutos (ignorando el signo)
de las desviaciones de cada elemento del conjunto de datos, es decir, hay que restar a la
media aritmtica cada valor del conjunto de datos, ignorando el signo, y sumamos todas
las diferencias para dividirlo entre el nmero total de datos.
Suma de los valores absolutos
Su formula es
Nmero de datos
La Desviacin Media MIDE LA DISPERSIN ALREDEDOR DEL PROMEDIO, mas que la
dispersin de ciertos valores, ya que el concepto de desviacin media se origina cuando
los desvos se toman en valor absolutos, eliminando as el efecto de que la suma de los
desvos (x
1
x = 0 ) que es igual a cero (o tiende a cero).
N
x x
dm
N
i
=
=
1
1
Otra forma de hacerlo, es elevar al cuadrado los desvos, por lo que surge la...
VARIANZA (S
2
) : Que es la media aritmtica (promedio) de los cuadrados de
los desvos y su frmula es la siguiente:
Suma de desvos al cuadrado
Nmero de datos
Sigamos el mismo ejemplo para calcular la varianza ( S
2
):
DESVIACIN ESTNDAR o TPICA ( S ): Es la raz cuadrada de la varianza (S
2
)
Tambin se puede definir como la raz cuadrada de la media aritmtica de los cuadrados
de los desvos.
En el mismo ejemplo tendramos lo siguiente:
Varianza (S
2
) fue igual a = 138.47 por lo tanto
Desviacin Estndar ( S ) = 138.47 = 11.77
Finalmente analicemos la medida de dispersin relativa llamada
COEFICIENTE DE VARIACIN ( C.V ): Es el resultado de la divisin de la desviacin
estndar entre la media aritmtica.
Este tipo de coeficiente es muy til para medir la DISPERSIN RELATIVA en base a la
desviacin estndar y la media y sirve bsicamente para comparar muestras distintas
en trminos numricos adimensionales, es decir, que mientras las dems medidas de
dispersin tienen unidades, el coeficiente de variacin carece de ellas.
Su formula es... C. V. = S ( Desviacin Estndar) .
X ( Media Aritmtica)
N
x x
S
N
i
=
=
1
2
1
2
) (
N
x x
S
2
1
) (
=
En el mismo ejemplo que estamos analizando, el coeficiente de variacin ser:
C. V = 11.77 . = 0.033
354.17
Tambin se puede expresar en porcentaje al multiplicar por 100 esto es, (0.033) (100) =
3.30%
C.V. = 3.30 %
RANGO INTERCUARTIL
El rango intercuartil es el resultado de la diferencia entre el tercer cuartil Q
3
y el primero
Q
1
, se expresa:
Rango intercuartil Q = Q
3
- Q
1
Cuando habindose aplicado la media aritmtica se quiere evitar la influencia de los
valores extremos, se analiza nicamente la situacin intermedia de la distribucin de
frecuencias aplicando el RANGO INTERCUARTIL.
El RANGO SEMIINTERCUARTIL o DESVIACIN CUARTIL, es la mitad del rango
intercuartil, se designa con Q
D
Rango semiintercuartil Q
D
= Q
3
- Q
1
2
Hagamos un ejemplo:
Calcular el rango intercuartil y la desviacin cuartil de los siguientes datos.
n = 12
Rango intercuartil Q = Q
3
Q
1
Q =88 76 = 12
Rango semiintrecuartil o Desviacin cuartil Q
D
= Q
3
Q
1
2
Q
D
=
12 = 6
2
El rango semiintercuartil (desviacin cuartil) mide la dispersin con mayor precisin que el
rango, sin embargo, presenta las limitaciones siguientes:
a) No toma en consideracin todos los valores de la distribucin de frecuencias y
puede suceder que los valores menores a Q
1
o superiores a Q
3
estn muy
compactos o muy dispersos, y el valor de Q sera el mismo.
b) No es posible, conociendo nicamente Q, hacer la ubicacin precisa de una
observacin dentro de la distribucin de frecuencias.
c) Igual que la mediana, no tiene propiedades que permitan su uso en las
relaciones matemticas que utiliza la estadstica
72 74 75 77 78 79 82 85 86 90 93 94
76
2
77 75
1
=
+
= Q 5 . 80
2
82 79
2
=
+
= Q 88
2
90 86
3
=
+
= Q
Percentiles
Percentil, en estadstica, parmetro que indica el porcentaje de individuos de una
distribucin que tienen un valor inferior a l. Es una medida de posicin.
Por ejemplo, el percentil 80, p
80
, es un nmero que supera al 80% de los datos de la
distribucin. Los percentiles tambin se llaman centiles.
RANGO ( R )= Es la diferencia del valor mayor menos el valor menor en un conjunto de datos y se
emplea de manera muy limitada, ya que es slo una apreciacin de la amplitud de los datos, y
presenta poca estabilidad; se usa, casi siempre que se requiera rapidez.
RANGO INTERCUARTIL ( Q ): es el resultado de la diferencia entre el tercer cuartil Q
3
y el primero
Q
1
. Su utilidad es baja y su valoracin respecto a la cantidad de datos que incluye en su aplicacin
en una distribucin normal es del 50 %
DESVIACIN MEDIA ( dm )= Es el promedio de los valores absolutos (ignorando signos) de las
desviaciones de cada dato; En sta prueba se pueden calcular los desvos tanto con la media
aritmtica como la mediana, segn convenga. Actualmente sta prueba casi no se usa. En una
distribucin normal, la cantidad de datos que incluye en su aplicacin es de aproximadamente el
58%.
VARIANZA ( S
2
) = Es el promedio de los cuadrados de los desvos y se utiliza en anlisis estadstico
avanzado, pero tiene el inconveniente de que sus unidades son las mismas de la variable al
cuadrao.
DESVIACIN ESTNDAR ( S ) = Es la raz cuadrada de la varianza o del promedio de los cuadrados
de los desvos. Es la ms importante de todas las medidas de dispersin ya que incluye ms o
menos el 68% de los trminos de una distribucin normal, adems por sus propiedades
algebraicas se utiliza con facilidad en el anlisis estadstico
COEFICIENTE DE VARIACIN ( CV ) = Es el cociente entre la desviacin estndar y la media
aritmtica. Generalmente se utiliza para comparar muestras distintas y saber cul tiene mayor o
menor dispersin en sus datos.