Escolar Documentos
Profissional Documentos
Cultura Documentos
Introducción
¿Comenzamos?
Objetivos:
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
Las medidas de tendencia central suelen llamarse promedios, y son el ‘valor típico’ en el sentido
de que se emplea a veces para representar todos los valores individuales de un conjunto de
datos. Es decir, las medidas de tendencia central dan un valor típico o representativo de un
conjunto de datos.
¿Qué medidas usaría usted para describir el valor central o para representar el conjunto de datos
en cada ejemplo? Hay muchas medidas de tendencia central que se usan para encontrar un
centro de un conjunto de datos. Tres son las más comunes: la media, la mediana, la moda y
debemos saber elegir qué medida utilizar para cada muestra o poblaciónl.
La mediana para el ejemplo del b), que es 78. Para los dos
últimos incisos, que son coches negros y ayudantes.
MEDIA
La media o promedio aritmético de un conjunto de números se
encuentra sumando los números y dividiendo después la suma
entre n, que es el tamaño de la muestra.
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
Las fórmulas que denotan las medias, tanto muestral como poblacional son:
x =
∑ xi =
∑ xi
n N
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
x =
∑ x i⋅f i = 4⋅183⋅192⋅201⋅21 = 190 =19
n 10 10
La media aritmética es el valor que tomaría la variable si estuviera uniformemente repartida entre
todos los individuos que forman la muestra (corresponde al concepto de centro de gravedad en
Física).
La media aritmética, o también media, considera todos los datos. Sin embargo, debido a que
todas las observaciones se emplean para el cálculo, el valor de la media puede afectarse de
manera desproporcionada por la existencia de valores extremos.
Ventajas de la media
Desventajas de la media
Aunque la media es confiable en el sentido de que toma en cuenta todos los valores del
conjunto de datos, puede verse afectada por valores extremos que no son representativos
del resto de los datos.
El cálculo se hace tedioso cuando trabajamos con una gran cantidad de valores diferentes.
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
MEDIANA
La mediana es, como su nombre lo indica, el valor medio o valor central de un conjunto
ordenado de observaciones. Cuando todas las observaciones se ordenan en forma creciente, la
mitad de éstas es menor que este valor y la otra mitad es mayor.
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
x o con Me.
La mediana se denota con
0 3 6 10 14 21 35
Como n=7, se ve fácilmente que Me=10. La interpretación es: en el 50% de los partidos se
anotó 10 puntos o menos y en el 50% de los partidos se anotó 10 puntos o más.
Si en el próximo juego anotaran 42, tendríamos la muestra:
0 3 6 10 14 21 35 42
con n=8 observaciones. Como ahora hay un número par de observaciones, los valores 10 y 14
ocuparán el lugar del medio y resulta que la mediana es 12, el promedio entre 10 y 14.
Ventajas de la mediana
Los valores extremos no afectan a la mediana tan intensamente como a la media.
La mediana es fácil de entender y se puede calcular a partir de cualquier tipo de datos
(excepto datos cualitativos nominales), incluso a partir de datos agrupados con clases de
extremo abierto, a menos que la clase mediana sea justamente una de las de extremo
abierto.
Desventajas de la mediana
Ciertos procedimientos estadísticos que utilizan la mediana son más complejos que
aquellos que utilizan la media.
Debido a que la mediana es una posición promedio, debemos ordenar los datos antes de
llevar a cabo cualquier cálculo, lo cual consume mucho tiempo si el conjunto de datos es
muy grande.
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
A: 1,2,2,2,3,78 B: 1,2,2,2,3,8
(tampoco la afectan valores extremos)
Interpretación: La moda, o el tipo de sangre más frecuente es el tipo A. Para estos datos
no tiene sentido usar la media o la mediana.
Ventajas de la moda
La moda, al igual que la mediana, se puede utilizar como una posición central para datos
tanto cualitativos como cuantitativos.
La moda no se ve mayormente afectada por los valores extremos. Incluso si los valores
extremos son muy altos o muy bajos, nosotros escogemos el valor más frecuente del
conjunto de datos como el valor modal. Podemos utilizar la moda sin importar qué tan
grandes o qué tan pequeños sean los valores del conjunto de datos, e independientemente
de cuál sea su dispersión.
Podemos calcular la moda aun cuando una o más clases sean de extremo abierto.
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
Intervalos xi fi Fi
Media aritmética
Para datos agrupados basta con extender la definición, considerando a los xi como los puntos
medios de cada intervalo, también llamados marca de clase, y siendo las fi, las frecuencias
absolutas correspondientes a cada clase (es algo parecido a calcular la media utilizando la suma
del producto de frecuencias por observación).
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
Intervalos xi fi Fi
[149 , 154) 151,5 4 4
[154 , 159) 156,5 3 7
[159 , 164) 161,5 18 25
[164 , 169) 166,5 7 32 → Clase mediana
[169 , 174) 171,5 16 48
[174 , 179) 176,5 8 56
[179 , 184] 181,5 4 60
n=60
n
– F ant Me
2
Me=lim inf long⋅
f me
Siendo:
lim inf : límite inferior de la clase mediana.
F ant Me : frecuencia acumulada correspondiente a la clase anterior a la clase mediana.
f Me : frecuencia absoluta correspondiente a la clase mediana.
long : longitud de la clase mediana.
n : tamaño de la muestra.
n 60
– F ant Me −25
Luego, 2 2
Me =lim inf long⋅ =1645⋅ =167,57 cm
f me 7
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
La mediana puede calcularse a partir del gráfico de la distribución acumulativa (ojiva), aunque en
forma aproximada.
Es conveniente realizar la ojiva colocando en ordenadas la frecuencia acumulada porcentual.
Ubicar el 50% y ver a qué valor de abscisa corresponde.
120%
100%
80%
60%
40%
20%
0% //
159 144 149 154 159 164 169 174 179 184 189 194 199 204
Mediana
En Excel, tenemos la función mediana(), que devuelve la mediana de un conjunto de datos.
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
Intervalos xi fi Fi
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
Los estadísticos de orden o medidas de posición no centradas, son aquellos valores numéricos
que nos indican su posición en el conjunto de datos ordenados, pues una fracción dada de los
datos presenta un valor de la variable menor o igual que el estadístico.
Si una serie de observaciones se colocan en orden creciente, el valor que divide al conjunto de
datos en dos partes iguales es la mediana. Por extensión, si preferimos tener una descripción más
detallada de la variabilidad de los valores individuales, se puede dividir los datos en otra cantidad
de partes iguales. Por ejemplo, en cuatro, en diez o en cien partes iguales, llamando a estas
medidas cuartiles, deciles y percentiles, respectivamente.
Gráficamente:
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
Deciles
Al dividir los datos en diez partes iguales, quedan definidos los deciles: D1, D2, ..., D9.
La fórmula para obtener el lugar del k-ésimo decil, siendo n el número de observaciones, es:
ºDk = k.(n+1)/10 y así, buscando en la lista ordenada de los valores o en la columna de
la frecuencia acumulada, se ve el valor de la variable correspondiente. En caso que ºD k no
sea un valor entero se calcula por interpolación lineal el valor del decil.
La mediana es el decil 5.
Por ejemplo, el decil 4 (D4) es el valor que deja por debajo de él, el 40% de los valores y por
encima de él, el 60%.
Percentiles
Al dividir los datos en cien partes iguales, quedan definidos los percentiles: P1, P2, ..., P99.
La fórmula para obtener el lugar del k-ésimo percentil, siendo n el número de observaciones,
es: ºPk = k.(n+1)/100 y así, buscando en la lista ordenada de los valores o en la
columna de la frecuencia acumulada, se ve el valor de la variable correspondiente. En caso
que ºPk no sea un valor entero se calcula por interpolación lineal el valor del percentil.
La mediana es el percentil 50.
El primer cuartil es el percentil 25.
El tercer cuartil es el percentil 75.
El cuarto decil es el percentil 40.
El ...................... decil es el percentil 70.
El octavo decil es el percentil ........ .
El percentil 82 (P82) es el valor que deja por debajo de él, el 82% de los valores y por
encima de él, el 18%.
Para calcular los valores de los estadísticos de orden, lo hacemos en Excel, con las funciones
cuartil() y percentil().
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
Interpretación Q1: "El 25% de las observaciones presenta una altura de 160 cm o menos y el
75% de las observaciones presenta una altura de 160 cm o más".
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
Para completar en la fórmula, debemos dividir el percentil por 100. por ejemplo el
percentil P30,se ingresa con la fórmula: =PERCENTIL(B7:C36;0,3)
Interpretación P30: "El 30% de las observaciones presenta una altura de 161,9 cm o menos y el
70% de las observaciones presenta una altura de 161,9 cm o más".
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009
Equipo docente
Tecnicatura Superior en Higiene y Seguridad. Universidad Tecnológica Nacional Facultad Mendoza. Cohorte 2009