Escolar Documentos
Profissional Documentos
Cultura Documentos
PROFESOR: HINCHO C. T.
MEDIDAS DE TENDENCIA CENTRAL
x
x + x , +... + xn i =1 i
x = M ( x) = 1 2 =
n n
PROFESOR: HINCHO C. T.
MEDIA DE LA POBLACIÓN.- La media aritmética de una población finita de N elementos
x1 + x2 , +... + xN
xi
= = i =1
N N
y1 f1 + y2 f 2 , +... + ym f m y f
yi fi i i
y = M ( y) = = i =1m = i =1
f
n n
i
i =1
𝐾
𝑖 𝑋𝑖 ∗𝑛𝑖
MEDIA PARA DATOS
AGRUPADOS
𝑋=
PROFESOR: HINCHO C. T.
𝑛
Algunas propiedades de la media aritmética:
-Son tomados en cuenta los valores de todas las observaciones del conjunto de datos.
-La media puede ser afectado por valores extraños o atípicos (extremos) que no son representativos del
comportamiento de la variable.
-No se puede calcular la media para un conjunto de datos agrupados en intervalos donde el último
intervalo no tiene límite superior
PROFESOR: HINCHO C. T.
LA MEDIANA.-Dado un conjunto de n observaciones x 1 , x2 , ..., xn
x, xme , Me, Me ( x )
La mediana la denotaremos indistintamente como:
valor central
Posición 1 2 3 4 5 6 7 8 9
datos ordenados 24 25 35 37 38 39 40 41 42
PROFESOR: HINCHO C. T.
a. Si el número de observaciones es par, en este caso, después de ordenado los
datos, existen dos valores centrales x( n / 2) y x(n / 2+1) en este caso se toma
como mediana la semisuma de ambos valores. Es decir:
x( n / 2) + x(n / 2+1)
Me ( x ) =
2
Ejemplo: Suponiendo que se considerara un nuevo salón de 28 alumnos
adicional en el ejemplo anterior Hallar la mediana de este nuevo conjunto de
datos.
Solución:
Como ahora son 10 datos la mediana se encontrara promediando los datos de
la posición 5 y 6
centrales
valores
Posición 1 2 3 4 5 6 7 8 9 10
datos ordenados 24 25 28 35 37 38 39 40 41 42
PROFESOR: HINCHO C. T.
MODA
Algunas características de la moda son:
RESOLVER EN CLASE sea las calificaciones : 13.2 12.5 14.0 15.2 19.0 14.5
16.5 17.8 18.0 18.4 11.6 14.2 08.6 15.2 09.5 17.0 determinar la media, mediana
y moda
PROFESOR: HINCHO C. T.
EJEMPLO PARA MEDIA AGRUPADA
•Una Macroempresa decide aplicar un test de puntuaciones para evaluar a sus empleados.
Los resultados se muestra en la siguiente tabla de frecuencias, con amplitud variado:
Puntuaciones Núm.De
INTERVALO empleados
0,30 94
30,50 140
50,70 160
70,90 98
90,100 8
PROFESOR: HINCHO C. T.
TABLA 2.1 Distribución de frecuencias discreta de números de hijos por
familia
yi fi yi f i
0 3 0
1 4 4
2 8 16
3 6 18
4 2 8
total 23 46
CALCULAR: m
-media y f i i
46
-mediana y = M ( y) = i =1
= =2
n 23
-moda
INTERPRETACION:
El número promedio de hijos por familia es de 2 hijos por familia.
PROFESOR: HINCHO C. T.
MEDIANA PARA DATOS AGRUPADOS
PROFESOR: HINCHO C. T.
FORMULA PARA MEDIANA PARA DATOS
AGRUPADOS
Utilizar la formula:
n
2 − FJ −1
Me = y ' j −1 + c j
FJ − FJ −1
Donde:
y ' j −1 = limite inferior de la clase mediana
c j = amplitud de la clase mediana
FJ = frecuencia absoluta acumulada de la clase mediana
n = número de observaciones
PROFESOR: HINCHO C. T.
Determinar la media, mediana y moda para la tabla siguiente
Datos que representan las horas extras de un grupo de empleados
[ 11 - 21 ) 16 5 5 0,09 0,09 9%
[ 21 - 31 ) 26 21 26 0,37 0,46 37%
[ 31 - 41 ) 36 8 34 0,14 0,6 14%
[ 41 - 51 ) 46 14 48 0,25 0,85 25%
[ 51 - 61 ) 56 3 51 0,05 0,9 5%
[ 61 - 71 ) 66 4 55 0,07 0,97 7%
[ 71 - 81 ) 76 2 57 0,03 1 3%
TOTAL n = 57 1 100%
PROFESOR: HINCHO C. T.
MODA PARA DATOS AGRUPADOS
en una distribución de frecuencias, es el valor de la variable que viene afectada por la máxima
frecuencia de la distribución. En distribuciones no agrupadas en intervalos se observa la
columna de las frecuencias absolutas, y el valor de la distribución al que corresponde la mayor
frecuencia será la moda.
PROFESOR: HINCHO C. T.
MODA PARA DATOS AGRUPADOS
1
Moi = y ' j −1 + c j
1 + 2
Donde:
y ' j −1 = límite inferior de la clase modal
1 = f j − f j −1
2 = f j − f j +1
f j = Frecuencia absoluta de la clase modal
f j −1 = Frecuencia absoluta de la clase pre modal
f j +1 = Frecuencia absoluta de la clase pos modal
c j = amplitud de la clase modal
PROFESOR: HINCHO C. T.
LOS DATOS REPRESENTAN LAS CALIFICACIONES DEL CURSO DE ESTADISTICA . CLASIFICADOS POR SEXO
GRUPO DE MUJERES: 13.5 12.5 14.0 11.0 19.5 14.5 16.5 17.5 18.0 18.5 11.5 16.0 06.0
15.5 09.5 17.0
GRUPO DE VARONES : 16.5 12.0 14.0 14.5 19.0 15.0 09.5 17.5 18.0 18.5 11.5 14.5 08.0
15.5 10.5 19.0
PROFESOR: HINCHO C. T.
⚫ TABLA 03 :
La tabla muestra las ventas en un día en la cafetería.
Medidas de asimetría
La asimetría: nos indica hacia qué lado están más agrupados los datos,
y en general , también nos señala el posible sesgo, existen asimetrías
positivas y asimetrías negativas.
Se puede determinar con un valor llamado coeficiente asimétrico y
existen varias formulas.
PROFESOR: HINCHO C. T.
RELACION DE LAMADIA, MEDIANA Y MODA
PARA DETERMINAR LA ASIMETRIA
PROFESOR: HINCHO C. T.
COEFICIENTE ASIMETRICO
El Coeficiente de Pearson:
PROFESOR: HINCHO C. T.
MEDIDA SIMETRICA
PROFESOR: HINCHO C. T.
MEDIDA ASIMETRICO
PROFESOR: HINCHO C. T.
KURTOSIS
KURTOSIS O APUNTAMIENTO
PROFESOR: HINCHO C. T.
KURTOSIS
PROFESOR: HINCHO C. T.
KURTOSIS
Medida de Fisher
Para datos sin agrupar se emplea la siguiente fórmula:
PROFESOR: HINCHO C. T.
CUARTILES ( MEDIDAS DE POSICION)
PROFESOR: HINCHO C. T.
PROFESOR: HINCHO C. T.
PROFESOR: HINCHO C. T.
EJEMPLO 1.- Determinar los cuartiles de los salarios anuales de jefes de
ventas
34.500 30.700 32.900 36.000 34.100 33.800 32.500
SOL: Los ordenamos de menor a mayor:
30.700 32.500 32.900 33.800 34.100 34.500 36.000
LUEGO:
Q1 = x 7 +1 = x( 2 ) = 32, 500
4
Interpretación:
Q1 : El 25 por ciento de los salarios anuales de los jefes de venta es inferior a
32,500
Q2 : El 50 por ciento de los salarios anuales de los jefes de venta es inferior a
33,800
Q3 : El 75 por ciento de los salarios anuales de los jefes de venta es inferior a
34,500
PROFESOR: HINCHO C. T.
a. DETERMINACIÓN DE LOS CUARTILES PARA DATOS
AGRUPADOS:
En el caso de que los datos estén agrupados en clases determinaremos los
cuartiles como sigue:
Para hallar Q1 :
n
i. Calcular .
4
ii. Por las frecuencias Absoluta acumuladas se identifica a la
clase que contiene a Q1 , esto es la clase para la cual se
cumple:
n
FJ −1 FJ
4
Con lo cual Q1 estará en la clase que tiene como frecuencia
acumulada FJ
n
− FJ −1
Q1 = y ' j −1 + c j 4
FJ − F J −1
PROFESOR: HINCHO C. T.
Para hallar Q2: se divide ( 2n / 4 ) es equivalente a la mediana
Para hallar Q3 :
3n
i. Calcular .
4
3n
− FJ −1
Q3 = y ' j −1 + c j 4
FJ − FJ −1
PROFESOR: HINCHO C. T.
EJEMPLO:
1. Una Macroempresa decide aplicar un test para evaluar a sus empleados. Los
resultados son resumidos en la siguiente tabla de frecuencias:
Puntuaciones Núm. De
empleados
0, 30
94
30, 50
140
50, 70
160
70, 90
98
90,100
8
Sol.
Procedimiento para hallar Q1
500
i. Calcular la posición de orden = 125 . Como la variable es tratada como
4
“continua” no nos preocupamos si n es par o impar.
PROFESOR: HINCHO C. T.
Intervalo yi fi Fi
0 30 15 94 94
30 50 40 140 234 Clase que contiene a Q1
50 70 60 160 394
70 90 80 98 492
90 100 95 8 500
i. Utilizando la formula:
n 500
− FJ −1 4 − 94
Me = y ' j −1 + c j 4 = 30 + 20 = 34.428
F − F
J J −1 234 − 94
Interpretación:
El 25 por ciento de los trabajadores tienen notas inferiores a 35 puntos, en un test de
evaluación de 100 puntos, de un total de 500 empleados.
PROFESOR: HINCHO C. T.
Procedimiento para hallar Q2
El valor de Q2 siempre es igual al de la mediana y tiene la misma interpretación.
3(500)
i. Calcular la posición de orden = 375 . Como la variable es tratada como
4
“continua” no nos preocupamos si n es par o impar.
PROFESOR: HINCHO C. T.
DIAGRAMA DE CAJAS Y BIGOTES.
Los diagramas de Caja-Bigotes (box-plots o box and whiskers) son una
presentación visual que describe varias características importantes, al
mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y
máximo de los datos, sobre un rectángulo, alineado horizontal o
verticalmente.
PROFESOR: HINCHO C. T.
PROFESOR: HINCHO C. T.
Diagrama de Tallos y Hojas
Profesor: Hincho C. T.
PERCENTIL
i.n
100 − FJ −1
Pi = y ' j −1 + c j
FJ − FJ −1
Profesor: Hincho C. T.
Centiles o Percentiles ( Pi)
Los percentiles son los 99 valores que dividen la serie de datos
en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%...
y al 99% de los datos.
P50 coincide con la mediana.
Profesor: Hincho C. T.
LAS MEDIDAS DE DISPERSIÓN.-
Muestra la variabilidad de una distribución de los datos en estudio, indicando por medio
de un valor, si las puntuaciones de una variable están muy alejadas de la media. Cuanto
mayor sea ese valor entonces mayor será la variabilidad.
cuanto menor sea y más homogénea las observaciones respecto a la media, menor será
la variabilidad de los datos.
Varianza Poblacional
La varianza (también denominada variancia, aunque esta denominación es menos
utilizada) es una medida estadística que mide la dispersión de las observaciones
respecto a un valor central (media).
Suele ser representada con la letra griega σ o una V (x) cuando la variable en estudio es
X . y se refiere a una población.
Profesor: Hincho C. T.
Para muestra Para muestra
n ≤ 30 𝑠𝑒 𝑑𝑖𝑣𝑖𝑑𝑒 𝑒𝑛𝑡𝑟𝑒 ( 𝑛 − 1) n > 30 𝑠𝑒 𝑑𝑖𝑣𝑖𝑑𝑒 𝑒𝑛𝑡𝑟𝑒 ( 𝑛)
EJEMPLO:
EDAD (aula – «A» ): 21 17 23 19 20 19 18 17 21
EDAD (aula – «B» ): 18 21 16 23 19 20 26 18 17
DETERMINAR LA VARIANZA ?
COEFICIENTE DE VARIACIÓN
En estadística el coeficiente de variación (de Pearson), es una medida de dispersión útil para
comparar dispersiones a escalas distintas pues es una medida invariante ante cambios de
escala. Sirve para comparar variables o grupos generalmente a escalas iguales que
pueden estar correlacionadas estadísticamente y sustantivamente con un factor en común. Es
decir, ambas variables tienen una relación causal con ese factor. Su fórmula expresa la
desviación estándar como porcentaje de la media aritmética, mostrando una mejor
interpretación porcentual del grado de variabilidad que la desviación típica o estándar. Por
otro lado presenta problemas ya que a diferencia de la desviación típica este coeficiente es
variable ante cambios de origen.
Profesor: Hincho C. T.
Por ello es importante que todos los valores sean positivos y su media de por tanto un
valor positivo. A mayor valor de C.V. mayor heterogeneidad de los valores de la
variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele
representarse por medio de las siglas C.V..
Exigimos que:
Se calcula:
S
C.V . = x100
X
Profesor: Hincho C. T.
Determinar la varianza para los datos no
agrupados
Ejemplos 02:
1) Sean las calificaciones de un curso de especialidad
Grupo A: 10, 12, 09, 15, 16, 11, 17, 12, 10, 19, 08, 14, 12, 13, 09, 18, 14
Grupo B: 12, 14, 09, 16, 10, 18, 11, 17, 13, 16, 10, 15, 06, 13, 20, 17, 15
Profesor: Hincho C. T.
Frecuencia Frecuencia Frecuencia
Frecuencia Frecuencia
Intervalos de clase Marca de clase Absoluta Relativa Relativa
Absoluta Relativa
Acumulada Acumulada Porcentual
[ Yj- i - Yj )
Xj nj Nj hj Hj hj%
[ 11 - 21 ) 16 5 5 0,09 0,09 9%
[ 21 - 31 ) 26 21 26 0,37 0,46 37%
[ 31 - 41 ) 36 8 34 0,14 0,6 14%
[ 41 - 51 ) 46 14 48 0,25 0,85 25%
[ 51 - 61 ) 56 3 51 0,05 0,9 5%
[ 61 - 71 ) 66 4 55 0,07 0,97 7%
[ 71 - 81 ) 76 2 57 0,03 1 3%
TOTAL n = 57 1 100%
Ejemplo 03:
Determinar la varianza para los datos agrupados
Profesor: Hincho C. T.
TAREA 2:
Teniendo en cuenta los datos del archivo EVALUACIÓN PROFESIONALES.sav (laboratorio n 3)
que corresponde a un estudio echo en base a una muestra de 200 profesionales, se construyo la
siguiente tabla para la variable ESTATURA:
Tabla Nº 01
Profesor: Hincho C. T.
PROFESOR: HINCHO C. T.