Escolar Documentos
Profissional Documentos
Cultura Documentos
DE LOS DATOS
MEDIDAS DE CORRELACIÓN
MÓDULO 2
Figura 2.1
2. Medidas de Dispersión
4. Coeficiente de Correlación
5. Recta de Regresión
Estadística Sumaria
Rango
Media Aritmetica Rango Intercuartil
Varianza
Mediana
Desviación Estándar
Moda Coeficiente de Variación
Estadística Sumaria
Tendencia Central
Llamados “Promedios”.
Promedios principales:
Media aritmética simple
Media ponderada
Media geométrica
Media Armónica Figura 2.2
Mediana
Moda
Figura 2.2. Imagen tomada de “El banquero colega”, por Rafa. Recuperado de
http://rafabatallitas.blogspot.pe/2011_11_01_archive.html
Media Aritmética Simple
Todo conjunto de variables posee una media.
Incluye a todos los valores.
Es única.
Suma de las desviaciones de cualquier valor y la media es cero.
-2
-1 +3
(Adaptado de Lind et al., 2012, p. 59-60)
1 2 3 4 5 6 7 8 9
Figura 2.3. Tomado de “La media como punto de equilibrio”, por Lind et al., 2012, Estadística aplicada a los
negocios y la economía (15ª ed.), p.61. Copyright 2012 por Mc Graw Hill.
Media Aritmética
Ventajas:
- Concepto familiar para muchas personas
- Es única para cada conjunto de datos
- Es posible comparar medias de diferentes muestras
Desventajas:
- Se ve afectada por los datos extremos.
1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Media = 3 Media = 4
(Levin & Rubin, 2004, p. 65)
Media Ponderada
Media aritmética en la
cual se considera a cada
uno de los valores de las
variables de acuerdo con
su importancia relativa
en el grupo.
No es afectada por
valores extremos.
Datos Agrupados
mediana
5 datos menores 5 datos mayores
Interpretación:
Durante 5 días se atendieron a menos de 11 clientes, y
durante 5 días se atendieron a más de 11 clientes.
Mediana
Reglas
1.- Si la serie es impar, la mediana ocupa el lugar central de
la serie previamente ordenada.
Ejemplo:
5, 10, 10, 12, 15, 17, 20, 21, 24
mediana
Mediana
Ventajas:
Los valores extremos no afectan a la mediana como
en el caso de la media aritmética.
Es fácil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos.
Desventajas:
Como valor central, se debe ordenar primero la serie
de datos.
(Levin y Rubin, 2004, p. 80)
Moda
Valor que más se repite en
un conjunto de datos.
Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15
UNIMODAL
Desventajas:
No tiene un uso tan frecuente como la media.
OBSERVACIÓN DATOS
22, 24, 25, 26, 27, 28,
EDAD 28, 29, 30, 31, 33, 34
Dispersión
Información sobre la
variabilidad de los datos.
Mismo centro,
Diferente variación
Rango o Recorrido
Diferencia entre el valor
mayor y el valor menor
Datos No Agrupados de un conjunto de datos.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Rango = 14 - 1 = 13
Datos Agrupados
Muestra
Unidades originales.
Población
Permite medir el % de
elementos dentro de
intervalos de una curva
simétrica.
Muestra
Puntaje estándar (Z).
Datos B
Media = 15.5
s = 0.9258
11 12 13 14 15 16 17 18 19 20 21
Datos C
Media = 15.5
s = 4.57
11 12 13 14 15 16 17 18 19 20 21
Puntaje o Resultado Estándar (Z)
-3 -2 -1 +1 +2 +3
Z
-3 -2 -1 0 +1 +2 +3
68%
95% 99.7%
2 3
34.13% 34.13%
13.60% 13.60%
2.135% 2.135%
0.135% 0.135%
-3 -2 -1 +1 +2 +3
68.26%
95.46%
99.73%
Figura 2.10.
Figura 2.10.
Adaptado de “Usos de la desviación estándar”, por Levin & Rubin, 2004,
Estadística para administración y economía (7a ed.), p.98. Copyright 2004 por Pearson Prentice Hall.
Coeficiente de Variación
Comparación de distribuciones.
Muestra
CV Grado de Variabilidad
0 < CV < 10 Datos muy homogéneos
10 ≤ CV < 15 Datos regularmente homogéneos
15 ≤ CV < 20 Datos regularmente variables
20 ≤ CV < 25 Datos variables
CV ≥ 25 Datos muy variables
Medidas de Simetría y Curtosis
Evalúa como están concentradas las observaciones.
Coeficientes:
- de Asimetría
- de Curtosis
Coeficiente de Simetría
y Curtosis de Fisher
Simetría Curtosis
Tercer momento Cuarto Momento
Simétrica = 0 Mesocúrtica = 0
∑ ni = 1 ( x i x ( 3 ∑ ni = 1 ( x i x ( 4
sk = k = 3
(n 1(s 2 (n 1(s 4
Coeficiente de Simetría
Establece si una distribución es simétrica o no.
No tiene unidades
Simétrica y y
Frecuencia
Frecuencia
y (cero sesgo)
Sesgada Sesgada a la derecha
Frecuencia
x
x x
Media = 20 Años
Fuerza de Ingreso semanal
Mediana = 20 tensión
Moda = 20 Moda Mediana Media
Media Mediana Moda $300 $500 $700
2 600 2 600 3 000
Figura 2.11.
Figura 2.11. Tomado de “Posiciones relativas de la media, la mediana y la moda”, por Lind et al., 2012, Estadística
aplicada a los negocios y la economía (15a ed.), pp.70-71. Copyright 2012 por Mc Graw Hill.
Coeficiente de Curtosis
Grado de concentración con relación a la media
aritmética.
Sin unidades.
Gráfico
- Diagrama de dispersión.
- Trazar una recta que trate de unir los puntos.
- Ventaja: simple y directo.
- Desventaja: procedimiento subjetivo.
16
14
12
X 3 1 2 5 4 10
8
6
Y 9 5 7 14 10 4
2
0
0 1 2 3 4 5 6
Análisis de Regresión Simple
Mínimos cuadrados
- Técnica para encontrar la ecuación de regresión
minimizando la suma de los cuadrados de las
distancias verticales entre los valores observados
y los estimados (recta) de Y.
- Hallar los coeficientes de regresión a y b.
-Ecuaciones Normales.
14
Y
12 * Y’
10
Valor Y’=2.7+2.1X
8 Efectivo * Valor
6 Estimado
4
0 1 2 3 4 5
Análisis de Regresión Simple
Error estándar de estimación
Mide la disparidad (dispersión) promedio entre los
valores observados y los valores estimados de Y.
Es el mismo signo de b.
Coeficiente de Correlación (r)
Correlación Correlación
Negativa Positiva
Moderna Moderna
-1 0.5 0 0.5 1
Figura 2.13
Figura 2.13 Adaptado de “Coeficiente de correlación”, por Lind et al., 2012,
Estadística aplicada a los negocios y la economía (15ª ed.), p.465. Copyright 2012 por Mc Graw Hill.
Coeficiente de Correlación (r)
Y Y Y
X X X
r = -1 r = -.6 r=0
Y Y Y
X X X
r = +1 r = +.3 r=0
Variaciones
14
Y Variación no
12 * Explicada Y’
10
Valor
8 Total *
6 Variación
Explicada
4
0 1 2 3 4 5
Coeficiente de Determinación (r 2)
Proporción de la variación total en la variable
dependiente (Y) que se explica o contabiliza por
variación de la variable dependiente X.
Interpretación
Si se selecciona al azar un mes entre enero y mayo, se
espera que las ventas se hayan incrementado 2.72% con
respecto al mes anterior.
Media Geométrica
Suponga que usted tiene un ingreso de $3000.00 y
recibe 5% de incremento salarial este año y 15% de
incremento el siguiente.
8 8 - 10 = 2 4
10 10 - 10 = 0 0
5 5 - 10 = 5 25
12 12 - 10 = 2 4
10 10 - 10 = 0 0
15 15 - 10 = 5 25
Varianza
2
Artículos vendidos
1 9 3 81 9 27
2 5 1 25 1 5
3 7 2 49 4 14
4 14 5 196 25 70
5 10 4 100 16 40
∑Y= 45 ∑X= 15 ∑Y2= 451 ∑X2= 55 ∑XY= 156