Escolar Documentos
Profissional Documentos
Cultura Documentos
Profesor:
Ing. Luis Alberto Sánchez Alvarado
1
Para ilustrar la forma de trabajo del análisis de regresión
múltiple se usará el siguiente caso
2
Todo análisis de regresión múltiple incluye una secuencia de
análisis la cual esta dado por:
Diseño de la investigación
Validación y presentación de
resultados
3
Objetivo: Es el punto de partida de toda investigación de análisis multivariado
Diseño de la investigación
Validación y presentación de
resultados
4
Objetivos …
5
Diseño de la investigación: Se debe analizar el tamaño de muestra ideal y la forma
como recoger la información de las variables
Diseño de la investigación
Validación y presentación de
resultados
6
Diseño de la investigación : El tamaño de muestra es quizás el factor más influyente
bajo control del investigador
Variables independientes: 3
Procedimiento por pasos: SI
7
Diseño de la investigación : La forma como se debe plantear el modelo es del
siguiente:
Inversión publicitaria
En TV
Inversión publicitaria
VENTAS
En Radio
Inversión publicitaria
En Web
8
Estimación del modelo: Tomando en cuenta las variables seleccionadas se
comienza a analizar la relación entre ellas
Diseño de la investigación
Validación y presentación de
resultados
9
Estimación del modelo : El modelo de regresión describirá la relación entre la
variable dependiente y el conjunto de variables independientes
Modelo de Regresión:
𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 … + 𝛽𝑘 𝑥𝑘 + 𝜖
Variable
dependiente,
criterio o a explicar.
Parámetro del
modelo :Término
constante. Parámetros del
modelo: Variables
Error: Variable
independientes,
aleatoria que da
predictoras o
cuenta sobre
explicativas
variabilidad que no
puede ser
explicada por la
relación de y e X
10
Estimación del modelo : Con el valor medio de “y” y sus respectivos “x” se logra
tener la ecuación de regresión múltiple y luego con muestras se obtiene la
ecuación estimada
Ecuación de Regresión:
𝐸(𝑦) = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 … + 𝛽𝑘 𝑥𝑘
Ecuación de Regresión ESTIMADA:
𝑦 = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2 … + 𝑏𝑘 𝑥𝑘
Estadísticos Muestrales: Variables
independientes, predictoras o explicativas
11
Estimación del modelo : En la aplicación el modelo quedará establecido por la
relación entre la ventas y los gastos en publicidad
Variable
dependiente,
criterio o a explicar.
Parámetro del
modelo :Término
constante. Parámetros del
modelo: Variables
Error: Variable
independientes,
aleatoria que da
predictoras o
cuenta sobre
explicativas
variabilidad que no
puede ser
explicada por la
relación de y e X
12
Para encontrar la ecuación que mejor se ajuste a los resultados se usa la
metodología de MINIMOS CUADRADOS, con la cual se busca minimizar el error
ESTIMACIÓN DE LOS
PARÁMETROS:
𝐸𝑟𝑟𝑜𝑟 = 𝑦𝑖 − 𝑦𝑖
𝑀𝑖𝑛𝑖𝑚𝑖𝑧𝑎𝑟 (𝑦𝑖 − 𝑦𝑖 )2
𝑖=1
𝑦 = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2 … + 𝑏𝑘 𝑥𝑘
13
Durante el análisis es necesario hacer pruebas de significancia tanto global como
individuales
Significancia global
Prueba F(k,n-k-1)
Se rechazará Ho si Sig <0.05
Significancia individual
Prueba T(n-k-1)
Se rechazará Ho si Sig <0.05
14
En el ejemplo…
15
Se selecciona las variables dependientes e independientes
16
Primero se prueba la significancia global
17
Primero se prueba la significancia global
Al plantear la prueba de hipótesis para cada uno de las variables se nota que la
variable Inversión publicitaria Web es NO significativa por lo que debería retirarse del
modelo.
Correr nuevamente el análisis de regresión pero sin tomar en cuenta esta variables.
18
Bondad de ajuste ….
19
El modelo estará dado por …
20
Supuestos del análisis de regresión: Ayudarán a garantizar la validez del modelo
Diseño de la investigación
Validación y presentación de
resultados
21
Para garantizar el análisis se debe cumplir con los supuestos
Linealidad No colinealidad
Independencia
22
Linealidad:
Linealidad No colinealidad
Independencia
23
Linealidad: La relación entre la variable dependiente y cada una de las
independientes debe ser una relación lineal
Gráfico de
dispersión Correlación Satisfacción General
Variable x1 0.86
Variable x2 0.68
Satisfacción General
Variable x3 0.65
Satisfacción
Funcionario de Negocio
24
Linealidad: En el ejemplo de ventas …
25
Linealidad: En el ejemplo de ventas …
26
Linealidad: En el ejemplo de ventas …
27
Linealidad: En el ejemplo de ventas …
28
Linealidad: En el ejemplo de ventas …
En estos gráficos también se puede ver que la relación toma una forma lineal , por
lo cual cumple el supuesto de linealidad.
29
Linealidad: Pero se puede demostrar la linealidad también
usando correlaciones
30
Linealidad: Pero se puede demostrar la linealidad también
usando correlaciones
31
Linealidad: Pero se puede demostrar la linealidad también
usando correlaciones
32
No colinealidad:
Linealidad No colinealidad
Independencia
33
Este supuesto implica que no debe existir una relación lineal fuerte entre las
variables independientes. Si no cumple se tiene multicolinealidad
34
La primera forma de probarlo es mediante el cálculo de las correlaciones
35
La segunda forma de probar este supuesto es con el índice de tolerancia
36
La tolerancia en SPSS…
Se puede apreciar que para ambas variables la tolerancia está por encima de 0.2, por
lo que se puede decir que la multicolinealidad no existe y el supuesto se da por
cumplido.
37
Normalidad:
Linealidad No colinealidad
Independencia
38
Normalidad: Los errores deben seguir una distribución normal, es el supuesto más
importante
distribución normal
39
Lo primero que se debe obtener son los residuo y los valores pronosticados.
La secuencia es la siguiente :
40
Las variables son creadas…
41
Se debe hacer la prueba de normalidad para el “error” o los “residuales” …
La secuencia es:
42
Se debe hacer la prueba de normalidad para el “error” o los “residuales” …
En este caso dado que el Sig. Es mayor a 0.05, se puede decir que los errores tienen una
distribución normal.
43
Media cero:
Linealidad No colinealidad
Independencia
44
Residuos con media cero : Permitirá garantizar que los pronósticos de alguna
forma son aleatorios
𝐻0 : 𝜖 ≠ 0
0
45
El histograma tiene como media cero:
46
La segunda prueba es usando una prueba de hipótesis de
medias:
La secuencia es:
47
La segunda prueba es usando una prueba de hipótesis de
medias:
Ho: La media de los errores es cero.
Los resultados indican que se acepta H0 y la media de los errores es igual a cero.
48
Homocedasticidad:
Linealidad No colinealidad
Independencia
49
Varianza constante de los errores (Homocedasticidad):
Valores pronosticados
50
La primera forma de probar la varianza constante es usando gráficos de correlación
entre los valores pronosticados y residuos estandarizados.
La secuencia es …
51
Para que cumpla este supuesto los puntos deben repartirse en forma constante…
Como se puede ver los puntos se reparten a través de la franja con lo que se
puede decir que el supuesto se cumple
52
La otra forma es usando Levene…
53
La otra forma es usando Levene…
Luego se hace una prueba de ANOVA para poder ejecutar la prueba de Levene …
54
La otra forma es usando Levene…
Ho: Las varianzas de los errores son igual en todos los grupos (Homocedasticidad)
55
Independencia:
Linealidad No colinealidad
Independencia
56
La independencia , esta relacionado con la aleatoriedad de los errores
Este supuesto se usa sobre todo cuando de tiene series temporales, un estadístico
para este fin es Durbin Watson que proporciona información sobre el grado de
independencia existente entre los errores:
57
La independencia , esta relacionado con la aleatoriedad de los errores
La secuencia es :
El DW en este caso es
igual a 2, por lo tanto el
supuesto se da por
válido:
58
Interpretación del resultado teórico: Se debe revisar si las relaciones encontradas
tienen coherencia con la realidad
Diseño de la investigación
Validación y presentación de
resultados
59
¿Cómo es explicado las ventas? ¿Quién tiene un impacto mayor sobre las ventas?
Coeficientes
Coeficientes no estandarizados tipificados
Se puede leer, que las ventas es explicado un 64% por la publicidad en radio y un
36% por la publicidad en TV.
60
Gráficamente sería
Inversión publicitaria
En TV
(36%)
VENTAS
Inversión publicitaria
En Radio
(64%)
61
Interpretación del resultado teórico: Se debe revisar si las relaciones encontradas
tienen coherencia con la realidad
Diseño de la investigación
Validación y presentación de
resultados
62
Este paso es opcional y se hace sobre todo cuando se tiene una muestra grande
63
Este paso es opcional y se hace sobre todo cuando se tiene una muestra grande
64
Este paso es opcional y se hace sobre todo cuando se tiene una muestra grande
65
Este paso es opcional y se hace sobre todo cuando se tiene una muestra grande
66
Este paso es opcional y se hace sobre todo cuando se tiene una muestra grande
Coeficientes
Coeficientes no estandarizados tipificados
Selección 30%
67