Escolar Documentos
Profissional Documentos
Cultura Documentos
X 1 2 3 4 5 6
Y 4,8 7,3 8,4 11 13,1 15,2
Y (dependiente)
X (independiente, explicativa, predictora)
Regresion Lineal Simple
El modelo condicional:
𝐸 𝑦𝑖 𝑋 = 𝑥𝑖 = 𝐵0 + 𝐵1 𝑥𝑖
𝜀𝑖 ~𝑁(0, 𝜎 2 ) cov 𝜀𝑖 , 𝜀𝑗 = 0 i≠ 𝑗
𝜀𝑖 ~𝑁(0, 𝜎 2 ) cov 𝜀𝑖 , 𝜀𝑗 = 0 i≠ 𝑗
Supuestos del modelo
Linealidad
V(𝜀𝑖 )= 𝜎 2 (constante), este supuesto hace que el modelo sea considerado como
homocedástico.
3. Homogeneidad
Los errores tienen valor esperado nulo : 𝐸 𝑒𝑖 = 0
Esto significa que el ajuste que se va ha hacer está centrado en los datos.
4. Independencia
Los errores son variables aleatorias independientes.
Regresión lineal simple
5. Normalidad
• Como consecuencia :
𝑦𝑖 ~ 𝑁(𝐵0 + 𝐵1 𝑥𝑖 , 𝜎 2 )
𝑆𝑥𝑦
𝜷𝟏 = 𝟎 =𝑦−
𝜷 ത 𝜷 𝟏 𝑥ҧ
𝑆𝑥𝑥
Sumas cuadráticas
Existen tres sumas cuadráticas importantes en un modelo de regresión
Suma Cuadrática del Error (SCE) mide la variabilidad de los valores observados
alrededor de la recta cuya ecuación es Ŷi = b0 + b1Xi
n n 2
SCE = ei2 = ( yi − yˆ i )
i =1 i =1
( )
n
SCT = yi − y
i =1
( )
n
SCR = yˆi − y
i =1
Prueba Global del modelo
Tabla Anova
Coeficiente de Determinación
𝑆𝐶𝑅
𝑅2 =
𝑆𝐶𝑇
0 ≤ 𝑅2 ≤ 1
𝑅2 indica la proporción de variabilidad de Y, explicada a través del modelo por las variables
de explicación; o si trabajamos con la potencia de explicación del modelo 𝑅2 x(100%), se
cambia el valor de proporción a porcentaje
• Un valor cercano a cero indica que no se capto casi nada de la variación total de Y,
• Un valor cercano a uno señala que casi 100% de la variabilidad fue captada
• Lo que interesa de un modelo es que capte la mayor variación, entonces es preferible que
sea cercano a 1
Ejemplo 1:
En base a los siguientes datos.
X 1 2 3 4 5 6
Y 4,8 7,3 8,4 11 13,1 15,2
𝑀𝐶𝑅
𝐹𝑜 = > 𝐹(𝛼,𝑝−1,𝑛−𝑝)
𝑀𝐶𝐸
X 1 2 3 4 5 6
Y 4,8 7,3 8,4 11 13,1 15,2
𝑟𝑥𝑦 = ± 𝑅2