Você está na página 1de 9

ANALISIS DE CORRELACIN Y REGRESIN MLTIPLE

El modelo de regresin mltiple es una tcnica estadstica que consiste en


la extensin del anlisis de regresin simple a aplicaciones que implican
dos o ms variables independientes o predoctoras: X1, X2, X3, .., Xk para k
2 y se desea pronosticar la variable dependiente Y.
Y / X 1 , X 2 ,...., X k 0 1 X 1 2 X 2 .... k X k

en donde:

0 1 ..... k

son los coeficientes de regresin poblacional.

La estimacin de la ecuacin de regresin poblacional es la ecuacin de


regresin lineal mltiple muestral cuya expresin es:
Y b0 b1 X 1 b2 X 2 .... bk X k

en donde b0, b1, b2, ., bk son los coeficientes de regresin muestral.


Cada coeficiente de regresin poblacional se estima mediante el respectivo
coeficiente muestral bi, utilizando el mtodo de los mnimos cuadrados.
Para k>2 la grafica de la ecuacin de regresin es un plano que interceptan
a Y en 0, los dems coeficientes de regresin parcial i son las pendientes
de la lnea de regresin Y con la variable Xi mientras las otras variables
independientes se mantienen constantes.
Estas pendientes indican el cambio de Y correspondiente a un incremento
unitario de Xi cuando las dems X permanecen constantes.
CORRELACIN Y REGRESIN MLTIPLE PARA EL CASO DE
UNA VARIABLE
DEPENDIENTE Y DOS VARIABLES
INDEPENDIENTES.
Y b0 b1 X 1 b2 X 2

donde:

: valor estimado de la variable dependiente.


b0 : Interseccin con Y
b1 y b2 Pendientes asociadas a X1 y X2
X1 y X2 Valores de las variables independientes.
Y

Se aplica el mtodo de los mnimos cuadrados usando los datos


observados, aplica las siguientes ecuaciones normales para determinar las
constantes.

Y nb b X b X
X Y b X b X b X X
X Y b X b X X b X
0

2
1

2
2
2

Ventajas de la Regresin Mltiple, la principal ventaja de la regresin


mltiple es que nos permite utilizar ms informacin disponible para
estimar la variable dependiente. En algunas ocasiones, la correlacin entre
dos variables puede resultar insuficiente par determinar una ecuacin de
estimacin confiable. Sin embargo, si agregamos los datos de ms variables
independientes, podemos ser capaces de determinar una ecuacin de
estimacin que describa la relacin con mayor precisin.
Pasos para la correlacin lineal y regresin mltiple.
1. Anlisis de Correlacin.
2. Determinar la ecuacin de regresin mltiple.
3. Examinar el error estndar de regresin mltiple de la estimacin.
4. Utilizar el anlisis de regresin mltiple para determinar que tambin
describe la ecuacin de regresin de datos observados.
CASO
El servicio nacional de tributacin esta tratando de estimar la cantidad
mensual de impuesto no pagado descubierto por su departamento de
auditorias. En el pasado se estima sobre la base del nmero esperado de
horas de trabajo en auditorias de campo, ltimamente se aade un factor
que es el nmero de horas de uso de computadoras para detectar impuestos
no pagados. Podramos combinar esta informacin con los datos
referentes a las horas de trabajo en auditorias y obtener una ecuacin ms
precisa para los impuestos no pagados descubiertos cada mes?
Meses
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
TOTAL

X1
Horas de Trabajo de
auditoria
(dos ceros omitidos)

X2
Horas de
computadoras
(dos ceros omitidos)

45
42
44
45
43
46
44
45
44
43

16
14
15
13
13
14
16
16
15
15

Y
Impuesto no pagado
descubierto
(Millones de
dlares)
29
24
27
25
26
28
30
28
28
2

X1

X2

Horas de
Impuesto
Trabajo de
Horas de
no pagado
auditoria computadoras descubierto
(dos ceros
(dos ceros
(Millones
Meses
omitidos)
omitidos)
de dlares) X1^2 X2^2
Y^2 X1*X2 X1*Y X2*Y Y est (Y-Yest)^2
Enero
45
16
29
2025
256
841
720
1305
464 29,136
0,018496
Febrero
42
14
24
1764
196
576
588
1008
336 25,246
1,552516
Marzo
44
15
27
1936
225
729
660
1188
405 27,473
0,223729
Abril
45
13
25
2025
169
625
585
1125
325 25,839
0,703921
Mayo
43
13
26
1849
169
676
559
1118
338 24,711
1,661521
Junio
46
14
28
2116
196
784
644
1288
392 27,502
0,248004
Julio
44
16
30
1936
256
900
704
1320
480 28,572
2,039184
Agosto
45
16
28
2025
256
784
720
1260
448 29,136
1,290496
Septiembre
44
15
28
1936
225
784
660
1232
420 27,473
0,277729
Octubre
43
15
27
1849
225
729
645
1161
405 26,909
0,008281
TOTAL
441
147
272
19461 2173
7428
6485
12005 4013
271,997
8,023877
promedio
Error
Estandar

44,1

14,7

27,2

1,07063913

Y 13,828 0,564 X 1 1,099 X 2

(Y-Yprom)^2
3,24
10,24
0,04
4,84
1,44
0,64
7,84
0,64
0,64
0,04
29,6

X1 = 441 X2 = 14 Y = 272
X1 X2 = 6485
X12 = 19461

X1 Y = 12005
X22 = 2173

X2 Y = 4013
Y2 = 7428

ECUACIONES NORMALES
272
= 10 b0 + 441 b1 + 147 b2
12005 = 441 b0 + 19461 b1 + 6485 b2
4013 = 147 b0 + 6485 b1 + 2173 b2
Debemos llegar a resolver este sistema de ecuaciones Normales para hallar
las constantes.
Caso.
Suponga que el Sistema Nacional de Tributacin, desea aumentar la
cantidad de sus descubrimientos de impuestos no pagado para el siguiente
mes y no tiene la intencin de contratar personal adicional, es decir el
numero de horas de trabajo permanece en 4300 horas, pero esta
aumentando el numero de horas en computadoras aproximadamente 1600
horas y adems establezca los intervalos de confianza bajo los cuales son
ciertas sus afirmaciones.
Debemos hallar el ERROR ESTNDAR DE LA ESTIMACIN
Se

(Y Y )

n k 1

Donde:
Y son las observaciones de la variable dependiente
Y son los valores estimados de la variable dependiente
n es el numero de observaciones
k es el numero de variables Independientes
CUADRO DE ANOVA
Los clculos para la Regresin Mltiple son largos. Pero muchos sistemas
dan resultados en forma estndar.
Lo primero que tenemos que conocer es el cuadro de anlisis de varianza,
para este caso la variacin tendr dos componentes: La regresin y el Error,
los grados de libertad en funcin de n y los nmeros de variables
independientes consideradas k.
El encabezado SS (suma de cuadrados) o la variacin por ejemplo:

Variacin Total
Variacin del Error

= SS Total = (Y Y ) 2
= SS error = (Y Y )

Variacin de regresin

= SS R

= SS Total - SS Error

El encabezado MS (Cuadrado Medio) se obtiene dividiendo SS entre sus


grados de Libertad.
Fuente

SS

Grados
Libertad

Regresin
Error

SS regresin
SS Error

k
n-k-1

Total

SS Total

n-1

de MS
MSR = SS R / k
MSE = SS E /
n-k-1

F
MSR / MSE

r2 = SSR / SS Total
Se = SS E / n k - 1
Fuente

SS

Grados
Libertad

Regresin
Error
Total

21.576123
8.023877
29.6

2
7
9

de MS
10.7880615
1.146268143

F
9.41146412

r2 = 21,576123 / 29.6 = 0.7289


Se = 8.023877 / 7 = 1.0706
PRUEBAS DE SIGNIFICANCIA DE LOS COEFICIENTES DE
REGRESIN
Una vez hallada la ecuacin de regresin muestral debemos determinar si
los coeficientes de esa ecuacin de regresin son significativos o no. Es
decir, se debe si los coeficientes de regresin calculados a partir de la
muestra implican que los correspondientes coeficientes de regresin
poblacional son o no distintos a cero.
Si todos los coeficientes de regresin poblacional son iguales a cero no
podremos predecir Y, es decir, no habra regresin lineal. Si solo uno de
ellos es igual a cero por ejemplo 2 = 0 podemos concluir que no hay
regresin de Y en la variable X2.

El anlisis de regresin debera comenzar con una prueba global de


significancia de los coeficientes de regresin muestral mediante un anlisis
de varianza (ANOVA). Si se acepta que no todos los coeficientes de
regresin poblacional son iguales a cero, entonces se debe analizar la
significancia de los coeficientes de regresin muestral en forma individual.
1.

ANALISIS DE VARIANZA PRUEBA GLOBAL DE LOS


COEFICIENTES DE REGRESIN
PASO 1. Planteamiento de la Hiptesis
Plantear las hiptesis que se debern someter a la prueba con
el fin de contrastar si la los correspondientes coeficientes
poblacionales tienen influencia sobre la Variable Dependiente
y por consiguiente el modelo es apropiado.
Ho
:
1 = 2 = ..... = k = 0
Ha
:
1 2 .. k 0
PASO 2. Nivel de Significancia
Determinar el valor de , es decir el error Tipo I que estamos
dispuestos a cometer.
PASO 3. Regla de decisin
Para esta prueba se trabaja con la Distribucin F para lo
necesitamos los grados de libertad del numerador (k) y del
denominador (n k 1) en la tabla se encuentra el valor crtico
de una cola.
PASO 4. Estadstico de Prueba
El estadstico de prueba F para probar la Hiptesis Nula Ho
contra Ha, es decir que todos los coeficientes de regresin
mltiple son iguales a cero, se obtiene de la siguiente frmula
con la ayuda del cuadro de ANOVA.
F

2
2
( SSTotal SSError ) / k ( (Y Y ) (Y Y ) ) / k

SSError / n k 1
(Y Y ) 2 / n k 1

PASO 5. Toma de Decisin


La regla de decisin es rechazar la Ho si el valor calculado de
F es mayor que el valor tabular o crtico obtenido de la tabla,
no rechazar la Ho en caso contrario.
2.

PRUEBA INDIVIDUAL
REGRESIN MLTIPLE

DE

LOS

COEFICIENTES

DE

Si existe regresin de la variable dependiente Y globalmente con todas


las variables independientes Xi en conjunto. Es deseable determinar que
variables contribuyen en forma significativamente al modelo de
regresin mltiple. Si alguna variable independiente Xi no contribuye n
forma significativa al modelo, se la debe descartar y buscar la ecuacin
lineal adecuada.
Ahora, llevaremos a cabo pruebas de hiptesis por separado, es
estadstico de prueba es la distribucin t de Student con n k 1 grados
de libertad, y un nivel de significancia de = 0,05 y con dos colas, se
rechaza la Hiptesis nula si t calculado es mayor o menor a los valores
crticos hallados en la tabla.
PASO 1. Planteamiento de la Hiptesis
Plantear las hiptesis para cada Variable Independiente por
separado.
Ho :
i = 0
Ha :
i 0
PASO 2. Nivel de Significancia
Determinar el valor de , es decir el error Tipo I que estamos
dispuestos a cometer.
PASO 3. Regla de decisin
Para esta prueba se trabaja con la Distribucin t - Student para
lo necesitamos los grados de libertad (n k 1) en la tabla se
encuentra el valor crtico de dos colas.
PASO 4. Estadstico de Prueba
El estadstico de prueba T para probar la Hiptesis Nula Ho
contra Ha, es decir que el coeficiente de regresin mltiple es
igual a cero.
t

bi 0
S bi

PASO 5. Toma de Decisin


La regla de decisin es rechaza la Hiptesis nula si t calculado
es mayor o menor a los valores crticos hallados en la tabla.

Sb1

Se
SCX 1

S b2

SCX 1 ( X 1 X 1 ) 2

SCX 2 ( X 2 X 2 ) 2

( X 1 )2

SCX 1 X 12

SCX 1 19461

Se
SCX 2

( 441) 2
10

( X 2 )2

SCX 2 X 22

SCX 2 2173

(147) 2
10

SCX 1 12.9

SCX 2 12.1

Se 1.07063913
1.07063913
S b1
0.2980905471
12.9
b
0.564
t X1 1
1.892
S b1
0.298090

Se 1.07063
1.07063913
S b2
0.307787
12.1
b
1.099
tX1 1
3.57
Sb1
0.307787

b1

SCX 1Y
SCX 1

SCX 1Y
S b1

b2

(X

X 1 )(Yi Y )

Se
SCX 1

SCX 1

SCX 2Y ( X 2 X 2 )(Yi Y )
S b2

(X

( X 1 ) 2

SCX 1 X

Se
SCX 2

SCX 2 ( X 2 X 2 ) 2

X 1 )2

2
1

SCX 2Y
SCX 2

( X 2 )2

SCX 2 X
2
2

SCX 1Y X 1 X (Y Y )

SCX 2Y X 2 X (Y Y )

SCX 1Y XY

SCX 2Y XY

( X 1 )( Y )
n

SCX 1Y 9.8
( 441)( 272)
10

SCX 1Y 9.8

SCX 2Y 4013

(147)( 272)
10

SCX 2Y 14.6
( 441)
10

SCX 1 12.9
9.8
0.7596899
12.9
1.07063913
S b1
0.2980905471
12.9
b
0.7596899
t X1 1
1.892
S b1
0.298090
b1

SCX 2Y 14.6

SCX 1Y 12005

SCX 1 19461

( X 2 )( Y )

SCX 2 2173

(147) 2
10

SCX 2 12.1
14.6
1.2066
12.1
1.07063913
S b2
0.307787
12.1
b
1.2066
t X1 1
3.92
S b1 0.307787
b2

Você também pode gostar