Escolar Documentos
Profissional Documentos
Cultura Documentos
Centre docent:
Departament dEconomia
Temes 5 a 7. Regressi Lineal Mltiple 1.- Anlisi de la rendibilitat de la banca privada a Espanya
Utilizando informacin relativa a 98 bancos privados que operan en Espaa (Ranking de la banca privada, El Pas, Domingo 3 de Diciembre de 1995) intentamos determinar algunas de las variables que puedan influir en el beneficio neto sobre recursos propios (ROE). El archivo en el que estn los datos se denomina caso3_06.sav Ajustaremos el siguiente modelo de regresin: ROEi = 1+2MEATi+3MIATi+4CNMOi+5PLANi+6CFATi+ 7CPCTi+8CTMOi+9PRRPi+10SRGEi+11RCLIi+ui en la que:
ROE MEAT
Beneficio neto sobre recursos propios. Margen de explotacin sobre activos totales medios. El margen de explotacin es el resultado de la actividad tpica sin incluir saneamientos, excepto amortizaciones de inmovilizado. Margen de intermediacin sobre activos totales medios. El margen de intermediacin son los productos financieros y otros rendimientos menos costes y cargas asimiladas. Comisiones netas por servicios sobre margen operativo. El margen operativo es el MIAT mas el rendimiento de la cartera. Plantilla. Costes financieros sobre activos totales medios. Intereses y cargas asimiladas. Costes de personal sobre costos de transformacin. Gastos de explotacin sin incluir amortizaciones. Costes de transformacin sobre margen operativo. Provisiones para riesgos sobre recursos propios. Incluye fondos de pensiones, impuestos y otras provisiones. Saneamiento sobre recursos generados. El saneamiento son aportaciones de todo tipo para garantizar los activos. Recursos de clientes.
MIAT
CNMO
PLAN CFAT
CPCT
CTMO PRRP
SRGE
RCLI
El anlisis descriptivo proporciona los siguientes resultados: GRAPH GRAPH GRAPH GRAPH GRAPH GRAPH GRAPH GRAPH GRAPH GRAPH /SCATTERPLOT(BIVAR)=meat WITH roe. /SCATTERPLOT(BIVAR)=miat WITH roe. /SCATTERPLOT(BIVAR)=cnmo WITH roe. /SCATTERPLOT(BIVAR)=plan WITH roe. /SCATTERPLOT(BIVAR)=cfat WITH roe. /SCATTERPLOT(BIVAR)=cpct WITH roe. /SCATTERPLOT(BIVAR)=ctmo WITH roe. /SCATTERPLOT(BIVAR)=prrp WITH roe. /SCATTERPLOT(BIVAR)=srge WITH roe. /SCATTERPLOT(BIVAR)=rcli WITH roe.
40,00
40,00
20,00
20,00
0,00
0,00
roe
-20,00
roe
-20,00 -40,00 -40,00 -60,00 -15,00 -10,00 -5,00 0,00 5,00 10,00 -60,00 -5,00 0,00 5,00 10,00 15,00 20,00
meat
miat
40,00
40,00
20,00
20,00
0,00
0,00
roe
-20,00
roe
-20,00 -40,00 -40,00 -60,00 -100,00 -50,00 0,00 50,00 100,00 -60,00 0,00 5000,00 10000,00 15000,00 20000,00 25000,00
cnmo
plan
40,00
40,00
20,00
20,00
0,00
0,00
roe
-20,00
roe
-20,00 -40,00 -40,00 -60,00 0,00 2,00 4,00 6,00 8,00 10,00 12,00 -60,00 0,00 10,00 20,00 30,00 40,00 50,00 60,00
cfat
cpct
40,00
40,00
20,00
20,00
0,00
0,00
roe
-20,00
roe
-20,00 -40,00 -40,00 -60,00 -400,00 -200,00 0,00 200,00 400,00 600,00 -60,00 -50,00 0,00 50,00 100,00 150,00 200,00
ctmo
prrp
40,00
40,00
20,00
20,00
0,00
0,00
roe
roe
-20,00 -20,00 -40,00 -40,00 -60,00 -6000,00 -4000,00 -2000,00 0,00 -60,00 0,00 1000000,00 2000000,00 3000000,00 4000000,00 5000000,00 6000000,00
srge
rcli
No se observa curvatura en ninguno de los grficos, aunque s valores atpicos. La relacin entre ROE y las variables explicativas es ms bien dbil. De momento intentaremos estimar la regresin vista anteriormente, y dejaremos que el diagnstico confirme o disconfirme nuestras sospechas. Seleccionamos Analizar, Regresin, Lineal, introducimos ROE en Dependiente y todos los regresores en Independientes. Dentro de Estadsticos seleccionamos Estimaciones, Ajuste del modelo, Intervalos de confianza, Descriptivos y Diagnsticos de colinealidad. Dentro de Guardar seleccionamos Valores pronosticados: No tipificados, Distancias de Cook y Residuos: Estudentizados. Los comandos equivalentes son: REGRESSION /DESCRIPTIVES CORR /STATISTICS COEFF CI R ANOVA TOL /DEPENDENT roe /METHOD=ENTER meat miat cnmo plan cfat cpct ctmo prrp srge rcli /SAVE PRED COOK SRESID .
Mostramos slo parte de los resultados, dado que la interpretacin no procede hasta que los supuestos estn verificados.
b Resumen del modelo
Modelo 1
R ,587a
R cuadrado ,344
a. Variables predictoras: (Constante), RCLI, CTMO, SRGE, CFAT, PRRP, MIAT, CPCT, CNMO, MEAT, PLAN b. Variable dependiente: ROE
(Constante) MEAT MIAT CNMO PLAN CFAT CPCT CTMO PRRP SRGE RCLI
Coeficientes no estandarizados Error tp. B 1,453 7,167 2,310 ,686 -,376 ,746 ,148 ,083 -2,20E-03 ,002 -3,93E-02 ,743 2,795E-02 ,141 -4,93E-02 ,017 9,984E-04 ,070 3,767E-03 ,002 1,028E-05 ,000
Intervalo de confianza para B al 95% Lmite Lmite inferior superior -12,802 15,708 ,947 3,674 -1,860 1,108 -,018 ,313 -,005 ,001 -1,517 1,438 -,252 ,308 -,084 -,015 -,138 ,140 -,001 ,008 ,000 ,000
Estadsticos de colinealidad Toler ancia FIV ,456 ,468 ,659 ,039 ,884 ,816 ,698 ,821 ,983 ,039 2,195 2,136 1,518 25,55 1,131 1,225 1,432 1,218 1,018 25,47
Empezamos con los grficos para el diagnstico de los supuestos y la presencia de valores atpicos. Estadsticos descriptivos de los residuos estudentizados (SRE_1), incluyendo asimetra y curtosis y grfico probabilstico normal de los residuos estudentizados EXAMINE SRE_1 /PLOT NPPLOT. Grfico de dispersin de los residuos con la previsin PRE_1. GRAPH /SCATTERPLOT(BIVAR)=PRE_1 WITH SRE_1. Grfico de dispersin de los residuos estudentizados con cada regresor (mostramos slo algunos de ellos). GRAPH /SCATTERPLOT(BIVAR)=meat WITH SRE_1. GRAPH /SCATTERPLOT(BIVAR)=miat WITH SRE_1. GRAPH /SCATTERPLOT(BIVAR)=cnmo WITH SRE_1. GRAPH /SCATTERPLOT(BIVAR)=plan WITH SRE_1. GRAPH /SCATTERPLOT(BIVAR)=cfat WITH SRE_1. GRAPH /SCATTERPLOT(BIVAR)=cpct WITH SRE_1. GRAPH /SCATTERPLOT(BIVAR)=ctmo WITH SRE_1. GRAPH /SCATTERPLOT(BIVAR)=prrp WITH SRE_1. GRAPH /SCATTERPLOT(BIVAR)=srge WITH SRE_1. GRAPH /SCATTERPLOT(BIVAR)=rcli WITH SRE_1. Grficos de dispersin de los residuos estudentizados y las distancias de Cook con un identificador previamente creado: COMPUTE ID = 1 . CREATE /id=CSUM(id). GRAPH /SCATTERPLOT(BIVAR)=id WITH SRE_1. GRAPH /SCATTERPLOT(BIVAR)=id WITH COO_1.
Descriptivos Studentized Residual Media Intervalo de confianza para la media al 95% Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Estadstico -,0073920 -,2395397 ,2247557 ,0545560 ,0956665 1,285 1,1334240 -4,50138 4,61100 9,11239 ,80263 -,776 6,696 Error tp. ,1169038
,249 ,493
5,00000
3 2,50000 2
Normal esperado
Studentized Residual
0,00000
-2,50000 -1
-2 -5,00000
Valor observado
Studentized Residual
-2
Studentized Residual
-10 0 10
-2
-4
-4
-6 -20
MEAT
PLAN
10 30 93
Studentized Residual
52 45 43
-4
Cook's Distance
-2
34 39
43
-6 0 20 40 60 80 100
-2 0 20 40 60 80 100
CSUM(ID)
CSUM(ID)
El supuesto de normalidad no se cumple (grfico claramente no normal, cocientes entre asimetra y curtosis y sus respectivos errores estndar superiores a 2 en valor absoluto). Para una muestra grande como la que nos ocupa, la nica consecuencia prctica de la no normalidad es que invalida los intervalos de previsin, pues stos se refieren a una nica observacin, con lo que no es de aplicacin el teorema central del lmite. El grfico de los residuos estudentizados con la previsin, no muestra ninguna pendiente clara, con lo que la homocedasticidad parece cumplirse. Los grficos de los residuos con los regresores no muestran ninguna curvatura clara. No es necesario, pues, transformar las variables. S se observan posibles valores atpicos. El valor crtico para los residuos con N=94 es Z donde =1-0,951/94 = 0,00054; redondeando, Z = 3,5. La presencia de valores no slo atpicos sino comparativamente muy influyentes se confirma en el grfico de las distancias de Cook. Realizaremos un anlisis de sensibilidad eliminando las tres observaciones con distancia de Cook mayor. Entramos en Datos Seleccionar casos, si se satisface la condicin y entramos la condicin id ~= 30 & id ~= 93 & id ~= 43, o bien los comandos: USE ALL. COMPUTE filter_$=(id ~= 30 & id ~= 93 & id ~= 43). FILTER BY filter_$. EXECUTE . Supongamos que estas tres observaciones corresponden a bancos de un tipo diferente de los restantes. En este caso, si los resultados tras omitirlos difieren mucho de los anteriores, est justificado descartar los resultados anteriores y continuar trabajando sin esas tres observaciones a partir de ahora:
Correlaciones
ROE MEAT MIAT CNMO PLAN CFAT CPCT CTMO PRRP SRGE RCLI
ROE 1,000 ,592 ,176 -,123 ,086 ,040 ,119 -,600 -,159 -,087 ,120
MEAT ,592 1,000 ,613 -,187 -,007 -,153 -,064 -,800 -,296 -,009 ,000
MIAT CNMO PLAN CFAT CPCT CTMO PRRP SRGE RCLI ,176 -,123 ,086 ,040 ,119 -,600 -,159 -,087 ,120 ,613 -,187 -,007 -,153 -,064 -,800 -,296 -,009 ,000 1,000 -,311 -,092 -,195 -,165 -,242 ,044 -,079 -,107 -,311 1,000 ,069 ,196 ,298 ,216 -,004 ,122 ,054 -,092 ,069 1,000 ,090 ,187 -,062 ,090 ,058 ,979 -,195 ,196 ,090 1,000 ,238 ,012 -,102 ,067 ,107 -,165 ,298 ,187 ,238 1,000 -,050 ,083 ,088 ,176 -,242 ,216 -,062 ,012 -,050 1,000 ,215 -,119 -,085 ,044 -,004 ,090 -,102 ,083 ,215 1,000 -,055 ,054 -,079 ,122 ,058 ,067 ,088 -,119 -,055 1,000 ,036 -,107 ,054 ,979 ,107 ,176 -,085 ,054 ,036 1,000
Modelo 1
R ,689a
R cuadrado ,475
a. Variables predictoras: (Constante), RCLI, MEAT, SRGE, CFAT, CNMO, PRRP, CPCT, MIAT, CTMO, PLAN b. Variable dependiente: ROE
ANOVAb Suma de cuadrados 7323,951 8084,343 15408,294 Media cuadrtica 732,395 101,054
Modelo 1
gl 10 80 90
F 7,248
Sig. ,000a
a. Variables predictoras: (Constante), RCLI, MEAT, SRGE, CFAT, CNMO, PRRP, CPCT, MIAT, CTMO, PLAN b. Variable dependiente: ROE
Coeficientesa Coeficie ntes estanda rizados Beta ,740 -,285 -,095 -,539 ,090 ,122 -,068 ,098 -,101 ,584 t -,600 3,148 -2,009 -,984 -1,297 1,016 1,361 -,367 1,013 -1,176 1,408 Sig. ,550 ,002 ,048 ,328 ,198 ,313 ,177 ,715 ,314 ,243 ,163
(Constante) MEAT MIAT CNMO PLAN CFAT CPCT CTMO PRRP SRGE RCLI
Coeficientes no estandarizados Error B tp. -4,468 7,449 4,478 1,422 -1,600 ,796 -8,31E-02 ,084 -1,82E-03 ,001 ,658 ,648 ,166 ,122 -1,52E-02 ,041 6,474E-02 ,064 -1,07E-02 ,009 8,285E-06 ,000
Intervalo de confianza para B al 95% Lmite Lmite inferior superior -19,291 10,355 1,647 7,309 -3,185 -,015 -,251 ,085 -,005 ,001 -,631 1,947 -,077 ,409 -,097 ,067 -,062 ,192 -,029 ,007 ,000 ,000
Estadsticos de colinealidad Tolera ncia FIV ,119 ,325 ,701 ,038 ,841 ,821 ,191 ,706 ,898 ,038 8,420 3,075 1,427 26,341 1,189 1,218 5,224 1,415 1,114 26,277
Descriptivos Studentized Residual Media Intervalo de confianza para la media al 95% Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Estadstico -,0110688 -,2200968 ,1979593 ,0759231 ,1310422 1,007 1,0036875 -4,12979 3,52930 7,65909 ,53435 -1,751 8,403 Error tp. ,1052150
,253 ,500
,3
,2
2
Normal esperado
,1
Cook's Distance
-1
0,0
-2
-,1 0 20 40 60 80 100
-3 -4 -2 0 2 4
Valor observado
CSUM(ID)
No mostramos todos los grficos de residuos, que tienen aspecto parecido a los vistos anteriormente. Es de notar que las diferencias en algunos coeficientes atribuidas a la eliminacin de las tres observaciones son grandes. Incluso alguna variable antes no significativa pasa a serlo y viceversa. El grfico de la distancia de Cook no muestra observaciones que destaquen de un modo espectacular. El supuesto de normalidad sigue sin cumplirse, con las limitaciones mencionadas arriba pero que no afectan a los contrastes para decidir la especificacin del modelo, que interpretamos conjuntamente con la multicolinealidad. La F global del modelo nos permite afirmar que algn efecto es significativo (rechazamos H0: 2=3=...=11=0 con un riesgo casi nulo). Si miramos los contrastes individuales vemos que son significativos los parmetros asociados a MEAT y MIAT (al 5%). No podemos concluir nada respecto a los efectos de las restantes variables. Incluso dos variables tienen un estadstico t inferior a la unidad en valor absoluto (CNMO y CTMO), con lo que su eliminacin del modelo podra mejorar la eficiencia de las estimaciones de los restantes coeficientes.
Instrumentos para detectar problemas de multicolinealidad: a) Matriz de correlaciones. El primer instrumento de deteccin de la multicolinealidad es la matriz de correlaciones entre las variables explicativas incluidas en la regresin. En nuestro caso, las parejas de variables MEAT-CTMO y PLAN-RCLI presentan correlaciones preocupantemente elevadas.
10
Modelo 1
R ,682a
R cuadrado ,465
a. Variables predictoras: (Constante), RCLI, MEAT, SRGE, CFAT, CPCT, PRRP, MIAT, PLAN
ANOVAb Suma de cuadrados 7160,524 8247,771 15408,294 Media cuadrtica 895,065 100,583
Modelo 1
gl 8 82 90
F 8,899
Sig. ,000a
a. Variables predictoras: (Constante), RCLI, MEAT, SRGE, CFAT, CPCT, PRRP, MIAT, PLAN b. Variable dependiente: ROE
Coeficientesa Coeficie ntes estanda rizados Beta ,815 -,289 -,600 ,086 ,101 ,109 -,100 ,648 t -1,033 7,145 -2,614 -1,466 ,998 1,174 1,190 -1,215 1,585 Sig. ,305 ,000 ,011 ,147 ,321 ,244 ,237 ,228 ,117
Coeficientes no estandarizados Error B tp. -6,395 6,189 4,934 ,691 -1,620 ,620 -2,02E-03 ,001 ,629 ,631 ,138 ,117 7,246E-02 ,061 -1,07E-02 ,009 9,184E-06 ,000
Intervalo de confianza para B al 95% Lmite Lmite inferior superior -18,707 5,918 3,560 6,308 -2,853 -,387 -,005 ,001 -,625 1,884 -,096 ,372 -,049 ,194 -,028 ,007 ,000 ,000
Estadsticos de colinealidad Toler ancia FIV ,501 ,534 ,039 ,883 ,880 ,774 ,967 ,039 1,994 1,871 25,688 1,132 1,136 1,291 1,034 25,586
Dos regresores tienen todavia FIV muy altos. En nuestro caso el modelo restringido es el modelo sin los dos regresores, el modelo general el modelo inicial, q es igual a 2 (nmero de igualdades contenidas en H0) y n-k es igual a 80, los grados de libertad del modelo general:
11
Modelo 1
R ,677a
R cuadrado ,458
a. Variables predictoras: (Constante), RCLI, MEAT, SRGE, CPCT, PRRP, MIAT, PLAN
ANOVAb Suma de cuadrados 7060,302 8347,992 15408,294 Media cuadrtica 1008,615 100,578
Modelo 1
gl 7 83 90
F 10,028
Sig. ,000a
a. Variables predictoras: (Constante), RCLI, MEAT, SRGE, CPCT, PRRP, MIAT, PLAN b. Variable dependiente: ROE
Coeficientesa Coeficie ntes estanda rizados
Coeficientes no estandarizados Error tp. 5,676 ,685 ,620 ,001 ,115 ,060 ,009 ,000
Intervalo de confianza para B al 95% Lmite inferior -15,219 3,486 -2,869 -,005 -,064 -,056 -,028 ,000 Lmite superior 7,358 6,211 -,405 ,001 ,392 ,183 ,007 ,000
Estadsticos de colinealidad Toler ancia ,509 ,535 ,039 ,926 ,791 ,969 ,039
Modelo 1
12
Resumen del modelo R cuadrado corregida ,396 Error tp. de la estimacin 10,1713
Modelo 1
R ,665a
R cuadrado ,443
a. Variables predictoras: (Constante), RCLI, MEAT, SRGE, PLAN_REL, CPCT, PRRP, MIAT ANOVAb Suma de cuadrados 6821,581 8586,713 15408,294 Media cuadrtica 974,512 103,454
Modelo 1
gl 7 83 90
F 9,420
Sig. ,000a
a. Variables predictoras: (Constante), RCLI, MEAT, SRGE, PLAN_REL, CPCT, PRRP, MIAT b. Variable dependiente: ROE
Coeficientesa Coeficie ntes estanda rizados Beta ,806 -,303 ,005 ,113 ,073 -,112 ,069 t -,534 7,010 -2,709 ,060 1,319 ,804 -1,355 ,813 Sig. ,595 ,000 ,008 ,952 ,191 ,424 ,179 ,418
Coeficientes no estandarizados Error B tp. -3,121 5,846 4,880 ,696 -1,702 ,628 1,687 27,902 ,154 ,117 4,867E-02 ,061 -1,20E-02 ,009 9,714E-07 ,000
Intervalo de confianza para B al 95% Lmite Lmite inferior superior -14,748 8,507 3,495 6,265 -2,951 -,452 -53,809 57,183 -,078 ,387 -,072 ,169 -,030 ,006 ,000 ,000
Estadsticos de colinealidad Tolera ncia FIV ,508 ,535 ,947 ,915 ,806 ,983 ,946 1,970 1,869 1,056 1,093 1,241 1,017 1,057
13
Resumen del modelo R cuadrado corregida ,407 Error tp. de la estimacin 10,0788
Modelo 1
R ,658a
R cuadrado ,433
Modelo 1
gl 4 86 90
F 16,421
Sig. ,000a
a. Variables predictoras: (Constante), SRGE, MEAT, CPCT, MIAT b. Variable dependiente: ROE
Coeficientesa Coefici entes estand arizado s Beta ,774 -,285 ,132 -,114 t -,614 7,514 -2,732 1,594 -1,396 Sig. ,541 ,000 ,008 ,115 ,166
Coeficientes no estandarizados Error B tp. -3,475 5,663 4,683 ,623 -1,600 ,586 ,180 ,113 -1,22E-02 ,009
Intervalo de confianza para B al 95% Lmite Lmite inferior superior -14,733 7,782 3,444 5,923 -2,764 -,436 -,044 ,404 -,030 ,005
Estadsticos de colinealidad Toler ancia FIV ,622 ,605 ,965 ,986 1,608 1,654 1,036 1,014
Los FIV son francamente bajos. Debemos contrastar la significacin conjunta de los regresores omitidos. El valor del estadstico es menor que el valor crtico al 95% (F3,83,5% 2,7), con lo que no
F=
14
Descriptivos Studentized Residual Media Intervalo de confianza para la media al 95% Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Estadstico -,0076188 -,2203901 ,2051525 ,0877287 ,0848348 1,044 1,0216614 -4,12764 3,21359 7,34123 ,54273 -1,852 7,412 Error tp. ,1070992
,253 ,500
4,00000
2,00000
Studentized Residual
0,00000
Normal esperado
-2,00000
-1 -4,00000 -2
-3 -6 -4 -2 0 2 4
Valor observado
15
Studentized Residual
Studentized Residual
0 10
-2
-2
-4
-4
-6 -10
-6 -10 0 10 20
MEAT
MIAT
4
4
2
2
0
0
Studentized Residual
Studentized Residual
0 10 20 30 40 50 60
-2
-2
-4
-4
-6
CPCT
SRGE
,6
,5
2
,4
0
,3
Studentized Residual
-2
,2
Cook's Distance
60 80 100
,1
-4
39 45
-6 0 20 40
CSUM(ID)
CSUM(ID)
Sigue sin observarse curvatura ni heterocedasticidad. Algunas observaciones siguen presentando residuos estudentizados muy elevados y por lo tanto parece que no quedan bien explicados por el modelo: la banca Jover y el banco de Vitoria, con un ROE mucho ms bajo de lo previsto. Si fusemos expertos en el sector, estudiaramos estos bancos a fondo para determinar la causa de este fenmeno. Podra ocurrir que ambos bancos tuvieran caractersticas comunes, que podran incluirse en el modelo como variables adicionales. No encontramos valores de la distancia de Cook que sobresalgan de forma tan destacada como para los tres bancos ya eliminados. Persiste la no normalidad, que invalidara los intervalos de previsin, que por lo tanto no realizamos. El R2 ajustado es del 41%, con lo que hemos de ser conscientes que gran parte de la variabilidad queda por explicar, posiblemente debido a la omisin de variables relevantes de las
16
Modelo 1
R ,620a
R cuadrado ,384
17
Coeficientes no estandarizados Error B tp. -10,172 5,291 3,640 ,510 ,227 ,116 -1,03E-02 ,009
Intervalo de confianza para B al 95% Lmite Lmite inferior superior -20,689 ,344 2,625 4,654 -,003 ,456 -,028 ,008
Estadsticos de colinealidad Tolera ncia FIV ,996 ,988 ,992 1,004 1,012 1,008
18