Você está na página 1de 9

Universidad Nacional de La Matanza Estadística

PRÁCTICA 12
RESPUESTAS EJERCICIOS DE
ANÁLISIS DE REGRESIÓN Y DE CORRELACIÓN

1- Con la finalidad de analizar la existencia de relación lineal entre las exportaciones e


importaciones de Argentina, en el período 1984-1999 se utilizaron los datos del
ejercicio 3 de la práctica 4 de la Balanza Comercial Argentina.

Millones de dólares
Exportaciones Importaciones Saldo
Año
1984 8.107 4.585 3.522
1985 8.396 3.814 4.582
1986 6.852 4.724 2.128
1987 6.360 5.818 542
1988 9.135 5.322 3.813
1989 9.579 4.203 5.376
1990 12.353 4.077 8.276
1991 11.978 8.275 3.703
1992 12.235 14.672 -2.637
1993 13.118 16.784 -3.666
1994 15.839 21.590 -5.751
1995 20.963 20.122 841
1996 23.811 23.762 49
1997 26.431 30.450 -4.019
1998 26.441 31.404 -4.963
1999 23.333 25.508 -2.175

Se obtuvo la siguiente información utilizando la barra de herramientas de Excel:

Estadísticas de la regresión Observaciones 16


Coeficiente de correlación múltiple 0,94530981 Coeficientes
Coeficiente de determinación R2 0,89361064 Intercepción (ordenada de la recta) -5682,807
R2 ajustado 0,8860114 Exportaciones (pendiente) 1,34522439
Error típico 3434,64191

Diagrama de dispersión Exportaciones Curva de regresión ajustada

35.000 35.000
Importaciones

30.000 30.000
Importaciones

25.000 25.000
20.000 20.000

15.000 15.000

10.000 10.000

5.000 5.000

0 0
0 5.000 10.000 15.000 20.000 25.000 30.000
0 5.000 10.000 15.000 20.000 25.000 30.000 Importaciones Exportaciones
Exportaciones Pronóstico Importaciones

a) Interpretar el coeficiente de regresión, el de correlación y el de determinación.

Prof. Fernández, Graciela


1
Universidad Nacional de La Matanza Estadística

Datos (datos extraidos de la tabla de Excel).


n = 16
a = -5682,807
b =1,34522439
La recta de regresión es:
ŷ = - 5682,807 +1,34522439 . x
Coeficiente de regresión

b = Y = 1,34522439 millones de u$s


X 1millón de u$s
En el período investigado por cada millón de dólares que ingresaban al país en
concepto de exportaciones salían 1,34522439 millones de dólares por las
importaciones realizadas.

Coeficiente de correlación
r = 0,94530981
Como es un valor cercano a 1 podemos decir:
En el período 1984 a 1999 existió correlación lineal en sentido directo entre el monto de
las importaciones y el monto de las exportaciones en Argentina.

Coeficiente de determinación
R2 = 0,89361064 
El 89,361% de las variaciones en los montos de las importaciones quedaron
explicadas por las variaciones de los montos de las exportaciones en el período 1984
a 1999.
b) Utilizando la ecuación de la recta de regresión, estimar a cuánto habrían ascendido
los millones de dólares en concepto de importaciones si se hubieran exportado
productos por un equivalente a 20.000 millones de dólares, en el mencionado
período.
Rta: Se estima que los millones de dólares en concepto de importaciones habrían
ascendido a los 21.221,6809 si se hubieran exportado productos por un
equivalente a 20.000 millones de dólares, en el mencionado período.
c) Realizar una prueba de hipótesis para el coeficiente de correlación e interpretarla.
Datos
r = 0,94530981
n = 16  n – 2 = 14 grados de libertad de la t de Student
Sea  = 0,05 entonces de tabla t de Student buscamos t14; 0,95 = + 1,76 (me fijé en
0,05 porque falta la columna de 0,95 y le cambié el signo por simetría de la
distribución).
Como r es positivo las hipótesis de trabajo son:
H1)  = 0 no existe correlación entre el monto de las importaciones y el monto de
las exportaciones
HA)  > 0 existe correlación en sentido directo entre el monto de las importaciones
y el monto de las exportaciones en la población.

Prof. Fernández, Graciela


2
Universidad Nacional de La Matanza Estadística

Representación gráfica de la situación

Estadístico de prueba

r. n  2 0,94530981. 14
t   10,84
1 r 2
1  0,89361064
Toma de decisión
En nuestro caso 10,84 > 1,76 el t cae en zona de rechazo de H0 por lo cual
rechazamos que no hay correlación entre el monto de las importaciones y el monto
de las exportaciones. Es decir que sí hay correlación en la población.

Conclusión
En base a una muestra de 16 años y con un nivel de significación del 5% se podría decir que
hay correlación lineal directa entre el monto de las importaciones y el monto de las
exportaciones en el período 1984 a 1999.
2- En una empresa se quiere estudiar si el monto de los viáticos mensuales pagados a
sus corredores y el volumen de ventas mensuales generales (debería decir en miles de
pesos o en millones de pesos según las dimensiones de la empresa) están
relacionados linealmente. Una muestra de 7 meses arrojó los siguientes datos: ŷ =
11,20 + 0,78 x y r 2 = 0,63
a) Interpretar en el contexto del problema, el coeficiente de regresión, el de
determinación y el de correlación.
Datos: n = 7, a = 11,20, b =0,78 y r 2 = 0,63  r = 0,63 = 0,7937
X : volumen de ventas mensuales generales en miles de pesos (agregamos esta
información)
Y: monto de los viáticos mensuales en cientos de pesos
Coeficiente de regresión b
En los siete meses analizados por cada mil pesos de aumento en el volumen de las
ventas los viáticos se incrementan 78$ (0,78 cientos de $).
Coeficiente de correlación
Como 0,7937 es un valor lejano de 0 pero no muy cercano a 1 se puede decir que:
En los 7 meses existió una buena correlación lineal en sentido directo entre los viáticos
pagados a los corredores y el volumen de las ventas realizadas para la empresa.
Coeficiente de determinación

Prof. Fernández, Graciela


3
Universidad Nacional de La Matanza Estadística

El 69,361% de las variaciones en los viáticos pagados a los corredores son


explicadas por las variaciones del volumen de las ventas realizadas para la empresa.
b) A un nivel de significación del 5 % realizar una prueba adecuada para decidir si el
aumento en los viáticos mensuales pagados a sus corredores se corresponde en
general con el aumento en el volumen de ventas mensuales.
Datos
r = 0,7937
n = 7  n – 2 = 5 grados de libertad de la t de Student
Sea  = 0,05 entonces de tabla t de Student buscamos t5; 0,95 = + 2,02 (me fijé en
0,05 porque falta la columna de 0,95 en la tabla y le cambié el signo por simetría de
la distribución).

Como r es positivo las hipótesis de trabajo son:


H1)  = 0 no existe correlación entre los viáticos pagados a los corredores y el
volumen de las ventas realizadas
HA)  > 0 existe correlación en sentido directo entre los viáticos pagados a los
corredores y el volumen de las ventas realizadas en la población.
Ustedes hacen el test completo
Conclusión
En base a una muestra de siete meses, se podría decir que con un nivel de significación del
5% que el aumento en los viáticos mensuales pagados a sus corredores se corresponderían,
en general, con el aumento en el volumen de ventas mensuales realizadas.
3- Los auditores deben comparar muchas veces el valor revisado (o actual) de un
artículo del catálogo de inventario con el valor en los libros (o nominal). Si una
compañía tiene su inventario y sus libros al día, debe existir una gran relación entre
los valores revisados y los nominales.
Artículo 1 2 3 4 5 6 7 8 9 10
Valor revisado 9 14 7 29 45 109 40 238 60 170
Valor nominal 10 12 9 27 47 112 36 241 59 167
a) Ajustar los datos a un modelo lineal a través de estos datos e interpretar los
coeficientes resultantes.
Ŷ = 0,71 + 0,9914 x
Les quedan las interpretaciones. Sugerencia 1º) ubicar quien es la variable X y quién v.a. es Y.
b) Realizar una prueba de hipótesis para la correlación con α = 0,05.
Les queda de tarea
c) Si el valor nominal fuera 100, estimar el valor revisado.
Rta. Si el valor nominal de un artículo es 100$ su valor revisado es 99,85$.
4- El gerente de ventas de una compañía se está preparando para una reunión de ventas,
y le gustaría mostrar al grupo de vendedores la forma como se relaciona el número
de visitas mensuales a clientes con el monto mensual de los pedidos que reciben. De
sus registros recolectó los siguientes datos correspondientes a 10 meses elegidos al
azar.
Nº de visitas 5 4 6 7 8 1 3 4 1 3
Pedidos (miles de $) 4,8 6,1 12,3 13,7 15,7 3,2 5,3 7,8 1,3 7,6
Comenzó a preparar el diagrama de dispersión, calculó la recta de regresión y la
graficó sobre el diagrama.

Prof. Fernández, Graciela


4
Universidad Nacional de La Matanza Estadística

a) Realizar los pasos efectuados por el gerente.


Pasos efectuados por el gerente
1) Confección del diagrama de dispersión
Volum en m onto pedidos en relación al nº de visitas a clientes

20
montos anuales

15
pedidos

10
5
0
0 2 4 6 8 10
nº visitas a clientes

2º) Determinación de la recta de regresión es:


Ŷ = 0,0456 + 1,8415 x
3º) Representación gráfica de la recta de regresión sobre el diagrama

Volumen monto pedidos en relación al nº de visitas a clientes

20
montos anuales

15
pedidos

y = 1,8415x + 0,0456
10
R2 = 0,845
5

0
0 2 4 6 8 10
nº visitas a clientes
.
b) Calcular los coeficientes de correlación y de determinación e interpretarlos.
Los coeficientes son: r = 0,9192 r2 = 0,8449 interpretarlos (les queda a ustedes)
c) A partir de los datos, ¿puede llegarse a la conclusión de que, en general, conforme
se incrementa el número de visitas, también se aumentaría el monto de pedidos?
Realizar una prueba estadística adecuada con un nivel de significación del 2%.
Ustedes realicen el test de hipótesis, la conclusión es:
Conclusión: De acuerdo a la información muestral y con un nivel de significación del 2%
se podría concluir que conforme se incrementa el número de visitas de ventas, también
podría aumentarse el monto anual de pedidos.
d) Estimar el monto de los pedidos si en un mes cualquiera elegido al azar se
programaran 2 visitas. Ídem si se programaran 7 visitas.

Ŷ(2) . 1000= $3728,60 e Ŷ(7) . 1000 = $12.936,30


5- Las ventas de dentífrico parecen depender del nivel de publicidad. A fin de someter a
prueba esta observación, se hizo una muestra de cuatro marcas tomadas al azar para
las cuales se consideraron los gastos publicitarios anuales y sus ventas anuales:

Prof. Fernández, Graciela


5
Universidad Nacional de La Matanza Estadística

Marca Perlas blancas Brillo El número 1 Dentisan


Gastos anuales en pub. (millon. de $) 2 4 3 1
Ventas anuales (millones de $) 2,5 5,2 4 2
a) Calcular la ecuación de regresión de cuadrados mínimos e interpretar.
Ŷ = 0,65 + 1,11 x Interpretaciones les queda a ustedes.
b) ¿Qué porcentaje de la variación en el valor de las ventas queda explicado (por el
modelo de regresión lineal) por la variación en los gastos anuales por publicidad?
Rta: El 96,75% de la variación en el valor de las ventas queda explicado por la
variación en los gastos anuales por publicidad.
c) Con un nivel de significación del 2%, realizar una prueba adecuada para decidir si
un aumento en los gastos anuales de publicidad se correspondería con un aumento
en el valor de las ventas anuales.
Hacer el test de hipótesis, la conclusión es:
Con un nivel de significación del 2% se podría decir que un aumento en los gastos anuales
en publicidad se correspondería con un aumento en el valor de las ventas anuales.
d) Con la base en la ecuación de regresión, ¿qué importe de ventas debería obtenerse
con una inversión de 1,5 millones de pesos en publicidad?
Rta: Ŷ(1,5) . 1 millón = $ 2.315.000
e) ¿Puede usted estimar las ventas que se obtendrían con un gasto en publicidad de 8
millones de pesos? Justificar la respuesta.
Rta: No, no es posible Justificar
6- Una financiera otorga préstamos para la compra de autos, casas, departamentos, etc.;
las cuotas son fijas que dependen del monto del préstamo. La siguiente tabla
consigna una muestra de cuatro préstamos con sus respectivas cuotas expresados
ambos en miles de pesos:
Monto: 7 15 25 60
Cuota: 0,4 2,1 2.6 2,9
a) ¿Qué porcentaje de la variación de las cuotas está expresado por el modelo de
regresión lineal?
Rta: El 57,44% de la variación de las cuotas está expresado por la variación del
monto del préstamo.
b) Calcule la recta de regresión que crea conveniente y grafíquela.
Ŷ = 1,0308 + 0,036 x
c) Probar si existiría correlación lineal significativa entre las variables, utilizando α =
0,01.
Rta: De acuerdo a la muestra y con un nivel de significación del 1% se podría decir
que hay una escasa correlación entre las variables.
d) ¿Cuál es el valor esperado de cuota para un monto de $ 45.000?
Ŷ (45) . 1000= $2650,80
e) A la luz de la conclusión de la prueba c): ¿es pertinente hacer la estimación
d)?.Justificar.
Rta: No sería muy pertinente, para asegurarnos deberíamos juntar información
complementaria, podría ser tomando una muestra de mayor tamaño.
7- Explicar por qué son falsas las siguientes afirmaciones

Prof. Fernández, Graciela


6
Universidad Nacional de La Matanza Estadística

a) El coeficiente de determinación indica si la pendiente de la recta de regresión es


positiva o negativa. Falso, el coeficiente de correlación es el que indica si la
pendiente es + ó - .
b) El coeficiente de regresión mide la fuerza de asociación entre las variables. Falso,
el coeficiente de regresión es la pendiente de la recta, los que miden la fuerza de
asociación entre las variables son los coeficientes de correlación y de
determinación.
c) El coeficiente de correlación puede tener un valor absoluto mayor que uno. Falso,
el coeficiente de correlación puede tener un valor absoluto menor o igual a uno.
d) El coeficiente de correlación mide el porcentaje de la variación de “y” en función
de “x” explicada por el modelo de regresión lineal. Falso, el coeficiente de
determinación mide el porcentaje de la variación de “y” en función de “x” explicada
por el modelo de regresión lineal.
8- En un estudio de distintos fondos comunes de inversión se desarrolló un
procedimiento consistente en construir la recta característica para cada fondo, esta
recta explica la redituabilidad de cada fondo en función de la redituabilidad
promedio. Si la pendiente de dicha recta es significativamente distinta de cero, se
dice que el fondo es muy sensible a los cambios y es, por lo tanto, una inversión
riesgosa, si por lo contrario, la pendiente de la recta es muy cercana a cero, se
considera una inversión estable.
Se analizó para el período 1992- 1996 la rentabilidad del Fondo Común de Inversión
Redifon (variable y) y el promedio del mercado, obteniéndose los siguientes
resultados
Datos
n=5
X  6,0 
X 2i  220,00 Y  3,52 Yi2  66,88 
X i Yi  119,6 
 X  n.X  5.6  30
i  n.Y  5.3,52  17,6 Y i

a) Encontrar la recta que explique la renta del Fondo Redifon en función de la renta
media.
a  y  bx
 x . y
 x .y 
i i
i i
b n
( x i ) 2
x 2
i 
n

 x . y   n
x. y 30.17, 6
i i
119, 6 
i i
5 14
b    0,35
x  
2 2
( x) (30) 40
2
i
i
220 
n 5

a  y  bx
a  3,52  0,35.6  1, 42

Ŷ = 1,42 + 0,35 x

Prof. Fernández, Graciela


7
Universidad Nacional de La Matanza Estadística

b) Decida si existe correlación lineal entre las rentabilidades promedio del mercado y
la del Fondo Redifon con un nivel de significación del 10%.
Hacer el test de hipótesis, la conclusión es:
Existe correlación lineal entre las variables a un nivel de significación del 10%.
c) Estimar la rentabilidad del Fondo Redifon para una rentabilidad media del
mercado de 8,0.
Rta: Ŷ (8,0) = 4,22
9- Los volúmenes medios de ahorro y renta del sector familias en billones de pesos,
para el período 1997-2006 fueron
Año 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
Ahorro 1.9 1.8 2.0 2.1 1.9 2.0 2.2 2.3 2.7 3.0
Renta 20.5 20.8 21.2 21.7 22.1 22.3 22.2 22.6 23.1 23.5
Datos
n = 10 X : volúmenes medios de ahorro Y: renta del sector familias en billones de $
Se pide:
a) La recta de regresión considerando el ahorro como variable independiente.
a= 17,32 b = 2,137 Ŷ = 17,32 + 2,137 x
b) Para el año 2007 se supone una renta de 24.1 billones de pesos. ¿Cuál sería el
ahorro esperado para el año 2007?
Ŷ = 17,32 + 2,137 .x
24,1 = 17,32 + 2,137 .x  x = 3,1727 billones de pesos
c) Calcular los coeficientes que evalúan si el modelo es adecuado.
Rta: r = 0,851 r2 = 0,7242
10- (*) En 1962 el economista norteamericano Arthur Okun planteó un modelo
macroeconómico que se conoce hoy en día como la “ley de Okun,” que establece que
existe una relación lineal entre el cambio en la tasa de desempleo y la tasa de
crecimiento del Producto Interno Bruto (PBI) real.
El siguiente cuadro muestra datos sobre desempleo y crecimiento económico en los
Estados Unidos durante el período 1966-95.
Les queda de tarea
a) Con estos datos estimar el modelo lineal y explicar el significado de los coeficientes
obtenidos.
b) Determinar el punto donde la recta de regresión corta el eje x para este caso, y
explicar su significado en términos del modelo.
c) Calcular los coeficientes e interpretar.
d) Realizar la prueba se significación para el coeficiente de correlación poblacional y
decidir, según la prueba anterior, si puede considerarse que ρ supera 0,9 con un nivel
del 0,05.

Tasa de Desempleo Crecimiento PIB real Tasa de Desempleo Crecimiento PIB real
(%) (%) (%) (%)
1966 3.6 6.0 1981 7.5 1.8
1967 3.7 2.6 1982 9.5 -2.2
1968 3.4 4.1 1983 9.5 3.9
1969 3.4 2.7 1984 7.4 6.2

Prof. Fernández, Graciela


8
Universidad Nacional de La Matanza Estadística

1970 4.8 0.0 1985 7.1 3.2


1971 5.8 3.1 1986 6.9 2.9
1972 5.5 4.8 1987 6.1 3.1
1973 4.8 5.2 1988 5.4 3.9
1974 5.5 -0.6 1989 5.2 2.5
1975 8.3 -0.8 1990 5.6 0.8
1976 7.6 4.9 1991 6.8 -1.2
1977 6.9 4.5 1992 7.5 3.3
1978 6.0 4.8 1993 6.9 3.1
1979 5.8 2.5 1994 6.0 4.1
1980 7.0 -0.5 1995 5.5 2.0

Prof. Fernández, Graciela


9

Você também pode gostar