Você está na página 1de 12

Ejercicio N1

La tabla muestra los datos para una muestra de 12 parejas sobre la cantidad de hijos que tienen y la
cantidad de hijos que haban establecido queran en el momento del matrimonio.

PAREJA 1 2 3 4 5 6 7 8 9 10 11 12
HIJOS QUE TIENE 4 3 0 4 4 3 0 ? 3 1 3 ?
HIJOS QUE QUERA 3 3 0 ? 2 3 0 ? 2 1 3 ?

Lamentablemente un virus computacional afect la base de datos, lo que hizo imposible conocer los
datos de la familia 8 y 12, adems se perdi el n de hijos que quera la familia 4. Sin embargo se
encontr un modelo hecho con la base de datos original, el cual se muestra a continuacin:

Yi = 0.2142857 + 1.14286 Xi
r2 = 0.677249 Se (2) = 0.24949
Suma total de cuadrados = 27 La media de X es 2 La media de Y es 2.5

SE PIDE:
1. Varianza de X y Varianza de Y
2. Obtener un intervalo de confianza al 95% de confianza para beta
3. Existe relacin significativa en su modelo?
4. Un dato encontrado a ltima hora da cuenta que la familia 4 antes de casarse manifest
intencin de tener hijos: es posible reconstruir la tabla original con la informacin rescatada?

Resolucin

1. Para poder calcular la varianza para ambas variables tenemos que considerar primero los
datos faltantes para la variable Y puesto que solo faltan dos. Adems considerar todas las
relaciones y frmulas posibles asociadas a una regresin simple de los datos recogidos.

Para calcular la sumatoria de x e y tenemos lo siguiente:

= = =
= = . =

Sabemos adems que:

( )2 302
SCT (suma de cuadrados totales) = 27 = 2
= 27 = 2 12

2 = 102

- Debido a que son dos datos los faltantes para la variable y los llamaremos a y b, los cuales
deben cumplir segn la tabla que:

17 = 2 + 2
Y tambin que:
+ =5
Completando cuadrados para la primera ecuacin=
17 = ( + )2 2
17 = 52 2
4 =
Y sabiendo que como mximo su suma debe ser 5, los nmeros faltantes son 5 y 1.

Tomando los datos en Excel tenemos que la varianza calculada es de :


4
3
0
4
4
3
0
5
3
1
3
1
Varianza 2,81060606
2 =2,810606061
Para poder calcular la varianza de x, tenemos las siguientes relaciones:

= Y adems 2 =
2

Si dividimos ambos factores:

2
=

Reemplazando trminos tenemos que:
1.14286 2,810606061
=
0.677249
De esto obtenemos que la varianza de x es igual a :
2 = 1.2072053

5. Obtener un intervalo de confianza al 95% de confianza para beta

El intervalo de confianza lo definimos como:

2 2,/2 (2)
10,0,025 = 2.2281
Intervalo de confianza se estima como:
1.14286 2.2281 0.24949

= [ 0,586971 , 1.698748]

3. Existe relacin significativa en su modelo?

Sabemos que SCT = SCR + SCE


2 = 1

SCE
0.677249 = 1
27
: = 8,714304
Por tanto = 27 8,714304 = 18,285696
Realizamos tabla Anova para ver significancia del modelo:
Fuentes Suma de Grados de MC F
cuadrados libertad OBSERVADO
Regresin 18,285696 1 18,285696 209,83
Error 8,714304 10 0,087143
Total 27 11

Al 95% 0,05,1,10= 4,965


Por tanto F observado es mayor que el F estadstico (4,965), por tanto podemos indicar que el
modelo es significativo.

4. Un dato encontrado a ltima hora da cuenta que la familia 4 antes de casarse manifest intencin
de tener hijos: es posible reconstruir la tabla original con la informacin rescatada?

No es posible reconstruir por lo menos la variable x, a pesar de que con la respuesta se deduzca que
ninguno de los tres valores faltantes sera 0. Falta informacin sobre la suma de los 2 para poder
generar al menos una tabla genrica para la variable x. La regresin solo nos estima una posibilidad,
por tanto no es 100% segura usarla.

Ejerccicio N2

La lnea del mercado de capitales (LMC) de la teora del portafolio postula, para portafolios
eficientes, una relacin lineal entre el retorno esperado y el riesgo (medido por la desviacin
estndar) como la siguiente:

Ei = 1 + 2i

Donde Ei = retorno esperado sobre el portafolio i y i = desviacin estndar del retorno. Dados
los siguientes datos sobre retorno esperado y desviacin del retorno de los portafolios de 34 fondos
mutuos en los Estados Unidos durante el perodo 1954-1963, verifique si los datos apoyan la
teora.
Datos en trminos absolutos:
i = 578 Ei = 476 iEi = 8337,7
E 14 17
Datos en trminos de desviacin:
i2 = 596.76 Ei2 = 179.44

Para analizar la relacin directa de lo anterior, solo debemos buscar el valor de la pendiente de beta
2 para saber si la relacin expuesta en la teora es la correcta, para ello necesitamos obtener la
sumatoria tanto para el retorno como para la desviacin de sus sumas al cuadrado. Dato que
tenemos datos en trminos de desviacin realizaremos los siguientes clculos:

Tenemos inicialmente que:

4762
2
179,44 =
34
De lo anterior tenemos que: 2 = 6843,44 para el retorno esperado.

De la misma manera para x o la desviacin estndar del retorno.


5782
596,76 = 2
34
De lo anterior tenemos que: 2 = 10422,76

Calculamos beta o pendiente de la regresin:

34 8337,7 578 476


2 = = 0,4117233
34 10422,76 5782

Podemos concluir finalmente que la teora expresada para portafolios eficientes, con una
relacin lineal entre el retorno esperado y el riesgo es cierta y de manera positiva.

Podemos obtener el coeficiente de intercepto b1=

1 = 14 17 0,4117233 = 7,0007~7
Por tanto el modelo de portafolio queda expresado como:
= + ,

Ejercicio N 3
Aerolneas Ibrica S.A. analiza la posibilidad de ingresar al mercado espaol de transporte areo.
Para esto, le encarga a usted el estudio de un modelo de regresin capaz de pronosticar la demanda
de pasajeros, con el objetivo de determinar el atractivo de este mercado.
Para realizar el anlisis, usted cuenta con las siguientes series de datos correspondientes a los

Ao Y X
1991 52,46 11,40
1992 61,85 11,87
1993 71,24 10,89
1994 80,63 10,85
1995 90,02 11,39
1996 100,71 12,23
1997 108,62 12,60
1998 116,29 13,34
1999 126,70 14,34
2000 138,61 15,42
millones de pasajeros espaoles que prefirieron la va area como medio de transporte y el producto
interno bruto per cpita en miles de euros.
Se pide:
a) Coeficientes Estimados del Modelo de Regresin.
b) Coeficiente de determinacin y Coeficiente de correlacin.
c) Pruebe la significancia estadstica de la pendiente y del intercepto a un 5%.
d) Pruebe la significancia estadstica del modelo a un 5%.
e) Los intervalos de confianza para cada uno de los parmetros y para 2 al 95%
f) Pronostique la cantidad de pasajeros transportados, suponiendo que el PIB espaol es 12.6
miles de euros.
g) Pruebe que la pendiente sea mayor que cero al 5% nivel de significancia.
h) Determine si existe una relacin positiva entre las variables del modelo.

Para poder responder las preguntas anteriores resolveremos mediante Excel (Regresin lineal y
anlisis de varianza) y contrastaremos:
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,86920886
Coeficiente de determinacin R^2 0,75552403
R^2 ajustado 0,72496454
Error tpico 14,9172541
Observaciones 10
ANLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crtico de F
Regresin 1 5501,48426 5501,48426 24,72305314 0,001090053
Residuos 8 1780,19575 222,524469
Total 9 7281,68001

Estadstico Inferior Superior


Coeficientes Error tpico t Probabilidad 95% 95%
- - -
Intercepcin -107,44367 40,9299034 2,62506532 0,030410304 201,828196 13,0591434
X 16,2596855 3,27010042 4,97222819 0,001090053 8,7188204 23,8005506
Tabla 1: Intercepto y Pendiente

A) Coeficientes Estimados del Modelo de Regresin.

= , + ,

B) Coeficiente de determinacin y Coeficiente de correlacin.

C) Pruebe la significancia estadstica de la pendiente y del intercepto a un 5%.

Segn los datos arrojados por el anlisis de varianza tenemos que:


Valor p
Intercepcin 0,0304103
X 0,00109005
Concluimos que para ambos se rechaza la hiptesis de que no son significativos y por tanto son
influyentes dentro del modelo.
D) Pruebe la significancia estadstica del modelo a un 5%.

De anlisis de varianza anterior obtenemos que Fisher observado es de 24,72 y el valor P para el
modelo en estudio es equivalente a 0,001 (menor a 0,05) por lo que rechazamos la hiptesis nula y
confirmamos que el modelo es significativo.

E) Los intervalos de confianza para cada uno de los parmetros y para 2 al 95%
Estadstico Inferior Superior
Coeficientes Error tpico t Probabilidad 95% 95%
- - -
Intercepcin -107,44367 40,9299034 2,62506532 0,030410304 201,828196 13,0591434
X 16,2596855 3,27010042 4,97222819 0,001090053 8,7188204 23,8005506

Del anlisis de coeficientes anterior tenemos que el intervalo de confianza para el intercepto es de:

= [201,82 , 13,059 ]
(2) = [ 8,7188 , 23,8]

F) Pronostique la cantidad de pasajeros transportados, suponiendo que el PIB espaol es 12.6 miles
de euros.
= , + ,
= 107,44367 + 16,2596 12.6 = 97,42729
Segn el pronstico la cantidad de pasajeros es de 97,42 millones de personas aproximadamente.

G) Pruebe que la pendiente sea mayor que cero al 5% nivel de significancia.


Para analizar lo anterior debemos considerar los siguientes datos obtenidos en Excel, las varianzas y
covarianzas respectivas:
Var y Var x
809,075557 2,31213444
Varxy 37,5945789
Teniendo como estadstico de prueba:
2
=

2 809,075557 16,259685 37,5945


= = 4,97243
2 10 2

16,259685 1,5205
= = 6,180
4
= 0,05 8
= 1,8595
Por tanto rechazamos la hiptesis de que es menor o igual a 0 b2, y por tanto es correcto decir que
la pendiente es mayor a 0.

H) Determine si existe una relacin positiva entre las variables del modelo.

De lo anterior y del anlisis hecho en G, podemos indicar que las variables presentan una relacin
positiva es decir a mayor producto percapita bruto mayor ser el aumento de pasajeros en las
distintos transportes.

Ejercicio N 4
Dados los siguientes datos de una lechera

SEMANA NIVEL SEMANAL DE PRECIO DE GASTOS EN


VENTAS (MILES DE LITROS) VENTA en centavos PUBLICIDAD
de dlar por litro cientos de dlares
1 10 130 9
2 6 200 7
3 5 170 5
4 12 150 14
5 10 160 15
6 15 120 12
7 5 160 6
8 12 140 10
9 17 100 15
10 20 110 21
SUMA 112 1440 114
a) Confeccione un modelo en dos variables que resulte adecuado para la situacin justifique
adecuadamente e interprete resultados.
b) Para su modelo calcule r y r. interprete
c) El precio explica las ventas de leche?
d) Establezca un intervalo de confianza para el parmetro relevante.
e) Efectu un pronstico de la cantidad de leche vendida si el precio fuese de US$ 1,63
f) Efectu un pronstico de la cantidad de leche vendida si el precio fuese de US$ 3,00
explique

a) Confeccione un modelo en dos variables que resulte adecuado para la situacin justifique
adecuadamente e interprete resultados.

Las variables elegidas fueron venta y precio, puesto que es de la segunda la demanda que se tendr
semanal y por tanto los niveles de utilidades generados de una empresa.

Analizando los datos en Excel tenemos que:


Coeficientes
Intercepcin 32,1359223
PRECIO DE VENTA en centavos de dlar por litro -0,14538835

Modelo estimado:
= , ,

b) Para su modelo calcule r y r. Interprete


Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,86348897
Coeficiente de determinacin R^2 0,7456132
R^2 ajustado 0,71381485
Error tpico 2,72545311
Observaciones 10
Del resultado anterior obtuvimos que la relacin prevista para el modelo es negativa (si uno
aumenta el otro disminuye) y que el modelo explica en un 74,56% los datos reales.

c) El precio explica las ventas de leche?

ANLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crtico de F
Regresin 1 174,175243 174,175243 23,4481722 0,00128432
Residuos 8 59,4247573 7,42809466
Total 9 233,6
Del anlisis de varianza para una regresin podemos concluir que el precio s explica las ventas de
la leche puesto que el modelo es totalmente significativo, ya que el valor crtico o p valor es mucho
menor a alfa = 0,05 para contrastar el estudio.
d) Establezca un intervalo de confianza para el parmetro relevante.

Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95%


Intercepcin 32,1359223 4,40858773 7,2893916 8,4753E-05 21,9697008 42,3021439
PRECIO DE VENTA en centavos
-0,14538835
de dlar0,03002445
por litro -4,84233128 0,00128432 -0,21462486 -0,07615184
Del anlisis de coeficientes, podemos indicar ambos parmetros son significativos y que por tanto
ambos son influyentes en el modelo puesto que su probabilidad es menor a 0,05 rechazando la
hiptesis de no significancia.
El intervalo de confianza para la pendiente es igual a :
= [0,214624863 , 0,076151836]
El intervalo de confianza para la interseccin es :
= [21,9697008 , 42,30214386]

e) Efectu un pronstico de la cantidad de leche vendida si el precio fuese de US$ 1,63


= , ,

Para el precio: 1,63 US$*100


= , ,
Por tanto la cantidad demanda ser de 8435,7 litros de leche aproximadamente.

f) Efectu un pronstico de la cantidad de leche vendida si el precio fuese de US$ 3,00 explique.
Para el precio: 3,00 US$*100
= , ,

Si el precio fuese de 3 dlares (300 dlares en centavos) la cantidad de leche que se vender
matemticamente es de -11,48, por lo que si lo situamos en la realidad, no se vender puesto que el
precio est muy por encima de lo que la gente realmente comprara.

Ejercicio N 5

EFECTUE UN MODELO LINEAL CON LAS TRES VARIABLES MENCIONADAS EN EL


EJERCICIO 4, CALCULANDO TODOS LOS INDICADORES VISTOS A LA FECHA.
COMENTE C/R AL CASO SIMPLE.

Se aplica la funcin de regresin en Excel y con ella obtendremos lo siguiente:


Coeficientes Error tpico Estadstico t Probabilidad
Intercepcin 16,4063651 4,34251935 3,77807531 0,00690962
PRECIO DE VENTA en centavos de dlar por litro -0,0824758 0,02196057 -3,75563086 0,00711547
GASTOS EN PUBLICIDAD cientos de dlares 0,5851009 0,13367182 4,37714473 0,00324572

El Modelo obtenido se expresa como:


= 16,4063 0,0825 + 0,5851
Donde PV = precio de venta y GP= gasto en publicidad.
Del modelo anterior podemos decir todas las variables son significativas ya que ocurre que sus p
valores o probabilidades son menores a 0,05, para un nivel de confianza del 95%.
Al analizar el modelo general tenemos que:
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,96536447
Coeficiente de determinacin R^2 0,93192856
R^2 ajustado 0,91247958
Error tpico 1,50719642
Observaciones 10
El modelo tiene una relacin lineal directa con el gasto en publicidad e inversa con el precio,
ajustndose en un 93,19% a los datos, por tanto es un modelo que explica significativamente los
reales.

ANLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crtico de F
Regresin 2 217,698513 108,849256 47,9165743 8,2296E-05
Residuos 7 15,9014872 2,27164103
Total 9 233,6
Para un nivel de confianza del 95% el modelo en general es significativo, puesto que su valor crtico
o p valor es mucho menor que 0,05 y se rechaza la hiptesis nula de no significancia. Dicho de otro
modo es un buen modelo predictivo.

Você também pode gostar