Você está na página 1de 26

SOLUCIÓN DE PROBLEMAS DE REGRESIÓN LINEAL

1- En una fábrica tenemos máquinas en línea y un número de servicios cumplidos que se


muestra en la siguiente tabla. Con estos datos hallar lo que se solicita a continuación:

Máquinas en línea Número de servicios cumplidos

3 3
6 2
5 3
4 5
4 3
6 6
8 6
7 4
a) Hallar el diagrama de dispersión

6
Númerde servicios cumplidos

4
y = 0.4025x + 1.8365
3 R² = 0.2013

0
0 2 4 6 8 10
Máquinas en línea

2. Hallar el coeficiente de correlación y el coeficiente de determinación e interpretarla

Coeficiente de correlación 0.448617723


Coeficiente de determinación 0.201257862
 Coef determin.: La variación de los números de servicios cumplidos es explicada en
un 20.1% por la variación maquinas en línea y con una variación 79.9% por otros
factores

 Coef correl Hay una relación directa entre las máquinas en línea y el número de
servicios cumplidos por el operador durante el periodo. El coeficiente de correlación
tiene por resultado 0.448617723, esto quiere decir, dichas variables presentan una
correlación positiva débil debido a que los puntos se dispersan mucho respecto a la
recta trazada a través de los centros de los datos.

3. AVIANCA seleccionó una muestra aleatoria de 25 vuelos nacionales y determinó que la


correlación entre el número de pasajeros y el peso total, en libras, del equipaje
almacenado en el compartimento para ello es 0.94. Con el nivel de significancia de 0.05,
¿se puede concluir que hay una asociación positiva entre ambas variables?
Solución:

Datos:

X= número de pasajeros.

Y= peso total de libras del equipaje almacenado en el compartimiento.

n=25

r=0.94

Formulación de la Hipótesis.

H0: ρ= 0 (No existe una asociación positiva)

H1: ρ≠ 0 (Existe una asociación positiva)

n<30

Hallar los puntos críticos.

α=0.05

Regla de decisión:
Rechazar Ho si y solo si t0 < -2.069 o t0 > 2.069

Cálculo de t0.

t0=13.21
Interpretación:

Se rechaza Ho y se acepta H1 dado que el valor de “t calculado” se haya en el área de


rechazo, por lo que se confirma que la relación existente entre el número de pasajeros y el
peso total, en libras, del equipaje almacenado en el compartimento.

4. Un psicólogo afirma que el éxito de los estudiantes en la UNMSM (medido por su


promedio) se relaciona con el ingreso familiar. En una muestra de 20 estudiantes, el
coeficiente de correlación es 0.40. Con el nivel de significancia de 0.01, ¿se puede
concluir que hay una correlación positiva entre las variables?
Solución:

Datos:

X=Promedio del estudiante UNMSM

Y=Ingreso familiar

n=20

r=0.40

Formulación de la Hipótesis.

H0: ρ= 0 (No existe una asociación positiva)

H1: ρ≠ 0 (Existe una asociación positiva)

Como n<30 utilizamos t para establecer los puntos críticos.

=0.01

t=1.860

Regla de decisión.

Rechazar Ho si y solo si t0 < 2.878 o t0 > 2.878


Cálculo de to.

t0=1.85

Interpretación:

Se rechaza Ho y se acepta H1 dado que el valor de “t calculado” se haya en el área de


rechazo, por lo que se confirma que la relación existente entre el promedio del alumno
UNMSM con el ingreso familiar

5. Un estudio que realizó el Organismo de Evaluación y Fiscalización Ambiental (OEFA) de

Perú en 12 automóviles reveló una correlación de 0.47 entre el tamaño del motor y sus

emisiones. Con un nivel de significancia de 0.01, ¿se puede concluir que hay una

asociación positiva entre estas variables? ¿Cuál es el valor p? Interprete los resultados.

Solución:

X=Tamaño del motor.


Y=Emisiones del motor.

Formulación de la Hipótesis.
H0: ρ= 0 (No existe una asociación positiva)
H1: ρ≠ 0 (Existe una asociación positiva)

Como n<30 utilizamos t para establecer los puntos críticos.


t (n-k) estudiantes = t10

α=0.01
t=3.169

De H0

Zona de rechazo de
H0

1.6838
Regla de decisión.
Rechazar Ho si y solo si t0 > 2.169

Calculo de to.

to=0.47*(10)1/2/((1-(0.47)2)1/2
to=1.6838

Interpretación:

Se rechaza Ho y se acepta H1 dado que el valor de “t calculado” se haya en el área de


rechazo, por lo que se confirma que la relación existente entre la cantidad gastada en
diversión y el tamaño de la familia es positiva.

6. El Cuerpo General de Bomberos Voluntarios del Perú desea estudiar la relación entre la
cantidad de daño por fuego, la distancia entre la casa ardiendo y la estación de bomberos
más cercana. Mediante una muestra de 30 demandas durante el año 2018, se determinó a
la distancia de la estación de bomberos (X) y la cantidad de daños, en miles de dólares
(Y). Veamos la siguiente tabla ANOVA.

TABLA
ANOVA
Fuente SS Ms
d f F
Regresión 1864.5782 1 1864.5782 38.83
Error residual 1344.934 28 48.0176
Total 3209.0716 29
Salida de la regresión
Variables Coeficiente Error estándar T(df=28)
Intercepción 33 3.2915 3.755
Distancia-x 34 0.7696 6.231

a) Elabore la ecuación de regresión. ¿Hay una relación directa o indirecta entre la distancia

de la estación de bomberos y la cantidad de daño?

Solución:

Y´= 12.3601 + 4.7956 x


864.5782
R= √3209.0716 = 0.7622

Interpretación:
Existe un grado de asociación directa fuerte entre las variables la distancia de la estación
de bombero y la cantidad de daño, ya que el coeficiente de correlación es muy cercano a 1.

7. Del ejercicio anterior hallar lo siguiente:


a) ¿Cuánto daño estimaría que provoca un incendio situado a 5 millas de la estación de
bomberos más cercana?
Solución:

Y´= 12.3601 + 4.7956 x


Y´= 12.3601 + 4.7956 (5)
Y´= 12.3601 + 23.978 = 36.3381
Interpretación:
Si un incendio se provoca a 5 milla de la estación de bomberos más cercana el daño se
estimaría en 36.3381 miles de dólares.

b) Encuentre e interprete el coeficiente de determinación.


Solución:
864.5782
𝑟 2 = 3209.0716 = 0.5810 = 58.10%

Interpretación:
La variación de la distancia de la estación de bomberos explica a la variable y la
cantidad de daño en un 58.10%.

c) Determine el coeficiente de correlación. Interprete su valor. ¿Cómo determinó el signo


del coeficiente de correlación?
Solución:

864.5782
R= √3209.0716 = 0.7622
Interpretación:
Existe un grado de asociación directa fuerte entre las variables la distancia de la estación
de bombero y la cantidad de daño, ya que el coeficiente de correlación es muy cercano
a 1.

8. Una Asociación de compras para el consumidor probó el área de calefacción efectiva de 20


calentadores eléctricos distintos, con consumos, en vatios, distintos. Los resultados son los
siguientes.

Calentador Vatios Área


1 1500 206
2 750 70
3 1500 199
4 1250 151
5 1250 181
6 1250 217
7 1000 94
8 2000 298
9 1000 136
10 1500 211
11 1250 116
12 500 72
13 500 82
14 1500 206
15 200 245
16 1500 219
17 750 63
18 1500 200
19 1250 151
20 500 44

a) Calcule la correlación entre consumo en vatios y área de calefacción. ¿Existe

una relación directa o indirecta? Hallando el coeficiente de correlación.

Solución:
Coef. Correlación (r) = 0.9393
Interpretación:
Existe un grado de asociación directa fuerte entre las variables consumo en vatios y
área de calefacción, ya que el coeficiente de correlación es muy cercano a 1.

b) Realice una prueba de hipótesis para determinar si es razonable que el


coeficiente sea mayor que 0. Utilice el nivel de significancia 0.05.
Solución:

Contrastación de hipótesis
H0: β≤0
H1: β>0

n=20 t(n-k)=t(18) α= 5% b 4.8606


tc= t critico=1.734 Sb 0.8402
to 5.7849

Interpretación:
Se rechaza la ¨H0¨y se acepta ¨H1¨, dado que el ¨to¨ es mayor que el ¨t critico¨ en
consecuencia existe una relación positiva entre el consumo de vatios y el área de
calefacción , por lo tanto se determina que es razonable que el coeficiente sea mayor
que 0.

9. Alicorp S.A., hace entregas en la región de Ecuador, en el lado sur y en el lado norte.
Alfredo Perez Gubbins, el presidente, estudia la relación entre la distancia de recorrido de
un embarque y el tiempo, en días, que dura en llegar a su destino. Para investigar esta
cuestión, el señor Perez Gubbins seleccionó una muestra aleatoria de 20 embarques del mes
pasado. La distancia de envío es la variable independiente y el tiempo de envío es la
variable dependiente. Los resultados son los siguientes:

TIEMPO DE
DISTANCIA
ENVIO
656 5
853 14
646 6
783 11
610 8
841 10
785 9
639 9
762 10
762 9
862 7
679 5
835 13
607 3
665 8
647 7
685 10
720 8
652 6
828 10

a) Trace un diagrama de dispersión. Con base en estos datos, ¿parece haber una relación
entre la cantidad de millas que debe recorrer el embarque y el tiempo que tarda en
llegar a su destino?

16
14
y = 0.0214x - 6.9339
12
Tiempo en horas

10
8
6
4
2
0
0 200 400 600 800 1000
Distancia en km.
b) Determine el coeficiente de correlación. ¿Es posible concluir que hay una correlación
positiva entre la distancia y el tiempo? Utilice el nivel de significancia 0.05.

Coef. De correlación:

X Y X^2 Y^2 XY
656 6 430336 36 3936
853 14 727609 196 11942
646 6 417316 36 3876
778 12 605284 144 9336
610 8 372100 64 4880
842 10 708964 100 8420
785 9 616225 81 7065
640 9 409600 81 5760
762 10 580644 100 7620
762 9 580644 81 6858
861 7 741321 49 6027
679 5 461041 25 3395
835 13 697225 169 10855
607 3 368449 9 1821
665 8 442225 64 5320
650 7 422500 49 4550
685 10 469225 100 6850
720 8 518400 64 5760
TOTAL 13036 154 9569108 1448 114271

(X- (X-Xmedia)(Y-
X Y Xmedia)^2 (Y-Ymedia)^2 Ymedia)
656 6 4654.271605 6.530864198 174.345679
853 14 16583.71605 29.64197531 701.1234568
646 6 6118.716049 6.530864198 199.9012346
778 12 2892.049383 11.86419753 185.2345679
610 8 13046.71605 0.308641975 63.45679012
842 10 13871.60494 2.086419753 170.1234568
785 9 3693.938272 0.197530864 27.01234568
640 9 7093.382716 0.197530864 -37.43209877
762 10 1427.160494 2.086419753 54.56790123
762 9 1427.160494 0.197530864 16.79012346
861 7 18708.16049 2.419753086 -212.7654321
679 5 2045.049383 12.64197531 160.7901235
835 13 12271.71605 19.75308642 492.345679
607 3 13741.04938 30.86419753 651.2345679
665 8 3507.271605 0.308641975 32.90123457
650 7 5508.938272 2.419753086 115.4567901
685 10 1538.382716 2.086419753 -56.65432099
720 8 17.82716049 0.308641975 2.345679012
TOTAL 13036 154 128147.1111 130.4444444 2740.777778

Covarianza (Sxy) 161.222222


D. Est. X (Sx) 86.8220327
D. Est. Y (Sy) 2.77005462

𝑆𝑥𝑦
𝑟=
𝑆𝑥 𝑆𝑦

161.222222
𝑟= = 0.670357728
86.8220327 ∗ 2.77005462

*Aplicamos la prueba de hipótesis para la linealidad del modelo, con un grado de significancia
del 5%
Plantemos la hipótesis:
H 0
: ρ= 0
H 1
: ρ≠ 0

N= 18 Α= 5% Tc = 2.921 To = 3.6136

R² 0.449379484
R 0.6704
Sr 0.1855
to 3.6136

(𝑟 − 𝑝)
T0 =
𝑆𝑟

√(1 − 𝑟2)
Sr =
(𝑛 − 𝑘)
Rechazo de Ho Rechazo de Ho

Acepto de Ho

-2.921 +2.921

Interpretación:

Se rechaza la hipótesis nula y se acepta la hipótesis alternativa, dado que la t calculada


es mayor que la t crítica, en consecuencia existe un grado de relación lineal de la
variable la distancia y el tiempo de envió.

10. Un economista estudia compañías que se hacen públicas por primera vez. Le interesa en
particular la relación entre el tamaño de la oferta y el precio por acción. Una muestra de 15
compañías que recién se hicieron públicas reveló la siguiente información.

Tamaño (en
millones de Precio por
dólares) X acción Y
9 10,8
94,4 11,3
27,3 11,2
179,27 11,1
71,9 11,1
97,9 11,2
93,5 11
70 10,7
160,7 11,3
96,5 10,6
83 10,5
23,5 10,3
58,7 10,7
93,8 11
34,4 10,8

a) Determine la ecuación de regresión.

Σy∗Σx2 −Σx∗Σxy
a=
𝑛∗Σx2 −(Σx)2

n∗Σxy−Σx∗Σy
b=
𝑛∗Σx2 −(Σx)2

X Y X^2 Y^2 XY
9 10.8 81 116.64 97.2
94.4 11.3 8911.36 127.69 1066.72
27.3 11.2 745.29 125.44 305.76
179.27 11.1 32137.7329 123.21 1989.897
71.9 11.1 5169.61 123.21 798.09
97.9 11.2 9584.41 125.44 1096.48
93.5 11 8742.25 121 1028.5
70 10.7 4900 114.49 749
160.7 11.3 25824.49 127.69 1815.91
96.5 10.6 9312.25 112.36 1022.9
83 10.5 6889 110.25 871.5
23.5 10.3 552.25 106.09 242.05
58.7 10.7 3445.69 114.49 628.09
93.8 11 8798.44 121 1031.8
34.4 10.8 1183.36 116.64 371.52
TOTAL 1193.87 163.6 126277.1329 1785.64 13115.417

Por lo tanto:

Σy∗Σx2 −Σx∗Σxy 163.6∗126277,1329−1193,87∗13115,417


a= = = 10,667
𝑛∗Σx2 −(Σx)2 15∗126277,1329−(1193,87)2

n∗Σxy−Σx∗Σy 15∗13115,417−1193,87∗1193,87
b= = = 0,003
𝑛∗Σx2 −(Σx)2 15∗126277,1329−(1193,87)2

Y=10,667-0,003x

b) Haga una prueba para determinar si el deslizamiento de la regresión lineal es positivo.


*Aplicamos la prueba de hipótesis para la linealidad del modelo, con un grado de
significancia del 5%

Plantemos la hipótesis:

H 0
: ρ= 0
H 1
: ρ≠ 0

N= 15 Α= 5% Tc = 3.012 To = 1.8991

R² 0.217178176
R 0.4660
Sr 0.2454
to 1.8991
(𝑟 − 𝑝) Rechazo de Ho Rechazo de Ho
T0 =
𝑆𝑟
Acepto de Ho
√(1 − 𝑟2)
Sr =
(𝑛 − 𝑘) -3.012 +3.012

Interpretación:

Se acepta la hipótesis nula y se rechaza la hipótesis alternativa, dado que la t calculada


es menor que la t crítica, en consecuencia no existe un grado de relación lineal de la
cantidad de tamaño y el precio de la acción.

SOLUCIÓN DE PROBLEMAS DE SERIES DE TIEMPO

1. Una importante corporación comercial de la ciudad de Lima ha tenido ventas por $15
millones, $20 millones, $25 millones, $30 millones y $35 millones durante los años de
2015 a 2019, respectivamente.

a. Pronosticar para por próximos 5 años.

Solución:
AÑO UTILIDADES
2015 15
2016 20
2017 25
2018 30
2019 35

Para aplicar el método de mínimos cuadrados, primero hay que identificar los coeficientes de
la ecuación de tendencia. Para esto se podrían utilizar las funciones de Excel o las fórmulas
tradicionales. Entonces, para utilizar las fórmulas tradicionales se desarrolla el siguiente
cuadro:

AÑO UTILIDADES t X*Y X^2


2015 15 1 15 1
2016 20 2 40 4
2017 25 3 75 9
2018 30 4 120 16
2019 35 5 175 25
TOTAL 125 15 425 55

A partir de dichos resultados se hallarán los coeficientes a y b de la ecuación de tendencia:

a = 10

b=5

Con aquellos datos se hallará la ecuación de tendencia y por tanto los pronósticos para los
próximos 5 años.

Ecuación de la tendencia:

y = a + bx
y = 10 + 5x

AÑO UTILIDADES t Y°
2015 15 1 15
2016 20 2 20
2017 25 3 25
2018 30 4 30
2019 35 5 35
2020 6 40
2021 7 45
2022 8 50
2023 9 55
2024 10 60

2. Las siguientes son las ventas (en miles de millones de dólares) de American Brands, Inc.
para los años de 1999 a 2004: 5.6, 5.9, 6.2, 6.5, 7.3 y 7.4.

a. Pronosticar para por próximos 5 años.

Solución:
AÑO UTILIDADES
1999 5.6
2000 5.9
2001 6.2
2002 6.5
2003 7.3
2004 7.4

Para aplicar el método de mínimos cuadrados, primero hay que identificar los
coeficientes de la ecuación de tendencia. Para esto se podrían utilizar las funciones de
Excel o las fórmulas tradicionales. Entonces, para utilizar las fórmulas tradicionales se
desarrolla el siguiente cuadro:

AÑO UTILIDADES t X*Y X^2


1999 5.6 1 5.6 1
2000 5.9 2 11.8 4
2001 6.2 3 18.6 9
2002 6.5 4 26 16
2003 7.3 5 36.5 25
2004 7.4 6 44.4 36
TOTAL 38.9 21 142.9 91

A partir de dichos resultados se hallarán los coeficientes a y b de la ecuación de tendencia:

a = 5.13333333

b = 0.385714286

Con aquellos datos se hallará la ecuación de tendencia y por tanto los pronósticos para los
próximos 5 años.

Ecuación de la tendencia:

y = a + bx
y = 5.13 + 0.39x

AÑO UTILIDADES t Y°
1999 5.6 1 5.52
2000 5.9 2 5.90
2001 6.2 3 6.29
2002 6.5 4 6.68
2003 7.3 5 7.06
2004 7.4 6 7.45
2005 7 7.83
2006 8 8.22
2007 9 8.60
2008 10 8.99
2009 11 9.38

3. Las siguientes son las exportaciones de paltas de Perú en los años de 2005 a 2013 (en
millones de dólares): 1359, 1263, 1655, 1951, 1964, 2000, 2142, 3220 y 3095.
a. Pronosticar para por próximos 5 años.

Solución:

AÑO UTILIDADES
2005 1359
2006 1263
2007 1655
2008 1951
2009 1964
2010 2000
2011 2142
2012 3220
2013 3095

Para aplicar el método de mínimos cuadrados, primero hay que identificar los
coeficientes de la ecuación de tendencia. Para esto se podrían utilizar las funciones de
Excel o las fórmulas tradicionales. Entonces, para utilizar las fórmulas tradicionales se
desarrolla el siguiente cuadro:

AÑO UTILIDADES t X*Y X^2


2005 1359 1 1359 1
2006 1263 2 2526 4
2007 1655 3 4965 9
2008 1951 4 7804 16
2009 1964 5 9820 25
2010 2000 6 12000 36
2011 2142 7 14994 49
2012 3220 8 25760 64
2013 3095 9 27855 81
TOTAL 18649 45 107083 285

A partir de dichos resultados se hallarán los coeficientes a y b de la ecuación de tendencia:

a = 918.944444

b = 230.633333

Con aquellos datos se hallará la ecuación de tendencia y por tanto los pronósticos para los
próximos 5 años.

Ecuación de la tendencia:
y = a + bx
y = 918.94 + 230.63x

AÑO UTILIDADES t Y°
2005 1359 1 1149.57778
2006 1263 2 1380.21111
2007 1655 3 1610.84444
2008 1951 4 1841.47778
2009 1964 5 2072.11111
2010 2000 6 2302.74444
2011 2142 7 2533.37778
2012 3220 8 2764.01111
2013 3095 9 2994.64444
2014 10 3225.27778
2015 11 3455.91111
2016 12 3686.54444
2017 13 3917.17778
2018 14 4147.81111
8. Describir el procedimiento que corresponda cuando los datos de demanda anual están
estacionalizados (agrupados):
a. Cada dos meses
b. Hallar el pronóstico para el año 2016

Demanda del año


Bimestral
2012 2013 2014 2015

I 3457 4607 4897 4870

II 6567 7245 9530 10656

Suma 10024 11852 14427 15526

Solución:

12000

10000

8000
Demanda

6000

4000

2000

0
0 1 2 3 4 5 6 7 8 9
Tiempo

a 3568.14286 b 646.77381

(Deman ÷
Año Semestre Deman Con mmcc: fe promedio
D)

I 3457 4214.91667 1 0.82018229


2012 Para cada semestre, es
II 6567 4861.69048 2 1.35076473 la suma de los valores
en la columna
I 4607 5508.46429 3 0.83634925 anterior, dividido
2013 entre cuatro:
II 7245 6155.2381 4 1.17704626
I 4897 6802.0119 5 0.71993405
2014
II 9530 7448.78571 6 1.27940316
I 4870 8095.55952 7 0.60156435 Tri I 0.74450749
2015
II 10656 8742.33333 8 1.21889656 Tri II 1.25652768 Pronóstico
I 9389.10714 9 Tri I 6990.260561
2004
II 10035.881 10 Tri II 12610.36218

EJEMPLO:

1. He aquí los gastos de publicidad (como porcentaje de gastos totales) y los beneficios de
operación netos (como porcentajes de ventas) en una muestra aleatoria de 10 pequeñas
joyerías:

Gastos de
publicidad Beneficios
X Y
1.2 2.7
0.7 2.4
1.5 2.7
1.8 3.3
0.5 1.1
3.4 5.8
1.0 2.2
3.0 4.2
2.8 4.4
2.5 3.8

a) Elabore los escenarios normal, pesimista y optimista

A 0.962722 n 10 Xmedia 1.84 t 2.306


(X -
B 1.248521 Syx 0.40796435 Ymedia 3.26
Xmedia)^2 -33.856
Gastos de ESCENARI
ESCENARI ESCENARIO
publicida Beneficio O
O NORMAL PESIMISTA
d s OPTIMISTA
Y` + t(n-k)
X Y Y` Y` -t(n-k) * Spyx X^2
*Spyx
1.2 2.7 2.4609 1.4797 3.4422 1.44
0.7 2.4 1.8367 0.8674 2.8060 0.49
1.5 2.7 2.8355 1.8504 3.8207 2.25
1.8 3.3 3.2101 2.2234 4.1967 3.24
0.5 1.1 1.5870 0.6244 2.5496 0.25
3.4 5.8 5.2077 4.2538 6.1616 11.56
1.0 2.2 2.2112 1.2340 3.1885 1
3.0 4.2 4.7083 3.7396 5.6770 9
2.8 4.4 4.4586 3.4842 5.4330 7.84
2.5 3.8 4.0840 3.1031 5.0649 6.25
ES
ESTIMACION

2.6 4.2089 3.2299 5.1879


2.7 4.3337 3.3569 5.3106
2.9 4.5834 3.6117 5.5551
3 4.7083 3.7396 5.6770
3.1 4.8331 3.8677 5.7986

Pronóstic
o

b) Elabore el gráfico que muestre los pronósticos.


Pronósticos
7.0000

6.0000

5.0000

4.0000

3.0000

2.0000

1.0000

0.0000
1.2 0.7 1.5 1.8 0.5 3.4 1.0 3.0 2.8 2.5 2.6 2.7 2.9 3 3.1
ESCENARIO PESIMISTA ESCENARIO NORMAL
ESCENARIO OPTIMISTA ESCENARIO REAL

9. Los datos de la producción de trigo en toneladas (X) y el precio del kilo de harina en
pesetas (Y ) en la década de los 80 en España fueron:

Producción de trigo 30 28 32 25 25 22 24 35
Precio de la Harina 25 30 27 40 42 50 45 30

a) Elabore los escenarios normal, pesimista , optimista y sus predicciones.


a 86.1405 Syx 5.01538883 T 2.447 (X-Media x)^2 137.8750
media de
b -1.8105 n 8 27.625 Suma X^2
X 6243

Producción Precio de
de trigo la Harina Escenario Escenario Escenario
normal pesimista optimista

X Y Y^ Y^ - T*Spyx Y^ + T*Spyx X^2 (X-Xmedia)^2


30 25 31.825 18.57333151 45.07671383 900 5.6406
28 30 35.4461 22.42303885 48.46907357 784 0.1406
32 27 28.204 14.40706714 42.0009111 1024 19.1406
25 40 40.8776 27.57449224 54.18072082 625 6.8906
25 42 40.8776 27.57449224 54.18072082 625 6.8906
22 50 46.3092 32.02593702 60.59237667 484 31.6406
24 45 42.6881 29.13081877 56.24542783 576 13.1406
35 30 22.7724 7.644218905 37.9006587 1225 54.3906
38 17.3409 0.398790962 34.28298601 6243 137.9
PREDICCIONES
40 13.7199 -4.630622054 32.07033194
45 4.66727 -17.67636839 27.01091054
25 40.8776 27.57449224 54.18072082
50 -4.3853 -31.15017208 22.37954651
34 24.583 9.959611445 39.20629971
42 10.0988 -9.780432699 29.97807549
36 20.9619 5.275343977 36.64850008
55 -13.438 -44.87192934 17.99613605

b) Elabore el gráfico que muestre los pronósticos.

80

60

40

20

0
30 28 32 25 25 22 24 35 38 40 45 25 50 34 42 36 55
-20

-40

-60

10. Un ejecutivo Netflix de publicidad desea establecer la relación entre la parte de mercado
de la empresa, Y, y sus gastos anuales en anuncios por internet, X. Dados los datos de
la tabla, determine una ecuación de regresión.

Parte del mercado, Y Gasto anual en anuncios


(porcentaje) por internet, X (miles de dólares)

8.8 23
12.7 33
13.8 36
15.0 39
17.2 42
28.6 69
30.8 88
41.2 127
53.0 130

a) Elabore los escenarios normal, pesimista , optimista y sus predicciones.

(X-Media
a 1.23145884 Syx 3.16193716 T 2.365
x)^2 13447.5556
b 0.35778002 n 9 X Media 65.2222222 Suma X^2 51733

Escenario Escenario Escenario


normal pesimista optimista
(X-
X Y
Y^ Y^ - T*Spyx Y^ + T*Spyx X^2 Xmedia)^2
23 8.8 9.46039925 0.65586039 18.2649381 529 1782.71605
33 12.7 13.0381994 4.44064769 21.6357512 1089 1038.2716
36 13.8 14.1115395 5.56524023 22.6578387 1296 853.938272
39 15 15.1848795 6.684828 23.6849311 1521 687.604938
42 17.2 16.2582196 7.79941101 24.7170282 1764 539.271605
69 28.6 25.9182801 17.6054438 34.2311164 4761 14.2716049
88 30.8 32.7161004 24.2629763 41.1692246 7744 518.82716
127 41.2 46.6695211 37.2995058 56.0395364 16129 3816.49383
130 53 47.7428612 38.2672824 57.2184399 16900 4196.16049
PREDICCIONES

133 48.8162012 39.2300543 58.4023482 51733 13447.5556


136 49.8895413 40.1878214 59.5912612
139 50.9628813 41.1405837 60.7851789
142 52.0362214 42.0883413 61.9841015
145 53.1095614 43.0310941 63.1880288
148 54.1829015 43.9688421 64.3969609

B) Elabore el gráfico que muestre los pronósticos.


70

60

50

40

30

20

10

0
23 33 36 39 42 69 88 127 130 133 136 139 142 145 148

Você também pode gostar