Você está na página 1de 42

Tema: Regresin Lineal y Correlacin

Facultad: Ciencias Administrativas

Curso: Estadstica para la Toma de Decisiones

Profesor: VICENTE ARMAS, EDGAR

Ciclo: IV

Alumnos: CERRN TUESTA, Josu


CASTILLEJO CHIGNE, Michael Frank
SANTIVAES SALAZAR, Jackeline Ximena
BASURTO SANTOS, Antony Hugo
BARZOLA OSORIO, Jefferson
SIMN CUEVA, Paul Snaider

2017
Dedicatoria

A mis padres quienes


siempre han sido un
ejemplo. A mis profesores
por el apoyo y la
incansable paciencia.
Introduccin
Uno de los aspectos ms relevantes de la Estadstica es el anlisis de la relacin o
dependencia entre variables. Frecuentemente resulta de inters conocer el efecto
que una o varias variables pueden causar sobre otra, e incluso predecir en mayor o
menor grado valores en una variable a partir de otra. Por ejemplo, supongamos que
la altura de los padres influye significativamente en la de los hijos. Podramos estar
interesados en estimar la altura media de los hijos cuyos padres presentan una
determinada estatura.

Los mtodos de regresin estudian la construccin de modelos para explicar o


representar la dependencia entre una variable respuesta o dependiente (Y) y la(s)
variable(s) explicativa(s) o dependiente(s), X. En este Tema abordaremos el modelo
de regresin lineal, que tiene lugar cuando la dependencia es de tipo lineal, y
daremos respuesta a dos cuestiones bsicas:

Es significativo el efecto que una variable X causa sobre otra Y? Es significativa


la dependencia lineal entre esas dos variables?

De ser as, utilizaremos el modelo de regresin lineal simple para explicar y


predecir la variable dependiente (Y) a partir de valores observados en la
independiente (X).
Marco terico
Regresin lineal
la regresin lineal o ajuste lineal es un modelo matemtico usado para aproximar la
relacin de dependencia entre una variable dependiente Y, las variables
independientes Xi y un trmino aleatorio .

Covarianza:
La covarianza es un valor que indica el grado de variacin conjunta de dos variables
aleatorias respecto a sus medias. Es el dato bsico para determinar si existe una
dependencia entre ambas variables y adems es el dato necesario para estimar
otros parmetros bsicos, como el coeficiente de correlacin lineal o la recta.

Coeficiente de correlacin:
El coeficiente de correlacin de Pearson es una medida de la relacin lineal entre
dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlacin
de Pearson es independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlacin de Pearson
como un ndice que puede utilizarse para medir el grado de relacin de dos variables
siempre y cuando ambas sean cuantitativas.
T de Student:

la prueba t de
Student, prueba t-Student, o Test-T es cualquier prueba en la que
el estadstico utilizado tiene una distribucin t de Student si la hiptesis nula es
cierta. Se aplica cuando la poblacin estudiada sigue una distribucin normal pero
el tamao muestral es demasiado pequeo como para que el estadstico en el que
est basada la inferencia est normalmente distribuido, utilizndose una estimacin
de la desviacin tpica en lugar del valor real. Es utilizado en anlisis discriminante.

Objetivos
Objetivos generales:

Comprender e interpretar los trminos variable dependiente e independiente.


Calcular e interpretar el coeficiente de correlacin, el coeficiente de
determinacin y el error estndar de estimacin.
Realizar una prueba de hiptesis para determinar si el coeficiente de
correlacin en la poblacin es cero.
Calcular la recta de regresin por mnimos cuadrados.
Elaborar e interpretar intervalos de confianza y pronstico para la variable
dependiente

Objetivos especficos

Saber relacionar todo teora a los casos de la vida real.


Tomar decisiones en base a los resultados encontrados luego del anlisis
estadstico.
37. Una aerolnea comercial selecciono una muestra aleatoria de 25 vuelos y
determin que la correlacin entre el nmero de pasajeros y el peso total, en
libras, del equipaje almacenado en el comportamiento para ello es 0.94. Con
el nivel de significancia de 0.05. Se puede concluir que hay una asociacin
positiva entre ambas variables?

X: nmero de pasajeros
Y: peso total en libras del equipaje almacenado en el comportamiento
n= 25
r: 0.94
1 paso: Formulacin de hiptesis

H0: = 0 (No existe una asociacin positiva)

H1: 0 (Existe una asociacin positiva)

2 paso: n<30 hallar los puntos crticos.

= 0.05

p= 2.069

Zona de aceptacin
de Ho

Zona de rechazo de
Zona de rechazo de
Ho
Ho

-2.069 2.069 13.21

3paso: Regla de decisin


Rechazar Ho si y solo si t0<-2.069 o t0 > 2.069

4paso: Calculo de t0
2
=
1 2
t0=13.21

5paso: Conclusiones y recomendaciones

Se rechaza con un nivel de significancia de 0.05, se puede concluir que si hay una
asociacin positiva entre ambas variables.

38. Un socilogo afirma que el xito de los estudiantes en la universidad


(medido por su promedio) se relacion con el ingreso familiar. En una muestra
de 20 estudiantes, el coeficiente de correlacin es de 0.40. Con el nivel de
significacin de 0.01, se puede concluir que hay una correlacin positiva
entre las variables?

X: Tamao familiar
Y: Cantidad gastada en diversin
n: 20
r: 0.40
1 paso: Formulacin de hiptesis
H0: =0 (No existe una relacin positiva)
H1: 0 (Existe una relacin positiva)

2paso: Como n<30 utilizamos t student para establecer los puntos crticos.

= 0.01
t=1.860

Zona de aceptacin
de H0

Zona de rechazo
Zona de rechazo
de H0
de H0

-2.878 1.85 2.878


8

3paso: Regla de decisin


Rechazar Ho si y solo si t0>2.878 o t0<-2.878

4paso: Calculo de t0
2
=
1 2
t0= 1.85

5paso: Conclusiones y recomendaciones


Por lo tanto se acepta H0, esto quiere decir que existe una asociacin
positiva entre las dos variables.

39. Un estudio que realizo la Agencia de Proteccin Ambiental en 12


automviles revelo una correlacin de 0.47 entre el tamao del motor y sus
emisores. Con un nivel de significacin de 0.01, se puede concluir que hay
una asociacin positiva entre estas variables? Cul es el valor p?

X: Tamao del motor


Y: Emisiones del motor
1 paso: Formulacin de hiptesis
H0: 0 (No existe una relacin positiva)
H1: >0 (Existe una relacin positiva)

2paso: Como n<30 utilizamos t student para establecer los puntos crticos.
t (n-k) student = t10
= 0.01
t= 3.169

Zona de aceptacin
de H0

Zona de rechazo
de H0

3.169 1.6838 3.169

3paso: Regla de decisin


Rechazar Ho si y solo si t0>3.169

4paso: Calculo de t0
t0= 0.47*(10)1/2/((1-(0.47)2)1/2
t0= 1.6838

5paso: Conclusiones y recomendaciones


Por lo tanto se acepta H0 y se rechaza H1, esto quiere decir que no existe
una asociacin positiva entre las dos variables.

40. Un hotel de los suburbios obtiene su ingreso bruto de la renta de sus


instalaciones y de su restaurante. Los propietarios tienen intereses en
conocer la relacin entre el nmero de habitaciones ocupadas por la noche y
el ingreso por da en el restaurante. En la siguiente tabla se presenta una
muestra de 25 das (de lunes a jueves) del ao pasado que indica el ingreso
del restaurante y el nmero de habitaciones ocupadas.
X: Nmero de habitaciones ocupadas
Y: Ingreso por da en el restaurant

a) parece que aumenta el ingreso por desayunos a medida que aumenta el


nmero de habitaciones ocupadas? Trace un diagrama de dispersin para
apoyar su conclusin.

Diagrama de Dispersin
1550

1500

1450

1400

1350

1300
0 10 20 30 40 50 60 70

Nos damos cuenta que hay una asociacin dbil entre las variables.

b) Determine el coeficiente de correlacin entre las dos variables. Interprete el


valor.
( )()
= = 0.42297809
(1)(.)
c) Es razonable concluir que hay una relacin positiva entre ingreso y
habitaciones ocupadas? Utilice el nivel de significancia 0.10

1 paso: Formulacin de hiptesis


H0: 0 (No existe una relacin negativa)
H1: < 0 (Existe una relacin negativa)

2paso: Como n<30 utilizamos t student para establecer los puntos crticos.
t (n-k) student = t23
= 0.10
t= 1.714
Zona de aceptacin
de H0
Zona de rechazo
de H0

Zona de rechazo
de H0

-1.714 1.714 2.238

3paso: Regla de decisin


Rechazar H0 si y solo si t0> 2.23865176

4paso: Calculo de t0
t0= 0.422978909*(23)1/2/((1-(2.23865176)2)1/2
t0=2.23865176

5paso: Conclusiones y recomendaciones


Por lo tanto se rechaza h0 y se acepta h1, esto quiere decir que existe una
relacin positiva entre las dos variables en trminos poblacionales.
41. En la siguiente tabla se muestra el nmero de automviles (en millones)
vendidos en Estados Unidos durante varios aos y el porcentaje de ellos que
fabric la compaa General Motors.

Utilice un paquete de software estadstico para responder las siguientes preguntas.

a) El nmero de automviles vendidos se relaciona de forma directa o


indirecta con el porcentaje del mercado de la General Motors? Trace un
diagrama de dispersin para apoyar su conclusin.

El nmero total de automviles vendidos disminuye conforme


Aumenta el porcentaje de acciones de General Motors en el mercado. La
relacin es inversa tal es as que cuando el porcentaje del mercado de la General
Motors aumenta, los automviles vendidos en millones disminuyen.

El signo de coeficiente de regresin es de signo negativo demostrando que hay


una relacin inversa en las variables, es de signo positivo cuando existe una
relacin directa pero en este caso sucede lo contrario.
20

18

Automviles vendidos en millones


16

14

12

10

2
0
0 10 20 30 40 50 60
Porcentaje de General Motors

b) Determine el coeficiente de correlacin entre las dos variables. Interprete


el valor.

( )( ) 335.29
= = = .
( 1) (12 1)(8.18494553)(4.21752297)

Valor r indica una relacin inversa muy fuerte entre las variables debido a su
cercana al 1.

c) Es razonable concluir que hay una asociacin negativa entre ambas


variables? Utilice el nivel de significancia 0.01.
Primer paso: Prueba de hiptesis de la existencia de Beta (1).

H0 : 0 (la correlacin o asociacin entre la poblacin es mayor o igual que cero)

H1 : 0 (la correlacin entre la poblacin es menor que cero )

Segundo paso: Tamao de muestra n = 12, nivel de significacin ()= 1%,


utilizamos la tabla t (student) con n=12 10 grados de libertad.

n k=

12 10= 2

= 1%
-2.764

Tercer paso: Regla de decisin

Rechazar H0 si t < = -2.764

Cuarto paso: Clculo del estadstico t0

2 0.882987724 12 2
= = = 5.948606424
1 2 10.8829877242

Quinto paso: Conclusiones y recomendaciones.


El valor t calculado se encuentra en la regin de rechazo. Por ello, se
rechaza y H1 se acepta. Esto significa que la correlacin entre la poblacin
es menor que cero. Existe una correlacin negativa.

d) Cunta variacin del mercado de la General Motors se contabiliza debido


a la variacin del nmero de automviles vendidos?

Determinaremos por el coeficiente de determinacin


La variacin es 77.9%, calculado por (-0.882987724)2, de la variacin en
participacin del mercado est representado por la variacin en los autos
vendidos.

42. En una muestra de 32 ciudades grandes de Estados Unidos, la correlacin


entre el nmero medio de pies cuadrados por empleado de oficina y la renta
mensual media en el distrito comercial del centro es -0.363. Con un nivel de
significancia de 0.05, se puede concluir que hay una asociacin negativa
entre las dos variables poblacionales?

Para poder concluir si existe una asociacin negativa entre las dos variables
poblaciones se realizara la Prueba de hiptesis del coeficiente de correlacin
(o de la linealidad del modelo)

Primer paso: Prueba de hiptesis de la existencia de Beta (1).


(La correlacin o asociacin entre la poblacin es mayor o igual que cero)
H 0 : 0
H1 : 0 (La correlacin entre la poblacin es menor que cero)

Segundo paso: Tamao de muestra n = 32, nivel de significacin ()= 5%,


Utilizamos la distribucin normal como estadstico de prueba ya que n>30. Por lo
tanto el valor critico en la tabla de la distribucin normal el cual es -1.64

1.64

Tercer paso: Regla de decisin

Rechazar H0 si t < = -1.64

Cuarto paso: Clculo del estadstico

Utilizamos una distribucin normal como estadstico de prueba ya que la muestra


es mayor que 30. Entonces para probar la hiptesis nula, utilizamos La frmula para
t es:

2 0.363 32 2
= = = 2.133779844
1 2 1 (0.363)2

Quinto paso: Conclusiones y recomendaciones.


El valor t calculado se encuentra en la regin de rechazo. Por ello, se
rechaza y H1 se acepta. Esto significa que la correlacin entre la poblacin
es menor que cero. Existe una correlacin negativa.

43. Cul es la relacin entre la cantidad gastada por semana en diversin y


el tamao de la familia? Gastan ms en diversin las familias grandes? Una
muestra de 10 familias del rea de Chicago revel las siguientes cifras por
tamao de familia y cantidad gastada en diversin por semana.
a) Calcule el coeficiente de correlacin.

)(
( ) .
= = = .
( ) . .

b) Establezca el coeficiente de determinacin.

= (. ) = .

c) Existe una asociacin positiva entre la cantidad gastada en diversin y el


tamao de la familia? Utilice el nivel de significancia 0.05

Por consiguiente realizaremos la Prueba de hiptesis del coeficiente de correlacin


(o de la linealidad del modelo).

Primer paso: Prueba de hiptesis de la existencia de Beta (1).

H0 : 0 (La correlacin entre la poblacin es menor que cero )

H1 : 0 (La correlacin o asociacin entre la poblacin es mayor o igual que cero)

Segundo paso: Tamao de muestra n = 10, nivel de significacin ()= 5%,


utilizamos la tabla t (student) con n=10 2 grados de libertad.

n k=

10 2= 8

= 5%
1.860

Valor critico en la tabla de la distribucin t el cual es 1.860

Tercer paso: Regla de decisin

Rechazar H0 si t > = 1.860

Cuarto paso: Clculo del estadstico t0

2 0.589 10 2
= = = 2.06147
1 2 10.5892

Quinto paso: Conclusiones y recomendaciones.


El valor t calculado se encuentra en la regin de aceptacin. Por ello, se
acepta y H1 se rechaza. Esto significa que la correlacin entre la poblacin
es menor que cero. Hay una correlacin negativa y no positiva como se
dice en la pregunta.

45. El fabricante de equipo para ejercicio Cardio Glide desea estudiar la


relacin entre el nmero de meses desde la compra de un aparato y el
tiempo que se utiliz el aparato la semana pasada.
Meses con el Horas
(X - ) (Y - ) (X - )^2 (Y - )^2 (X - )(Y - )
equipo de uso
12 4 5.5 -1.8 30.25 3.24 -9.9
2 10 -4.5 4.2 20.25 17.64 -18.9
6 8 -0.5 2.2 0.25 4.84 -1.1
9 5 2.5 -0.8 6.25 0.64 -2
7 5 0.5 -0.8 0.25 0.64 -0.4
2 8 -4.5 2.2 20.25 4.84 -9.9
8 3 1.5 -2.8 2.25 7.84 -4.2
4 8 -2.5 2.2 6.25 4.84 -5.5
10 2 3.5 -3.8 12.25 14.44 -13.3
5 5 -1.5 -0.8 2.25 0.64 1.2
65 58 100.5 59.6 -64
6.5 Sx 3.34165628
5.8 Sy 2.57336788 b -0.63681592
-
n 10 r a 9.93930348
0.82693964

a) Trace la informacin en un diagrama de dispersin. Suponga que las horas


de uso son la variable dependiente. Comente sobre la grfica.

Diagrama de dispersin
12

10

4
y = -0.6368x + 9.9393
2 R = 0.6838

0
0 2 4 6 8 10 12 14

La grafica al tener una pendiente negativa y al estar los puntos tan


cerca a la recta muestra que existe una correlacin negativa fuerte
entre las variables. Adems que por cada mes adicional el tiempo de
uso se reduce en -0.6368

b) Determine el coeficiente de correlacin. Interprete el resultado.

(
)( )
= = = . 9
( )( ) . .

El coeficiente de correlacin es negativo, quiere decir que existe una


relacin inversa entre las variables, este valor esta muy cerca al -1 por
lo que se concluye que hay una asociacin fuerte.

c) Con un nivel de significancia de 0.01, hay una asociacin negativa entre


las variables?
H0 = 0 (la correlacin entre la poblacin es cero.)
H1 0 (la correlacin entre la poblacin es diferente de cero.)

2 0.826910 2
= = = 1.804
1 2 1 (0.8269)2

Rechazar H0 si y solo si: -2.355 < t < 2.355

-2.355 0 +2.355

Se rechaza H0 y se acepta la H1 , llegando a la conclusin que el coeficiente


de correlacin de la muestra -0.8269 es demasiado grande como para
provenir de una poblacin sin correlacin. Existiendo una relacin negativa
o inversa entre ambas variables, y la relacin entre ambas variables es
fuerte.

46. La siguiente ecuacin de regresin se calcul a partir de una muestra de


20 observaciones:

= 15 5X

Fuente gl SS MS
Regresin 1 300 300
Error 20 2 100 16.666667
Total 20 1 400

SSE se determin ser 100, y SS total, 400.

a) Determine el error estndar de estimacin.


100
. = = = 2.3570
2 18

b) Encuentre el coeficiente de determinacin.

300
2 = = = 0.75
400
c) Determine el coeficiente de correlacin. (Precaucin: cuidado con el signo!)

= = 0.75 = 0.866
47. Una tabla ANOVA comprende:

FUENTE DF SS MS F
Regresin 1 50 SSR/1 SSR/(SSE/n-
2)
Error n-2 SSE SSE/n-2
Total 24 SS total* 500

a) Complete la tabla ANOVA.


FUENTE DF SS MS F
Regresin 1 50 50 0.1111
Error 23 10350 450
Total 24 10400 500

b) Cul fue el tamao de la muestra?

=
= => =

c) Determine el error estndar de estimacin.

10350
. = = = 21.213
2 23
d) Establezca el coeficiente de determinacin.

50
2 = = = 0.004807
10400
48. Emily Smith decide comprar un auto que consuma poco combustible.
Considera varios vehculos, con base en el costo estimado de compra y la
edad del vehculo.
a) Trace estos datos en un diagrama de dispersin, con el costo de
estimado como variable dependiente.

Diagrama de dispersin
25,000.00

20,000.00

15,000.00

10,000.00

5,000.00
y = -1533.6x + 18358
R = 0.6763
0.00
0 2 4 6 8 10 12

b) Calcule el coeficiente de correlacin.


(
)( ) , .
= = = .
( )( ) . , .

c) Se realiz un anlisis de regresin y la ecuacin de regresin resultante


es Costo estimado = 18358 1534 Edad. Interprete el significado de la
pendiente.
= 18,258 1,534X
Pendiente = b = -1,534
Quiere decir que por cada ao adicional que tenga un vehculo el
costo estimado se reducir en $ 1,534.
d) Calcule el costo de un auto de cinco aos.
= , , = , , () = , .

e) La siguiente es una fraccin de la captura de pantalla del software de la


regresin. Qu le dice esto?

Que la ecuacin seria de esta manera:


= 18358 1533.6
Y que tiene un pendiente negativa fuerte.

f) Utilizando un nivel de significancia de 0.10, pruebe la significancia de la


pendiente. Interprete el resultado. Existe una relacin significativa entre
ambas variables?

Prueba de significancia de la pendiente:

Formulacin de la hiptesis

0 : 1 0
1 : 1 < 0

Tamao de la muestra

: = 8

: = 10%

Regla de decisin
Rechazar H0 si y solo si: -1.943 < t < 1.943

t= 1.943

-1.943 0 +1.943

Calculo del estadstico t0

Determinacin del estadstico (t calculable)

1,534 0
= = = 5.008
306.25

Conclusin y recomendacin.
Se rechaza H0 y se acepta la H1 , llegando a la conclusin que el coeficiente
de correlacin de la muestra -0.822 es demasiado grande como para
provenir de una poblacin sin correlacin. Existiendo una relacin negativa
o inversa entre ambas variables, y la relacin entre ambas variables es
fuerte.
49. La National Highway Association estudia la relacin entre el nmero de
licitadores en un proyecto para una carretera y la licitacin ms alta (menor
costo) del proyecto. De inters particular resulta saber si el nmero de
licitadores aumenta o disminuye la cantidad de la oferta ganadora.

a) Determine la ecuacin de regresin. Interprete la ecuacin. Ms licitadores


tienden a aumentar
o a disminuir la cantidad de la oferta ganadora?

RPTA: La ecuacin sera esta: Y= -0.4652x + 11.218


-Por cada incremento del nmero de licitadores en una unidad la oferta disminuye en -0.4652

b) Estime la cantidad de la oferta ganadora si se hubieran presentado siete


licitadores.
Y= -0.4652x + 11.218
Y= -0.4652(7) + 11.218
Y= 7.9616
c) Se desea construir una nueva entrada en la carretera Ohio Turnpike. Se
presentaron siete licitadores. Determine un intervalo de prediccin de 95% de la
oferta ganadora.
RPTA: Intervalo de prediccin
10.9886559

d) Determine el coeficiente de determinacin. Interprete su valor.

R^2 = 0.50302688

El grado de variacin de la oferta ganadora por la variacin de nmero de licitadores est


equilibrado

50. El seor William Profit estudia compaas que se hacen pblicas por primera
vez. Le interesa en particular la relacin entre el tamao de la oferta y el
precio por accin. Una muestra de 15 compaas que recin se hicieron
pblicas revel la siguiente informacin.
a) Determine la ecuacin de regresin.

Diagrama de dispersin
11.4

11.2

11

10.8

10.6
y = 0.0031x + 10.66
R = 0.2106
10.4

10.2
0 20 40 60 80 100 120 140 160 180 200

Y = 0.0031x + 10.66

b) Establezca el coeficiente de determinacin. Considera que el seor Pocho con el tamao


de la oferta como variable independiente?

R^2 = 0.21721278

El seor no est satisfecho con que el tamao de la oferta sea una variable independiente.

51. Bardi Trucking Co., ubicada en Cleveland, Ohio, hace entregas en la regin de
los Grandes Lagos, en el lado sur y en el lado norte. Jim Bardi, el presidente,
estudia la relacin entre la distancia de recorrido de un embarque y el
tiempo, en das, que dura en llegar a su destino. Para investigar esta cuestin, el
seor Bardi seleccion una muestra aleatoria de 20 embarques del mes
pasado. La distancia de envo es la variable independiente y el tiempo de
envo es la variable dependiente. Los
resultados son los siguientes:

a) Trace un diagrama de dispersin. Con base en estos datos, parece haber una
relacin entre la cantidad de millas que debe recorrer el embarque y el tiempo que
tarda en llegar a su destino?

b) Determine el coeficiente de correlacin. Es posible concluir que hay una


correlacin positiva entre la distancia y el tiempo? Utilice el nivel de significancia
0.05.
RPTA: 0.69210443

Si existe una correlacin positiva pero dbil.

c)Establezca e interprete el coeficiente de determinacin.

R^2 = 0.47900854

d)Determine el error estndar de estimacin.


RPTA: 145306.55

53. en la siguiente tabla se muestra informacin sobre el precio de accin y el


dividendo de una muestra de 30 compaas.

a. Calcule la ecuacin de regresin usando el precio de venta con base en


el dividendo anual interprete el valor de la pendiente

a = 2.41

b = 26.8

Ecuacin de regresin:

Precio= 26.8 + 2.41 x Dividendo

Por cada dlar adicional de dividendo, el precio aumenta $2.41.

b. Pruebe la significancia de la pendiente

5057.6
r2 = = 0.6858
7682.7

Por lo tanto, 65.8% de la variacin del precio se explica por el dividendo.

c. Encuentre el coeficiente de determinacin. interprete su valor

r = 0.658 = 0.811

0.811 30 2
t= = 7.34
1 (0.811)^2
Y como t se rechaza cuando t >1.701. La correlacin de la poblacin es positiva.

54. Un empleado de carreteras realiz un anlisis de regresin de la


relacin entre el nmero de accidentes fatales en zonas de construccin y
el nmero de desempleados en el estado. La ecuacin de regresin es
Accidentes fatales 12.7, 0.000114 (Desempleados) Algunos datos
adicionales son

a. Cuntos estados haba en la muestra?

n = 20

b. Determine el error estndar de estimacin.

= 670 = 25.89

c. Encuentre el coeficiente de determinacin.


10354
r2 = = 0.462
22408
d. Determine el coeficiente de correlacin.

0.67920 2 2.880
= = = 3.92
1 (0.679)^2 0.734

e. Con un nivel de significancia de 0.05, sugiere la evidencia que hay una


asociacin positiva entre los accidentes fatales y el nmero de
desempleados?

No, la correlacin puede ser negativa


55. El siguiente es un anlisis de regresin que relaciona el valor actual de
mercado en dlares con el tamao en pies cuadrados de casas de Greene
County, Tennessee. La ecuacin de regresin es: Valor 37.186, 65.0 Tamao.

a. Cuntas casas haba en la muestra?

n=35

b. Calcule el error estndar de estimacin.

= 29 778 406 = 5456.96

c. Calcule el coeficiente de determinacin.


13548662082
r2 = = 0.932
14531349474
d. Calcule el coeficiente de correlacin.

0.63530 2
t= = 4.35
1 (0.635)^2

e. Con un nivel de significancia de 0.05, sugiere la evidencia que hay una


asociacin positiva entre los accidentes fatales y el nmero de
desempleados?

No, la correlacin a veces puede ser negativa

58. Una cooperativa de compras para el consumidor probo el rea de


clefaccion efectiva de 20 calentadores elctricos distintos, con consumos,
en vatios, distintos. Los resultados son los siguientes.
a) Calcule la correlacin entre consumo en vatios y rea de calefaccin. Existe
una relacin directa o indirecta?

Hallando el diagrama de anlisis de correlacin, nos muestra que existe una


relacin directa o positiva fuerte por el anlisis de correlacin ( 0.93928707) ya
que tiene una acerca a +1.

Diagrama de dispersin
y = 0.1489x - 22.581
350 R = 0.8823
300

250

200

150

100

50

0
0 500 1000 1500 2000 2500

1500 Linear (1500)

b) Realice una prueba de hiptesis para determinar si es razonable que el


coeficiente sea mayor que 0. Utilice el nivel de significancia 0.05.

HALLAMOS CON NIVEL DE SIGNIFICACION AL 5%

PRIMER PASO: Prueba de hiptesis de existencia de beta (1).


H 0 : 1 0
H 1 : 1 0

SEGUNDO PASO: Tamao de muestra n = 20, nivel de significacin () = 5%,


utilizamos la tabla t (student) con n k grados de libertad.

2.101

TERCER PASO: Regla de decisin

Rechazar H0 s y solo s t0 > 2.101

CUARTO PASO: Calculo del estadstico t0

rn2 0.93928707202
t0= = = 11.6137623
1r2 10.88226019

QUINTO PASO: Conclusiones y recomendaciones.

Rechazar H0 y aceptar H1, por lo tanto, existe linealidad entre los vatios y el rea.
Se recomienda hacer la prueba de hiptesis de la confiabilidad del modelo para
hacer pronsticos.

c)Elabore la ecuacin de regresin del calentamiento efectivo con base en el


consumo de vatios.

Empezamos hallando la pendiente de la ecuacin:

b= r * sy/sx

b= 0.93928707 * 5004.78684/ 199177.632= 0.1489

a= y- bx

a= 157.95 0.1489 (1212.5)


a= -22.581

Finalmente hallamos la ecuacin de regresin:

y = 0.1489x - 22.581
R = 0.8823

d) Qu calentador parece la mejor compra con base en el tamao del residuo?

En base a los residuos, el mejor calentador fue el 18

ANLISIS DE VARIANZA
Grados de libertad
Regresin 1
Residuos 18
Total 19

59. Un entrenador de perros investiga la relacin entre el tamao del can


(peso en libras) y su consumo alimentario diario (medido en tazas estndar).
El resultado de una muestra de 18 observaciones es el siguiente:

a) Calcule el coeficiente de correlacin Es razonable concluir que la


correlacion entre la poblacin es mayor que 0? Utilice el nivel de
significancia 0.05

Coeficiente de correlacin
mltiple 0.98720335
HALLAMOS CON NIVEL DE SIGNIFICACION AL 5%

PRIMER PASO: Prueba de hiptesis de existencia de beta (1).

H 0 : 1 0
H 1 : 1 0

SEGUNDO PASO: Tamao de muestra n = 18, nivel de significacin () = 5%,


utilizamos la tabla t (student) con n k grados de libertad.

1.746

TERCER PASO: Regla de decisin

Rechazar H0 s y solo s t0 > 1.746

CUARTO PASO: Calculo del estadstico t0

rn2 0.98720335182
t0=1r2 = = 24.564
10.974570462

Quinto paso: Conclusiones y recomendaciones.

Rechazar H0 y aceptar H1, por lo tanto, existe linealidad entre el peso y las
raciones.
Se recomienda hacer la prueba de hiptesis de la confiabilidad del modelo para
hacer pronsticos.

Si es aceptable decir que la relacin entre poblacin y correlacin es mayor que


cero, ya que estos tienen relacin.

b) Elabore la ecuacin de regresin de las tazas con base en el peso del can.
Cunto cambia el peso estimado del perro cada taza adicional del
alimento?
Empezamos hallando la pendiente de la ecuacin:

b= r * sy/sx

b= 0.98720335*47.1395162 /2.02919862 = 22.933

a= y- bx

a= 92.611111122.933 (5.33333333)

a= -29.7

Finalmente hallamos la ecuacin de regresin:

y = 22.933x - 29.7

Hemos encontrado a y b , es decir hemos calculado los estimadores. Al halla b,


hemos calculado el incremento ya sea en peso, talla, temperatura, etc.

En conclusin, por cada tasa de comida aumentada, el perro aumenta


aproximadamente en 23 libras.

c)Come demasiado o come menos uno de los perros?

El perro que ms come es el 4to

60. La Waterbury Insurance Company desea estudiar la relacin entre la


cantidad de dao por fuergo, la distancia entre la casa ardiendo y la estacin
de bomberos mas cercana. Esta informacin se empleara en el ajuste de la
cobertura del seguro. Mediante una muestra de 30 demandas durante el ao
pasado, el director del departamento de actuarios determino la distancia de
la estacin de bomberos (x) y la cantidad de daos, en miles de dlares (y).
A continuacin se presenta la captura de pantalla de MegaStat.

a) Elabore la ecuacin de regresin Hay una relacin directa o indirecta entre


la distancia de la estacin de bomberos y la cantidad de dao?
Hallando la ecuacin de regresin:

a=12.3601 y= 12.3601+4.7956 x
b=4.7956

Entre la distancia de la estacin de los bomberos y la cantidad de dao hay una


relacin directa, ya que el coeficiente b muestra como signo positivo. Este
coeficiente indica que al aumentar una milla ms de distancia, se espera una
perdida aumentada en 12.3601 miles de dlares.

b) Cunto dao estimara que provoca un incendio situado a 5 millas de la


estacin de bomberos ms cercana?
Hallamos en la ecuacin de regresin:

Y= 12.3601+4.7956 (5) = 36.3381 miles de dlares

e) Realice una prueba de hiptesis para determinar si hay una relacin


significativa entre la distancia a la estacin de bomberos y la cantidad de dao.
Utilice el nivel de significancia de 0.01 y una prueba de dos colas.

Prueba de la confiabilidad del modelo:

n = 30

Significancia = 0.01 /2 = 0.005 1- /2 = 0.9995

T/2 = 2.763

Regla de Decisin: Rechazar Ho si Fo > 2.763

Primer paso:

Establecer las hiptesis nula y alternativa.

H0 : 0 (la correlacion entre la poblacin es cero)

H1 : > 0 (la correlacion entre la poblacin es positiva)

Esta prueba es de una sola cola porque lo que nos interesa es confirmar si la asociacin es
positiva entre las variables.

Segundo paso:

Hallamos los grados de libertad n-2, entonces tendramos: 30-2=28, adems de saber que
el nivel de significancia es 0.05. La regla de decisin nos dice que debemos rechazar la
hiptesis nula si el valor calculado del estadstico de prueba es mayor a 1.812.
r(n 2) 0.103830 2
t= = = 0.329
1 r 2 1 0.10382
Respuesta:

Observamos que el t=0.329 es menor que el valor critico; es decir si aceptamos la


hiptesis nula. Se concluye entonces que no existe una correlacin positiva entre la
distancia de la estacin de bomberos y la cantidad de dao
61. A continuacin se presentan las pelculas con las ventas mundiales en
taquilla ms altas y su presupuesto (cantidad total disponible para hacer la
pelcula)

Encuentre la correlacin entre el presupuesto mundial y las ventas en taquilla


mundiales. Comente sobre la asociacin entre ambas variables. Parece que las
pelculas con presupuestos mayores obtienen ingresos en taquilla elevados?
3000

y = 0.0489x + 787.77
2500 R = 0.0005

2000

1500

1000

500

0
0 200 400 600 800 1000 1200

Series1 diagrama de dispersion Linear (diagrama de dispersion)

Estadsticas de la regresin
Coeficiente de 0.023112044
correlacin mltiple
Coeficiente de 0.000534167
determinacin R^2
R^2 ajustado -0.020288038
Error tpico 369.8022244
Observaciones 50

Respuesta:

Podemos ver que la recta est ligeramente inclinada positivamente y el coeficiente


de correlacin es de 0.02311, esto nos dice que hay pocas posibilidades que un
gran presupuesto para montar una pelcula puede resultar taquillera.
Adems, que la dispersin es dbil, quiere decir que algunas taquillas obtuvieron
mayores ganancias y poca inversin y viceversa, no hay una relacin estable entre
ellas.
Conclusiones y
recomendaciones
La regresin es una tcnica que ayuda a la prediccin, pero no dice
exactamente lo que ocurrir, dice lo que podra ocurrir, nos propicia
elementos de juicio para decidir, pero lo que ocurrir con cualquier
fenmeno no estar bajo el control total. Se puede estimar ventas por
cierta cantidad, que ser til para establecer cuanto producir, mas no
son garantas suficientes de que se darn las estimaciones.

Las predicciones minimizan los riesgos de errar en las decisiones, mas


no los elimina; ningn mtodo o tcnica podr librarnos de nuestras
malas decisiones. Adems de que el proceso de obtencin de los
datos a utilizar como insumo para la prediccin podra ser subjetivo, y
por ende no se lo suficientemente certero en los resultados.

Sujetarse demasiado en las predicciones, no es fundamento para el


desarrollo creativo y decisiones novedosas, esto en el caso de las
empresas, ya que no es base suficiente como para decidir quin est
siendo ms novedoso en el tiempo. Es decir que se ve limitado en el
campo cualitativo.

La regresin al considerar de manera funcional las variables en


estudio vuelve ms objetiva la manera de generar los elementos
(ecuacin) para predecir valores dentro del intervalo.
Bibliografa
Lind, Marchal, Wathen. (2008). Estadstica aplicada a los
negocios y la economa. Mexico: McGraw- Hill Interamericana.

Você também pode gostar