Você está na página 1de 25

ANLISIS DE REGRESIN Y CORRELACIN LINEAL

SIMPLE.
1. Se tom una muestra para analizar cul es la relacin entre la edad (en meses) y el peso
(en kilogramos) de nios en edad pre escolar, en donde se obtuvo los siguientes
resultados.
X =1122 n=22 Y =308 X 2=57809
2

Y = 4505

XY =16002

X : Edad (meses)
Y : Peso ( Kg)

a) Hallar la edad promedio de la muestra y sus medidas de dispersin.


X = 1122 =51meses 4.25 aos
X =
Promedio:
n
22
Varianza:
x

x 2

S 2x =
Desviacin estndar:
S x = S2x =5.2870 meses
X + S x
X S x X
45.713 meses X 56.287 meses

3.8 aos X 4.7 aos


Coeficiente de variacin:
S
C . V = x 100 =10.37
X

La muestra es homognea

b) Hallar el peso promedio de la muestra y sus medidas de dispersin.

Promedio:

y = 308 =14 Kg
Y =
n
22

Varianza:
y

2
y

S 2y =

Desviacin estndar:
S y = S2y =3.031 Kg
Y S y Y Y + S y

10.969 Kg Y 17.031 Kg
Coeficiente de variacin:
S
C . V = y 100 =21.65
Y

La muestra es homogenea

c) Estime un modelo segn una relacin lineal entre la edad y el peso de los nios,
interprete el coeficiente de regresin.

El modelo es:
^
Y =a+bX
^
Peso=a+bEdad

b=

Donde:
n XY X Y

a=

n X ( X )
2

22 (16002 ) ( 1122 ) (308)


=0.5
22 ( 57809 )(1122)2

Y b X = 308 0.51122 =11.5


n

22

22

Luego:
^
Peso=11.5+ 0.5Edad

Interpretacin: el coeficiente de regresin

b=0.5

nos indica que por cada mes que

pasa, el peso en promedio aumenta en 500 gr.


d) Estimar cuanto ser el peso para un nio de 58 meses de edad.
Si edad ( x ) =58 meses 4.83 aos entonces :
^
Peso=11.5+ 0.5 (58 )

^
Peso=17.5 Kg
e) Estimar que edad aproximada tiene un nio que pesa 12.5 Kg.
^
Peso=11.5+ 0.5Edad

Edad=

Peso+11.5 12.5+ 11.5


=
=48 meses 4 aos
0.5
0.5

f) Hallar la varianza residual de la regresin.

xy

y a yb
2

S 2xy =

S 2xy =

4505 (11.5 )( 308 ) ( 0.5 ) (16002)


=2.3
20

2
Desviacin estndar: s xy = S xy =1.52

es confiable

g) Determinar el coeficiente de correlacin, interprete.


r=

r=

XY n( X )( Y )
X 2n( X )2 Y 2 n(Y )2
1600222(51)(14 )

5780922(51)2 450522(14)2

=0.87

Existe una relacin positiva fuerte entre la edad y el peso de los nios.
h) Hallar el coeficiente de determinacin, interprete. E indicar a su criterio que otros
factores determinan el peso de los nios.
R2=r 2100=76.3
La variabilidad en el peso de los nios es explicado en un 76.3% por la variabilidad
en su edad. Otros factores que determinan el peso de los nios en edad pre escolar
es la alimentacin (nmero de comidas por da), altura, ingreso econmico de los
padres.
2. En la comunidades A y B se realizo un estudio para determinar si la agilidad mental de los
nios esta en relacin directa con su edad. Se escogieron 10 nios de cada comunidad y se
les aplico un test para medir su agilidad mental con los siguientes resultados.
Comunidad A

X =8

X 2=672

Comunidad B
2
n X =722.5

X 2=747

Y =22.5

n y 2=4368.10

Y 2= 5549

Y 2= 4783

XY =1888

XY =1835

a) Encontrar por el mtodo de mnimos cuadrados la curva que mejor se ajuste entre la edad
y la agilidad mental de los nios, interprete el coeficiente de regresin.
Comunidad A

El modelo es:
Y^ =a+bX
^
Peso=a+bEdad

b=

Dnde:
n XY X Y
2

n X ( X )
2

a=

10 ( 1888 )( 80 )(225)
=2.75
10 ( 672 )(80)2

Y b X = 225 2.7580 =0.5


n

10

10

Luego:
^
Peso=11.5+ 0.5Edad

Interpretacin: el coeficiente de regresin de b=2.75


nos indica por cada ao cumplido por nios su agilidad mental en
promedio aumenta 2.75
Comunidad de B
El modelo es:
^
Y =a+bX
^
Peso=a+bEdad

b=

Dnde:
n XY X Y
2

n X 2 ( X )

10 ( 1835 )( 85 )(209)
=2.39
2
10 ( 747 ) (85)

a=

Y b X = 209 2.385 =0.604


n

10

10

Luego:
^
Peso=0.604+2.39Edad
Interpretacin: el coeficiente de regresin b=2.39 nos indica que por cada ao
cumplido por los nios, su agilidad mental aumenta en promedio 2.39
b) Estimar cuanto ser la agilidad mental de un nio de 7aos de edad.
Comunidad A:

Y^ =a+bX
^
Peso=0.5+b 2.75Edad
^
Peso=0.5+2.757
^
Peso= 19.75
Comunidad B

Y^ =a+bX
^
Peso=0.604+2.39Edad
^
Peso=0.604+2.397
^
Peso= 17.33
c) Hallar la varianza residual de la regresin.
Comunidad A:

xy
2
y
a

yb

2
S xy =

S 2xy =

5549( 0.5 )( 225 )( 2.75 ) (1888)


=30.56
8

2
Desviacin estndar: s xy = S xy =1.52

es confiable

Comunidad:

xy
2

y a yb

2
S xy =

S 2xy =

4783 ( 0.604 ) ( 209 )( 2.39 ) (1835)


=33.89
8

2
Desviacin estndar: s xy = S xy =1.52

es confiable

d) Determinar el coeficiente de correlacin, interprete.


Comunidad A:

r=

r=

XY n( X )( Y )
X 2n( X )2 Y 2 n(Y )2
188810(8)(22.5)

67210(8)2 554910(22.5)2

=0.7052

Interpretacin: existe una correlacin positiva fuerte


Comunidad B:

r=

r=

XY n( X )( Y )
X 2n( X )2 Y 2 n(Y )2
183510(8.5)(20.9)

74710 (8.5)2 478310(20.9)2

=0.580

Interpretacin: existe una correlacin positiva moderada


e) Hallar el coeficiente de determinacin, interprete. E indicar a su criterio que otros factores
determinan la agilidad mental de los nios.
Comunidad A:
2

R =r 100
2

R =0.7052100
2

R =70.52
Interpretacin: la variabilidad en la agilidad mental de los nios es explicado en un
70.52% por la variabilidad en la edad
Comunidad B:
2

R =r 100
2

R =0.580100
2

R =58.0
Interpretacin:La variabilidad en la agilidad mental de los nios es explicado en un
8.0% por la variabilidad en su edad. Otros factores que determinan la agilidad
mental de los nios de las comunidades de la alimentacin, horas de sueo,
motivacin, actividades intelectuales
3. Los siguientes datos corresponden a las notas obtenidas en dos exmenes parciales aplicados a
ocho alumnos.
Primer examen

13

14

10

11

13

Segundo examen

10

12

11

14

13

11

X: Primer examen
Y: Segundo examen
a) Realizar el diagrama de dispersin para estos datos y analizar.

Grfica de lnea ajustada


Segundo examen = 7.294 + 0.3488 Primer examen
S
R-cuad.
R-cuad.(ajustado)

14

1.93303
19.9%
6.6%

Segundo examen

13
12
11
10
9
8
7

10
11
12
Primer examen

13

14

El diagrama de dispersin q no existe una relacin lineal notoria es decir, que las notas del
primer examen no determina los resultados en el segundo examen; sin embargo ajustamos a
un modelo lineal.
b) Hallar la ecuacin de regresin lineal considerando como variable dependiente al segundo
examen.
El modelo es:

Y^ =a+bX
^
EXAC 2=a+bEXAC 1
^
EXAC 2=7.29+0.35EXAC 1
Interpretacin: el coeficiente de regresin b=0.35 indica que por cada punto que
aumente la nota del primer examen, en promedio del segundo examen aumente en
0.35 puntos
Si EXA 1=10 entonces ^
EXA 2=10.78 P=(10,10.78)
Si EXA 1=11 entonces ^
EXA 2=11.13 Q=(11, 11.13 )

Si EXA 1=14 entonces ^


EXA 2=12.18 R=(14, 12.18)
c) Hallar la varianza residual de la regresin

xy

y a yb
2

S 2xy =

S 2xy =3.74
2
Desviacin estndar: s xy = S xy =1.1.93

ser confiable?

Otra forma:
HIPOTESIS NULA H= El modelo no es confiable
HIPOTESIS ALTERNA H=El modelo es confiable
Del anlisis de varianza (MINITAB) P=0.268
Regla de decisin (anlisis de varianza)
Si (P) >0.005 entonces se acepta la hiptesis nula
Si (P)<0.05 entonces se rechaza la hiptesis nula
Como P=0.268 > 0.05 entonces se acepta la hiptesis nula es decir el modelo
no es confiable
Anlisis de varianza
Fuente
Regresin
Error
Total

GL
1
6
7

SC
5.5804
22.4196
28.0000

MC
5.58038
3.73660

F
1.49

P
0.268

d) Determinar el coeficiente de correlacin, interprete.

r=0.4464

Existe una correlacion positiva debil

e) Hallar el coeficiente de determinacin, interprete. E indicar a su criterio que otros factores


determinan las notas obtenidas en el segundo examen.

R2=19.92

La variabilidad en el segundo examen es explicado en un 19.92% por

la variabilidad en el primer examen, otros factores que determinan las notas


obtenidas en el segundo examen son horas de asistencia a clase, horas de estudio
fuera de clase, mtodos estudio.

4. Durante 10 aos consecutivos , se registro la importacin y la exportacin de productos( en


miles de TM)
12. 10.
9.6 8.4 6.7
5
4.8 3.6 2.8 2.2 1.8
Importacin
3
8
11.
Exportacin
11.9 8.9 7.8 7.4 6.5 4.3 5.3 3.3 2.8 1.7
6
X: Importar
Y: Exportar
a) Realizar el diagrama de dispersin para estos datos y analizar la tendencia.
Grfica de lnea ajustada
Exportacion = 0.8646 + 0.9116 Importacion
S
R-cuad.
R-cuad.(ajustado)

12

0.875865
94.1%
93.4%

Exportacion

10
8
6
4
2
2

6
8
Importacion

10

12

El diagrama de dispersin se observa que existe una tendencia lineal creciente, es decir
conforme pasen los aos hay mayor es la exportacin y/o importacin de los
productos

b) Encontrar por el mtodo de mnimos cuadrados la curva que mejor se ajuste entre la
importacin y exportacin de productos, interprete el coeficiente de regresin.

Y^ =a+bX
^
EXPORTACION =a+bIMPORTACION
^
EXPORTACION =0.86+0.91IMPORTACION
Interpretacin: el coeficiente de regresin b= 0.91= 1 miles de TM
c) Graficar la recta de regresin en el diagrama de dispersin.
d) Estimar cuanto ser la importacin si se exporta 8.5 tm.

^
EXPORTACION =0.86+0.91IMPORTACION
^
IMPORTACION =8.37=8TM
e) Estimar cuanto ser la exportacin si se importa 7.3 tm.

^
EXPORTACION =0.86+0.91IMPORTACION
^
EXPORTACION = 7.51= 8TM
f) Hallar la importacin promedio y su desviacin estndar.

Promedio:
X =6.18 TM
X =
n
Desviacin estndar:
S x = S2x =3.63 TM
X + S x
X S x X

2.55 TM X 9.81 TM
g) Hallar la exportacin promedio y su desviacin estndar.

Promedio:

y =6.5
Y =
n

Desviacin estndar:
S y = S2y =3.41TM

Y S y Y Y + S y
3.08 TM Y 9.91 TM
h) Hallar la varianza residual de la regresin.

xy
2

y a yb

2
S xy =

S 2xy =0.76 TM
2
Desviacin estndar: s xy = S xy =0.88 TM

ser confiable?

Otra forma:
HIPOTESIS NULA H= El modelo no es confiable
HIPOTESIS ALTERNA H=El modelo es confiable
Del anlisis de varianza (MINITAB) P=0.000
Regla de decisin (anlisis de varianza)
Si (P) >0.005 entonces se acepta la hiptesis nula
Si (P)<0.05 entonces se rechaza la hiptesis nula
Como P=0.000> 0.05 entonces se rechaza la hiptesis nula es decir el
modelo es confiable
Anlisis de varianza
Fuente
Regresin
Error
Total

i)

GL
1
9
10

SC
109.776
6.904
116.680

MC
109.776
0.767

F
143.10

P
0.000

Determinar el coeficiente de correlacin, interprete.

r=0.97 Correlacin positiva fuerte

j)

Hallar el coeficiente de determinacin, interprete. E indicar a su criterio que otros


factores determinan la variable dependiente.

R2=r 2100=97
La variabilidad en el peso de los nios es explicado en un 76.3% por la variabilidad
en su edad. Otros factores que determinan el peso de los nios en edad pre escolar
es la alimentacin (nmero de comidas por da), altura, ingreso econmico de los
padres.
5. Se desea saber si hay relacin entre el tiempo que le dedican al estudio fuera de horas de clase y
el rendimiento acadmico en un determinado curso, dando los siguientes resultados:

X =180 n=40

Y =457 X 2=1035.92

Y 2= 6141

XY =2430.7

a) Hallar el tiempo promedio de estudio fuera de clases y sus medidas de dispersin.

Promedio:

X = 180 =4.5 horas


X =
n
40

Varianza:
x

2
x

S 2x =
Desviacin estndar:
S x = S2x =2.4 horas
X + S x
X S x X

2.1 horas X 6.9 horas

Coeficiente de variacin:
S
C . V = x 100 =53.3
X

La muestra es homognea

b) Hallar el rendimiento acadmico promedio y sus medidas de dispersin.

Promedio:

y = 457 =11.4 capacidad


Y =
n
40

Varianza:
y

23.6

y 2

S 2y =
Desviacin estndar:
S y = S2y =4.9 capacidad
Y S y Y Y + S y

6.5 capacidad Y 16.3 capacidad


Coeficiente de variacin:
S
C . V = y 100 =42.98
Y

La muestra es homogenea

c) Estime un modelo segn una relacin lineal entre horas de estudio fuera de clase y su
rendimiento acadmico, interprete el coeficiente de regresin.

El modelo es:

Y^ =a+bX
RA=a+bHD

b=

Donde:
n XY X Y
2

n X 2 ( X )

a=

40 ( 2430.7 )(180)(457)
=1.7
40 ( 1035.92 )(180)2

Y b X = 457 1.7180 =3.8


n

40

40

Luego:
^
rendimiento academico=3.8+1.7horas de estudio

Interpretacin: el coeficiente de regresin

b=1.7

nos indica que por cada hora

estudiada fuera de clases, el rendimiento acadmico promedio es

d) Estimar cuanto ser el rendimiento acadmico para un alumno que estudio 3.5 horas

Si horas ( x )=3.5 horas entonces :


RA=3.8+ 1.7 ( 3.5 )
^
RA=9.8 capacidad
e) Estimar cuantas horas estudio un alumno que obtuvo una nota de 14 puntos.

^
RA=3.77 +1.7HD

HD=

RA3.8 143.8
=
=6 horas
1.7
1.7
f) Hallar la varianza residual de la regresin.

xy

y a yb
2

S 2xy =

S 2xy =

61413.8( 457 ) ( 1.7 ) (2430.7)


=7.2
38

2
Desviacin estndar: s xy = S xy =2. es confiable

g) Determinar el coeficiente de correlacin, interprete.

r=

XY n( X )( Y )
X 2n( X )2 Y 2 n(Y )2

r=

2430.740 (4.5)(11.4)

1030.9240 (4.5)2 614140(11.4 )2

0.83

Interpretacin: Existe una relacin positiva fuerte entre las horas que dedican sus estudios
fuera de clases y el rendimiento acadmico
h) Hallar el coeficiente de determinacin, interprete. E indicar a su criterio que otros
factores determinan el rendimiento acadmico.

R2=r 2100=68.9
6. Las pruebas acerca del consumo de combustible de un vehculo que viaja a diferentes
velocidades produjeron los siguientes resultados.
Velocidad
Consumo

20 30 40
18. 18.8 19.1
3

50
19.
6

60
19.
8

70
20

80
20.
6

90
21

a) Realizar el diagrama de dispersin para estos datos y analizar la tendencia.

Grfica de lnea ajustada


Consumo = 17,63 + 0,03667 Velocidad
S
R-cuad.
R-cuad.(ajustado)

21,0

0,110554
98,7%
98,5%

20,5

Consumo

20,0
19,5
19,0
18,5
18,0
20

30

40

50
60
Velocidad

70

80

90

b) Encontrar por el mtodo de mnimos cuadrados la curva que mejor se ajuste


entre la velocidad y el consumo, interprete el coeficiente de regresin.
Como la tendencia es lineal el modelo es:

Y =a+bX

Consumo=17.63+0.03667 Velocidad
Interpretacion:
c) Graficar la recta de regresin en el diagrama de dispersin.
Ver el grafico de a).
d) Estimar cuanto ser el consumo de combustible si el auto va a una velocidad de 75
k/h.

Consumo=17.63+0.03667 Velocidad

Consumo=17.63+0.03667 ( 75 )=20.4 galones


e) Estimar cuanto ser la velocidad del auto si ha consumido 25 galones de
combustible.

Consumo=17.63+0.03667 Velocidad

Velocidad=

Consumo
25
=
=1.42 k /h
17.63+ 0.03667 17.66

f) Hallar consumo de combustible promedio y su desviacin estndar.


Promedio:

y=

y i = 157.2 =19.65
n

Varianza:

yi

y 2
S 2y =

Desviacion estndar:

S Y = S = 0.8171=0.9039
2
y

g) Hallar la velocidad promedio y su desviacin estndar.


Promedio:

x=

xi = 440 =55
n

Varianza:

xi

x 2
S2x =

Desviacion estndar:

S x = S = 600=24.49
2
x

h) Hallar la varianza residual de la regresin.

xy

y a yb
2

S 2xy =

S 2xy =

i)

61413.8( 457 ) ( 1.7 ) (2430.7)


=7.2
38

Determinar el coeficiente de correlacin, interprete.

r=

XY n( X )( Y )
X 2n( X )2 Y 2 n(Y )2
r=

2430.740 (4.5)(11.4)

1030.9240 (4.5)2 614140(11.4 )2

0.83

Interpretacin: Existe una relacin positiva fuerte entre las horas que dedican sus
estudios fuera de clases y el rendimiento acadmico
j) Hallar el coeficiente de determinacin, interprete. E indicar a su criterio que otros
factores determinan el consumo de combustible.
2

R =r 100=68.9
7.

Sea Y la produccin (en millones ) de un determinado articulo fabricado por una


compaa durante los aos 1999 al 2008 como se observa en el siguiente cuadro:
199 200 200 200 200 200 200 200 200 200
9
0
1
2
3
4
5
6
7
8
92.
89. 83. 68. 69. 67. 58. 61.
Produccin
92.3 80
2
1
5
9
2
1
3
2
Aos

a) Trazar un grafico de lneas para estos datos y analizar la tendencia.

Grfica lineal de Produccion


95
90

Produccion

85
80
75
70
65
60
1999

2000

2001

2002

2003
2004
Aos

2005

2006

2007

2008

Del diagrama Podemos Observar q hay una tendencia decreciente en


la produccin segn van pasando los aos.
b) Hallar la recta de regresin (serie de tiempo) de mnimos cuadrados de la
produccin en funcin de los aos
Grfica de series de tiempo de Produccion
95
90

Produccion

85
80
75
70
65
60
1999

2000

2001

2002

2003
2004
Aos

c) Estimar la produccin de artculos para el ao 2009.


Como la tendencia es lineal el modelo es:

2005

2006

2007

2008

Y =a+bX
Produccion=8039+3.975 Aos

Produccion=8039+3.975 ( 2009 )=53.2 millones

8. Se sabe que la produccin de algodn de un pas, expresada en millones de toneladas,


fueron:
199 199 199 199 199 200 200 200 200
5
6
7
8
9
0
1
2
3
10 12 15 15 18 19 23 30
Produccin
8
Aos

a) Trazar un grafico de lneas para estos datos y analizar la tendencia.


Grfica lineal de Produccion
30

Produccion

25

20

15

10

1995

1996

1997

1998

1999
Aos

2000

2001

2002

2003

Observamos que existe una tendencia creciente es decir q segn


avanzan los aos la produccin aumenta

b) Hallar la recta de regresin (serie de tiempo) de mnimos cuadrados de la


produccin en funcin de los aos

Grfica de series de tiempo de Produccion


30

Produccion

25

20

15

10

1995

1996

1997

1998

1999
Aos

2000

2001

2002

2003

c) Estimar la produccin de algodn para los tres aos siguientes.


Como la tendencia es lineal el modelo es:

Y =a+bX
Produccion=4781+2.400 Aos

Produccion=4781+2.400 ( 2004 )=28.6 millones de toneladas


Produccion=4781+2.400 ( 2005 )=31 millones de toneladas
Produccion=4781+2.400 ( 2006 )=33.4 millones de toneladas

9. El auditor del sistema educativo pblico ha estudiado los registros del inventario para
averiguar si el inventario actual de libros de texto es tpico. Las siguientes existencias
corresponden a los 5 aos anteriores.
Ao
Inventari
o

2004
4620

2005
4910

2006
5490

2007
5730

2008
5990

a) Trazar un grafico de lneas para estos datos y analizar la tendencia.


Grfica lineal de Produccion
6000

Inventario

5750
5500
5250
5000
4750
4500
2004

2005

2006
Aos

2007

2008

Se
Observa en el diagrama que existe una tendencia creciente segn
pasan los aos.
b) Hallar la recta de regresin (serie de tiempo) de mnimos cuadrados del
inventario en funcin de los aos
Grfica de series de tiempo de Produccion
6000

Produccion

5750
5500
5250
5000
4750
4500
2004

2005

c) Estimar el inventario para el ao 2009.


Como la tendencia es lineal el modelo es:

Y =a+bX

2006
Aos

2007

2008

Inventario=708788+ 356.0 Aos


Inventario=708788+ 356.0 ( 2009 )=6416 libros