Você está na página 1de 22

INTRODUCCIÓN:

El análisis de regresión es una técnica estadística que tiene como objetivo establecer
modelos matemáticos para representar, formalmente, las relaciones de dependencia
existentes entre un conjunto de variables estadísticas (Malhotra, 2008; Pérez, 2014).
Existe la regresión simple: manera sencilla de identificar la correlación entre dos variables
a partir de una gráfica; y la regresión múltiple el cual implica una sola variable dependiente
y dos o más variables independientes. Es la técnica estadística que simultáneamente
desarrolla una relación matemática entre dos o más variables independientes y una variable
dependiente de intervalo.

EJEMPLO DE REGRESIÓN SIMPLE:


Calcular el coeficiente de correlación de Pearson del siguiente conjunto de datos que buscan
una relación entre la variable X (inteligencia) e Y (rendimiento académico):
X Y
105 4
116 8
103 2
124 7
137 9
126 9
112 3
129 10
118 7
105 6

Y= Bo+B1 X 8.3=-16.70+0.19x
Y(x)=-16.70+0.19X 8.3=-16.70+0.19x
-16.5 8.3+16.70=0.19x
25=0.19x
Ecuación de regresión:
x=25/0.19
Y(120)=-16.70+0.19(120) x=131.57
6.993657505

Conclusión: Para que un alumno saque el promedio de 8.3


como calificación (y), es más probable que un
alumno con el IQ de 131.
EJEMPLO DE REGRESIÓN MÚLTIPLE:
Se realizó un estudio sobre un camión de reparto de diésel para saber si la humedad, la
temperatura del aire y la presión barométrica influyen en la emisión de óxido nitroso en ppm
(partes por millón). Las mediciones se tomaron en distintos momentos y los datos son los
siguientes:
Y x1 x2 x3
Óxido nitroso Humedad Temperatura Presión
0.9 72.4 76.3 29.18
0.91 41.6 70.3 28.35
0.96 34.3 77.1 29.24
0.89 35.1 68 29.27
1 10.7 79 29.78
1.1 12.9 67.4 29.39
1.15 8.3 66.8 29.69
1.03 20.1 76.9 29.48
0.77 72.2 77.7 29.09
1.07 24 67.7 29.6
1.07 23.2 76.8 29.38
0.94 47.4 86.6 29.35
1.1 31.5 76.9 29.63
1.1 10.6 86.3 29.56
1.1 11.2 86 29.48
0.91 73.3 76.3 29.4
0.87 75.4 77.9 29.28
0.78 96.6 78.7 29.29
0.82 107.4 86.8 29.03
0.95 54.9 70.9 29.37

¿Existe una correlación?

¿Cuál es la ecuación lineal?


DESARROLLO / RESULTADOS
PROBLEMAS 1 Y 2 MALHOTRA:
1.- Una importante cadena de supermercados desea determinar el efecto de la promoción
sobre la competitividad relativa. Se obtuvieron datos de 15 estados sobre los gastos
promocionales en relación con un importante competidor (gastos del competidor 100) y
sobre las ventas relativas a este competidor (ventas del competidor) 100
y x
Num del estado Gastos promocionales relativos Ventas relativas
1 95 98
2 92 94
3 103 110
4 115 125
5 77 82
6 79 84
7 105 112
8 94 99
9 85 93
10 101 107
11 106 114
12 120 132
13 118 129
14 75 79
15 99 105

A usted se le asignó la tarea de indicarle al gerente si hay alguna relación entre los gastos
promocionales relativos y las ventas relativas.
a) Grafique las ventas relativas (eje Y) contra los gastos promocionales relativos (eje
X) e interprete este diagrama

Gráfico de dispersión
140
120
100
80
60
40
20
0
0 20 40 60 80 100 120 140

Ventas relativas Linear (Ventas relativas)


INTERPRETACIÓN:
Sí existe una relación positiva entre los gastos promocionales relativos y las ventas relativas.

b) ¿Qué medida usaría para determinar si existe una relación entre las dos variables?,
¿Por qué?
Se usaría un análisis de regresión simple, porqué existe una variable X y una variable Y
únicamente para analizar.

c) Realice un análisis de regresión bivariado de las ventas relativas sobre los gastos
promocionales relativos
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.993511162
Coeficiente de determinación R^2 0.987064428
R^2 ajustado 0.986069384
Error típico 1.692728176
Observaciones 15

Coeficientes
Intercepción 8.073083316
Variable X 1 0.859183461

d) Interpretación
La relación que existe entre los gastos promocionales relativos con las ventas relativas es
fuerte.

e) ¿Es significativa la relación de regresión?


Sí es significativa ya que es cercano a uno. Y eso indica que la regresión es casi línea

f) Si la empresa igualara a su competidor en términos de los gastos promocionales


(si los gastos promocionales relativos fueran de 100), ¿cuáles serían las ventas
relativas de la empresa?
Y= Bo + B1 X
Y= 100 (x) = 8.07 + .859(x) 108.9322668
108 = .859(x)
X= 108 / .859 126.785805 Ventas relativas de la empresa
PROBLEMAS 1 Y 2 MALHOTRA:
2) Para entender el papel que tienen la calidad y el precio en la clientela de farmacias, se
calificaron 14 tiendas importantes en una gran zona metropolitana en términos de la
preferencia por comprar, la calidad de la mercancía y los precios justos. Todas las
calificaciones se obtuvieron en una escala de 11 puntos, donde los números más altos
indican calificaciones más positivas.
Y x1 x2
Num de tienda Preferencia Calidad Precio
1 6 5 3
2 9 6 11
3 8 6 4
4 3 2 1
5 10 6 11
6 4 3 1
7 5 4 7
8 2 1 4
9 11 9 8
10 9 5 10
11 10 8 8
12 2 1 5
13 9 8 5
14 5 3 2

a) Haga un análisis de regresión múltiple para explicar la preferencia de tienda en


términos de la calidad de la mercancía y el precio.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.97498495
Coeficiente de determinación R^2 0.95059564
R^2 ajustado 0.94161303
Error típico 0.76180101
Observaciones 14

Coeficientes Error típico


Intercepción 0.53488557 0.47072057
Calidad x1 0.97644825 0.09671166
Precio x2 0.25111961 0.07130576

b) Interprete los coeficientes de regresión parcial.


La relación que existe entre las variables de calidad y precio junto con la preferencia es
positiva.
c) Determine la significancia de la regresión general
Sí es significativa ya que es cercano a uno. Y eso indica que la regresión es casi lineal

d) Determine la significancia de los coeficientes de regresión parcial.


Y=Bo+B1x1
+B2x2
1.76245344

Las variables no son dependientes entre sí, ya que la preferencia de las tiendas no coincide
con el precio.

PROBLEMAS 11.1 – 11.10 WALPOLE.


11.1 Se realizo un estudio en Virginia Tech para determinar si ciertas medidas de la fuerza
estática del brazo influyen en las características de “levantamiento dinámico” de un
individuo. Veinticinco individuos se sometieron a pruebas de fuerza y luego se les pidió que
hicieran una prueba de levantamiento de peso, en el que el peso se elevaba en forma
dinámica por encima de la cabeza. A continuación, se presentan los siguientes datos:
X Y
Fuerza del brazo Levantamiento dinámico
Individuo
1 17.3 71.7
2 19.3 48.3
3 19.5 88.3
4 19.7 75
5 22.9 91.7
6 23.1 100
7 26.4 73.3
8 26.8 65
9 27.6 75
10 28.1 88.3
11 28.2 68.3
12 28.7 96.7
13 29 76.7
14 29.6 78.3
15 29.9 60
16 29.9 71.7
17 30.3 85
18 31.3 85
19 36 88.3
20 39.5 100
21 40.4 100
22 44.3 100
23 44.6 91.7
24 50.4 100
25 55.9 71.7

a) Estime los valores de β0 y β1 para la curva de regresión lineal Μy x β β = 0+ 1x


Y=64.529 + 0.5609x 120
y = 0.5609x + 64.529
100

80

60

40

20

0
0 10 20 30 40 50 60

Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.391696455
Coeficiente de determinación R^2 0.153426113
R^2 ajustado 0.116618553
Error típico 13.28013377
Observaciones 25

Interpretación: Las medidas de la fuerza estática del brazo no influyen en las características
de levantamiento dinámico.

b) Calcule un estimado puntual de Μy|30.


Y=64.529 +
0.5609x
Y=64.529 +
16.827
0.5609(30)
Y=64.529+16.827 81.356

Coeficientes
Levantamiento
dinámico 64.52915556
Fuerza del brazo 0.560897793

RESULTADO: 30 81.356
INTERPRETACIÓN: Sí la fuerza del brazo se encuentra en 30 las características de
levantamiento dinámico que se podría apreciar es de 81.356.

11.2 Las siguientes son las calificaciones de un grupo de 9 estudiantes en un informe de


medio semestre (x) y en el examen final (y):
X Y
Medio semestre Examen final
77 82
50 66
71 78
72 34
81 47
94 85
96 99
99 99
67 68

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.561005514
Coeficiente de determinación R^2 0.314727186
R^2 ajustado 0.21683107
Error típico 19.47153771
Observaciones 9

Interpretación:
El hecho de que el alumno/a se mantenga con un promedio regular o bueno en el periodo
semestral no tiene relación a que la calificación del examen final sea positiva.

a) Estime la recta de regresión lineal.


Y= 12.062 + 0.7771x
120

100 y = 0.7771x + 12.062

80

60

40

20

0
0 20 40 60 80 100 120
Coeficientes
Examen final 12.06232107
Medio semestre 0.777141599

b) Calcule la calificación final de un estudiante que obtuvo 85 de calificación en el informe


de medio semestre
Y= 12.062 + 0.7771x
=12.062 + 0.7771 (85)
=12.062 + 66.0535
=78.1155
Conclusión:
Un alumno puede tener buenas calificaciones durante todo el semestre por la entrega de
trabajos, actividades o tareas, sin embargo, eso no quiere decir que el alumno tenga un IQ
elevado y por ende mantenga sus notas elevadas con los exámenes finales.

11.3 Se registraron las cantidades de un compuesto químico y que se disuelve en 100


gramos de agua a distintas temperaturas x:
X Y
°C gr a) Calcule la ecuación de la recta de regresión.
0 8
15 12
'5.8254+0.5676x
30 25 b) Grafique la recta en un diagrama de dispersión
45 31
60 44
75 48
0 6
15 10
30 21
45 33
60 39
75 51
0 8
15 14
30 24
45 28
60 42
75 44
c) Estime la cantidad de producto químico que se disolverá en 100 gr de agua a 50°
Y= Bo+B1 X
100 = 5.8254 + 0.5676 (50) 28.38
100= 5.8254 + 28.38
34.2054

11.4 Para fines de calibración se recabaron los siguientes datos, los cuales permitirían
determinar la relación entre la presión y la lectura correspondiente en la escala.
X Y
Lectura en la
Presión (Lb/pulg2)
escala
10 13
10 18
10 16
10 15
10 20
50 86
50 90
50 88
50 88
50 92

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.99809769
Coeficiente de determinación R^2 0.99619899
R^2 ajustado 0.99572386
Error típico 2.5
Observaciones 10

Interpretación:
El manejo de la presión tendrá una relación fuerte con el resultado de la lectura de la escala
entre más presión se haga los resultados en la lectura serán elevados.

a) Calcule la ecuación de la recta de regresión.


Y= Bo+B1 X
Coeficientes
Lectura en la escala -1.7
Presión (Lb/Pulg29 1.81
Y=-1.7 + 1.81(x)
b) En esta aplicación el propósito de la calibración es estimar la presión a partir de
una lectura observada en la escala. Estime la presión para una lectura en la escala
de 54, usando ˆx = (54 – b0)/b1.
X = (54 – 1.7) / 1.81 55.7
X= 55.7 / 1.81
X= 30.7734

11.5 Se realizó un estudio sobre la cantidad de azúcar convertida en cierto proceso a


distintas temperaturas. Los datos se codificaron y registraron como sigue:
X Y
Temperatura Azúcar convertida
1 8.1
1.1 7.8
1.2 8.5
1.3 9.8
1.4 9.5
1.5 8.9
1.6 8.6
1.7 10.2
1.8 9.3
1.9 9.2
2 10.5

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.707026444
Coeficiente de determinación R^2 0.499886392
R^2 ajustado 0.444318214
Error típico 0.632607239
Observaciones 11

Interpretación:
Aunque la azúcar convertida vaya aumentando a nivel que avanza la temperatura no se
tiene una relación ciertamente.
Azúcar convertida
a) Estime la recta de regresión lineal:
12
y = 1.8091x + 6.4136
10
Coeficientes
Azúcar 8
convertida 6.413636364 6
Temperatura 1.809090909
4
2
0
0 0.5 1 1.5 2 2.5
Y= Bo + B1x
Y= 6.4136 + 1.8091x

b) Calcule la cantidad media de azúcar convertida que se produce cuando se registra una
temperatura codificada de 1.75.
Y= 6.4136 + 1.8091 (1.75)
Y= 6.4136 + 3.16590909
9.579545455

11.6 En cierto tipo de espécimen de prueba metálico se sabe que la tensión normal sobre
un espécimen se relaciona funcionalmente con la resistencia al corte. El siguiente es un
conjunto de datos experimentales codificados para las dos variables:
Y X
Resistencia al Tensión
corte normal
26.5 26.8
27.3 25.4
24.2 28.9
27.1 23.6
23.6 27.7
25.9 23.9
26.3 24.7
22.5 28.1
21.7 26.9
21.4 27.4
25.8 22.6
24.9 25.6

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0.655567186
Coeficiente de determinación
R^2 0.429768335
R^2 ajustado 0.372745169
Error típico 1.63965003
Observaciones 12
a) Estime la recta de regresión:
35
y = -0.6264x + 41.481
30

25

20

15

10

0
0 5 10 15 20 25 30

Coeficientes
Resistencia al corte 42.58180269

Tensión normal -0.686077126


FÓRMULA: Y= Bo+B1 X
Y=41.481+0.6264x
Y= 42

b) Estime la resistencia al corte para una tensión normal de 24.5.


Y=41.481+(0.6264*24.5)
Y= 26

Conclusión: La estimación de la resistencia al corte que se necesita dentro de una tensión


normal de 24. 5 es de 26.
0.6264(x)=26-41.481
15.3468
0.6264(x)=15.3468
Comprobación: x=15.3468/0.6264
24.5

11.7 Los siguientes son algunos de los datos contenidos en un conjunto clásico denominado
“datos piloto de graficación” que aparecen en Fitting Equations to Data, de Daniel y Wood,
publicado en 1971. La respuesta y es el contenido de ácido del material determinado por
análisis volumétrico; mientras que el regresor x es el contenido de ácido orgánico
determinado por extracción y ponderación.
Y X
Análisis Ponderación y
volumétrico extracción
76 123
62 55
66 100
58 75
88 159
70 109
37 48
82 138
88 164
43 28

a) Grafique los datos; ¿la regresión lineal simple parece un modelo adecuado?

Ácido del material


100

80

60

40

20

0
0 50 100 150 200

Sí, la regresión lineal simple es el modelo adecuado para este análisis.

b) Haga un ajuste de regresión lineal simple; calcule la pendiente y la intersección


Regresión lineal simple: 31.708 + 0.6173x
Pendiente: 0.6173x
Intersección: 31.7086604

Coeficientes
Análisis volumétrico. 31.7086604
Ponderación y extracción 0.35326666
c) Grafique la recta de regresión en la gráfica del inciso a.

Ácido del material


100
90
y = 0.3533x + 31.709
80
70
60
50
40
30
20
10
0
0 20 40 60 80 100 120 140 160 180

11.8 Se aplica un examen de colocación de matemáticas a todos los estudiantes de nuevo


ingreso en una universidad pequeña. Se negará la inscripción al curso regular de
matemáticas a los estudiantes que obtengan menos de 35 puntos y se les enviará a clases
de regularización. Se registraron los resultados del examen de colocación y las
calificaciones finales de 20 estudiantes que tomaron el curso regular:
X Y
Examen de Calificación
colocación en el curso
50 53
35 41
35 61
40 56
55 68
65 36
35 11
60 70
90 79
35 59
90 54
80 91
60 48
60 71
60 71
40 47
55 53
50 68
65 57
50 79

a) Elabore un diagrama de dispersión:

Diagrama de dispersión
100
90
80
70
60
50
40
30
20
10
0
0 20 40 60 80 100

b) Calcule la ecuación de la recta de regresión para predecir las calificaciones en el


curso a partir de las del examen de colocación.
Y= Bo+B1 X
Coeficientes
Calificación en el curso 32.50591447
Examen de colocación 0.471064604

Y=32.506+(0.4711x)
32.97697907

c) Grafique la recta en el diagrama de dispersión.

Recta de regresión
100
y = 0.4711x + 32.506
90
80
70
60
50
40
30
20
10
0
0 20 40 60 80 100
d) Si la calificación aprobatoria mínima fuera 60 puntos, ¿qué calificación en el
examen de colocación se debería usar en el futuro como criterio para negar a los
estudiantes el derecho de admisión a ese curso?

Coeficientes
Calificación en el curso 32.50591447
Examen de colocación 0.471064604

0.4711x = 60 – 32.506
0.4711x = 27.49
X= 27.49 / 0.4711
= 58.365849

11.9 Un comerciante minorista realizó un estudio para determinar la relación que hay entre los
gastos semanales de publicidad y las ventas.
X Y
Costos de
Ventas $
publicidad $
40 385
20 400
25 395
20 365
30 475
50 440
40 490
20 420
50 560
40 525
25 480
50 510
35 456.438
a) Elabore un diagrama de dispersión:

Diagrama de dispersión
600

500

400

300

200
y = 3.2208x + 343.71
100

0
0 10 20 30 40 50 60

b) Calcule la ecuación de la recta de regresión para pronosticar las ventas semanales a


partir de los gastos de publicidad.
Coeficientes
Ventas 343.7058267
Costo de publicidad 3.220814052

Y= 343.71 + 3.2208x

c) Estime las ventas semanales si los costos de publicidad son de $35.


Y= 343.71 + 3.2208x
Y= 343.71 + 3.2208(35)
Y= 343.71 + 112.728
Y= 456.438
Comprobación

456.438=343.71+3.2208(x)

3.2208x=456.438-343.71 112.728

3.2208x=112.728

x=112.728/3.2208 35
11.10 Los siguientes datos son los precios de venta z de cierta marca y modelo de automóvil
usado con w años de antigüedad. Ajuste una curva de la forma μ γδ z w w = mediante la
ecuación de regresión muestral no lineal.
w(años) z (dólares)
1 6350 Y= Bo + B1x
2 5695
2 5750 Y= 6451.3 + 313.21 (x)
3 5395 =6451.3+313.21
5 4985
5 4895 6764.51

INVESTIGACIÓN DE CAMPO:
Visite 10 farmacias de su área y evalúe cada una en términos de su imagen y calidad
general en el servicio dentro de la tienda, utilizando escalas de 11 puntos (1= mala,
11= excelente). Después, analice los datos que haya reunido de la siguiente manera:
a) Grafique la imagen general (eje Y) contra el servicio relativo dentro de la tienda
(eje X) e interprete este diagrama.
X Y
Farmacias
Servicio Relativo Imagen General
Del Ahorro 7 7
Guadalajara 8 9
Similares 8 7
Benavides 7 8
Chihuahua 6 8 9
Botica central 8 7
Disfarh 9 10
Farmacia Mirador 7 7
Farmacia San Martín 9 7
Farmacias especializadas 8 6

FARMACIAS CHIHUAHUA
12
y = 0.551x + 3.3469
10

0
0 1 2 3 4 5 6 7 8 9 10

INTERPRETACIÓN:
Las farmacias mantienen una imagen generalmente buena hacia los consumidores o
clientes que suelen visitarla, aunque el servicio no sea del todo perfecto la imagen es
atractiva haciendo de esta visita un momento agradable. Es decir, el hecho de que las
farmacias mantengan una imagen agradable hacia el consumidor estos reaccionan de
manera positiva al continuo regreso para abarcar sus necesidades rutinarias o de vez en
cuando. Siendo estas las farmacias con más frecuencia a visitar.

b) ¿Qué medida usaría para determinar si existe una relación entre las dos
variables?, ¿por qué?
El análisis de regresión multivariante, porqué desde un inicio te arroja los resultados para
conocer sí existe o no relación entre las mismas variables que se están estudiando y
analizando. Además, que tiene la facilidad de estimar ciertos resultados que se necesiten
probar.

c) Realice un análisis de regresión bivariado de la imagen general sobre el


servicio dentro de la tienda.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.324830027
Coeficiente de determinación R^2 0.105514546
R^2 ajustado -0.006296135
Error típico 1.255599702
Observaciones 10

INTERPRETACIÓN COEFICIENTES:
Existe una relación baja entre los coeficientes, es decir, que el servicio de las farmacias no
tiene nada que ver con que la imagen de la farmacia este o se encuentre en buen/mal
estado. Haciendo hincapié a que sí el servicio mejorará y la imagen general de la empresa
fuera mala, los clientes o consumidores seguirían asistiendo dado que tienen lo que ellos
necesitan.

Coeficientes
Imagen general 3.346938776
Servicio Relativo 0.551020408

ECUACIÓN DE REGRESIÓN:
Y= 3.3469 + 0.551x
3.897959184

CONCLUSIÓN:
Como resultado de la actividad logramos comprender con totalidad para que nos sirve
relacionar las variables que se nos muestran en los diferentes casos. Así mismo: nos
llevamos de aprendizaje nuevos métodos y formas de analizar los datos que se nos presente
en cualquier problema, así como la facilidad de estimar resultados futuros o sobre alguna
variable que se quiera conocer.

Você também pode gostar