Você está na página 1de 10

V Regresin lineal simple

5.1. Modelo de regresin lineal simple


5.2. Mtodo de mnimos cuadrados
5.3. Coeficiente de determinacin
5.4. Pruebas de significancia

5.1 ESTIMACIN MEDIANTE LA LINEA DE REGRESIN.


Muchas veces las decisiones gerenciales se basan en la relacin entre dos o ms variables. Por
ejemplo, despus de revisar la relacin entre los gastos de publicidad y las ventas, un gerente de
mercadotecnia podra tratar de predecir las ventas para determinado nivel de gastos de publicidad. En
otro caso, una empresa de electricidad podra usar la relacin entre la temperatura mxima diaria y la
demanda de electricidad para predecir el consumo de energa con base en las temperaturas mximas
pronosticadas para el mes siguiente. A veces, un administrador confa en su intuicin para juzgar como
se relacionan dos variables. Sin embargo, si se pueden obtener datos, se puede emplear un
procedimiento estadstico llamado anlisis de regresin para plantear una ecuacin que muestre
cmo dependen las variables entre s.
En la terminologa de la regresin, la variable que se va a predecir se llama variable dependiente. La o
las variables que se usan para predecir el valor de la variable dependiente se llaman variables
independientes. Por ejemplo, para analizar el efecto de gastos de publicidad sobre las ventas, el deseo
de un gerente de mercadotecnia, de predecir las ventas, nos sugiere que ventas sea la variable
dependiente. Los gastos de publicidad seran la variable independiente que se usa para poder predecir
las ventas. En notacin estadstica, y representa la variable dependiente y x la variable
independiente.
El principal objetivo del anlisis de regresin es estimar el valor de una variable aleatoria. En esta
unidad se describirn el tipo ms sencillo de anlisis de regresin, donde intervienen una variable
independiente y una variable dependiente, y la relacin entre ellas se aproxima mediante una lnea
recta. A esto se le llama regresin lineal simple. El anlisis de regresin donde intervienen dos o ms
variables independientes se llama anlisis de regresin mltiple.

DIAGRAMA DE DISPERSIN.
El diagrama de dispersin permite observar grficamente los datos y hacer conclusiones preliminares
acerca de la relacin posible entre las variables.
Un diagrama de dispersin es una grfica en la cual cada punto representa un par de valores
observados de las variables independientes y dependientes. El valor de la variable independiente X
se grafica en el eje horizontal, y el valor de la variable dependiente Y se grafica en el eje vertical.
La forma de la relacin que se representa en el diagrama de dispersin puede ser curvilnea en lugar
de lnea.
El primer paso para determinar si existe una relacin entre dos variables es examinar la grfica de los
datos observados (o conocidos). Esta grfica, o dibujo, se llama diagrama de Dispersin.

Un diagrama de dispersin nos puede dar dos tipos de informacin. Visualmente, podemos identificar
patrones que indiquen las variables estn relacionadas. Si esto no sucede, podemos ver qu tipo de
lnea, o ecuacin de estimacin, describe esta relacin.
La direccin de la curva puede identificar si la relacin curvilnea es directa o inversa. Para conocer las
relaciones posibles en un diagrama de dispersin, examinemos las grficas de las figuras. Las grficas
(a) y (b) muestran relaciones lineales directas e inversas. Las grficas (c) y (d) son ejemplos
relacionados curvilneas que indican asociaciones directas e inversas entre variables.
Respectivamente. La grafica (e) ilustra una relacin lineal inversa con un patrn de puntos ampliamente
dispersos. Esta mayor dispersin indica que existe menor grado de asociacin entre las variables
independientes y dependientes que existe en la grfica (b). El patrn del punto de la grfica (f) parece
indicar que no existe relacin entre 2 variables; por tanto, conocer el pasado referente a una variable
no nos permitir pronosticar ocurrencias futuras de las otras.

a) Lineal directa

d) Curvilinea inversa

b) Lineal inversa

e) Recta inversa con ms dispersin

c) Curvilinea Directa

f) Ninguna relacin

5.2 MTODO DE MNIMOS CUADRADOS.

El mtodo de mnimos cuadrados es un procedimiento para encontrar la ecuacin de regresin


estimada usando datos de una muestra. En el mtodo de los mnimos cuadrados se emplean los datos
de la muestra para determinar los valores de b0 y b1 que minimizan la suma de los cuadrados de las
desviaciones entre los valores observados de la variable dependiente yi, y los valores estimados de la
variable dependiente i.

Donde:
b1= pendiente de la lnea de regresin estimada (pdte de la recta)
b0= ordenada al origen de la lnea de regresin estimada (variable ordenada y)
= Ecuacin de regresin
X= valor de la variable independiente
Y= valor de la variable dependiente
n= nmero total de observaciones
= valor medio de la variable independiente
= valor medio de la variable dependiente

Ejemplo1. La tabla siguiente presenta datos muestrales sobre el nmero de horas de estudio
invertidos por los estudiantes fuera de clase, durante un periodo de tres semanas, para un curso de
estadstica de negocios, junto con las calificaciones que obtuvieron en un examen aplicado al final de
ese periodo. Determine:
a) La grafica de dispersin.
b) La ecuacin de regresin por mnimos cuadrados.
c) Estime la calificacin de un estudiante que dedico 30 horas al estudio de la materia.

Estudiante
muestreado

Horas de
estudio

Calif. en el
exam. Y

XY

X2

X
1

20

64

1280

400

16

61

976

256

34

84

2856

1156

23

70

1610

529

27

88

2376

729

32

92

2944

1024

18

72

1296

324

22

77

1694

484

Total

192

608

15032

4902

Solucin:
a)
b)

( )( )( )
( )(
)

)(

)
c)

)(

Ejemplo 2. La tabla siguiente da en pulgadas las respectivas alturas X e Y de una muestra de 12


padres y sus hijos mayores. Determine:
a) La grafica de dispersin.
b) La ecuacin de regresin por mnimos cuadrados.
c) Estime la altura de un hijo si el padre mide 75 pulgadas.

Altura del
padre

Altura del hijo

XY

X2

X
65

68

4420

4225

63

66

4158

3969

67

68

4556

4489

64

65

4160

4096

68

69

4692

4624

62

66

4092

3844

70

68

4760

4900

66

65

4290

4356

68

71

4828

4624

67

67

4489

4489

69

68

4692

4761

71

70

4970

5041

X= 800

Y=811

XY=54107

X2=53418

Solucin:
a)
b)

)(
)(
( )((

)(

)
) )

c)

)(

INTERPRETACIN DEL ERROR ESTNDAR DE LA ESTIMACIN.


El error estndar del estimador es la desviacin estndar condicional de la variable dependiente Y,
dado un valor de la variable independiente X. Para datos poblacionales, el error estndar del
estimador se representa mediante el smbolo Y,X. la frmula de desviaciones que permite estimar este
valor con base en datos muestrales es:

Ejemplo 1. La tabla siguiente presenta datos muestrales sobre el nmero de horas de estudio
invertidos por los estudiantes fuera de clase, durante un periodo de tres semanas, para un curso de
estadstica de negocios, junto con las calificaciones que obtuvieron en un examen aplicado al final de
ese periodo. Determine, el error estndar del estimador.

Estudiante
muestreado

Horas de
estudio (X)

Calif. en
el exam.
(Y)

XY

X2

Y2

20

64

1280

400

4096

16

61

976

256

3721

34

84

2856

1156

7056

23

70

1610

529

4900

27

88

2376

729

7744

32

92

2944

1024

8464

18

72

1296

324

5184

22

77

1694

484

5929

Total

192

608

15032

4902

47094

Solucin:
(

)(

)(

Ejercicio. La tabla siguiente da en pulgadas las respectivas alturas X e Y de una muestra de 12


padres y sus hijos mayores. Determine, el error estndar del estimador.

Altura del
padre (X)

Altura del
hijo (Y)

XY

X2

Y2

65

68

4420

4225

4624

63

66

4158

3969

4356

67

68

4556

4489

4624

64

65

4160

4096

4225

68

69

4692

4624

4761

62

66

4092

3844

4356

70

68

4760

4900

4624

66

65

4290

4356

4225

68

71

4828

4624

5041

67

67

4489

4489

4489

69

68

4692

4761

4624

71

70

4970

5041

4900

X= 800

Y=811

XY=54107

X2=53418

Y2=54849

Solucin:
(

)(

)(

5.3 ANLISIS DE CORRELACIN Y DETERMINACION


Es el conjunto de tcnicas estadsticas empleado para medir la intensidad de la asociacin entre dos
variables. El principal objetivo del anlisis de correlacin consiste en determinar qu tan intensa es la
relacin entre dos variables.
El coeficiente de Correlacin, describe la intensidad de la relacin entre dos conjuntos de variables de
nivel de intervalo. El valor del coeficiente de correlacin puede tomar valores desde menos uno hasta
uno, indicando que mientras ms cercano a uno sea el valor del coeficiente de correlacin, en
cualquier direccin, ms fuerte ser la asociacin lineal entre las dos variables. Mientras ms cercano a
cero sea el coeficiente de correlacin indicar que ms dbil es la asociacin entre ambas variables. Si
es igual a cero se concluir que no existe relacin lineal alguna entre ambas variables.

Para propsitos de clculo resulta conveniente la siguiente frmula para el coeficiente de


determinacin muestral.

El coeficiente de correlacin muestral es:

O bien

( )

( )

Ejemplo. Determine, la correlacin de los datos. (De acuerdo al ejemplo).

Solucin:

)(

)(

) ( )(
( )( )

O bien

( )(

( )

( )

( )(

)(

)(

) ( )(

)
)

Ejercicio. Determine el coeficiente de correlacin. (De acuerdo al ejercicio).

Solucin:

)(

)(

)
)(

)(

O bien

( )

(
( )

)(

)(
)

)(

)
(

) (

)(
)(

)
)

Você também pode gostar