Escolar Documentos
Profissional Documentos
Cultura Documentos
1.- Introduccin
2.- Diagrama de dispersin
3.- Especificacin del modelo de regresin lineal simple
3.1.- Supuestos del modelo
4.- Estimacin de parmetros
4.1.- Estimacin mediante mnimos cuadrados
Regresin lineal simple
1.- Introduccin
El coeficiente de correlacin r!"#$ nos permite conocer la magnitud de la relacin
supuestamente lineal# e!istente entre dos %aria&les. En el presente documento nos
introduciremos en el concepto de regresin lineal$ donde estudiaremos la estructura de
la relacin e!istente entre tales %aria&les. 'm&os conceptos -regresin " correlacin-
estn ntimamente ligados$ mientras el primero especifica la forma de la relacin$ el
segundo$ so&re la &ase de esta forma$ estudia la intensidad de la relacin esta&lecida.
De una manera ms concreta$ mediante el modelo de regresin especificaremos la
ecuacin de regresin (ue nos permitir un do&le o&)eti%o*
a#descri&ir de una manera clara " concisa la relacin e!istente entre am&as
%aria&le$ "
&#predecir los %alores de una %aria&le en funcin de la otra.
En un sentido mu" amplio$ " +a&lando en t,rminos puramente estadsticos$ podemos
afirmar (ue el anlisis de regresin es un m,todo (ue permite anali-ar la %aria&ilidad de
una determinada %aria&le en funcin de la informacin (ue le proporcionan una o ms
%aria&les. Se concreta (ue una determinada %aria&le -%aria&le respuesta$ e!plicada$
dependiente o criterio- pueda e!presarse en funcin de otra u otras %aria&les -
predictoras$ e!plicati%as$ independientes o regresores-$ lo (ue permitir predecir los
%alores de la %aria&le respuesta en funcin de las %aria&les e!plicati%as$ as como
determinar la importancia de ,stas. .or otro lado$ se especifica (ue la estructura de la
relacin es lineal. Este aspecto es importante por cuanto se descartan a(u otros tipos de
relaciones. /emos de decir$ aun(ue slo sea por curiosidad +istrica$ (ue el t,rmino
0regresin0 se de&e a Sir 1rancis 2alton 1322-1411# estudiando la relacin de la
estatura entre padres e +i)os.
5&ser% (ue los padres altos tenan +i)os altos$ aun(ue no tan altos como sus
progenitores. Igualmente$ los padres &a)os tendan a tener descendencia de &a)a estatura
aun(ue ms altos (ue sus respecti%os padres. En am&os casos$ pues$ e!ista una cierta
tendencia a la estatura media$ o dic+o en t,rminos de propio 2alton$ e!ista una
0regresin a la mediocridad0.
Es e%idente el inter,s el modelo de regresin lineal aplicado. Supngase$ por citar tan 3
slo algunos posi&les casos de estudio$ el efecto de una cierta terapia so&re las
respuestas de los pacientes sometidos a ella$ los gastos de pu&licidad de una empresa "
el consumo ciudadano$ el efecto del ta&aco so&re el cncer$ el clima la&oral " la
producti%idad en una empresa o la calidad de ense6an-a " el rendimiento acad,mico.
7omo se +a indicado$ en el presente captulo$ nos limitaremos al estudio de la regresin
donde se estudia la relacin (ue so&re la %aria&le de respuesta e)erce una 8nica %aria&le
e!plicati%a.
Este tipo de regresin -la ms sencilla de las posi&les- se denomina por esta ra-n
regresin lineal simple.
2.- Diagrama de dispersin
.re%io a todo anlisis$ resulta con%eniente una primera inspeccin %isual de los datos al
o&)eto de compro&ar la con%eniencia o no de utili-ar el modelo de regresin simple. Se
recurre a este respecto$ a la representacin con)unta de los datos mediante el diagrama
de dispersin o nu&e de puntos. 9na simple o)eada nos permitir determinar*
a# si e!iste relacin o no entre las %aria&les "
&# si ,sta es o no lineal.
'dems pueden e!traerse otras informaciones de inter,s$ como son*
a# el grado de estrec+e- de la nu&e de puntos$ indicadora de la intensidad de la
relacin$
&# si e!isten %alores anmalos (ue distorsionan la posi&le relacin$ o
c# si la dispersin de los datos a lo largo de la nu&e de puntos es uniforme$ lo (ue
tendr su importancia$ tal como %eremos en los pr!imos apartados.
:a informacin o&tenida es importante para encarar la actuacin ms con%eniente. 9na
nu&e redondeada " sin contornos definidos %ea en la figura la imagen de la es(uina
superior i-(uierda# es indicadora de ausencia de relacin. :a %aria&le e!plicati%a es
irrele%ante " no merece la pena seguir con el modelo en cuestin.
En las imagenes superiores siguientes se sugiere una relacin lineal$ ms fuerte en una$
de&ido a su ma"or estrec+e-$ aun(ue en am&os casos un anlisis estadstico posterior se
+ace necesario para confirmar con seguridad la relacin insinuada en los grficos.
En la imagen inferior i-(uierda la relacin es claramente cur%ilnea " no procede a
aplicar el modelo lineal de regresin. '(u podemos optar por transformar los datos a
efecto de lograr linealidad$ o lo (ue puede ser ms con%eniente$ respetar los datos "
ela&orar el modelo pertinente.
En la siguiente imagen la dispersin no es constante a lo largo del recorrido de los datos
-+eterocedasticidad-$ lo (ue imposi&ilita$ como se tendr ocasin de compro&ar$ la
aplicacin del modelo lineal de regresin.
.or otro lado$ en la ultima imagen un par de datos anmalos -outliers- e)ercen una
distorsin importante so&re el modelo$ lo (ue o&ligar a replantearse la con%eniencia de
eliminarlos o &ien incluirlos en el modelo$ con la consiguiente transformacin del
mismo.
3.- Especificacin del modelo de regresin lineal simple
7omo se +a o&ser%ado anteriormente$ cuando e!isten ra-ones para suponer la e!istencia
de una relacin lineal entre dos %aria&les$ podremos esta&lecer la siguiente estructura de
relacin*
En t,rminos grficos$ esta relacin (uedara e!presada mediante el siguiente diagrama
causal*
donde podemos distinguir las %aria&les ;$ < " =.
:a %aria&le ;$ origen de la flec+a en la figura es la %aria&le o&ser%ada cu"a incidencia
so&re < deseamos estudiar. En t,rminos de la ecuacin de regresin es la %aria&le (ue
sir%e de &ase para la prediccin. Se le denomina %aria&le predeterminada$ e!plicati%a$
predictora$ independiente$ e!gena o simplemente$ regresor. En nuestra opinin$
%aria&le e!plicati%a o predictora$ son los t,rminos cu"os significados ilustran me)or el
propsito de estas %aria&les. Se dice (ue es fi)a si sus %alores son esta&lecidos por el
in%estigador> por el contrario$ se dice (ue es aleatoria cuando sus %alores no estn
determinados por el in%estigador sino (ue se elige una muestra aleatoria de su)etos " se
miden am&as %aria&les.
:a %aria&le <$ punto final de la flec+a$ es la %aria&le (ue el modelo pretende dar cuenta
Se la suele denominar como %aria&le de respuesta$ e!plicada$ dependiente$ criterio o
endgena.
El o&)eto de la regresin %a a ser$ precisamente$ estimar la relacin (ue < presenta con
; " predecir sus %alores en su)etos no medidos en la muestra. Igualmente$ en nuestra
opinin$ consideramos ms con%eniente el t,rmino de %aria&le de respuesta o e!plicada.
:a %aria&le =representa el componente de error en la prediccin de la %aria&le < de&ido
la relacin estocstica entre < " ;. Se le denomina entre otros nom&res como error$
pertur&acin$ o residual. De&e su %alor fundamentalmente a dos tipos de factores*
a# medicin incorrecta de la %aria&le <$ "
&# influencia de otras %aria&les omitidas por el modelo.
Si salimos del es(uema determinista (ue impera en 7iencias
/umanas " concedemos un cierto %alor al a-ar " a la
espontaneidad +a&remos de a6adir a los puntos anteriores un
tercer punto* c# %aria&ilidad in+erente a la conducta +umana.
X Y