Escolar Documentos
Profissional Documentos
Cultura Documentos
1
puntos. Este procedimiento se llama metodo indicara una relacion directa entre ellas (a ma-
de Cuadrados Mnimos [6]. yor valor de la variable explicativa, el valor de
la variable dependiente Y aumentara), [ < 0
EL METODO DE CUADRADOS delatara una relacion de tipo inverso, mien-
MINIMOS tras que [ = 0 nos indica que no existe una
La suma de los cuadrados de los residuos da relacion lineal clara entre ambas variables. As
una medida de la bondad de ajustede la rec- mismo, y tal y como se deduce de la ecuacion
ta. Cuanto mas pequeno es ese numero tanto de la recta de regresion, el coeficiente b nos da
mejor es el ajuste. Si tenemos valores de dos una estimacion del cambio por termino medio
variables, X (TEMPERATURA) Y (HUME- en la variable Y por cada unidad en que se
DAD), y hemos realizado una regresion de Y incrementa X. Al igual que ocurre con otros
sobre X, obteniendo una recta que da un valor estimadores, existira cierta incertidumbre en
ajustado estimado de Y para cada valor de la el calculo de las estimaciones, que se podra
variable X. [7] reflejar mediante intervalos de confianza para
ambos valores. [9]
El estudio comienza por un modelo lineal.
Interesa obtener los mejores estimadores de los INTERACCION, CONFUSION Y
parametros y . Si llamamos a y b a nuestros COLINEALIDAD.
estimadores, la ecuacion de la recta estimada
es: Cuando se introduce mas de una variable
en el modelo de regresion es necesario contras-
y=a+bx
tar, ademas la independencia de los efectos
Los residuos es la contraparte muestral de de todas ellas. Es decir, se supone que la aso-
los errores, donde las diferencias entre el valor ciacion de cada variable con la respuesta no
observado y el valor predicho miden el error de depende del valor que tomen el resto en la
prediccion, si el valor observado es mayor que ecuacion de regresion. En otro caso se dira que
el valor predicho el residuo es positivo y caso existe interaccion. Antes de aprobar el mode-
contrario es negativo, con una prediccion per- lo definitivo, por lo tanto, se debe explorar la
fecta resulta un residuo nulo. La suma de los necesidad de incluir terminos de interaccion
cuadrados de los residuos refleja la precision calculados a partir del producto de pares de
y exactitud global de las predicciones, Cuan- variables, comprobando si mejora la predic-
to mas cerca esten los valores observados de cion. [10]
los predichos tanto menor sera la suma de los
cuadrados de los residuos por tanto El Metodo En ocasiones el fenomeno de la interaccion
de Cuadrados Mnimos consiste en elegir a y se hace coincidir erroneamente con los de con-
b de manera que la suma de cuadrados de los fusion y correlacion. Existe confusion cuando
residuos sea lo mas pequena posible[8]. el efecto de una variable difiere significativa-
mente segun se considere o no en el modelo
INTERPRETACION DE LOS CO- alguna otra. Esta se asociara tanto con la va-
EFICIENTES DE REGRESION. riable inicial como con la respuesta, de modo
que en casos extremos puede invertir el primer
En la ecuacion general de la recta de re- efecto observado. En ese caso las estimaciones
gresion, claramente b es la pendiente de la adecuadas son aquellas que proporciona el mo-
recta y a el valor de la variable dependiente delo completo, y se diran que estan controladas
Y para el que X = 0. En consecuencia, una o ajustadas por variables de confusion. [11]
vez estimados estos coeficientes, en la mayora
de las aplicaciones el valor de a no tendra una El fenomeno que se produce cuando dos va-
interpretacion directa, mientras que el valor [ riables explicativas muestran una correlacion
servira como un indicador del sentido de aso- alta recibe el nombre de cuasi-colinealidad y
ciacion entre ambas variables: as, [ > 0 nos puede producir estimaciones inestables de los
2
coeficientes que se traducen en valores desorbi- de puntos o diagrama de dispersion. La simple
tados de sus errores tpicos y resultados poco inspeccion visual de este diagrama nos per-
crebles. La mayora de paquetes estadsticos mitira intuir si la relacion entre las variables
muestran en sus salidas diagnosticos de co- se ajusta aceptablemente a una funcion recta.
linealidad (tolerancia, factor de inflaccion de Ello dependera de si podemos imaginar una
la varianza, ndice de condicion) que pueden recta que pase relativamente cerca de la ma-
ayudarnos a solventar estos problemas. Por lo yora de los puntos. La mejor recta de todas
tanto, se ha de tener un cuidado especial en la sera la que cumpla la condicion de minimizar la
etapa de construccion del modelo: un cambio suma de las distancias medidas desde los pun-
significativo en las estimaciones tras la inclu- tos a la recta, elevadas al cuadrado. Por eso,
sion de una nueva variable puede evidenciar se llama tambien recta de cuadrados mnimos
cualquiera de estos fenomenos.[12] o de mejor ajuste. Obviamente, en cualquier
situacion sera posible encontrar una recta de
ESQUEMA DE RECTA POSITIVA. mejor ajuste, que minimice dichas distancias.
Pero si aun esta recta deja muy lejos a gran
En la ecuacion de la regresion lineal X es parte de las observaciones, no nos servira para
el valor de un caso en la variable X, que que- hacer predicciones adecuadas: ello significa que
remos predecir (por ejemplo, la temperatura), la relacion entre las variables no se ajusta bien
en tanto que Y es el valor de ese caso en la a una funcion de esta clase. [14]
variable Y, que nos es conocido y tomamos
como base para la prediccion (por ejemplo, la CONDICIONES O SUPUESTOS
humedad). Que cosa son los estadsticos a y DEL MODELO.
b? El primero se denomina la constante o la
ordenada al origen y puede interpretarse como Este modelo de la regresion lineal conlle-
el valor de Y cuando X vale cero: sera el punto
va exigentes supuestos. Ademas del ajuste a
en que la recta corta al eje vertical. En cuanto
la linealidad y el uso de escalas de intervalos,
al coeficiente b, que se denomina la pendientedebieran cumplirse en la poblacion las condi-
de la recta, sera el incremento (o, al reves, la
ciones propias. Ello significa que, para cada
disminucion) que experimentan los puntajes valor de X las Y debieran distribuirse en for-
de Y cada vez que X aumenta en una unidad. ma normal y con similar varianza. Y, de igual
Obviamente, cuando la correlacion es negativamodo, para cada valor de Y debieran distri-
(cuando el coeficiente r tiene signo negativo),
buirse las X en forma normal y con varianzas
tambien b es negativo. Y la recta que mejor semejantes. Para que esto fuera cierto, al me-
representa la relacion entre las variables tiene
nos debiera verificarse que las distribuciones
inclinacion inversa. [13] muestrales de las variables no se alejaran en
exceso de la normalidad y que sus varianzas
ESQUEMA DE RECTA NEGATI- no fueran demasiado diferentes.
VA.
Por lo tanto, en la regresion lineal estamos
Ahora bien, se ha dicho que hacemos el admitiendo que todos los factores o causas
supuesto de que las medias de Y para cada que influyen en la variable respuesta Y pueden
X seguiran el curso de una recta, que usa- dividirse en dos grupos: el primero contiene a
remos para predecir. Pero cual recta hemos una variable explicativa X y el segundo incluye
de usar?. Seguramente, no ha de ser cualquie- un conjunto amplio de factores no controlados
ra. Supongamos que tomamos una muestra que englobaremos bajo el nombre de pertur-
de valores medidos. Y luego representamos la bacion o error aleatorio, , que provoca que la
humedad sobre el eje horizontal y la tempe- dependencia entre las variables dependiente e
ratura sobre el eje vertical. Si trazamos los independiente no sea perfecta, sino que este
puntos correspondientes a las observaciones, sujeta a incertidumbre. [15]
tendremos lo que se da en llamar una nube
3
2. SOFTWARE 3. MATERIALES y ME-
TODOS
Y=m X+b
4
del valor real. La formula a usarse es la si-
guiente:
5
Tabla 3. Resultados fro - ambiente 4.2. DE RESULTADOS
Determinamos que nuestra ecuacion tiene
un 5,71 % de error al predecir la humedad del
medio.
El rango de error aumenta en las mediciones
entre fro y el ambiente.
Referencias
[1] Mayne,Jordy Modeling of traffic Signal
Control and Transit Signal Priority Stra-
tegies in a Microscopic Simulation Labo-
ratory (Tesis de maestra inedita), 3rd ed.
Massachussets: , 2001.
Tabla 5. Resultados caliente - ambiente
[2] MONTGOMERY, D.; PECK, E.; VI-
NING, G. Introduccion al analisis de re-
gresion lineal, Mexico, Ed. Limusa Wi-
ley, 2006, 588 p., ISBN: 970-24-0327-8.
stat Statistics notes: Correlation, regres-
sion and repeated data. BMJ 1994; 308: 896
6
[7] Seber GAF. Linear Regression Analysis. [12] Gutierrez-Pulido, H. y De la Vara Salazar,
New York: John Wiley Sons, 1977. R. (2005), CONTROL ESTADISTICO DE
CALIDAD Y SEIS SIGMA; Primera Edi-
[8] Pita Fernandez S, Rey Sierra T, Vila Alon- cion. 2005 Editorial McGraw-Hill, Mexico.
so MT. Relaciones entre variables cuanti-
tativas (I). Cadernos de Atencion Primaria [13] Gutierrez-Pulido, H. y De la Vara Sala-
1997; 4: 141-145. zar, R. (2003), DISENO Y ANALISIS DE
EXPERIMENTOS ; McGraw-Hill, Mexico.
[9] Altman DA. Practical statistics for medi-
cal research. 1th ed., repr. 1997. London: [14] (Arduino, 2017); Extrado de:
Chapman Hall; 1997. http://arduino.cl/arduino-uno/