Você está na página 1de 7

Análisis Modelo de Regresión Lineal Simple en

el DtaSet Iris utilizando el lenguaje R


Angel Quizhpe
18 de junio del 2018

Resumen
En este trabajo se analizará el modelo de regresión lineal simple en el
lenguaje R con los datos del DataSet Iris.

1. Introducción
El método de regresión lineal es bien conocido en varios campos y quizás es
el más natural de aprender, ya que la idea de trazar la recta que mejor describe
la relación entre puntos de un plano parece familiar e intuitivo.

El problema con el método o el modo en que se enseña pude variar, como el


método en ocasiones se subvalora debido a que ese considera en general que es
solo “agregar línea de tendencia” a los datos, pero se deja de lado la revisión de
los estadísticos y de revisar el comportamiento de los errores de la estimación [2].

En este trabajo se aplicará la regresión lineal simple a los datos del DataSet
Iris en el lenguaje R, este método es una de las formas más simples y fácilmente
interpretables del aprendizaje supervisado, una de las técnicas de regresión li-
neal enmarcadas dentro del amplio campo del aprendizaje automático (machine
learning), tan de moda últimamente.
2. Desarrollo:
Antes de empezar a desarrollar nuestro modelo en el lenguaje R empezare
dando algunos conceptos que son fundamentales para la construcción del mode-
lo.

2.1. ¿Qué es la Regresión lineal?


En estadística la regresión lineal o ajuste lineal es un modelo matemático
usado para aproximar la relación de dependencia entre una variable dependiente
Y , las variables independientes Xi en términos de  [?].

Este modelo puede ser expresado como:

Yt = βo + β1 β1 + β2 β2 + ... + βp βp +  (1)

donde:

Yt : variable dependiente, explicada o regresando.


X1 , X2 , ...Xp : variables explicativas, independientes o regresores.
β1 , β2 , ...βp : parámetros, miden la influencia que las variables explicativas
tienen sobre el regrediendo.

Donde β0 es la intersección o término “constante", las β1 (i > 0) son los paráme-


tros respectivos a cada variable independiente, y p es el número de parámetros
independientes a tener en cuenta en la regresión. La regresión lineal puede ser
contrastada con la regresión no lineal.

Existen diferentes tipos de regresión lineal, pero en este trabajo nos enfoca-
remos a regresión lineal simple.

2.2. ¿Qué es la Regresión lineal Simple?


Sólo se maneja una variable independiente, por lo que sólo cuenta con dos
parámetros. Son de la forma:

Yi = β0 + β0 Xi + εi (2)

En donde α es la ordenada en el origen (el valor que toma Y cuando X vale


0), β es la pendiente de la recta (e indica cómo cambia Y al incrementar X
en una unidad) y ε una variable que incluye un conjunto grande de factores,
cada uno de los cuales influye en la respuesta sólo en pequeña magnitud, a la
que llamaremos error. X e Y son variables aleatorias, por lo que no se puede
establecer una relación lineal exacta entre ellas.
Mediante las técnicas de regresión de una variable Y sobre una variable X,
buscamos una función que sea una buena aproximación de una nube de puntos
(xi,yi), mediante una curva del tipo:

Figura 1: Regresión línea.

3. Análisis
3.1. Descripción del DataDet Iris
El Iris datos flor es un multivalente conjunto de datos introducidos por el
British estadístico y biólogo Ronald Fisher en su artículo de 1936. El conjunto
de datos consiste en 50 muestras de cada una de las tres especies de Iris (Iris
setosa, Iris virginica e Iris versicolor). Se midieron cuatro características de cada
muestra: la longitud y el ancho de los sépalos y pétalos, en centímetros.

Figura 2: Muestra instantánea del conjunto de datos del iris.


3.2. Desarrollo
A continuación, ajustaremos el modelo de regresión lineal simple en R:

1. Cargamos la data Iris.txt

Iris<-read.table("C:/Users/PC/Desktop/XI/Inteligencia...
...artificial/Domumentos Latex/Iris.txt", head(TRUE))

2. El conjunto de datos consta de cuatro medidas (longitud y anchura de


pétalos y sépalos) de ciento cincuenta flores de iris de tres especies asi
como se muestra en el siguiente diagrama de disperción el codigo en R es
el siguiente.

#attach permitirme extraer las columnas del datafreme


attach(Iris)

#creamos los diagrams de dispercion


pairs(Iris)

Figura 3: Diagrama de disperción iris .

3. Graficamos los datos con un grafico de disperción de las variables Sepa-


lLength y PetalLength.
Figura 4: Diagrama de disperción iris .

4. Como se puede observar en el diagrama de dispeción,las variables Sepa-


lLength y PetalLength podemos aplicar Regresión lineal.
El código es el siguiente:

#graficamos los datos con un grafico de disperción


par(mfrow=c(1,1))
plot(SepalLength,PetalLength, xlab = "SepalLength", ylab = "PetalLength")

5. Ajustamos el modelo en R el codigo es:

#El modelo en R lo ajustamos


m1<-lm(SepalLength~PetalLength)

6. Obtenemos el resumen del modelo que queremos ajustar con la función


sumary.

summary(m1)

A continuación se muestra el resumen:

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.30557 0.07843 54.90 <2e-16 ***
PetalLength 0.40913 0.01890 21.65 <2e-16 ***
7. Graficamos la recta de regresión estimada. esta recta nos sirve para hacer
un tipo de predicción.

#graficar la recta de regresion estimada


#esta recta de regresion la obtenemos con estos parametros (interccion=339.405 y tem=48
abline(lsfit(Iris$SepalLength,Iris$PetalLength))
#esta recta nos sirve para hacer un tipo de prediccion

Figura 5: Diagrama de disperción iris .

8. De acuerdo a los datos el modelo seria el siguiente: y = 4,30557 + 0,40913x


9. Correlación de Pearson entre pares de variables:
p <- cor(Iris[-5]) # Correlación de Pearson
cat("Correlación de Pearson\n")
print(p)
Correlación del DataSet Iris:

Correlación de Pearson
> print(p)
SepalLength SepalWidth PetalLength PetalWidth
SepalLength 1.0000000 -0.1093692 0.8717542 0.8179536
SepalWidth -0.1093692 1.0000000 -0.4205161 -0.3565441
PetalLength 0.8717542 -0.4205161 1.0000000 0.9627571
PetalWidth 0.8179536 -0.3565441 0.9627571 1.0000000
Referencias
[1] Mithun, S., JIXTA: Regresión lineal en R,(2015), [Online]. Available:
"https://jixta.wordpress.com/2015/02/14/linear-regression-in-r/".
[2] Mithun, S., WIKIPEDIA: Regresión lineal ,(ABRIL, 2018), [Online]. Avai-
lable:
"https://es.wikipedia.org/wiki/Regresión_lineal".

Você também pode gostar