Você está na página 1de 11

Taller 2: Sistemas de Ecuaciones Lineales.

Cupitra-Rodríguez Jefferson, Romo-Ramírez Hoshdenk & Paz-Rivera Roland Stiven


Facultad de Ingeniería, Universidad del Valle.
Presentado a: Noreña Agudelo Gonzalo - 20 de mayo de 2018
PUNTO 1

Con el método de regresión por mínimos cuadrados ajuste una línea recta para el siguiente
conjunto de datos:

X 0 2 4 6 9 11 12 15 17 19
y 5 6 7 6 9 8 7 10 12 12

Además de los coeficientes de la ecuación (pendiente e intersección), calcule el error estándar de


la estimación y el coeficiente de correlación. Con relación a estos valores explique de forma escrita
qué tan bien se ajusta el modelo a los datos iniciales. Adicionalmente grafique (puede ser a mano,
en Excel o Scilab) los datos iniciales y el modelo de regresión obtenido.

SOLUCIÓN

En la siguiente tabla se muestran los valores calculados de la pendiente, intersección, error


estándar, y coeficiente de correlación para los datos del punto

X Y e e2 ̅)𝟐
∑(𝒚𝒊 − 𝒚
0 5 0,15 0,02 10,24
2 6 0,44 0,20 4,84
4 7 0,74 0,55 1,44
6 6 -0,97 0,93 4,84
9 9 0,98 0,95 0,64
11 8 -0,73 0,53 0,04
12 7 -2,08 4,33 1,44
15 10 -0,14 0,01 3,24
17 12 1,16 1,34 14,44
19 12 0,45 0,20 14,44
Suma 82 -0.25x10-3 9,07 55,60
Pendiente 0,3525
Intersección 4,8515
Error estándar 1,0650
Coeficiente de
correlación 0,8368
 Dado que el error estándar representa la dispersión entre los datos alrededor de la línea de
regresión, un valor grande de éste indicaría una alta dispersión, mientras que uno pequeño
revelaría poca dispersión, al ser nuestro error estándar aproximadamente 1 (1.0650), se podría
decir que estos datos se ajustan linealmente a la recta de forma aceptable, y esto se puede
apreciar al ver que la mayoría de los puntos se distribuyen cerca de la línea, excepto el dato
x=12 cuya imagen se encuentra más alejada de la recta que los demás puntos, lo que podría
indicar que es un dato atípico, que puede influir en el ajuste negativamente.

14
y = 0.3525x + 4.8515
12 R² = 0.8368

10

0
0 2 4 6 8 10 12 14 16 18 20

 Puesto que el coeficiente de correlación indica la relación entre dos variables analizadas, y se
expresa en términos de porcentaje, se esperaría que entre más cercano este esté estadístico a
100% (o 1) mayor es el ajuste entre las dos variables, en este caso se obtuvo que nuestro
coeficiente de relación fue de 0,8368 (o 83,68%), el cual podría considerarse aceptable o alto,
dependiendo del nivel de rigurosidad que se requiera para nuestro análisis, este valor es posible
que se haya visto afectado por el dato presumiblemente atípico x=12, que es el que más se aleja
de la línea recta.
PUNTO 2

Haga uso del método de regresión por mínimos cuadrados para definir un ajuste al siguiente
conjunto de datos.

X 1 2 3 4 5 6 7 8 9
Y 1 1,5 2 3 4 5 8 10 13

A. Además de los coeficientes, calcule el error estándar de la estimación y el coeficiente de


correlación. Grafique los datos y la línea recta del modelo. Evalúe qué tan bueno es el
ajuste.
B. Realice nuevamente un modelo, pero esta vez usando regresión polinomial, con la
intención de ajustar una parábola al conjunto de datos iniciales. Realice un análisis a modo
de comparación entre los resultados que acaba de obtener, y los que obtuvo en el punto
a).

SOLUCIÓN

A. En la siguiente tabla se muestran los valores calculados de la pendiente, intersección,


error estándar y coeficiente de correlación para los datos del punto.

X Y e e2 ̅)𝟐
∑(𝒚𝒊 − 𝒚
1 1,00 1,56 2,42 18,32
2 1,50 0,60 0,36 14,29
3 2,00 -0,36 0,13 10,76
4 3,00 -0,82 0,67 5,20
5 4,00 -1,28 1,63 1,64
6 5,00 -1,74 3,01 0,08
7 8,00 -0,19 0,04 7,40
8 10,00 0,35 0,12 22,28
9 13,00 1,89 3,57 59,60
Suma 47,50 0,00 11,95 139,56
Pendiente 1,4583
Intersección -2,0139
Error estándar 1,306652697
Coeficiente de
correlación 0,9144
14.00

12.00 y = 1.4583x - 2.0139


R² = 0.9144
10.00

8.00

6.00

4.00

2.00

0.00
0 1 2 3 4 5 6 7 8 9 10
-2.00

 Aunque la gráfica tiene la forma de una parábola, se puede observar que estos datos se
ajustan bien a una regresión lineal, ya que en primera instancia se observa que tienen un
error estándar asociado, en términos relativos, pequeño de 1,3, y un coeficiente de
correlación de 0,9144 (91,44%), incluso mayor al del punto 1 (0,8368), esto en primer lugar
indica que hay una baja dispersión entre los datos y la línea recta, es posible que el intervalo
utilizado no sea lo suficientemente grande como para afectar el ajuste lineal entre las dos
variables analizadas.

B.

14.00

y = 0.191x2 - 0.4518x + 1.4881


12.00
R² = 0.9949

10.00

8.00

6.00

4.00

2.00

0.00
0 1 2 3 4 5 6 7 8 9 10

Al hacer el ajuste usando una regresión polinomial se puede observar a simple vista que la
línea de tendencia cruza la mayoría de los puntos, por lo tanto, tiene sentido que el
coeficiente de correlación sea mucho más cercano a 1 (99,49%), que el obtenido con la
regresión lineal (91,44), esto quiere decir que es este tipo de regresión representa mejor
nuestros datos que el modelo lineal.

PUNTO 3.

Ajuste una ecuación cúbica a los datos. Halle los coeficientes además de R^2 y S𝒚/𝒙

x 3 4 5 7 8 9 11 12
y 1.6 3.6 4.4 3.4 2.2 2.8 3.8 4.6

(INTERPOLACIÓN) Polinomio interpolante de Newton.

SOLUCIÓN

 A continuación, se muestra la gráfica del ajuste de los datos usando una regresión
polinomial de grado 3 por medio del programa Excel, en ella se puede observar que la
3 2
parábola descrita por la ecuación Y = 0,0467x - 1,0412x + 7,1438x - 11,489 no intersecta
los puntos o datos que Brinda el ejercicio, por lo tanto, tiene sentido que el coeficiente de
correlación (R^2) no esté tan aproximado a 1.

6.0

R² = 0,829
5.0

4.0

3.0

2.0

1.0

0.0
0 2 4 6 8 10 12 14
 En la siguiente tabla se encuentran los datos de la muestra, el valor de cada uno de los
coeficientes (ai) del polinomio interpolante de Newton, la Desviación Estándar (Sy), el
Coeficiente de Correlación (R^2) y el Error Estándar (Sy/x):

n X Y Coefcientes
0 3 1,6 a0 1,600
1 4 3,6 a1 2,000
2 5 4,4 a2 -0,600
3 7 3,4 a3 0,042
4 8 2,2 a4 0,002
5 9 2,8 a5 0,008
6 11 3,8 a6 -0,003
7 12 4,6 a7 64,503
R^2 0,829
D. Estándar 3,14
Error Estándar 1,018099044

 El Polinomio Interpolante está dado por:

P(x) = a0 + a1(x-x0) + a2(x-x0)(x-x1) +…+ an(x-x0)…(x-xn-1)

 Teniendo en cuenta que P(xn) = yn


 Por medio del programa Excel, calculamos las constantes a0, a1, a2 y a3, teniendo en cuenta el
despeje de cada una del polinomio de interpolación de Newton.

PUNTO 4.

Un investigador se encuentra analizando un cultivo de café, en el cual analiza la cantidad de

bacterias existentes (Y), a medida que cambia la temperatura (X) a la cual se encuentra

expuesta. La siguiente tabla detalla los datos obtenidos por el investigador.

X -4 6 0 -6
Y -22 18 -6 -30

Utilice la fórmula de interpolación de Newton de diferencias divididas, para interpolar el

punto x = 3.

(INTERPOLACIÓN) Polinomio interpolante de Lagrange.


SOLUCIÓN

En la siguiente tabla se muestran los datos de las bacterias (Y) con respecto a la temperatura (X) y
por medio de la fórmula de interpolación (Polinomio interpolante de Lagrange). El método de
Lagrange para hallar un polinomio de grado 4 se representa así:

F(x)=∑𝒏𝒊=𝟎 𝑳𝒊(𝒙) ∗ 𝒇(𝒙𝒊)

 Donde Ln es el término de Lagrange.

n X Y = f(Xn) F(3)
0 -4 -22 L0 22,275
1 6 18 L1 4,725
2 0 -6 L2 -7,875
3 -6 -30 L3 -13,125

 Para este caso, la suma de los 4 términos es el único polinomio de tercer grado que pasa a través
de los 4 puntos, interpolando así el punto x=3.

F(3)= 22,275*f(x0) +4,725*f(x1)-7,875*f(x2)-13,125*f(x3)

 Al evaluarlo, tenemos:

F(3)=36

PUNTO 5

Un estudiante se encuentra investigando el impacto en la producción de un cultivo (Y) según los


cambios en la cantidad de hectáreas de caña de azúcar sembradas (X). El estudiante logró recolectar
los siguientes 4 datos, pero necesita conocer específicamente qué impacto tiene la producción,
cuando las hectáreas sembradas cambian a valor de 1, es decir, x = 1.

X -4 -3 2 -6
Y -16 -5 -10 -50

Utilice la fórmula de interpolación de Lagrange con los 4 datos obtenidos por el estudiante
SOLUCIÓN

 X=1
 X0 = -4
 X1 = -3
 X2 = 2
 X3 = -6

 Usaremos la fórmula para interpolación cubica


(𝑥 − 𝑥1)(𝑥 − 𝑥2)(𝑥 − 𝑥3) (𝑥 − 𝑥0)(𝑥 − 𝑥2)(𝑥 − 𝑥3)
𝑓(𝑥) = ∗ 𝑓(𝑥0) + ∗ 𝑓(𝑥1)
(𝑥0 − 𝑥1)(𝑥0 − 𝑥2)(𝑥0 − 𝑥3) (𝑥1 − 𝑥0)(𝑥1 − 𝑥2)(𝑥1 − 𝑥3)
(𝑥 − 𝑥0)(𝑥 − 𝑥1)(𝑥 − 𝑥3) (𝑥 − 𝑥0)(𝑥 − 𝑥1)(𝑥 − 𝑥2)
+ ∗ 𝑓(𝑥2) + ∗ 𝑓(𝑥3)
(𝑥2 − 𝑥0)(𝑥2 − 𝑥1)(𝑥2 − 𝑥3) (𝑥3 − 𝑥0)(𝑥3 − 𝑥1)(𝑥3 − 𝑥2)
 Reemplazando tenemos:
(1 + 3)(1 − 2)(1 + 6) (1 + 4)(1 − 2)(1 + 6)
𝑓(𝑥) = ∗ 𝑓(𝑥0) + ∗ 𝑓(𝑥1)
(−4 + 3)(−4 − 2)(−4 + 6) (−3 + 4)(−3 − 2)(−3 + 6)
(1 + 4)(1 + 3)(1 + 6) (1 + 4)(1 + 3)(1 − 2)
+ ∗ 𝑓(𝑥2) + ∗ 𝑓(𝑥3) = −1
(2 + 4)(2 + 3)(2 + 6) (−6 + 4)(−6 + 3)(−6 − 2)

PUNTO 6

Punto 6. (Punto de consulta) Splines

Si bien en el curso se han tratado métodos para realizar ajuste de curvas por medio de aproximación
e interpolación, abordando para este último técnicas como Newton Y Lagrange; también hay que
tener en cuenta que existen otro tipo de métodos para hacer estimación de forma interpolante. Un
método altamente conocido es la Interpolación por Splines (trazadores).

A. Realice las consultas correspondientes que lo lleven a comprender a plenitud el método


por Splines. Posteriormente escriba un informe en el cual explique con sus palabras y no
textualmente las de la fuente, en qué cosiste el método.
B. Realice un ejemplo detallado del método que abarque de forma completa el concepto y
sus componentes.
C. Compare el método por Splines y los métodos vistos en clase. Evidenciando las principales
similitudes y diferencias.
SOLUCIÓN

A. La interpolación por Splines consiste al igual que en los anteriores métodos en crear
polinomios que se ajusten de la mejor manera a la función sin embargo en este método se
divide el intervalo de trabajo en varios subintervalos en los cuales se usan diferentes
polinomios que se unen para llevar una continuidad como una función a trozos esto trae
consigo una gran ventaja dado que los polinomios usados son de menor grados a los que
usaríamos en otros métodos.

B. Ejemplo de Splines de grado 2 para hallar el ln de 4.5

x 1 4 5 6
y 0 1.3862944 1.6094379 1.7917595

 Definimos los intervalos [1,4], [4,5], [5,6]

A cada intervalo le asignamos un polinomio de grado 2

𝑎1 𝑥 2 + 𝑏1 𝑥 + 𝑐1 𝑠𝑖 𝑥 ∈ [1,4]
𝑓(𝑥) = {𝑎2 𝑥 2 + 𝑏2 𝑥 + 𝑐2 𝑠𝑖 𝑥 ∈ [4, 5]
𝑎3 𝑥 2 + 𝑏3 𝑥 + 𝑐3 𝑠𝑖 𝑥 ∈ [5,6]

 Ahora se debe cumplir.

f(1)= 0 f(4)= 1.3862944 f(5)= 1.6094379 f(6)= 1.7917595

 Así obtenemos las siguientes ecuaciones al evaluar los polinomios.

𝑎1 + 𝑏1 + 𝑐1 = 0 (1)

𝑎1 16 + 𝑏1 4 + 𝑐1 = 1.3862944 (2)

𝑎2 16 + 𝑏2 4 + 𝑐2 = 1.3862944 (3)

𝑎2 25 + 𝑏2 5 + 𝑐2 = 1.6094379 (4)
𝑎3 25 + 𝑏3 5 + 𝑐3 = 1.6094379 (5)

𝑎3 36 + 𝑏3 6 + 𝑐3 = 1.7917595 (6)

 Ahora como los polinomios son de grado 2 debemos hallar la primera derivada y para que sean
continúas.

2𝑎1 𝑥 + 𝑏1 𝑠𝑖 𝑥 ∈ [1,4]
𝑓(𝑥) = { 2𝑎2 𝑥 + 𝑏2 𝑠𝑖 𝑥 ∈ [4, 5]
2𝑎3 𝑥 + 𝑏3 𝑠𝑖 𝑥 ∈ [5,6]

 Para asegurar la continuidad debemos evaluar e igualar en las posibles discontinuidades:

𝑎1 8 + 𝑏1 = 𝑎2 8 + 𝑏2 (7)

𝑎2 10 + 𝑏2 = 𝑎3 10 + 𝑏3 (8)

 De esta manera obtenemos 8 ecuaciones y 9 incógnitas por lo que suponemos una de ellas (a1=
0) y resolvemos el sistema de ecuaciones obteniendo las siguientes constantes:

𝑎2 = −0.23895463 𝑎3 = 0.19813273
𝑏1 = 0.46209813 𝑏2 = 2.3737352 𝑏3 = −1.9971385
𝑐1 = −0.46209813 𝑐2 = −4.2853723 𝑐3 = 6.6418119
 Reemplazamos:
0.46209813𝑥 − 0.46209813 𝑠𝑖 𝑥 ∈ [1,4]
𝑓(𝑥) = {−0.23895463𝑥 2 + 2.3737352𝑥 − 4.2853723 𝑠𝑖 𝑥 ∈ [4, 5]
0.19813273𝑥 2 − 1.9971385𝑥 + 6.6418119 𝑠𝑖 𝑥 ∈ [5,6]

 Evaluamos el punto de interés x=4.5

𝑓(4.5) = 1.5576048

C. Comparación del método de Splines y los métodos vistos en clase:


 Diferencias

El método de Splines usa varios polinomios mientras que los otros métodos solo usan uno que en
principio es de mayor grado que los usados en este método, además lo que permite el uso de varios
polinomios de menor grado son los intervalos de trabajo los cuales no usaban los métodos vistos en
clase, por otro parte otra diferencia se encuentra en las oscilaciones que se crean en los diferentes
métodos ya que al crear polinomios de menor grado se evitan muchas de ellas, y por último la
adaptación a los cambios brucos en las funciones muestra una diferencia más entre estos métodos
ya que los Splines tienen una aproximación muchos mejor en estos casos.
 Similitudes

La primera similitud que se encuentra es la más sencilla dado que todos los métodos usan
polinomios y de alguna manera entre mayor sea el grado usado es mejor (sin embargo en el método
de Splines se usa normalmente como máximo el grado 3 dado que las oscilaciones son mínimas),
esto de alguna forma trae consigo otra similitud dado que las oscilaciones en ambos métodos son
un problema, además todos estos método dan como respuesta resultados aproximados lo que hace
que la existencia del error sea una similitud entre estos métodos.

Você também pode gostar