Escolar Documentos
Profissional Documentos
Cultura Documentos
Con el método de regresión por mínimos cuadrados ajuste una línea recta para el siguiente
conjunto de datos:
X 0 2 4 6 9 11 12 15 17 19
y 5 6 7 6 9 8 7 10 12 12
SOLUCIÓN
X Y e e2 ̅)𝟐
∑(𝒚𝒊 − 𝒚
0 5 0,15 0,02 10,24
2 6 0,44 0,20 4,84
4 7 0,74 0,55 1,44
6 6 -0,97 0,93 4,84
9 9 0,98 0,95 0,64
11 8 -0,73 0,53 0,04
12 7 -2,08 4,33 1,44
15 10 -0,14 0,01 3,24
17 12 1,16 1,34 14,44
19 12 0,45 0,20 14,44
Suma 82 -0.25x10-3 9,07 55,60
Pendiente 0,3525
Intersección 4,8515
Error estándar 1,0650
Coeficiente de
correlación 0,8368
Dado que el error estándar representa la dispersión entre los datos alrededor de la línea de
regresión, un valor grande de éste indicaría una alta dispersión, mientras que uno pequeño
revelaría poca dispersión, al ser nuestro error estándar aproximadamente 1 (1.0650), se podría
decir que estos datos se ajustan linealmente a la recta de forma aceptable, y esto se puede
apreciar al ver que la mayoría de los puntos se distribuyen cerca de la línea, excepto el dato
x=12 cuya imagen se encuentra más alejada de la recta que los demás puntos, lo que podría
indicar que es un dato atípico, que puede influir en el ajuste negativamente.
14
y = 0.3525x + 4.8515
12 R² = 0.8368
10
0
0 2 4 6 8 10 12 14 16 18 20
Puesto que el coeficiente de correlación indica la relación entre dos variables analizadas, y se
expresa en términos de porcentaje, se esperaría que entre más cercano este esté estadístico a
100% (o 1) mayor es el ajuste entre las dos variables, en este caso se obtuvo que nuestro
coeficiente de relación fue de 0,8368 (o 83,68%), el cual podría considerarse aceptable o alto,
dependiendo del nivel de rigurosidad que se requiera para nuestro análisis, este valor es posible
que se haya visto afectado por el dato presumiblemente atípico x=12, que es el que más se aleja
de la línea recta.
PUNTO 2
Haga uso del método de regresión por mínimos cuadrados para definir un ajuste al siguiente
conjunto de datos.
X 1 2 3 4 5 6 7 8 9
Y 1 1,5 2 3 4 5 8 10 13
SOLUCIÓN
X Y e e2 ̅)𝟐
∑(𝒚𝒊 − 𝒚
1 1,00 1,56 2,42 18,32
2 1,50 0,60 0,36 14,29
3 2,00 -0,36 0,13 10,76
4 3,00 -0,82 0,67 5,20
5 4,00 -1,28 1,63 1,64
6 5,00 -1,74 3,01 0,08
7 8,00 -0,19 0,04 7,40
8 10,00 0,35 0,12 22,28
9 13,00 1,89 3,57 59,60
Suma 47,50 0,00 11,95 139,56
Pendiente 1,4583
Intersección -2,0139
Error estándar 1,306652697
Coeficiente de
correlación 0,9144
14.00
8.00
6.00
4.00
2.00
0.00
0 1 2 3 4 5 6 7 8 9 10
-2.00
Aunque la gráfica tiene la forma de una parábola, se puede observar que estos datos se
ajustan bien a una regresión lineal, ya que en primera instancia se observa que tienen un
error estándar asociado, en términos relativos, pequeño de 1,3, y un coeficiente de
correlación de 0,9144 (91,44%), incluso mayor al del punto 1 (0,8368), esto en primer lugar
indica que hay una baja dispersión entre los datos y la línea recta, es posible que el intervalo
utilizado no sea lo suficientemente grande como para afectar el ajuste lineal entre las dos
variables analizadas.
B.
14.00
10.00
8.00
6.00
4.00
2.00
0.00
0 1 2 3 4 5 6 7 8 9 10
Al hacer el ajuste usando una regresión polinomial se puede observar a simple vista que la
línea de tendencia cruza la mayoría de los puntos, por lo tanto, tiene sentido que el
coeficiente de correlación sea mucho más cercano a 1 (99,49%), que el obtenido con la
regresión lineal (91,44), esto quiere decir que es este tipo de regresión representa mejor
nuestros datos que el modelo lineal.
PUNTO 3.
Ajuste una ecuación cúbica a los datos. Halle los coeficientes además de R^2 y S𝒚/𝒙
x 3 4 5 7 8 9 11 12
y 1.6 3.6 4.4 3.4 2.2 2.8 3.8 4.6
SOLUCIÓN
A continuación, se muestra la gráfica del ajuste de los datos usando una regresión
polinomial de grado 3 por medio del programa Excel, en ella se puede observar que la
3 2
parábola descrita por la ecuación Y = 0,0467x - 1,0412x + 7,1438x - 11,489 no intersecta
los puntos o datos que Brinda el ejercicio, por lo tanto, tiene sentido que el coeficiente de
correlación (R^2) no esté tan aproximado a 1.
6.0
R² = 0,829
5.0
4.0
3.0
2.0
1.0
0.0
0 2 4 6 8 10 12 14
En la siguiente tabla se encuentran los datos de la muestra, el valor de cada uno de los
coeficientes (ai) del polinomio interpolante de Newton, la Desviación Estándar (Sy), el
Coeficiente de Correlación (R^2) y el Error Estándar (Sy/x):
n X Y Coefcientes
0 3 1,6 a0 1,600
1 4 3,6 a1 2,000
2 5 4,4 a2 -0,600
3 7 3,4 a3 0,042
4 8 2,2 a4 0,002
5 9 2,8 a5 0,008
6 11 3,8 a6 -0,003
7 12 4,6 a7 64,503
R^2 0,829
D. Estándar 3,14
Error Estándar 1,018099044
PUNTO 4.
bacterias existentes (Y), a medida que cambia la temperatura (X) a la cual se encuentra
X -4 6 0 -6
Y -22 18 -6 -30
punto x = 3.
En la siguiente tabla se muestran los datos de las bacterias (Y) con respecto a la temperatura (X) y
por medio de la fórmula de interpolación (Polinomio interpolante de Lagrange). El método de
Lagrange para hallar un polinomio de grado 4 se representa así:
n X Y = f(Xn) F(3)
0 -4 -22 L0 22,275
1 6 18 L1 4,725
2 0 -6 L2 -7,875
3 -6 -30 L3 -13,125
Para este caso, la suma de los 4 términos es el único polinomio de tercer grado que pasa a través
de los 4 puntos, interpolando así el punto x=3.
Al evaluarlo, tenemos:
F(3)=36
PUNTO 5
X -4 -3 2 -6
Y -16 -5 -10 -50
Utilice la fórmula de interpolación de Lagrange con los 4 datos obtenidos por el estudiante
SOLUCIÓN
X=1
X0 = -4
X1 = -3
X2 = 2
X3 = -6
PUNTO 6
Si bien en el curso se han tratado métodos para realizar ajuste de curvas por medio de aproximación
e interpolación, abordando para este último técnicas como Newton Y Lagrange; también hay que
tener en cuenta que existen otro tipo de métodos para hacer estimación de forma interpolante. Un
método altamente conocido es la Interpolación por Splines (trazadores).
A. La interpolación por Splines consiste al igual que en los anteriores métodos en crear
polinomios que se ajusten de la mejor manera a la función sin embargo en este método se
divide el intervalo de trabajo en varios subintervalos en los cuales se usan diferentes
polinomios que se unen para llevar una continuidad como una función a trozos esto trae
consigo una gran ventaja dado que los polinomios usados son de menor grados a los que
usaríamos en otros métodos.
x 1 4 5 6
y 0 1.3862944 1.6094379 1.7917595
𝑎1 𝑥 2 + 𝑏1 𝑥 + 𝑐1 𝑠𝑖 𝑥 ∈ [1,4]
𝑓(𝑥) = {𝑎2 𝑥 2 + 𝑏2 𝑥 + 𝑐2 𝑠𝑖 𝑥 ∈ [4, 5]
𝑎3 𝑥 2 + 𝑏3 𝑥 + 𝑐3 𝑠𝑖 𝑥 ∈ [5,6]
𝑎1 + 𝑏1 + 𝑐1 = 0 (1)
𝑎1 16 + 𝑏1 4 + 𝑐1 = 1.3862944 (2)
𝑎2 16 + 𝑏2 4 + 𝑐2 = 1.3862944 (3)
𝑎2 25 + 𝑏2 5 + 𝑐2 = 1.6094379 (4)
𝑎3 25 + 𝑏3 5 + 𝑐3 = 1.6094379 (5)
𝑎3 36 + 𝑏3 6 + 𝑐3 = 1.7917595 (6)
Ahora como los polinomios son de grado 2 debemos hallar la primera derivada y para que sean
continúas.
2𝑎1 𝑥 + 𝑏1 𝑠𝑖 𝑥 ∈ [1,4]
𝑓(𝑥) = { 2𝑎2 𝑥 + 𝑏2 𝑠𝑖 𝑥 ∈ [4, 5]
2𝑎3 𝑥 + 𝑏3 𝑠𝑖 𝑥 ∈ [5,6]
𝑎1 8 + 𝑏1 = 𝑎2 8 + 𝑏2 (7)
𝑎2 10 + 𝑏2 = 𝑎3 10 + 𝑏3 (8)
De esta manera obtenemos 8 ecuaciones y 9 incógnitas por lo que suponemos una de ellas (a1=
0) y resolvemos el sistema de ecuaciones obteniendo las siguientes constantes:
𝑎2 = −0.23895463 𝑎3 = 0.19813273
𝑏1 = 0.46209813 𝑏2 = 2.3737352 𝑏3 = −1.9971385
𝑐1 = −0.46209813 𝑐2 = −4.2853723 𝑐3 = 6.6418119
Reemplazamos:
0.46209813𝑥 − 0.46209813 𝑠𝑖 𝑥 ∈ [1,4]
𝑓(𝑥) = {−0.23895463𝑥 2 + 2.3737352𝑥 − 4.2853723 𝑠𝑖 𝑥 ∈ [4, 5]
0.19813273𝑥 2 − 1.9971385𝑥 + 6.6418119 𝑠𝑖 𝑥 ∈ [5,6]
𝑓(4.5) = 1.5576048
El método de Splines usa varios polinomios mientras que los otros métodos solo usan uno que en
principio es de mayor grado que los usados en este método, además lo que permite el uso de varios
polinomios de menor grado son los intervalos de trabajo los cuales no usaban los métodos vistos en
clase, por otro parte otra diferencia se encuentra en las oscilaciones que se crean en los diferentes
métodos ya que al crear polinomios de menor grado se evitan muchas de ellas, y por último la
adaptación a los cambios brucos en las funciones muestra una diferencia más entre estos métodos
ya que los Splines tienen una aproximación muchos mejor en estos casos.
Similitudes
La primera similitud que se encuentra es la más sencilla dado que todos los métodos usan
polinomios y de alguna manera entre mayor sea el grado usado es mejor (sin embargo en el método
de Splines se usa normalmente como máximo el grado 3 dado que las oscilaciones son mínimas),
esto de alguna forma trae consigo otra similitud dado que las oscilaciones en ambos métodos son
un problema, además todos estos método dan como respuesta resultados aproximados lo que hace
que la existencia del error sea una similitud entre estos métodos.