Você está na página 1de 14

UNIVERSIDAD DE MAGALLANES

FACULTAD DE CIENCIAS
DEPTO. DE MATEMÁTICA Y FÍSICA
Prof. Dr. Félix Zamorano B.

ANÁLISIS DE DATOS EXPERIMENTALES

El procedimiento para obtener la relación funcional entre dos variables: una


independiente (x) y otra dependiente (y), dependerá del comportamiento de ambas
variables, esto es, si tienen un comportamiento lineal o no lineal.

Decimos que los datos tienen un comportamiento lineal si el gráfico de estos es una línea
recta y el parámetro de correlación ‘r’ es 1 o bien -1 (o muy aproximado en ambos
casos), en tanto que tendrán un comportamiento no lineal en el caso en el cual el gráfico
es una línea curva y, por lo tanto, el parámetro ‘r’ se encontrará en el intervalo
comprendido entre -1 y 1, es decir, -1<r<1.

Ejemplo de aplicación:

1. Tabulación de los datos

Tabla 1. Cantidad y obtenida a partir de la cantidad x

Nº X y x · y x2 y2
Dato (Luts) (Pers)
1 10 32 320 100 1024
2 14 44 616 196 1936
3 16 50 800 256 2500
4 17 52 884 289 2704
5 20 62 1240 400 3844
6 25 78 1950 625 6084
7 32 98 3136 1024 9604
Σ 134 416 8946 2890 27696
Fuente: Datos experimentales obtenidos en laboratorio
2
2. Gráfico de los datos

100

90

80

70
y (Luts)

60

50

40

30

20

10

0
0 5 10 15 20 25 30 35
x (Pers)
Gráfico 1. Comportamiento de la cantidad y en función de la cantidad x .

Observe que se ha trazado la mejor recta de modo que quede el máximo de puntos sobre
la recta y los restantes queden distribuidos en igual cantidad sobre y bajo la recta.

3. Cálculo del parámetro de correlación r

Como mencionado anteriormente, el parámetro de correlación r, es un parámetro que


sirve para establecer si la relación entre dos variables cualesquiera, x e y, tienen una
relación lineal o una relación no lineal, es decir, si la relación es de la forma y = mx + n
(una línea recta) o es diferente de dicha forma (una línea curva). Su valor se obtiene
mediante la expresión:
∑ (x i • y i )
− (x • y )
r= N
σx • σy
3
siendo σx y σy, respectivamente:

σx =
( )− x
∑ xi
2
2
y σy =
( )− y
∑ yi
2
2

N N

Para los datos de la tabla anterior, el cálculo del parámetro de correlación arroja los
siguientes resultados:

∑ (x i • y i ) 8946 134 416


= = 1278 ; x= = 19 ; y= = 59
N 7 7 7

σx =
( )− x
∑ xi
2
2
=
2890
− 19 2 = 7.2
N 7

σy =
( )− y
∑ yi
2
2
=
27696
− 59 2 = 21.8
N 7

1278 − 10 • 59
r= =1
7.2 • 21.8

Este resultado indica que los datos de la tabla anterior tienen un comportamiento lineal
(es una línea recta con pendiente positiva) y, a continuación, veremos cómo establecer la
relación funcional para el primer caso: los datos tienen un comportamiento lineal.

Cómo el gráfico de los datos y el parámetro de correlación indican que la relación


buscada es una línea recta, la ecuación de ésta tiene la forma particular:

y = mx + n [1]

en la cual ‘m’ corresponde a la pendiente de la recta y ‘n’ al corte ( cuando x = 0) y el


problema se reduce a determinar el valor correspondiente de m y el de n.

4. Obtención de la relación funcional: Caso relación lineal

Existen tres métodos diferentes para determinar estos valores y así establecer la
relación funcional. A saber, los métodos son:
a. Método gráfico
b. Método de los promedios
c. Método de los cuadrados mínimos
4

a. El método gráfico utiliza el gráfico para tal efecto de forma que para calcular ‘m’ se
escogen dos puntos de la recta trazada, P1 = (x1 , y1) y P2 = (x2 , y2) y se efectúa
la operación:

y 2 − y1
m=
x 2 − x1

en tanto que para determinar ‘n’ se lee directamente el punto en el gráfico en el cual la
recta corta al eje de la variable independiente (punto en el cual x = 0).

Como ejemplo, usemos la tabla de datos anterior, en la que el parámetro de correlación


de los datos presentados es r = 1 y el gráfico correspondiente es:

100

90 Referencia
P2
y = f(x)
80 Extrap.

70
y (Luts)

60

50 P1

40

30

20

10
n = 2(Luts)

0
0 5 10 15 20 25 30 35
x (Pers)
Gráfico 1. Comportamiento de la cantidad y en función de la cantidad x .

En este, el punto P1 tiene coordenadas (12,38) y las del punto P2 son (24,74); entonces
la pendiente será:

(74 − 38) Luts 36 Luts  Luts 


m= = = 3 
(24 − 12) Pers 12 Pers  Pers 
5
Del gráfico se obtiene directamente el corte, siendo este n = 2(Luts). Así
entonces, sustituyendo estos valores en la ecuación [1], la relación funcional es:

y = 3x + 2,
x medido en unidad Pers e y en unidad Luts.

Otra forma de expresar lo mismo es:

 Luts 
y = 3  x + 2(Luts)
 Pers 

b. El método de los promedios utiliza la tabla de datos de tal forma que la divide en
dos grupos para formar un sistema de ecuaciones y de esta manera determinar el valor
de m y n. El sistema se forma con las ecuaciones que resultan de:

M
M 

i =1
y i =  ∑ x i m + Mn
 i =1 

N
 N 
∑ i  i=∑
y = x i m + (N - M )n
i =M +1 M +1 

en la cual, M es la cantidad de datos correspondiente a la primera mitad de la tabla y N


es la cantidad total de datos.

Observando la tabla de datos, hay 7 pares de datos (x,y) de modo que se toman los
primeros 4 pares para la primera ecuación y los restantes para la segunda ecuación. En la
tabla, esto es:
x Y
(Pers) (Luts)
10 32 4


4
y i = 178
∑i =1
x i = 57 14 44
i =1
16 50
17 52
20 62 7


7

∑ x i = 77 y i = 238
i =5
25 78 i = 5

32 98

Luego, introduciendo cada sumatoria en las ecuaciones correspondientes, se obtiene el


sistema:
6
1) 178 = 57m + 4n
2) 238 = 77m + 3n

que, al resolver, resulta m = 3 y n = 2. Por lo tanto, la relación funcional es:

y = 3x + 2,
x medido en unidad Pers e y en unidad Luts.

o bien:
 Luts 
y = 3  x + 2(Luts)
 Pers 

la cual es idéntica a la obtenida en el método anterior.

c. El método de los cuadrados mínimos es un método estadístico el cual evalúa N


ecuaciones del tipo y = mx + n, las cuales se suman y, además, se forman N ecuaciones
del tipo xy = mx2 + nx, las cuales también se suman. Siendo N la cantidad total de
datos, se obtienen dos ecuaciones de las cuales al despejar m y n resulta:

 N   N  N
 ∑ x i  *  ∑ y i  − N ∑ (x i * y i )
m =  i =1   i =1 2  i =1

 N 
( )
N

 ∑ xi  − N ∑ x i
2

 i =1  i =1

 N  N  N 2  N 
 ∑ x i  * ∑ (x i * y i ) −  ∑ x i  *  ∑ y i 
n =  i =1  i =1 2
 i =1   i =1 
 N 
( )
N

 ∑ x i  − N ∑ x i
2

 i =1  i =1

Para los datos de la tabla anterior se obtiene:

134 * 416 − 7 * 8946  Luts 


m= = 3 
134 − 7 * 2890
2
 Pers 

134 * 8946 − 416 * 2890


n= = 2(Pers)
134 2 − 7 * 2890

Entonces, la relación funcional resulta ser:

 Luts 
y = 3  x + 2(Luts)
 Pers 
7
Observe que en los tres métodos se ha obtenido la misma relación funcional, vale
decir, los mismos valores para m y n, cosa que se habría de esperar, pero no siempre
ocurre esta situación, en especial cuando el valor del parámetro de correlación r no es
exactamente 1 (recta con pendiente positiva) ó -1 (recta con pendiente negativa).

5. Relación funcional: caso relación No lineal

Hemos visto los métodos para determinar una relación funcional empírica para el caso en
que los datos tienen un comportamiento lineal, esto es, cuando el parámetro de
correlación es 1 ó -1 y el gráfico es una línea recta.

En caso de que el parámetro de correlación se encuentre en el intervalo comprendido


entre -1 y 1, es decir, -1< r < 1, el gráfico será una línea curva y decimos que los datos
tienen un comportamiento no lineal.

Para poder determinar la relación funcional, lo que hay que hacer primero es
transformar los datos para que tengan un comportamiento lineal, esto es, rectificar los
datos y, posteriormente, aplicar cualquiera de los métodos vistos anteriormente, puesto
que ahora los datos tendrán un comportamiento lineal.

Existen dos métodos para rectificar los datos y así determinar la relación funcional de
un conjunto de datos que tienen un comportamiento no lineal:

a. método logarítmico
b. método del cambio de variable.

a. Método logarítmico: Este método supone que la relación funcional debe tener la forma
general:
y = axb [2]

Consiste en aplicar logaritmo a todos los pares de datos (variable independiente y


dependiente) de forma que la nueva tabla de datos tiene dos nuevas columnas: una log x
y la otra log y. Si se grafican estos pares de datos (logx, log y) y con estos se calcula el
nuevo parámetro de correlación, se espera que el gráfico sea una recta y que r’ =1 o r’ =
-1 o aproximados a estos valores).

¿Cómo determinar el valor de a y el de b en de la ecuación general [2]?

Con los datos (log x, log y) se ha conseguido rectificarlos por lo tanto la ecuación de esa
recta es ahora:
8

log y = m (log x) + n [3]

en donde m y n se determinan ya sea utilizando el método gráfico, el de los promedios o


el de los cuadrados mínimos. Sabemos que es más correcto aplicar este último.

A continuación, aplicamos propiedades logarítmicas en la expresión [3] y también


antilogaritmo al corte n; esto es, a = antilog n, de modo que al aplicar logaritmo a la
cantidad a se obtiene: log a = log(antilog n) = n . De esta manera resulta:

log y = log xm + log a

log y = log (a xm)

y al aplicar antilogaritmo en ambos lados de la igualdad, resulta:

y = a xm

la cual es idéntica a la expresión [2] y, por simple comparación, se deduce que a =


antilog n y que b = m.

Ejemplo de aplicación. La siguiente es una tabla de datos que ha sido ya completada


para todos los efectos de cálculo y el gráfico 2 corresponde a la gráfica de los datos
(x,y).

Tabla 1. Datos experimentales de la cantidad y en función de la cantidad x.


Dato x(Fats) y(Lots) log x log y log x * log y (log x)2 (log y)2

1 1.0 1.000 0.000 0.000 0.000 0.000 0.000
2 3.0 0.111 0.477 -0.955 -0.456 0.228 0.912
3 4.0 0.063 0.602 -1.201 -0.723 0.362 1.442
4 6.0 0.028 0.778 -1.553 -1.208 0.605 2.412
5 7.0 0.020 0.845 -1.699 -1.436 0.714 2.887
6 9.0 0.012 0.954 -1.921 -1.833 0.910 3.690
7 10.0 0.010 1.000 -2.000 -2.000 1.000 4.000
8 12.0 0.007 1.079 -2.115 -2.235 1.164 4.644
Σ 52 1.251 5.735 -11.484 -9.981 4.983 19.987
9

1.2

1.1

1.0

0.9

0.8

0.7
y(Luts)

0.6

0.5

0.4

0.3

0.2

0.1

0.0

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
x(Fats)

Gráfico1. Comportamiento de la cantidad y en función de la cantidad x.

Si con los datos (x,y) se calcula el parámetro de correlación, éste dará r = -0.66 y su
gráfico corresponde a una línea curva, como se muestra en el gráfico 1. Al analizar ambos
resultados, se concluye que los datos NO tienen un comportamiento lineal. En tanto, si
calculamos el nuevo parámetro de correlación, ahora con los datos (logx, logy), resulta r’
= 1 y el gráfico correspondiente a tales datos, es el observado en el gráfico 2.

0.0

-0.5

-1.0
logy

-1.5

-2.0

-2.5

0 0.5 1 1.5
logx
Gráfico 2. Comportamiento de la cantidad logy en función de logx

A partir de los resultados de los parámetros de correlación y los gráficos anteriores, se


observa que se ha procedido a la rectificación de los datos y ahora procedemos a
determinar el valor de m y n con los datos (logx, logy); aquellos que se encuentran en el
rectángulo oscurecido. Aplicando el método de los cuadrados mínimos se obtiene: m = -
2.004 y n = 0.001 los cuales al ser aproximados resultan m = -2 y n = 0. A su vez,
10
sabemos que a = antilog n = 1 y que b = m = -2. Por lo tanto, la relación funcional
buscada es:
y(Lots) = 1 * [x(Fats)]-2
o simplemente,
1
y(Lots) =
[x(Fats)]2

b. Método del cambio de variable: Este método consiste en cambiar la variable


independiente o la dependiente o ambas, por una función de ella; es decir, se cambia la
variable en cuestión z por una g(z), como por ejemplo, 1/z, z2, 1/z2, log z, ez, sen
z, z , etc. Podemos ver que existe un sin número de funciones posibles. Para
simplificar la situación, se recurre al conocimiento de geometría analítica, la cual
mediante la simple inspección del gráfico, es posible establecer a priori las posibles
funciones de rectificación. Para establecer cual es la correcta, habrá que calcular el
parámetro de correlación para cada una de las posibles funciones, es decir, calcular r
para cada par de datos (g(x), y) ó (x, g(y)) ó ambas (g(x), g(y)), siendo g(z) la posible
función y escoger aquella cuyo valor sea más próximo a 1 ó -1. Una vez determinada la
mejor función de rectificación, ésta tendrá (por ejemplo) la forma:

y = m g(x) + n [4]

en donde hay que determinar m y n mediante el método, por ejemplo, de los cuadrados
mínimos o de los promedios, que tienen mayor confiabilidad.

Al aplicar uno de estos métodos a la tabla de datos anteriormente utilizada y sustituir la


variable independiente x por g(x) = 1/x2, resulta la siguiente tabla de datos:

Dato x(Fats) 1/x2 y(Lots)


Nº (Fats-2)
1 1.0 1.000 1.000
2 3.0 0.111 0.111
3 4.0 0.063 0.063
4 6.0 0.028 0.028
5 7.0 0.020 0.020
6 9.0 0.012 0.012
7 10.0 0.010 0.010
8 12.0 0.007 0.007
Σ 52 1.251 1.251
11
en la cual usted puede observar que x se ha sustituido por 1/x2 y los valores de y son
los mismos. En efecto, al calcular r’ con los nuevos datos (1/x2, y), éste resulta ser 1 y
el gráfico 3 muestra que se ha logrado la rectificación.

1.0
y (Lots)

0.5

0.0

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2
1/x2 (Fats-2)
Gráfico 3. Comportamiento de la variable y en función de 1/x2.

En este caso, ahora la pendiente es m = 1 Lots * Fats 2 ( ) y el corte n = 0, por lo que la


relación funcional será:

y(Lots) = 1( Lots*Fats2) * 1/x2 + 0,


o simplemente:
1
y(Lots ) =
[x(Fats)]2

Observe que la relación es idéntica a la anterior, pero es importante entender que con el
método logarítmico resulta una relación funcional con un término en la derecha, en tanto
que con el método del cambio de variable resulta una relación funcional de dos términos.
Observe las expresiones [2] y [4].

5. Relación funcional polinomial

En los anteriores análisis de datos experimentales, hemos visto los diferentes métodos
para determinar la relación funcional entre dos variables: cuando hay un comportamiento
lineal entre ellas y dos métodos de rectificación, para el caso no lineal. En esta parte
veremos como establecer la relación funcional entre dos variables (que hemos
12
generalizado como x e y), cuando se tiene la certeza de que la relación funcional a
determinar es un polinomio en la forma de la serie de Taylor, es decir, de la forma:

y = a0 + a1x + a2x2 + a3x3 + .........+ anxn [5]

y en la cual algunas de las constantes (ai) puede ser cero y otras hay que determinar.

El método para obtener el grado del polinomio se denomina “método de las diferencias
finitas” y lo que hay que hacer es determinar el máximo exponente de la variable
independiente (x). Para tal efecto, se debe realizar la sucesiva diferencia ∆y entre los
datos de la variable dependiente (y). Veamos como se realiza en la siguiente tabla:

x(Fis) y(Mat) ∆i=1 ∆i=2 ∆i=3 ∆i=4


1.4 2
2
2.0 4 1
3 -1
2.6 7 0 2
3 1
3.2 10 1 0
4 1
3.8 14 2 -4
6 -3
4.4 20 -1
5
5.0 25

Pi 23/1 3/2 -2/6 -2/24


en donde:
∆i
Pi =
i!
Para establecer el grado del polinomio, se observa si existe una columna de ceros en las
columnas de las diferencias, que sea obtenida en forma natural. Si esto ocurre, entonces
el grado del polinomio lo da el valor de i de la columna anterior a la columna de ceros. Si
esto no ocurre se analiza el parámetro Pi, entre los Pi donde ocurre el cambio de signos
(de positivo a negativo o viceversa). Aquel Pi que tenga valor más próximo a cero indicará
que el i de la columna anterior corresponde al grado del polinomio. Para el caso de
nuestra tabla, observe que no hay ninguna columna de ceros y al analizar los Pi, se
produce el cambio de signo entre i = 2 e i = 3, siendo P3 más cercano a cero que P2, por
lo tanto el grado del polinomio es 2, con lo que resulta la serie de Taylor:

y = a0 + a1x + a2x2 [6]


13

faltando por determinar los valores de a0 , a1 y a2. Para ello, vea si en la tabla de datos
aparece el dato (0, d). Si es así, entonces a0= d, faltando por determinar a1 y a2 los
cuales se obtienen por el método de los promedios, esta vez dividiendo la tabla en dos y
formando un sistema de dos ecuaciones de la forma:

M
 M   M 2
1) ∑ y i = Ma 0 +  ∑ i  1  ∑ x i a 2
 x  a +
i =1  i=1   i=1 

N
 N   N 
2) ∑ y = (N − M)a
i = M +1
i 0 +  ∑ x i a 1 +  ∑ x i2 a 2
 i = M +1   i= M +1 

siendo M la primera mitad de datos y N el total.

En nuestra tabla, no tenemos el par de datos (0, d) luego hay que determinar tres
constantes: a0 , a1 y a2 con lo cual hay que formar tres ecuaciones de la forma anterior,
esto es:
No. x(Fis) x2 (Fis2) y(Mat)
1 1.4 1.96 2.0
2 2.0 4.00 4.0
Σ 3.4 5.96 6.0
3 2.6 6.76 7.0
4 3.2 10.24 10.0
Σ 5.8 17.00 17.0
5 3.8 14.44 14.0
6 4.4 19.36 20.0
7 5.0 25.00 25.0
Σ 13.2 58.80 59.0

De la tabla anterior, se forman las ecuaciones:

1) 6.0 = 2 a0 + 3.4 a1 + 5.96 a2


2) 17.0 = 2 a0 + 5.8 a1 + 17.0 a2
3) 59.0 = 3 a0 + 13.2 a1 + 58.8 a2

 Mat 
que al resolver, resultan los valores aproximados a0 = 0, a1 = 0 y a2 = 1 2 
, por lo
 Fis 
que al sustituir en [6], la relación funcional buscada es:

 Mat  2
y(Mat) = 1 2 
x
 Fis 
14

En otro aspecto, al graficar la tabla de datos (x,y), se obtendrá una semi-parábola, como
se muestra en el gráfico 4, cuya ecuación es la obtenida anteriormente.

20

15
y(Mat)

10

1 2 3 4 5
x(Fis)

Gráfico 4. Comportamiento de la variable y en función de la variable x.

Você também pode gostar