Você está na página 1de 736

La derivada covariante de un tensor I

Los tensores, al igual que otros objetos matemáticos, también pueden ser diferenciados con las
herramientas del cálculo infinitesimal. Sin embargo, hay que tomar aquí ciertas precauciones.
Considérese un tensor covariante T = (Tp(x(t))) en donde la notación nos indica que para las
operaciones que vamos a llevar a cabo este tensor está definido a lo largo de una curva x(t)
expresada en ecuaciones paramétricas tales como (x1= 1+2t², x2=-4+5t, x3= 6t). Si la derivada de
un tensor ha de estar bien definida, no basta con que apliquemos las reglas del cálculo
infinitesimal que ya conocemos para obtener algo que podríamos sentirnos tentados a llamar “la
derivada de un tensor”. Es necesario que el resultado obtenido también se comporte como un
tensor, es necesario que también se transforme de acuerdo con la definición del tensor bajo un
cambio de coordenadas. Si esto no ocurre, la operación no nos sirve de nada, porque al no
poderse transformar “la derivada del tensor” como un tensor bajo un cambio de coordenadas,
entonces una ecuación tensorial que involucre derivadas de los mismos no será independiente
de un cambio de coordenadas, contraviniendo la principal razón para recurrir al uso de tensores
que es para poder escribir relaciones matemáticas como las que ocurren en la Relatividad
General, independientes del sistema de coordenadas utilizado. Y resulta que la diferenciación
ordinaria de un tensor no nos produce un tensor.

PROBLEMA: Demostrar que la derivada de un tensor covariante de orden uno T = (Tp) no es


un tensor.

Si T = (Tp) es un tensor covariante, entonces de acuerdo a la definición de tensor:

Diferenciando el tensor T con respecto a xk:

Aplicando la regla de la cadena a la inversa con el fin de que el primer término se transforme de
acuerdo con la definición del tensor:
Reacomodando:

El primer término en el lado derecho de la igualdad efectivamente transforma de acuerdo con la


definición del tensor, pero el segundo término resaltado en amarillo parece resistir cualquier
intento de manipulación para lograr que también transforme de acuerdo con la definición del
tensor. La derivada ordinaria del tensor T podría haber sido también un tensor, de no haber
sido por este término adicional que ha aparecido como consecuencia de la aplicación de la regla
de Leibnitz (la diferencial del producto de dos cantidades es igual a la primera por la diferencial
de la segunda más la segunda por la diferencial de la primera). Lo que tenemos obviamente ya
no es un tensor, porque no se transforma como un tensor, no cumple con la definición básica del
tensor.

A menos de que estemos dispuestos a llevar a cabo alguna redefinición de la derivada del tensor,
tal parece que hemos llegado hasta donde podíamos haber llegado, tal parece que nos
tendríamos que conformar con la simple aritmética de tensores que ya hemos visto, limitados a
efectuar la suma, la diferencia y el producto de tensores (además de las operaciones adicionales
de contracción).

Buscando solventar este problema, el matemático Elwin Bruno Christoffel propuso la única
salida posible: redefinir el concepto de derivada de tensor agregando justo el término adicional
requerido para cancelar el término extra que aparece en la diferenciación ordinaria del tensor,
haciéndolo de tal manera que se preserve la independencia de coordenadas que los tensores nos
ofrecen en su notación compacta. Esta propuesta la dió a conocer al mundo en 1869 en su papel
titulado “Über die Transformation der homogen Differentialausdrücke zweiten Grades”, y el
“término de corrección” es conocido en lo que hoy se conoce en el análisis tensorial como
los símbolos de Christoffel del primer género y del segundo género, los cuales están
definidos mediante tres índices y los cuales son obtenidos a su vez del tensor métrico del espacio
bajo consideración. Junto con los símbolos de cuatro índices introducidos por Bernhard
Riemann (empleados en la definición del tensor de Riemann) los símbolos son conocidos hoy
como los símbolos Riemann-Christoffel.

Naturalmente, al crear una nueva definición de la derivada de tensor que no concuerda con la
diferenciación ordinaria, ya no se le puede seguir llamando derivada, llamándosele por lo tanto
la derivada covariante (no hay nada que esté definido como “derivada contravariante”, tal
cosa no existe).

La presencia de los símbolos de Christoffel en la derivada covariante de un tensor garantizan


que ésta derivada covariante también será un tensor, asegura que también se transformará
como un tensor de acuerdo a la definición fundamental del tensor, porque bajo la
transformación el símbolo de Christoffel adquiere un término que cancela el término
problemático que impediría que la derivada covariante pueda transformarse como un tensor.
Ese término extra es el que surge de la otra parte de la derivada covariante, que es la derivada
parcial del tensor. Esta es la verdadera razón que dió origen a los símbolos de Christoffel.

Desde el punto de vista geométrico, mientras que el tensor métrico nos describe sobre un
espacio curvo (como la superficie de un globo) una especie de “derivada de primer orden” de la
curvatura, los símbolos de Christoffel, definidos como están a partir de las derivadas covariantes
del tensor métrico, nos describen una especie de “derivada de segundo orden” de la curvatura.

Dicho lo anterior, introduciremos ahora la definición de los símbolos del Christoffel del
primer género ó de primera especie (first kind), caracterizados porque todos los índices
que los caracterizan son sub-índices (subscriptos), estando simbolizados en la mayoría de los
libros de texto con los siguientes dos tipos de notación:

Los símbolos de Christoffel del primer género, con todos los tres índices abajo, están definidos
mediante la siguiente relación:
Introduciremos ahora una notación abreviada utilizada frecuentemente en muchos textos, razón
por la cual conviene recordarla:

Con esta notación condensada, el símbolo de Christoffel del primer género se puede escribir de
la manera siguiente:

Desafortunadamente, esta no es la única notación abreviada utilizada para la derivada parcial


que queremos representar (ojalá y lo fuera). Existe otro tipo de notación, también utilizada
ampliamente tanto en los libros de texto como en la literatura técnica, conocida como
la notación de la coma, de acuerdo con la cual si vamos a llevar a cabo una diferenciación
parcial de algo como gjk con respecto a la coordenada xμ, entonces representamos dicha
diferenciación simplemente como gjk,μ. En otras palabras:

Con la notación condensada de “coma”, el símbolo de Christoffel del primer género se puede
escribir de la manera siguiente:

Por si la anterior carga de simbología nueva no fuese suficiente, existe en otros libros la
convención de que al utilizar el símbolo de la “coma” para indicar diferenciación se prescinda
del uso de la coma por completo, “sobreentendiéndose” que la derivada parcial del tensor
métrico g con respecto a la coordenada xμ será simbolizado con el sub-índice μque corresponda
puesto al final prescindiendo de la coma. O sea que la anterior fórmula se puede escribir
igualmente en forma aceptable (aunque menos clara) como:
Esto último frecuentemente se escribe de la siguiente manera mediante un simple reacomodo de
los términos con el único propósito de hacerlo más fácilmente memorizable (mnemónica)
recurriéndose a la permutación cíclica de los sub-índices:

Γijk = (- gij,k + gjk,i + gki,j)/2

Con el fin de ir familiarizando aquí mismo al lector con los tipos de notación abreviada
mencionada, se utilizarán indistintamente las formas abreviadas.

PROBLEMA: Verificar que si se intercambian los dos primeros índices en un símbolo de


Christoffel del primer género, el componente obtenido es el mismo.

Puesto que el tensor métrico es simétrico, o sea:

gij = gji

Tomando derivadas parciales con respecto a las coordenadas xi, xj y xk obtenemos (utilizando la
coma para abreviar la simbolización de la derivada parcial):

gij,k = gji,k___gjk,i = gkj,i___gki,j = gik,j

Puesto que:

Γijk = (- gij,k + gjk,i + gki,j)/2___Γjik = (- gij,k + gik,j + gkj,i)/2

obtenemos de inmediato que Γijk = Γjik. Este resultado nos es de utilidad en cualquier problema
en donde queramos reducir los cálculos requeridos para la obtención de los símbolod de
Christoffel del primer género.

PROBLEMA: Demuéstrese que en cualquier sistema de coordenadas, los símbolos de


Christoffel del primer género se desvanecen sí y solo sí el tensor métrico tiene componentes
constantes en dicho sistema de coordenadas.

Permutando los índices de los símbolos de Christoffel del primer género del arreglo (ijk):
Γijk = (- gij,k + gjk,i + gki,j)/2

al arreglo (jki) obtenemos lo siguiente:

Γjki = (- gjk,i + gki,j + gij,k)/2

Sumando ambas expresiones obtenemos lo siguiente:

Si el tensor métrico g tiene componentes constantes en cierto sistema de coordenadas, entonces


todas las derivadas del tipo ∂gik /∂xk serán iguales a cero, y la única manera en la que la suma de
los componentes Γijk y Γjki sea cero en todos los casos es que los símbolos de Christoffel sean
iguales a cero en todos los casos.

La importancia de la definición que se ha dado a los símbolos de Christoffel que se obtienen a


partir de un tensor métrico g es que si se conocen todos los componentes del tensor
métrico g entonces a través de la definición se pueden obtener todos los símbolos de Christoffel
del primer género. Y una vez obtenidos, podemos obtener la derivada covariante que estamos
buscando, lo cual es nuestro propósito final.

PROBLEMA: Obtener los símbolos de Christoffel del primer género para la métrica
Euclideana en coordenadas esféricas.

En coordenadas esféricas (x1,x2,x3) = (r,θ,φ), el elemento de línea ds² está dado por:

ds² = dr² + r²(dθ)² + r² sen²θ (dφ)²

ds² = (dx1)² + (x1)²(dx2)² + (x1)² sen2(x2) (dx3)²

Entonces los componentes del tensor métrico g, en su representación matricial explícita G, se


pueden escribir de la siguiente manera:
Con los componentes del tensor métrico g en nuestras manos, el cálculo de los símbolos de
Christoffel procede de manera directa. Empezaremos con la evaluación de Γ111 = Γrrr:

Γ111 = (- g11,1 + g11,1 + g11,1)/2

Γrrr = (- grr,r + grr,r + grr,r)/2

Γrrr = ( grr,r)/2 = (∂grr/∂r)/2 = 0

Tenemos que grr,r es igual a cero porque grr es una constante (1) cuya derivada es cero.
Procediendo en forma similar, obtenemos otros símbolos de Christoffel:

-----------------

Γ221 = (- g22,1 + g21,2 + g12,2)/2

Γθθr = (- gθθ,r + gθr,θ + grθ,θ)/2

Γθθr = (- ∂gθθ/∂r + ∂gθr/∂θ + ∂grθ/∂θ)/2

Γrrr = (- 2r)/2 = - r

-----------------
Γ212 = (- g21,2 + g22,1 + g21,2)/2

Γθrθ = (- gθr,θ + grθ,θ + gθθ,r)/2

Γθrθ = (- ∂gθr/∂θ + ∂grθ/∂θ + ∂gθθ/∂r)/2

Γθrθ = (∂gθθ/∂r)/2

Γθrθ = (2r)/2 = r

-----------------

Γ122 = (- g12,2 + g22,1 + g21,2)/2

Γrθθ = (- grθ,θ + gθθ,r + gθr,θ)/2

Γrθθ = (- ∂grθ/∂θ + ∂gθθ/∂r + ∂gθr/∂θ)/2

Γrθθ = (2r)/2 = r

-----------------

Γ331 = (- g33,1 + g31,3 + g13,3)/2

Γφφr = (- gφφ,r + gφr,φ + grφ,φ)/2

Γφφr = (- ∂gφφ/∂r + ∂gφr/∂φ + ∂grφ/∂φ)/2

Γφφr = - r sen²θ

-----------------

Γ323 = (- g32,3 + g23,3 + g33,2)/2

Γφθφ = (- gφθ,φ + gθφ,φ + gφφ,θ)/2


Γφθφ = (∂gφφ/∂θ)/2

Γφθφ = (2r² senθ cosθ)/2

Γφθφ = r² senθ cosθ

Y del mismo modo, tenemos:

Γ332 = Γφφθ = - r² senθ cosθ

Γ133 = Γrφφ = r sen²θ

Γ313 = Γφrφ = r sen²θ

Γ233 = Γθφφ = r² senθ cosθ

siendo todos los demás símbolos de Christoffel iguales a cero.

La repetición de algunas de las respuestas anteriores nos hace sospechar que no es necesario
evaluar individualmente todos y cada uno de los símbolos de Christoffel para todas las
combinaciones posibles de componentes, de que por razones de simetría es posible acortar el
trabajo.

PROBLEMA: Demostrar que los símbolos de Christoffel de primer género son simétricos en el
intercambio de los dos primeros índices.

Tomamos la definición de los símbolos de Christoffel de primer género:

Γijk = (- gij,k + gjk,i + gki,j)/2

e intercambiamos los dos primeros índices, obteniendo:

Γjik = (- gji,k + gik,j + gkj,i)/2

En esta última expresión usamos la propiedad de simetría del tensor métrico gpq = gqp:

Γjik = (- gij,k + gjk,i + gki,j)/2


Comparando las dos expresiones para Γijk y Γjik concluímos que los símbolos de Christoffel de
primer género son simétricos en el intercambio de los dos primeros índices, o sea

Γijk = Γjik

Habiéndose definido ya los símbolos de Christoffel del primer género, ahora pasamos -con la
ayuda del tensor métrico g para subir el tercer sub-índice- a la definición de los símbolos de
Christoffel del segundo género, la cual como se ve depende de la definición dada
previamente de los símbolos de Christoffel del primer género:

Γ i jk = girΓjkr

En realidad, esta segunda definición es hasta cierto punto trivial, porque no es más que una
subida de índice con la ayuda del tensor métrico que ya habíamos estudiado previamente en la
“Gimnasia de índices”.

Es importante recalcar el hecho de que aunque la operación de elevación del tercer sub-índice
en los símbolos de Christoffel del primer género siempre se hace con la ayuda del tensor
métrico g y aunque se escriben de una manera parecida a como se escriben las expresiones
propias del cálculo tensorial, los símbolos de Christoffel no son tensores. No pueden serlo, ya
que fueron agregados precisamente como una “compensación” para poder definir una derivada
tensorial. No pueden serlo, porque para obtenerlos es necesario obtener las derivadas parciales
ordinarias del tensor métrico, las cuales no son tensores por las razones ya señaladas desde el
principio de esta entrada. No pueden serlo porque no se transforman como los tensores bajo un
cambio de coordenadas.

Precisamente ante la posibilidad de que los símbolos de Christoffel pudieran ser confundidos
con tensores, anteriormente se utilizaba, además de la notación alterna [ij,k] con la cual se
simbolizan los símbolos de Christoffel del primer género, la notación de corchetes para definir a
los símbolos de Christoffel del segundo género:

Esta equivalencia entre ambas notaciones es fácil de recordar, porque el símbolo superior
puesto entre los corchetes es el mismo que el superíndice en la notación Γ, y el par de símbolos
puestos abajo en la notación entre corchetes es el mismo que el par puesto abajo en la notación
Γ. Con la notación de corchetes, el ascenso de índice que convierte a un símbolo de Christoffel
de primer género en uno de segundo género:

Γ i jk = girΓjkr

en notación de corchetes se viene escribiendo como:

Si hacemos una comparación entre ambos tipos de notación, podemos ver que el cambio de una
notación a otra se puede llevar a cabo sin problema alguno puesto puesto que los símbolos para
los super-índices y los sub-índices siguen el mismo orden y la misma nomenclatura en la
notación de corchetes y paréntesis cuadrados.

Del mismo modo como se tuvo Γijk = Γjik para los símbolos de Christoffel del primer género, esta
propiedad de simetría se aplica también a los símbolos de Christoffel del segundo género sobre
los dos índices inferiores, o sea Γi jk = Γi kj.

Una vez familiarizados con los símbolos de Christoffel, si vamos a definir un nuevo tipo de
derivada que vamos a llamar la derivada covariante de un tensor, la cual tendrá como propósito
principal el producir algo que pueda ser transformado de acuerdo con la definición del tensor,
este tipo de derivada no puede ser simbolizado con la misma “coma” que utilizamos para la
definición de la diferenciación parcial ordinaria abreviada. Para ello, utilizamos el semicolon,
o sea “;”.

Definimos formalmente a los componentes de la derivada covariante de un


tensor contravariante T = (Ti) con respecto a una coordenada xk como:

Obsérvese cómo al principio en el lado derecho utilizamos un semicolon para indicar que se está
tomando la derivada covariante del tensor T, mientras que dentro de la expresión que define a
los componentes utilizamos una coma para denotar a la derivada parcial ∂Ti /∂xk. Esta es la
diferencia notacional entre una derivada parcial ordinaria y una derivada covariante. Sin
embargo, una vez que se ha sobreentendido al tratarse de obtener la derivada de un tensor hay
que recurrir a la definición de la derivada covariante, en una buena cantidad de textos y
publicaciones se prescinde del semicolon y se denota todas las derivadas mediante la coma. , y
el tipo de derivada que hay que aplicar se saca mediante el contexto respondiento a la pregunta:
¿Se trata de un tensor, sí o no? Si es un tensor, hay que aplicar la derivada covariante. Y si no es
un tensor, recurrimos a la diferenciación ordinaria. Es muy importante tener esto en mente con
el fin de evitar confusiones y malentendidos.

Dada la anterior definición, definimos formalmente a los componentes de


la derivada covariante de un tensor covariante T = (Ti) con respecto a una coordenada xk como:

Para sistemas rectangulares (coordenadas Cartesianas) los símbolos de Christoffel se reducen


a cero, con lo cual derivadas covariantes se reducen a las derivadas parciales comunes.

Las definiciones dadas arriba se pueden extender a derivadas covariantes de tensores de orden
mayor. En el caso más general, estamos hablando de la derivada covariante de un tensor mixto
contravariante de orden M y covariante de orden N. La derivada covariante de un tensor
cualquiera incrementa el orden covariante del tensor resultante en una unidad. De
este modo, la derivada de un tensor mixto contravariante de orden siete y covariante de orden
cuatro será un tensor de orden doce, aún contravariante de orden siete pero covariante de orden
cinco.

La derivada covariante de un tensor II


Puesto que los símbolos de Christoffel son cruciales para poder definir la derivada de un tensor
de modo tal que esta también sea un tensor, en esta entrada nos enfocaremos sobre algunas
propiedades en la evaluación de los mismos.

PROBLEMA: Comprobar que los símbolos de Christoffel de segundo género son simétricos en
el intercambio de los dos sub-índices.
Ya se demostró previamente que los símbolos de Christoffel de primer género son simétricos en
el intercambio de los dos primeros índices, Γabc = Γbac. Puesto que los símbolos de Christoffel de
segundo género son obtenidos a partir de los símbolos de Christoffel de primer género con la
ayuda del tensor métrico conjugado g-1 :

girΓabr = Γiab

sin tocarse para nada los dos sub-índices que le dan la propiedad de simetría a los símbolos de
Christoffel de primer género, se concluye que también los símbolos de Christoffel de segundo
género son simétricos en el intercambio de sus dos sub-índices.

PROBLEMA: Obtener los símbolos de Christoffel de segundo género para la métrica en


coordenadas polares.

El punto de partida es, como siempre, la definición del elemento de línea. Tratándose de las
coordenadas polares, el elemento de línea es:

ds² = dr² + r²(dθ)²

Entonces los componentes del tensor métrico g que corresponden a este elemento de línea,
acomodados en forma matricial, tienen el siguiente aspecto:

En coordenadas generalizadas, la simbolización de esto es la siguiente:

La obtención de los símbolos de Christoffel de segundo género para cualquier métrica requiere
que primero se evalúen los símbolos de Christoffel de primer género, lo cual se hará a
continuación con la definición básica en su forma mnemónica (memorizable):
Γ111 = (- g11,1 + g11,1 + g11,1)/2

Γrrr = (- grr,r + grr,r + grr,r)/2

Γrrr = ( grr,r)/2 = (∂grr/∂r)/2 = 0

Puesto que los símbolos de Christoffel del primer género son simétricos en el intercambio de sus
primeros dos índices, una vez evaluado Γ121 = Γrθr no es necesario evaluar Γ211 = Γθrrya que son
iguales. Entonces:

Γ121 = (- g12,1 + g21,1 + g11,2)/2

Γrθr = (- grθ,r + gθr,r + grr,θ)/2

Γrθr = (- ∂grθ/∂r + ∂gθr/∂r + ∂grr/∂θ)/2

Γrθr = (0 + 0 + 0)/2 = 0 = Γθrr = Γ211

-----------------

Γ122 = (- g12,2 + g22,1 + g21,2)/2

Γrθθ = (- grθ,θ + gθθ,r + gθr,θ)/2

Γrθθ = (- ∂grθ/∂θ + ∂gθθ/∂r + ∂gθr/∂θ)/2

Γrθθ = (0 + 2r + 0)/2 = (2r)/2 = r = Γθrθ = Γ212

-----------------

Γ221 = (- g22,1 + g21,2 + g12,2)/2

Γθθr = (- gθθ,r + gθr,θ + grθ,θ)/2

Γθθr = (- ∂gθθ/∂r + ∂gθr/∂θ + ∂grθ/∂θ)/2

Γθθr = (- 2r + 0 + 0)/2 = (- 2r)/2 = - r


Continuando de la misma manera completamos los ocho símbolos de Christoffel para las
coordenadas polares:

Γ112 = Γrrθ = (- ∂grr/∂θ + ∂grθ/∂r + ∂gθr/∂r)/2 = 0

Γ222 = Γθθθ = (- ∂gθθ/∂θ + ∂gθθ/∂θ + ∂gθθ/∂θ)/2 = (0 + 0 + 0)/2 = 0

Una vez que tenemos los símbolos de Christoffel de primer género, el siguiente paso consiste en
elevar el tercer índice de los mismos para obtener los símbolos de Christoffel del segundo
género, para lo cual necesitamos los componentes del tensor métrico conjugado g-1 , los cuales
se obtienen obteniendo la inversa de la matriz que contiene los componentes del tensor métrico
g. Puesto que la matriz G es diagonal, la inversa de dicha matriz se obtiene invirtiendo cada uno
de los componentes a lo largo de la diagonal principal de g, dejando los demás componentes
fuera de la diagonal iguales a cero:

o bien:

En este problema sólo hay tres símbolos de Christoffel de primer género que no son
cero: Γ221 = Γθθr, y Γ122 = Γ212 = Γrθθ = Γθrθ. Todos los símbolos de Christoffel de primer género que
son cero seguirán siendo cero tras la operación de elevación del índice. Aquellos que no lo son se
muestran evaluados a continuación:

g11 Γ221 = grr Γθθr = (1)(- r)

Γ122 = Γrθθ = - r

g22 Γ122 = gθθ Γrθθ = (1/r²)(r)

Γ212 = Γθrθ = 1/r

Por la propiedad de simetría en los dos subíndices, este símbolo de Christoffel de segundo
género es igual al símbolo de Christoffel de segundo género Γ221 = Γθθr = 1/r. Esto concluye la
evaluación de los símbolos de Christoffel de segundo género para la métrica en coordenadas
polares.

Puesto que mediante una transformación adecuada de las coordenadas, todo tensor
métrico g cuya representación matricial tenga una forma como la siguiente:

puede ser convertido a un tensor métrico g cuya representación matricial es la de una


matriz diagonal:

siempre y cuando se cumpla la propiedad de simetría g ij = gji, podemos esperar entonces que
todos los tensores métricos con los que habremos de trabajar en la Teoría de la Relatividad
serán tensores “diagonales”, porque si no lo son ciertamente pueden ser puestos en dicha forma.
Siendo así, cabe preguntarse entonces si podemos utilizar este hecho en ventaja nuestra para
reducir la cantidad de cálculos requeridos para encontrar todos los símbolos de Christoffel que
pertenezcan a cierta métrica dada. Ya vimos que en el caso de los símbolos de Christoffel tanto
del primer género como del segundo género estos son simétricos en el intercambio de sus
primeros dos índices, y con este solo hecho pudimos recortar la cantidad de cálculos requeridos.
Teniendo a la mano el bono extra de que el tensor métrico sea diagonal, con todos los
componentes iguales a cero para i ≠ j, debe de haber simplificaciones adicionales que podamos
llevar a cabo para recortar aún más la cantidad de cálculos requeridos, y efectivamente tal cosa
es posible.

PROBLEMA: Si g es un tensor métrico tal que gpq = 0 si p ≠ q, demostrar que para los
símbolos de Christoffel de primer género:

1) Γpqr = (∂gpp/∂xp)/2 para p = q = r

2) Γpqr = - (∂gpp/∂xr)/2 para p = q ≠ r

3) Γpqr = (∂gpp/∂xq)/2 para p = r ≠ q

4) Γpqr = 0 para p, q, r distintos

Puesto que se trata de un tensor que ya está “diagonalizado”, la solución es directa recurriendo a
la definición del símbolo de Christoffel de primer género:

Γpqr = (- gpq,r + gqr,p + grp,q)/2

Γpqr = (- ∂gpq/∂xr + ∂gqr/∂xp + ∂grp/∂xq)/2

1) En el caso en el que todos los índices son iguales, p = q = r, en la definición el primer término
cancela al segundo término dejando únicamente al tercer término:

Γppp = (- ∂gpp/∂xp + ∂gpp/∂xp + ∂gpp/∂xp)/2

Γppp = (0 + ∂gpp/∂xp)/2 = (∂gpp/∂xp)/2

2) En el caso en el que los índices p y q son iguales ambos pero diferentes del índice r, dos de los
términos son cero por ser el tensor métrico un tensor diagonal, con lo cual tenemos:
Γppr = (- ∂gpp/∂xr + ∂gpr/∂xp + ∂grp/∂xp)/2

Γppr = (- ∂gpp/∂xr + 0 + 0)/2 = - (∂gpp/∂xr)/2

3) En el caso en el que los índices p y r son iguales ambos pero diferentes del índice q, dos de los
términos son cero por ser el tensor métrico un tensor diagonal, con lo cual tenemos:

Γpqp = (- ∂gpq/∂xp + ∂gqp/∂xp + ∂gpp/∂xq)/2

Γpqp = (0 + 0 + ∂gpp/∂xq)/2 = (∂gpp/∂xq)/2

4) Si los tres índices p, q y r son distintos, entonces los tres términos son cero por ser el tensor
métrico un tensor diagonal.

Γpqr = (- ∂gpq/∂xr + ∂gqr/∂xp + ∂grp/∂xq)/2

Γpqr = (0 + 0 + 0)/2 = 0

PROBLEMA: Usando los resultados del problema anterior, y considerando de nuevo queg es
un tensor métrico tal que gpq = 0 si p ≠ q, obtener los resultados que correspondan al caso de
los símbolos de Christoffel de segundo género.

Para obtener los símbolos de Christoffel de segundo género a partir de los símbolos de
Christoffel de primer género, necesitamos los componentes del tensor métrico conjugado g-1. Si
el tensor métrico g es un tensor “diagonal”, entonces el tensor métrico conjugado g-1también lo
será, y como ya lo vimos en la entrada titulada “El tensor métrico”, cada uno de sus
componentes gii será obtenido de los componentes gii mediante la siguiente relación:

gii = 1/gii

Se recuerda que en esta simbolización específica no aplica la convención de sumación para


índices repetidos.

De este modo, cuando r ≠ s:

Γs pq = gsr Γpqr = 0
porque gsr = 0 en el tensor métrico conjugado g-1 cuando r ≠ s.

Y por otro lado, cuando r = s:

Γs pq = gss Γpqs = (1/gss) Γpqs

= Γpqs /gss

Nuevamente, se recuerda que aquí no aplica la convención de sumación para índices repetidos.

Usando los resultados del problema anterior, podemos proceder a elevar los índices en cada uno
de los casos indicados arriba cuando tal cosa sea factible:

1) En el caso en el que todos los índices son iguales, p = q = s, habíamos obtenido lo siguiente:

Γppp = (∂gpp/∂xp)/2

Entonces la elevación del tercer índice nos produce el siguiente símbolo de Christoffel de
segundo género:

Γs pq = Γp pp = Γppp /gpp = [(∂gpp/∂xp)/2]/gpp

= [(∂gpp/∂xp)/gpp]/2

Es costumbre en los libros de texto de análisis tensorial agregar aquí un paso adicional de
simplificación, recurriéndose a la definición de la derivada del logaritmo natural:

que cuando se trata de una función general de varias coordenadas toma la siguiente forma:
De este modo, para el caso en el que todos los índices son iguales, p = q = s, tenemos:

Se debe recalcar aquí que esta representación se dá en los textos únicamente por “elegancia
matemática”, ya que al momento de efectuar los cálculos en realidad no vamos a tomar el
logaritmo natural de nada. De cualquier manera, es mejor que el lector esté familiarizado con
esta simbología porque seguramente volverá a encontrarla si continúa con estudios posteriores
sobre el tema.

2) En el caso en el que los índices p y q son iguales ambos pero diferentes del índice s, habíamos
obtenido lo siguiente:

Γpps = - (∂gpp/∂xs)/2

Entonces la elevación del tercer índice nos produce el siguiente símbolo de Christoffel de
segundo género:

Γs pq = Γs pp = Γpps /gss = [- (∂gpp/∂xs)/2]/gss

= - [(∂gpp/∂xs)/gss]/2

En este caso, la simplificación simbólica mediante la derivada del logaritmo natural no es


aplicable.

3) En el caso en el que los índices p y s son iguales ambos pero diferentes del índice q, habíamos
obtenido lo siguiente:

Γpqp = (∂gpp/∂xq)/2

Entonces la elevación del tercer índice nos produce el siguiente símbolo de Christoffel de
segundo género:

Γs pq = Γp pq = Γpqp /gpp = [(∂gpp/∂xq)/2]/gpp

= [(∂gpp/∂xq)/gpp]/2
Esta expresión sí se presta para la representación logarítmica simbólica. Es la siguiente:

4) En el caso en el que los tres índices p, q y r son distintos, habíamos obtenido lo siguiente:

Γpqs = 0

Puesto que la elevación del índice de algo cuya evaluación resultó ser cero deberá ser
necesariamente también cero, se concluye que para el caso en el que todos los índices son
distintos entonces:

Γs pq = 0

Los resultados que hemos logrado aquí nos permiten avanzar más rápidamente en la evaluación
de los símbolos de Christoffel de segundo género que necesitamos para poder obtener,
eventualmente, la derivada de un tensor. Podemos memorizar mejor estos “atajos” con una
“tabla” como la siguiente teniendo siempre en mente que estos procedimientos abreviados de
cálculo sólo son válidos para una métrica cuya representación matricial es la de una matriz
diagonal:

Cada quien podrá desarrollar, según su propia experiencia, los trucos que le ayuden a
memorizar mejor estas relaciones que son de gran utilidad.
La derivada covariante de un tensor III
En esta entrada aprovecharemos las simplificaciones obtenidas al final de la entrada previa para
poder obtener los símbolos de Christoffel de segundo género cuando se trata de tensores
métricos cuya matriz es una matriz diagonal.

PROBLEMA: Determinar los símbolos de Christoffel de segundo género para las


coordenadas cilíndricas.

Para las coordenadas cilíndricas:

(x1, x2, x3) = (r, φ, z)

el elemento de línea es:

ds² = dr² + r²dθ² + dz²

con lo cual las componentes diagonales del tensor métrico son:

g11 = 1____g22 = r²____g33 = 1

Puesto que tanto g11 como g33 son constantes, de acuerdo con lo que vimos en la entrada previa
los únicos símbolos de Christoffel que no son cero los tendremos para p = 2. Usando las
fórmulas simplificadas, estos son:

PROBLEMA: Determinar los símbolos de Christoffel de segundo género para las


coordenadas esféricas.

Para las coordenadas esféricas:


(x1, x2, x3) = (r, φ, z)

el elemento de línea es:

ds² = dr² + r²dθ² + r² sen²θ dθ²

con lo cual las componentes diagonales del tensor métrico son:

g11 = 1____g22 = r²____g33 = r² sen² θ

Puesto que tanto g11 es constante, de acuerdo con lo que vimos en la entrada previa los únicos
símbolos de Christoffel que no son cero los tendremos para p = 2 o p = 3. Usando las fórmulas
simplificadas, estos son:
Los símbolos de Christoffel NO son tensores. Sin embargo, cabe hacernos la siguiente pregunta:
si queremos pasar de un sistema de coordenadas a otro, ¿cuáles serán entonces las propiedades
de transformación de los símbolos de Christoffel, tanto del primer género como del segundo
género?

PROBLEMA: Derivar la ley de transformación para los símbolos de Christoffel de primer


género.

La naturaleza del problema consiste en obtener el procedimiento requerido para transformar un


símbolo de Christoffel de primer género Γabc a su correspondiente símbolo de Christoffel Γabc.
(con una barra encima de la letra gamma). El punto de arranque para la solución empieza,
desde luego, con la ley tensorial de transformación para el tensor métrico:

Tenemos que obtener tres derivadas parciales del tensor métrico con respecto a cada una de las
coordenadas del sistema hacia el cual se va a llevar el símbolo de Christoffel a ser transformado.
Aplicando la regla de Leibniz para la diferencial del producto de tres funciones:

d(uvw) = uv·dw + uw·dv + vw·du

y aplicando también la regla de la cadena a ∂gpq /∂xm, la primera derivada parcial será:
Aplicando la misma regla de Leibniz, podemos obtener las otras dos derivadas parciales. Sin
embargo, podemos ahorrarnos algo de trabajo si simplemente tomamos la expresión para la
primera derivada que acabamos de obtener y aplicamos una permutación cíclica de los índices
para obtener la segunda derivada:

j→k

k→m

m→j

que resulta ser:

Otra permutación cíclica de los índices:

k→m

m→j

j→k

nos produce la tercera derivada:


Restando ∂gjk/∂xm de la suma de ∂gkm/∂xj y ∂gmj/∂xk, multiplicando por 1/2 y metiendo las
definiciones de los símbolos de Christoffel de primer género, obtenemos la siguiente ley de
transformación:

con la que el símbolo de Christoffel de primer género Γpqr es transformado a Γjkm. Obsérvese que
si no fuese por el segundo término en el lado derecho, los símbolos de Christoffel se
transformarían también como tensores. Pero no son tensores, ya que fueron de hecho
concebidos como el “factor de corrección” requerido para que la derivada de un tensor pueda ser
redefinida como derivada covariante de modo tal que esta también sea un tensor.

PROBLEMA: Derivar la ley de transformación para los símbolos de Christoffel de segundo


género.

Puesto que los símbolos de Christoffel de segundo género se obtienen a partir de los símbolos de
Christoffel de primer género, para lo cual se utiliza el tensor métrico conjugado g-1 para subir el
tercer índice, no debe causar asombro de que una vez obtenida la ley de transformación para los
símbolos de Christoffel de primer género en el problema anterior recurramos al tensor métrico
conjugado aplicándolo sobre dicho resultado para poder obtener la ley de transformación para
los símbolos de Christoffel de segundo género.

En este caso, utilizamos la relación que nos define al tensor métrico conjugado como un tensor,
la cual es:
Utilizamos esta relación en la ley de transformación para los símbolos de Christoffel de primer
género que obtuvimos en el problema anterior, la parte izquierda de la relación en el lado
izquierdo de la ecuación y la parte derecha de esta relación en el lado derecho de la ecuación:

En el lado izquierdo de esta ecuación el tensor métrico conjugado gnm eleva al tercer índice m del
símbolo de Christoffel de primer género Γjkm convirtiéndolo en un símbolo de Christoffel de
segundo género con el super-índice n:

Lo mismo sucede en el lado derecho de la ecuación en donde el tensor métrico conjugado eleva
al tercer índice del símbolo de Christoffel de primer género convirtiéndolo en uno de segundo
género. Obsérvese que hemos agrupado dos simplificaciones, las cuales nos resultan en la
siguiente ley de transformación para los símbolos de Christoffel de segundo género:

Obsérvese que si no fuese por el segundo término en el lado derecho, los símbolos de Christoffel
de segundo género se transformarían también como tensores.
PROBLEMA: Demostrar la siguiente relación:

Para demostrar la relación proporcionada, usaremos la ley de transformación para los símbolos
de Christoffel de segundo género obtenida en el problema anterior. Si multiplicamos ambos
lados de dicha ley por ∂xm/∂xn, tenemos entonces, introduciendo en el lado derecho los deltas
Kronecer δms y δmp:

Esto se simplifica de inmediato a lo siguiente:

Despejando esto último para ∂²xm/∂xj∂xk obtenemos la relación pedida.

Este último resultado nos posibilita llevar a cabo una demostración importante, la demostración
de que la derivada covariante de un tensor es un tensor.

PROBLEMA: Demostrar que la derivada covariante de un tensor es un tensor.

Para la resolución de este problema podemos utilizar ya sea un tensor covariante o un tensor
contravariante. La demostración que será llevada a cabo aquí utilizará un tensor contravariante;
en el caso del tensor covariante la demostración es casi idéntica con modificaciones triviales en
los pasos.
Considérese el tensor contravariante T = (Tp) de orden uno. Siendo un tensor, entonces debe
obedecer la regla fundamental de transformación:

Tomaremos ahora la derivada parcial de este tensor con respecto a x k:

Utilizaremos ahora la regla de la cadena en el lado derecho de la expresión:

Tomamos ahora la derivada del producto de las dos cantidades ∂x i/∂xr y Tr:

Utilizaremos ahora la relación obtenida en el problema anterior, con la cual obtenemos lo


siguiente:

Puesto que, por la regla de la cadena:


Y puesto que, por la misma definición de tensor para el caso de un tensor contravariante de
orden uno:

la expresión que estamos desarrollando se convierte en:

Factorizando el lado derecho, reacomodando los términos, renombrando índices según se


requiera y utilizando la propiedad de simetría de los símbolos de Christoffel, llegamos a lo
siguiente:

Obsérvese bien la forma en la cual se han puesto tanto el lado izquierdo como el lado derecho de
la relación. Del lado izquierdo, lo que tenemos es ni más ni menos que la derivada
covariante del tensor T = (Tp) en el sistema de coordenadas de barra. Y lo que tenemos del lado
derecho es ni más ni menos que la derivada covariante del tensor original T en el sistema de
coordenadas original (sin la barra). Esto significa que la relación se reduce a:
Lo que nos está diciendo esto esencialmente es que la derivada covariante del tensor
contravariante de orden uno T = (Tp), simbolizada mediante el semicolon como T;k = (Tp;k), se
transforma justo como lo requieren las propiedades de la definición de un tensor. Queda
demostrado entonces que la derivada covariante de un tensor es también un tensor. Esto,
desde luego, se lo debemos a la ayuda de los símbolos de Christoffel que nos dieron la
“corrección” necesaria para poder definir a la derivada covariante de un tensor

La derivada covariante de un tensor IV


Una vez que hemos entendido bien la naturaleza de los símbolos de Christoffel y cómo se
obtienen a partir del tensor métrico g, el siguiente paso natural consiste en utilizarlos para
obtener la derivada covariante de cualquier tensor T. El primer término en la derivada
covariante de un tensor dado será simplemente la derivada ordinaria del tensor con respecto a la
coordenada específica sobre la cual se esté evaluando el componente tensorial. Los demás
términos serán los términos de “corrección” necesarios para que la derivada del tensor sea
también un tensor, y cada uno de estos términos de corrección será el producto de un símbolo
de Christoffel por el tensor que va apareado con dicho tensor dependiendo del tipo de tensor del
que se trate, ya sea un tensor covariante (con un sub-índice), un tensor contravariante (con un
super-índice), o inclusive un tensor mixto que pueda tener varios sub-índices y super-índices.
Cada índice covariante (sub-índice) dá lugar a un término de “término de corrección” que va de
acuerdo con la definición de la derivada covariante de un tensor covariante, y cada índice
contravariante (super-índice) dá lugar a un término de “término de corrección” que va de
acuerdo con la definición de la derivada covariante de un tensor contravariante, razón por la
cual resulta ventajoso aprenderse ambas fórmulas de memoria o tenerlas a la mano cuando se
van a utilizar en la evaluación de la derivada covariante de un tensor mixto con varios índices.
Con el objeto de que se vaya adquiriendo familiaridad en la aplicación de las fórmulas, a
continuación se verán varios problemas en los cuales obtenemos la derivada covariante de
varios tensores, la cual será simbolizada por la notación del semicolon. Es importante no perder
la perspectiva de que en los “términos de corrección” la convención de sumación para índices
repetidos se aplica en toda la extensión de la palabra, y cada término de corrección
inevitablemente generará varios términos adicionales. Es aquí cuando apreciamos la ventaja
simplificadora de la convención de sumación que nos permite omitir el tener que escribir los
símbolos de sumatoria Σ que sólo agregarían más confusión a una notación de por sí extensa.

PROBLEMA: Obtener la derivada covariante del tensor Tjk con respecto a xq.

En este caso, tenemos un tensor covariante de orden dos. Tendremos por lo tanto dos términos
de corrección, ambos de signo negativo de acuerdo a la definición de la derivada covariante de
un tensor covariante. La respuesta a este problema es la siguiente:

PROBLEMA: Obtener la derivada covariante del tensor Tjk con respecto a xq.

En este caso, tenemos un tensor contravariante de orden dos. Tendremos por lo tanto dos
términos de corrección, ambos de signo positivo de acuerdo a la definición de la derivada
covariante de un tensor contravariante. La respuesta a este problema es la siguiente:

PROBLEMA: Obtener la derivada covariante del tensor Tj k con respecto a xq.

En este caso, tenemos un tensor mixto de orden dos, covariante de orden uno y contravariante
de orden uno. Tendremos por lo tanto dos términos de corrección, uno con signo positivo y el
otro con signo negativo de acuerdo a las definiciones de la derivada covariante de un tensor
covariante y de un tensor contravariante. La respuesta a este problema es la siguiente:

PROBLEMA: Obtener la derivada covariante del tensor Tjkl con respecto a xq.

En este caso, tenemos un tensor mixto de orden tres, covariante de orden dos y contravariante
de orden uno. Tendremos por lo tanto tres términos de corrección, dos con signo negativo y el
otro con signo positivo de acuerdo a las definiciones de la derivada covariante de un tensor
covariante y de un tensor contravariante. La respuesta a este problema es la siguiente:
PROBLEMA: Obtener la derivada covariante del tensor Tjkl con respecto a xq.

En este caso, tenemos un tensor mixto de orden tres, covariante de orden uno y contravariante
de orden dos. Tendremos por lo tanto tres términos de corrección, uno con signo negativo y los
otros dos con signo positivo de acuerdo a las definiciones de la derivada covariante de un tensor
covariante y de un tensor contravariante. La respuesta a este problema es la siguiente:

PROBLEMA: Obtener la derivada covariante del tensor Tjklm con respecto a xq.

En este caso, tenemos un tensor mixto de orden cuatro, covariante de orden dos y
contravariante de orden dos. Tendremos por lo tanto cuatro términos de corrección, dos con
signo negativo y los otros dos con signo positivo de acuerdo a las definiciones de la derivada
covariante de un tensor covariante y de un tensor contravariante. La respuesta a este problema
es la siguiente:

PROBLEMA: Obtener la derivada covariante del tensor Tjklm con respecto a xq.

En este caso, tenemos un tensor mixto de orden cuatro, covariante de orden tres y
contravariante de orden uno. Tendremos por lo tanto cuatro términos de corrección, tres con
signo negativo y el otro con signo positivo de acuerdo a las definiciones de la derivada
covariante de un tensor covariante y de un tensor contravariante. La respuesta a este problema
es la siguiente:
PROBLEMA: Obtener la derivada covariante del tensor Tjklm con respecto a xq.

En este caso, tenemos un tensor mixto de orden cuatro, covariante de orden uno y
contravariante de orden tres. Tendremos por lo tanto cuatro términos de corrección, tres con
signo positivo y el otro con signo negativo de acuerdo a las definiciones de la derivada
covariante de un tensor covariante y de un tensor contravariante. La respuesta a este problema
es la siguiente:

PROBLEMA: Obtener la derivada covariante del tensor Tjklmn con respecto a xq.

En este caso, tenemos un tensor mixto de orden cinco, covariante de orden dos y contravariante
de orden tres. Tendremos por lo tanto cinco términos de corrección, tres con signo positivo y
dos con signo negativo de acuerdo a las definiciones de la derivada covariante de un tensor
covariante y de un tensor contravariante. La respuesta a este problema es la siguiente:

PROBLEMA: Obtener la derivada covariante del tensor Tjklmn con respecto a xq.

En este caso, tenemos un tensor mixto de orden cinco, covariante de orden tres y contravariante
de orden dos. Tendremos por lo tanto cinco términos de corrección, dos con signo positivo y los
otros tres con signo negativo de acuerdo a las definiciones de la derivada covariante de un
tensor covariante y de un tensor contravariante. La respuesta a este problema es la siguiente:
Una vez familiarizados con la derivación covariante de tensores, podemos investigar las
similitudes que hay entre la diferenciación ordinaria y la diferenciación covariante. Y
encontraremos que hay muchas similitudes.

PROBLEMA: En el cálculo diferencial ordinario, el diferencial del producto de dos


funciones u y v es igual al producto de la primera función u por la diferencial dv de la segunda
más la segunda función v por la diferencial du de la primera:

d(uv) = udv + vdu

Esta regla es conocida como la regla de Leibniz. Demostrar que para el producto de dos
tensores T y S también tenemos una regla similar.

La demostración se puede llevar a cabo para dos tensores covariantes, o dos tensores
contravariantes, o una mezcla de ambos tipos. Para una demostración lo más amplia posible que
cubra a ambos tipos, nos conviene considerar a T y a S como tensores mixtos del mismo orden,
de orden dos, lo cual cubre todas las posibilidades. No es necesario considerar tensores de orden
mayor.

Si T y S son tensores mixtos de orden dos, entonces T = (Ti j) y S = (Si j). El producto de dichos
tensores, componente por componente, será (recuérdese la definición del producto externo de
dos tensores):

TS = U = (Tpr · Sqs)

A continuación formaremos la suma del producto de la derivada covariante del tensor T (la cual
simbolizaremos con la notación del semicolon puesto como sub-índice) por el tensor Sy del
producto del tensor T por la derivada covariante del tensor S, lo cual es el símil de la regla de
Leibinz en el cálculo diferencial ordinario:

(Tpr ; k) · (Sqs) + (Tpr) · (Sqs ; k)

Queremos demostrar que esto se nos reduce a la derivada covariante de algo como U = (Upqrs)
(recuérdese que el producto de dos tensores mixtos de orden dos nos debe producir un tensor de
orden 4, covariante de orden dos y contravariante de orden dos), o sea a:
Upq rs ; k

Para formar la suma de productos Leibniz indicada arriba, a continuación podemos aplicar
directamente la definición de la derivada covariante metiendo en el panorama a los símbolos de
Christoffel, tomando en cuenta que se trata tanto de la derivada covariante del tensor T como de
la derivada covariante del tensor S:

Podemos remover los paréntesis, reagrupar, y simplificar usando el hecho de que por la
definición del producto externo de dos tensores:

(Ttr) · (Sqs) = Utq rs

(Tpr) · (Sts) = Upt rs

(Tpt) · (Sqs) = Upq ts

(Tpr) · (Sqt) = Upq rt

Con todo esto tenemos entonces lo siguiente:

Lo que se ha puesto de color rojo entre los paréntesis es algo que puede ser simplificado, ya que
es esencialmente igual a la derivada parcial ordinaria (¡no covariante!) de Upq rs:

(Upq rs),k = Upq rs,k = ∂Upq rs/∂xk


Entonces lo anterior se nos convierte en:

∂Upq rs/∂xk + Γptk Utq rs + Γqtk Upt rs - Γt rk Upq ts - Γi jk Upq rt

Pero todo esto no es más que la derivada covariante de Upq rs, siendo el tensor U el producto
directo de los tensores S y T, o sea Upq rs;k. Entonces:

Upq rs;k =

(Tpr · Sqs);k = (Tpr ; k) · (Sqs) + (Tpr) · (Sqs ; k)

En notación de componentes, ésto último es la regla de Leibniz para la derivada covariante del
producto de dos tensores T y S. Simbólicamente, en una forma más compacta, podemos
representar la regla de la siguiente manera:

[TS]; k = T; k S + TS; k

La regla de Leibniz para la derivada covariante del producto de dos tensores también se
representa simbólicamente de otras maneras, por ejemplo:

∇(T ⊗ S) = (∇T) ⊗ S + T ⊗ (∇S)

Desafortunadamente, este último tipo de representación no va muy de acuerdo con el uso que
normalmente se le dá al operador vectorial diferencial nabla ∇, y se puede prestar a confusiones,
aunque tiene la ventaja de utilizar el operador “⊗” para distinguir el producto directo de los dos
tensores (producto externo) del producto interno de tensores que implica una contracción al
aplicarse la convención de sumación para índices repetidos. Quizá una mejor forma de
representar la regla de Leibniz para derivadas covariantes consiste en tomar lo mejor de ambas
simbología y escribirla del siguiente modo:

[T ⊗ S]; k = [T; k ⊗ S] + [T ⊗ S; k]

PROBLEMA: Obtener la derivada covariante del siguiente producto directo de tensores:

Uj k Vlm n
(1) aplicando primero al pie de la letra la definición de la derivada covariante al producto
tensorial dado, y (2) aplicando la regla de Leibniz.

Si tomamos directamente el producto tensorial dado y le aplicamos la definición de la derivada


covariante, tenemos lo siguiente:

Simplificando (tomando la derivada parcial ordinaria del producto de Uj k y Vlm nreagrupando


bajo paréntesis los términos comunes a cada uno de los dos tensores mixtos):

Pero el factor entre paréntesis del primer término es simplemente la derivada covariante
de Ujk con respecto a xq, mientras que el factor entre paréntesis del segundo término es
simplemente la derivada covariante de Vlmn con respecto a xq. Entonces:

(Uj k Vlm n) ; q = Uj k ; q Vlm n + Uj k Vlm n ; q

(2) La aplicación de la regla de Leibniz nos dá el mismo resultado que acabamos de obtener,
pero de manera mucho más rápida.

Como puede verse, la derivada covariante de un producto de tensores obedece las mismas reglas
que las que se aplican a las derivadas ordinarias del cálculo infinitesimal.

PROBLEMA: Demostrar que la derivada covariante del tensor métrico g es igual a cero.
Aplicando rigurosamente la definición de la derivada covariante a la diferenciación covariante
del tensor métrico g = (gjk), tenemos lo siguiente:

Como puede verse, tanto en el segundo término como en el tercer término del lado derecho se
pueden bajar los índices de los símbolos de Christoffel por la acción del tensor métrico,
convirtiendo a ambos en símbolos de Christoffel de primer género:

Pero por otro lado tenemos la identidad tensorial:

Con esto el resultado se nos hace cero. La derivada covariante del tensor métrico g es igual a
cero.

PROBLEMA: Demostrar que la derivada del tensor métrico conjugado g-1 es igual a cero.

Aplicando rigurosamente la definición de la derivada covariante a la diferenciación covariante


del tensor métrico conjugado g-1 = (gjk), tenemos lo siguiente:

Pero aquí tenemos también otra identidad tensorial fácilmente demostrable:

con la cual el resultado se nos hace cero. La derivada covariante del tensor métrico
conjugado g-1 es igual a cero.

PROBLEMA: Demostrar que la derivada covariante del tensor delta Kronecker es igual a
cero.

Aplicando rigurosamente la definición de la derivada covariante a la diferenciación covariante


del tensor mixto delta Kronecker δ = (δjk), tenemos lo siguiente:

La derivada ordinaria del tensor delta Kronecker es igual a cero porque el tensor delta
Kronecker contiene únicamente términos constantes. Aplicando la propiedad del tensor delta
Kronecker para el reemplazo de los índices, esto nos deja únicamente con lo siguiente:

Entonces la derivada covariante del tensor delta Kronecker δ es igual a cero.

PROBLEMA: Obtener la derivada covariante de:

gjkTkmn

La relación dada es el producto (exterior) del tensor métrico g por otro tensor mixto T. Podemos
aplicar aquí la regla de Leibniz obtenida previamente para la derivada covariante del producto
de dos tensores, lo cual nos dá:

(gjkTkmn);q = gjk;qTkmn + gjkTkmn;q

El primer término se hace cero en virtud de que por uno de los problemas resueltos previamente
la derivada covariante del tensor métrico g es igual a cero, quedándonos como resultado final el
siguiente:

(gjkTkmn);q = gjkTkmn;q
En general, al llevar a cabo una diferenciación covariante, tanto el tensor métrico g como el
tensor métrico conjugado g-1 como el tensor delta Kronecker δ pueden ser tratados como si
fuesen constantes.

Antes de dejar este tema, veremos algo de interés relacionado con lo que hemos estado tratando
y la Teoría de la Relatividad.

PROBLEMA: Obtener los símbolos de Christoffel de primer género para el 4-espacio de la


Teoría Especial de la Relatividad.

Para el espacio-tiempo de la Teoría Especial de la Relatividad podemos utilizar como elemento


de línea ds² el siguiente:

ds² = (cdt)² - (dx)² - (dy)² - (dz)²

que en coordenadas generalizadas haciendo:

(x1, x2, x3, x4) = (ct, x, y, z)

podemos escribir como:

ds² = (x1)² - (x2)² - (x3)² - (x4)²

De aquí podemos obtener directamente los elementos del tensor métrico g para este 4-espacio,
que son:

g11 = 1

g22 = g33 = g44 = -1

gij = 0 para i ≠ j

Con esto, la evaluación de los símbolos de Christoffel de primer género es directa e inmediata, y
todos ellos son iguales a cero porque todos los gij son constantes o son cero, como en el
siguiente caso en el que i = 2, j = 2 y k = 4:
Γijk = (- gij,k + gjk,i + gki,j)/2

Γ224 = (- g22,4 + g24,2 + g42,2)/2

Γ224 = (- ∂g22/∂x4 + ∂g24/∂x2 + ∂g42/∂x2)/2

Γ224 = [0 + 0 + 0]/2

Γ224 = 0

Al ser todos los símbolos de Christoffel de primer género iguales a cero, los símbolos de
Christoffel de segundo género son también iguales a cero. Puesto que los símbolos de Christoffel
cuando son diferentes de cero indican la posible presencia de una curvatura en el espacio bajo
consideración (esto se verá posteriormente cuando tratemos el tema del tensor de Riemann), al
ser todos cero para el intervalo relativista propio de la Teoría Especial de la Relatividad tenemos
nuestra primera confirmación matemática formal de que el espacio-tiempo Lorentziano es un
espacio-tiempo plano

El determinante del tensor métrico


A cualquier matriz cuadrada siempre podemos definirle un número único obtenido mediante
una combinación de operaciones matemáticas que hacen que dicho número dependa del valor
numérico de cada componente en dicha matriz (hay otros números que son característicos o
propios a cada matriz, los cuales son conocidos como los valores eigenque en alemán significa
precisamente “característico” o “propio”, los cuales no nos conciernen para la discusión que será
llevada a cabo aquí). Ese número se llama el determinante de la matriz, y está definido
mediante una expansión que se conoce como la expansión de Laplace:

Al determinante de una matriz A frecuentemente se le simboliza como |A|.

La primera vez que la mayoría de los estudiantes en las escuelas de enseñanza media y superior
entran en contacto con el concepto del determinante es en la resolución de sistemas de
ecuaciones lineales de primer grado, con un procedimiento de solución como el generalmente
conocido como la regla de Cramer. La fórmula dada arriba para la expansión de Laplace no
siempre es dada a los estudiantes en su primer contacto con el concepto del determinante,
aunque la idea detrás de la fórmula les es enseñada intuitivamente.

Intuitivamente, la idea detrás de la expansión de Laplace consiste en seleccionar todo un


renglón o toda una columna de una matriz A que será usado para llevar a cabo la expansión de
Laplace. (En la fórmula dada arriba para la expansión de Laplace, se ha supuesto que se ha
seleccionado un renglón i de la matriz, el cual es un índice libre. En caso de que se seleccione
una columna, basta con especificar la sumatoria para una columna j de la matriz,
reemplazándose el índice j por el índice i en la sumatoria). Para cualquier elemento que forme
parte del renglón (o de la columna) seleccionado, si borramos todo el renglón y toda la columna
en la que está situado obtenemos una sub-matriz llamada matriz menor aij que a su vez será
manejada como un determinante det aij. Esta matriz menor, multiplicada por un signo positivo
o negativo dependiendo del renglón y de la columna, recibe el nombre de cofactor.

A continuación tenemos un ejemplo de un determinante derivado de una matriz 3x3 en el cual


se ha llevado a cabo una expansión de Laplace usando para dicha expansión la primera columna
(obsérvese la alternancia de signos):

Y a continuación tenemos una expansión de Laplace efectuada en base al primer renglón del
determinante de la matriz mostrada:
Obsérvese que los signos positivos y negativos de los cofactores aparecen mostrados en la matriz
de signo puesta en la esquina superior derecha. Cada signo está dado de acuerdo con la fórmula
dada arriba para la expansión de Laplace. Así, al menor M23 que corresponde al elemento puesto
en el segundo renglón y en la tercera columna le tocará un signo negativo:

(-1) i + j = (-1) 2 + 3 = (-1) 5 = -1

mientras que a un menor M24 que corresponda al elemento de una matriz 6x6 puesto en el
segundo renglón y en la cuarta columna le tocará un signo positivo:

(-1) i + j = (-1) 2 + 4 = (-1) 6 = + 1

Para el ejemplo numérico mostrado, el valor del determinante en base a la expansión de Laplace
será:

det(A) = (+1)(-1)[4-9] + (-1)(2)[-6+2] + (+1)(0)[27-4]

det(A) = 5 + 8 + 0

det(A) = 13

No es difícil demostrar que el determinante de una matriz tiene el mismo


valor independientemente del renglón y la columna que sean escogidos para llevar a cabo la
expansión de Laplace, y esta es una de las primeras cosas que se deben enseñar en un curso
introductorio de Algebra Lineal.

La representación matricial G de un tensor métrico g se presta de modo natural para que


incorporemos el concepto del determinante del tensor métrico, al cual para evitar que se le
confunda con el tensor métrico g o con cualquier otra cantidad física se le simbolizará de color
azul como g. Así, mediante la expansión de Laplace, podemos definir al determinante del tensor
métrico de la siguiente manera:

PROBLEMA: Dado el siguiente tensor métrico:

expresar el determinante de dicho tensor evaluado en términos de los elementos del segundo
renglón y sus cofactores correspondientes. Generalizar el resultado obtenido a un
determinante de cualquier tamaño.

Cada cofactor de gij es el determinante que obtenemos al borrar el renglón i y la columna j en la


que aparece gij, asociando el signo (-1) i + j a dicho determinante. Designando a los cofactores de
g21, g22 y g23 como G(2,1), G(2,2) y G(2,3), respectivamente, tenemos entonces que dichos
cofactores son:

Entonces, por la expansión de Laplace, tenemos que el determinante del tensor métrico será:

g = g21G(2,1) + g22G(2,2) + g23G(2,3)


La generalización hacia un determinante de cualquier tamaño empleando la convención de
sumación para índices repetidos será:

g = gijG(i,j)

Tómese nota de que la convención de sumación se está aplicando aquí únicamente al índicej, no
al índice i. Por esta razón y para evitar confusiones, es mejor escribir esta definición de
determinante basada en la expansión por cofactores mostrando explícitamente el símbolo de la
sumatoria que normalmente omitimos en otros casos:

Los cofactores no solo sirven para ayudarnos a encontrar el determinante g de una matriz.
También nos sirven para encontrar la matriz inversa G-1 de una matriz G. Si se nos dá una
matriz A y se nos pide obtener la matriz inversa de A, el procedimiento es el siguiente (nótese
que en la matriz de cofactores Cij los componentes son colocados en forma transpuesta):

Esto significa que podemos obtener todos los componentes del tensor métrico conjugado g-1 =
(gpq) a partir de los cofactores obtenidos de la matriz G del tensor métrico original g. La relación
utilizada es la siguiente:

PROBLEMA: Obtener los componentes del tensor métrico conjugado g-1 que corresponden al
tensor métrico g en coordenadas esféricas evaluando el determinante g y los cofactores
necesarios a partir de la matriz G que corresponde al tensor métrico g.

Para el tensor métrico g expresado en coordenadas esféricas, puesto que la representación


matricial G de los componentes de la métrica es:

el determinante g de su representación matricial será simplemente:

La evaluación de los componentes que corresponden al tensor métrico conjugado se muestran a


continuación:

g11 = (cofactor de g11)/g = G(1,1) /g

g11 = 1

g22 = (cofactor de g22)/g = G(2,2) /g


g22 = 1/r²

g33 = (cofactor de g33)/g = G(3,3) /g

g33 = 1/r²

g21 = (cofactor de g12)/g = G(1,2) /g

g21 = 0

Podemos ver que para todos los demás gjk para los cuales g ≠ k, estos tendrán un valor de cero.

PROBLEMA: Demuéstrese que:

g11G(1,3) + g21G(2,3) + g31G(3,3) = 0

y una vez que esto ha sido demostrado, generalizar el resultado tanto para una expansión
sobre renglones como para una expansión sobre columnas.

Apliquemos al siguiente determinante la expansión de Laplace para determinar a través de los


cofactores el valor g del determinante llevando a cabo la expansión sobre la tercera columna sin
fijarnos por el momento en la forma en la cual están escritos los elementos puestos en la
tercera columna pero respetando al pie de la letra la notación que corresponde a cada cofactor
asociado con dicha posición:
La expansión de Laplace del determinante llevada a cabo sobre los elementos de la tercera
columna tal y como están escritos viene siendo la siguiente:

g = g11G(1,3) + g21G(2,3) + g31G(3,3)

Inspeccionando el determinante dado, nos damos cuenta de que tanto la primera columna del
determinante como la tercera columna son iguales. Pero sabemos por las propiedades de los
determinantes que si un determinante tiene dos renglones o dos columnas iguales, el valor del
determinante será cero, lo cual ocurre en este determinante en el que la primera columna (de
color magenta) es igual a la tercera columna (de color rojo). Esto implica que:

g=0

lo cual a su vez implica que:

g11G(1,3) + g21G(2,3) + g31G(3,3) = 0

Podemos hacer una generalización de este resultado para una expansión llevada a cabo sobre
una columna, la cual es la siguiente (llevando a cabo la sumación de términos sobre k):

g1jG(1,p) + g2jG(2,p) + g3 jG(3,p) + g4 jG(4,p) + ... = 0

Σk gkjG(k,p) = 0 si j ≠ p

Del mismo modo, la generalización para una expansión llevada a cabo sobre un renglón es la
siguiente (llevando a cabo la sumación de términos sobre p):

gj1G(p,1) + gj2G(p,2) + gj3G(p,3) + gj4G(p,4) + ... = 0

Σk gjkG(p,k) = 0 si j ≠ p

PROBLEMA: Demostrar que bajo las relaciones dadas arriba para la obtención de los
componentes del tensor métrico conjugado mediante el determinante g de la matriz de los
componentes del tensor métrico y los cofactores de la misma, se cumple la siguiente relación:

gjk gpk = gpk gjk = δpj

Usando los resultados de los problemas anteriores, podemos afirmar que:

gjk G(j,k) = g

gjk [G(j,k)/g] = g/g

gjk gjk = 1

Y por otro lado:

gjkG(p,k) = 0 si j ≠ p

gjk[G(p,k)/g] = 0/g

gjk gpk = 0 para j ≠ p

Los dos resultados se pueden resumir en uno solo con el delta de Kronecker:

Esta es la formalización matemática del hecho de que la contracción tensorial entre un tensor
métrico g y su correspondiente tensor métrico conjugado g-1 nos resulta en el tensor delta
Kronecker.

A continuación demostraremos una relación importante que será utilizada cuando tratemos el
tema de la divergencia de un tensor.

PROBLEMA: Demostrar que:


Empezaremos con la definición de la expansión de Laplace para la evaluación del
determinante g escogiéndose un renglón para llevar a cabo la sumatoria (si en vez de escoger un
renglón escogemos una columna, esto en nada altera el resultado final):

A continuación tomaremos la derivada del determinante g con respecto a un elemento específico


gjr de la matriz de la cual proviene el determinante. Esta operación la podemos llevar a cabo
puesto que en su construcción el cofactor G(j,k) no contiene explícitamente al elemento g jk y por
lo tanto podemos tratar al cofactor como si fuese una constante. En la sumatoria, la
diferenciación no abarcará los términos para los cuales k ≠ r puesto que estos se volverán cero,
quedándonos como el único elemento diferenciable aquél elemento para el cual k = r. A manera
de ejemplo, se llevará a cabo la demostración de esto para una expansión de Laplace sobre el
tercer renglón de una matriz 3x3:

Las derivadas posibles del determinante g son las siguientes:

Volviendo al cálculo simbólico, el resultado de la diferenciación será entonces:

Pero sabemos que:


Por otro lado, por la regla de la cadena tenemos lo siguiente:

Con lo cual llegamos a lo siguiente:

Anteriormente ya habíamos encontrado la siguiente relación entre símbolos de Christoffel de


primer género (en la segunda línea se hace uso de la propiedad de simetría bajo la cual los
símbolos de Christoffel permanecen iguales tras el intercambio de los dos primeros sub-
índices):

Introduciendo esto en la relación de arriba y dejando que gjr actúe sobre cada símbolo de
Christoffel de primer género convirtiéndolo en un símbolo de Christoffel de segundo género tras
la elevación del tercer sub-índice se tiene entonces:

Puesto que queremos una expresión en la que haya un solo símbolo de Christoffel involucrado, y
puesto que para nuestros fines podemos hacer que el símbolo de Christoffel Γjjm represente lo
mismo que el símbolo de Christoffel Γrrm, podemos escribir j = r y tener así:
Despejando para Γrrm:

Esto lo podemos poner en una forma más compacta metiendo el símbolo g dentro de la derivada
usando para ello la definición de la derivada del logaritmo natural:

Usando las propiedades de los logaritmos, el factor (½) puede entrar como una exponenciación
fraccionaria de g, que viene siendo en realidad una raíz cuadrada. De este modo, llegamos a
nuestro resultado final:

Obviamente, en la Teoría de la Relatividad, siendo una teoría basada en un 4-espacio, el


determinante del tensor métrico será:

El tensor métrico más simple de todos es el que corresponde a un espacio-tiempo plano,


Lorentziano, y ya sea que tomemos como elemento de línea (dándole a la velocidad de la luz un
valor unitario) el siguiente:

ds² = - dt² + dx² + dy² + dz²


o que tomemos el siguiente:

ds² = dt² - dx² - dy² - dz²

el determinante del tensor métrico Lorentziano que identificaremos aquí como η y que
corresponde a este elemento de línea será -1:

Es aquí en donde tiene su origen el signo negativo que encontramos en conversiones relativistas
de coordenadas y en las fórmulas en las cuales aparece el determinante g del tensor
métrico g dentro de una raíz cuadrada con signo negativo. Sin embargo, a la hora de llevar a
cabo cálculos numéricos, en ningún momento tomamos la raíz cuadrada de algún número
negativo venido de un determinante, y para evitar esta posibilidad (o más bien, confusión) en
algunos textos se acostumbra encerrar a g entre las barras verticales que indican que se debe
tomar el valor absoluto (siempre positivo) del mismo, apareciendo en dichas fórmulas como |g|.
Los números imaginarios que provienen de la raíz cuadrada de números negativos no tienen
cabida dentro de la Teoría de la Relatividad.

La divergencia de un tensor I
Teniendo ya en nuestras manos la definición de una derivada que puede comportarse como un
tensor bajo una transformación de coordenadas, la derivada covariante, la cual aplicándose a un
campo tensorial V = (Vα) se escribe con la notación del semicolon como:

resulta casi irresistible la tentación de igualar los índices α y β:

lo cual hace que entre en acción la convención de sumación para índices repetidos efectuándose
de este modo la operación tensorial de contracción que nos producirá en este caso un escalar.
Pero, ¿qué significa el número así obtenido? Esto es lo que cubriremos en esta entrada.

Uno de los conceptos fundamentales en el análisis vectorial es el de la divergencia. En un


espacio de tres dimensiones, al hablar acerca de la divergencia en realidad estamos hablando de
la divergencia de un campo vectorial. Matemáticamente hablando, para definir a la
divergencia utilizamos el operador vectorial del ó nabla ∇, (en griego la palabra “nabla” significa
“arpa”). Pero antes de entrar con mayor formalidad en detalles técnicos, es conveniente tener
una idea sobre el significado físico de lo que estamos hablando.

Como ya se había explicado previamente en la entrada “Introducción al cálculo tensorial”, un


campo vectorial es algo que podemos imaginar como una infinitud de vectores en un espacio tri-
dimensional, en donde a cada punto en el espacio se le asigna un vector específico. Un ejemplo
de un campo vectorial puede ser la representación gráfica aproximada de varios vectores típicos
de un remolino de agua. Otro ejemplo lo pueden ser las líneas del campo de fuerza eléctrico que
emanan de una carga eléctrica positiva. Hay muchísimos ejemplos que podríamos citar, pero la
idea sigue siendo la misma.

En dondequiera que haya un campo vectorial, podemos trazar una superficie y podemos
formularnos una pregunta acerca del flujo neto de líneas de fuerza que están atravesando dicha
superficie. Aunque la cantidad de líneas de fuerza que atraviesan un pedazo pequeño de la
superficie es infinito (al haber una cantidad infinta de puntos dentro de dicho pedazo de
superficie), de cualquier manera nos las podemos arreglar para definir el flujo de líneas de
fuerza que están atravesando ese pedazo de superficie. Esto requiere que consideremos
únicamente las líneas de fuerza que, efectivamente, están atravesando la superficie. Si en una
porción pequeña de la superficie las líneas de fuerza son tales que están recorriendo la
superficie tangencialmente, sin entrar ni salir de la misma, entonces no hay flujo alguno de
líneas de fuerza a través de dicha superficie.

En la siguiente ilustración, tenemos un flujo de vectores fluyendo en el sentido del eje-x que está
atravesando una lámina plana cuadrada montada con sus orillas sobre el eje-y y el eje-z, estando
por lo tanto perpendicular al eje-x:
Es obvio que si la lámina estuviera acostada en el plano formado por el eje-x y el eje-y, aunque el
flujo de vectores se mantuviera igual no habría un flujo de vectores atravesandola lámina.
Obviamente, la orientación que tenga una superficie con respecto a un flujo de vectores es
importante para determinar cuantitativamente el flujo que la atraviesa y al cual denominaremos
con la letra Φ.

Vectorialmente hablando, utilizando los vectores unitarios de base usuales i = (1,0,0), j =


(0,1,0) y k = (0,1,0) en un sistema de coordenadas rectangulares, y suponiendo que el flujo de
vectores de la ilustración de arriba tiene una intensidad de 5 unidades, este flujo de vectores lo
podemos representar como:

F=5i+0j+0k

F=5i

En este caso, podemos definir el flujo vectorial Φ a través de la lámina simplemente


multiplicando la magnitud de la intensidad del flujo de vectores F por el área que está
atravesando:

Φ=F·A

que evaluada numéricamente para este caso resulta ser simplemente:


Φ = F · Δx Δy = 5 · (1) (1) = 5

Este es un ejemplo sencillo, inclusive trivial. Pero si inclinamos la lámina o inclusive si la


doblamos, ya no resulta tan trivial. Y si además de ello en vez de un campo vectorial de
magnitud constante la lámina es atravesada por un campo vectorial que cambia de dirección
constantemente, como en el caso de la siguiente figura en donde la lámina ha sido deformada y
en donde el campo vectorial cambia de magnitud y cambia de dirección constantemetne:

entonces la determinación del flujo tiene que ser formalizada de alguna manera. Lo primero que
se nos viene a la mente es sub-dividir la lámina (como se ha hecho en la figura de arriba) en un
gran número de pequeños “pedazos” de superficie, determinar el flujo a través de cada uno de
ellos, y sumar la contribución individual para así obtener el flujo total a través de la lámina.
Puesto que en cada punto del espacio tri-dimensional cada vector tiene bien definida su
magnitud y su dirección, para definir la operación del flujo vectorial en cada uno de esos
pequeños “pedazos” de superficie tenemos que asignarle una dirección a cada elemento de
superficie.

¿Y cómo le asignamos una dirección a una superficie?


Mediante un vector normal a dicha superficie, un vector perpendicular como el que se
muestra a continuación:

Resulta evidente que para una superficie que no es plana, para una superficie curva, habrá un
gran número de normales que podemos trazar en cada “pequeño pedazo de superficie”:

De este modo, habiéndole asignado una dirección a cada “pequeño pedazo de superficie” si
calculamos el flujo ΔΦ que atraviesa cada “pequeño pedazo de superficie” ΔS, podemos definir el
flujo que atraviesa a ΔS como el producto punto o producto escalar de los vectores F y ΔS:

ΔΦ = F · ΔS

El flujo total Φ que atraviesa la superficie de la lámina será igual con un buen grado de precisión
a la suma de las contribuciones individuales, o sea:

Φ = Σ F · ΔS

La evaluación será matemáticamente exacta si en vez de recurrir a pequeños pedazos discretos


utilizamos pedacitos infinitesimales y llevamos a cabo la integración:

Φ = ∫ F · ΔS
La pregunta que nos hacemos ahora es la siguiente: ¿Y si consideramos toda una superficie
cerrada? En tal caso, podemos considerar la posibilidad de que al flujo total de líneas de
fuerza saliendo a través de una superficie cerrada pueda asignársele un número positivo, el
cual nos indicaría que a través de dicha superficie después de sumar el flujo neto de líneas que
entran por la superficie y el flujo total de líneas de fuerza que salen de la superficie tenemos
una salida neta de líneas de fuerza, lo cual nos indica que adentro de la superficie cerrada hay
“algo” que nos está generando líneas de fuerza, hay una fuente. Y al haber un flujo neto de líneas
de fuerza saliendo de una superficie cerrada, decimos que hay unadivergencia (positiva) de
líneas de fuerza, o más formalmente, decimos que la divergencia del campo vectorial sobre esa
superficie cerrada es positiva.

Por otro lado, también podemos considerar la posibilidad de que al flujo total de líneas de
fuerza entrando a través de una superficie cerrada pueda asignársele un número negativo, el
cual nos indicaría que a través de dicha superficie después de sumar el flujo neto de líneas que
entran por la superficie y el flujo total de líneas de fuerza que salen de la superficie tenemos
una entrada neta de líneas de fuerza, lo cual nos indica que adentro de la superficie cerrada hay
un sumidero. Y al haber un flujo neto de líneas de fuerza entrando hacia una superficie cerrada,
decimos que hay una divergencia (negativa) de líneas de fuerza, o más formalmente, decimos
que la divergencia del campo vectorial sobre esa superficie cerrada es negativa.

Y en el caso en el que el flujo neto total de líneas de fuerza que atraviesan a una superficie
cerrada sea igual a cero, esto nos indicaría que a través de dicha superficie el flujo neto de líneas
que entran por la superficie es igual al flujo total de líneas de fuerza que salen de la superficie.

Considérese a continuación el campo vectorial que representa las líneas de fuerza eléctrica de
una carga positiva situada en el centro, de la cual emanan las líneas de fuerza que repelen a otra
carga de prueba (también positiva) que se quiera acercar a la carga situada en el centro (aunque
el dibujo es un dibujo en dos dimensiones, en realidad se está tratando de representar un campo
vectorial de tres dimensiones):
Si esta fuente de líneas de fuerza la encerramos dentro de una esfera imaginaria, podemos ver
que a través de la superficie de dicha esfera no habrá líneas de fuerza entrando, atravesándola
desde fuera hacia adentro; únicamente hay líneas de fuerza que están saliendo. Entonces el flujo
neto de líneas de fuerza tiene que ser una cantidad positiva. La divergencia del campo eléctrico
ocasionado por una carga eléctrica positiva siempre tiene un valor positivo cuando la
superficie con la cual se mide dicha divergencia únicamente encierra esa carga positiva.

Considérese a continuación el campo vectorial que representa las líneas de fuerza eléctrica de
una carga negativa situada en el centro, la cual genera líneas de fuerza que no repelen sino que
atraen a otra carga de prueba (positiva) que se quiera acercar a la carga situada en el centro:
Si este sumidero de líneas de fuerza lo encerramos dentro de una esfera imaginaria, podemos
ver que a través de la superficie de dicha esfera no habrá líneas de fuerza saliendo,
atravesándola desde dentro hacia afuera; únicamente hay líneas de fuerza que están entrando.
Entonces el flujo neto de líneas de fuerza tiene que ser una cantidad negativa. La divergencia
del campo eléctrico ocasionado por una carga eléctrica negativa siempre tiene un valor
negativo cuando la superficie con la cual se mide dicha divergencia únicamente encierra esa
carga negativa.

Ahora veremos un ejemplo en el que la divergencia de líneas de fuerza es cero. Considérese no


una carga elétrica positiva solitaria o una carga eléctrica negativa solitaria sino un par de cargas
eléctricas iguales en magnitud y diferentes únicamente en cuanto al signo, una carga positiva y
una carga negativa, como lo muestra la siguiente figura:
De nueva cuenta, si encerramos la carga positiva situada a la izquierda dentro de una superficie
esférica imaginaria, entonces habrá una divergencia positiva del campo vectorial sobre dicha
superficie. Y si si encerramos la carga negativa situada a la derecha dentro de una superficie
esférica imaginaria, entonces habrá una divergencia negativa del campo vectorial sobre dicha
superficie. Pero si encerramos ambas cargas dentro de una superficie esférica, la divergencia
del campo vectorial sobre dicha superficie será igual a cero, porque todas las líneas de fuerza
que entran es igual a las líneas de fuerza que salen. En el dibujo de arriba, aunque es bi-
dimensional, podemos ver que por cada línea de fuerza que entra a la superficie esférica
imaginaria que encierra ambas cargas habrá una línea de fuerza que sale “cancelándola”. Pero
no es necesario que la superficie imaginaria sea esférica. La superficie puede tener
cualquier configuración, como la de una caja. La divergencia seguirá siendo igual a cero,
porque dentro de la superficie hay una fuente y un sumidero que se cancelan mutuamente.

Consideremos un último ejemplo, el de un imán cuyo campo vectorial posiblemente ha sido


“visualizado” por muchos niños y jóvenes que han tenido la oportunidad de poner un imán
debajo de una hoja de papel esparciendo encima de la hoja limaduras de hierro:

En este caso, podemos trazar una superficie cerrada de cualquier forma en torno a cualquier
parte del imán, y la divegencia será cero, porque por cada línea de fuerza que entre a dicha
superficie habrá una línea de fuerza que salga. A diferencia de lo que ocurre con las cargas
eléctricas, no hay monopolos magnéticos en donde uno de ellos actúe como una fuente (el
monopolo “norte”) y el otro como un sumidero (el monopolio “sur”) de líneas de fuerza. Si los
hay, no han sido descubiertos hasta la fecha ni han podido ser producidos en el laboratorio. En
el dibujo de arriba tal vez algunos puedan confundirse al creer que en el extremo izquierdo del
imán (el polo sur) hay un sumidero y que en el extremo derecho del imán (el polo norte) hay una
fuente de líneas de campo magnético, pero debe tomarse en cuenta de que todas las líneas de
fuerza que están entrando en el extremo izquierdo del imán se están yendo dentro del
imán hacia el extremo derecho, de modo que el flujo neto de líneas de fuerza es igual a cero.

La realidad física de que no existen ni fuentes ni sumideros de líneas del campo magnético fue
expresada por James Clerk Maxwell con la siguiente fórmula:

∇·B = 0

Esta fórmula lo que nos dice es que, para cualquier superficie cerrada, la divergencia de las
líneas del campo magnético, representadas con un campo vectorial designado como B, es
igual a cero.

Se había señalado arriba que la divergencia es un simple número, un escalar. Pero en la fórmula
de arriba, a la izquierda de la misma tenemos un campo vectorial. La única forma en la cual
podamos obtener un escalar (o hablando “tensorialmente”, un tensor de orden cero) en el lado
derecho de la fórmula, es llevando a cabo un producto interno de los tensores de orden uno que
aparecen en el lado izquierdo de la fórmula. Esto quiere decir que ∇ es un operador tensorial.
Para un campo de fuerza vectorial F = (Fx, Fy, Fz ) definido en coordenadas Cartesianas:

F = Fx i + Fy j + Fz k i

la divergencia del campo vectorial sobre una superficie cerrada está dada por:

Con la ayuda de los tensores, el concepto de la divergencia se puede extender de un campo


vectorial hacia un campo tensorial en cualquier número de dimensiones, sin tener que
limitarnos a las tres dimensiones originales sobre las cuales fue concebida dicha idea. La
definición de la divergencia de un campo tensorial T = (Tα) se puede comenzar dándola como la
divergencia de un tensor contravariante de orden uno de la siguiente manera:
∇·T = ∂μTμ = ∂Tμ/∂xμ

Por los índices repetidos, vemos que la convención de sumación entra en acción de inmediato, y
que en un caso general la divergencia de un campo tensorial en un espacio n-dimensional será:

∇·T = ∂T1/∂x1 + ∂T2/∂x2 + ∂T3/∂x3 + ...

A continuación llevaremos a cabo la derivación de la fórmula tensorial para poder obtener la


divergencia de un campo vectorial en un espacio n-dimensional cualquiera.

PROBLEMA: Demostrar que la divergencia de un campo vectorial V = (Vα) está dada por la
siguiente fórmula:

Para un campo vectorial V = (Vα), y téngase en mente que un vector es un tensor, la definición
de la derivada covariante empleando la notación del semicolon e involucrando a los símbolos de
Christoffel se puede escribir de la siguiente manera:

Vα;β = Vα,β + Γαβμ Vμ

Esta definición nos proporciona la siguiente relación para la divergencia del campo vectorial al
llevarse a cabo la igualación de los índices en la definición de la derivada covariante de un tensor
contravariante de orden uno:

div Vp = Vp;p = Vk,k + Γppk Vk

Para mayor claridad, prescindiremos de la notación de la coma utilizada para denotar en forma
compacta la diferenciación parcial, y escribiremos la relación en su forma explícita:

Ahora utilizaremos la siguiente relación demostrada en la entrada “El determinante del tensor
métrico”:
Tenemos entonces lo siguiente sustituyendo el símbolo de Christoffel:

Tomaremos la derivada eliminando del panorama al logaritmo natural y preparando el terreno


para una simplificación posterior:

La simplificación que podemos llevar a cabo consiste en unirlo todo, la suma de dos términos,
bajo un solo término, la derivada de un producto:

Esta es la fórmula que queríamos demostrar.

Si estamos dispuestos a sacrificar un poco de claridad en aras de una mayor compacidad,


podemos recurrir a la notación de la coma para indicar con mayor brevedad la diferenciación en
la fórmula que acabamos de obtener, llegando así al siguiente resultado alterno que tal vez sea
más fácilmente memorizable:

Es conveniente hacer aquí un señalamiento. En algunos libros de texto y en algunas


publicaciones de índole técnica y científica, en las dos fórmulas que acabamos de demostrar el
determinante g del tensor métrico se escribe dentro de los radicales no como lo hemos mostrado
sino con un signo negativo. Es así como se nos muestran las siguientes fórmulas que nos
pueden parecer un poco extrañas a primera vista:
En realidad, esta última notación es algo confusa y no está realmente justificada, porque en
ningún momento tomamos la raíz cuadrada de un número negativo (lo cual nos produciría un
número imaginario). La intención original en escribir así las fórmulas tensoriales de la
divergencia de esta manera era advertir que, siendo el determinante g de una matriz un número
que puede ser positivo o negativo, en caso de ser negativo la fórmula se debería aplicar la
fórmula tal cual, y en caso de ser positivo simplemente se ignoraba el signo negativo.
Desafortunadamente, la costumbre en el uso de esta notación se asentó sin ser acompañada en
todo momento por las razones detrás de su razón de ser, aumentando la confusión en quienes
tienen la intención de aprender la Teoría de la Relatividad como autodidactas sin contar con un
buen maestro que les aclare estos puntos confusos.

PROBLEMA: Obtener la expresión para la divergencia de un campo vectorial V =


(Vα) expresada en coordenadas polares.

Para el tensor métrico g expresado en coordenadas polares, puesto que la representación


matricial G de los componentes de la métrica es:

el determinante g de su representación matricial será simplemente r²:

En coordenadas polares (r,θ), si denotamos las componentes del tensor V como (Vr,Vθ), la
aplicación de la fórmula tensorial para la divergencia obtenida en la entrada previa es directa e
inmediata. Empezando con la fórmula:
que expandida para fines de cálculo es:

lo primero que podemos hacer es llevar a cabo la expansión de las sumatorias dentro de la
fórmula para cada coordenada como lo indica la convención de sumación para índices repetidos
utilizando el hecho de que:

con lo cual tenemos, representando las diferenciaciones parciales con la notación de la coma
(esta representación que pudiera parecer superflua tiene la intención de ir familiarizando a los
lectores con otros tipos de notación utilizadas para representar la evaluación de la divergencia
de un campo vectorial bajo algún sistema de coordenadas) :

Escribiendo los términos explícitamente como lo indica la notación de la coma como índice que
significa diferenciación parcial:

En esta expresión se ha puesto de color rojo la parte del término que en virtud de la
independencia de las coordenadas será eliminado, dejándonos con lo siguiente:
Reacomodando los términos es así como llegamos a la expresión de la fórmula final del modo
más compacto posible:

PROBLEMA: Obtener la expresión para la divergencia de un campo vectorial V =


(Vα) expresada en coordenadas esféricas.

Para el tensor métrico g expresado en coordenadas esféricas, puesto que la representación


matricial G de los componentes de la métrica es:

el determinante g de su representación matricial será simplemente:

En coordenadas esféricas (r,θ,φ), si denotamos las componentes del tensor V como (Vr,Vθ,Vφ), la
aplicación de la fórmula tensorial para la divergencia es directa e inmediata. Nuevamente,
recurrimos a la fórmula tensorial para la divergencia:

En este caso, tenemos:


Habiendo reemplazado al determinante g por su valor, la expansión que habremos de llevar a
cabo sobre los índices repetidos en base a la convención de sumación deberá ser:

Esta expansión de sumatorias dentro de la fórmula se debe llevar a cabo para cada una de las
tres coordenadas tal y como lo indica la convención de sumación para índices repetidos, lo cual
nos resulta en:

El tercer término al llevarse a cabo la diferenciación con respecto a obviamente se nos volverá
cero. Llevando a cabo las diferenciaciones de los términos dentro del paréntesis tenemos
entonces:
Simplificando:

Expandiendo el término remanente hacia la sumatoria requerida sobre las tres coordenadas de
acuerdo a la convención de sumación para índices repetidos:

La divergencia de un tensor II
Asociado con el concepto de la divergencia está un teorema famoso debido a Gauss, conocido
como el teorema de la divergencia, el cual clásicamente (en el Análisis Vectorial) se expresa
mediante la siguiente igualdad que relaciona a una integral de superficie evaluada sobre una
superficie cerrada (un cubo, una esfera, una pirámide, etc.) con una integral evaluada sobre el
volumen encerrado dentro de dicha superficie:

En esta fórmula, del lado izquierdo tenemos un campo vectorial F del cual obtenemos la
divergencia del mismo mediante la aplicación del operador diferencial nabla ∇, tras lo cual
llevamos a cabo una integración en torno a cierto volumen, y del lado derecho tenemos una
integral de superficie llevada a cabo sobre una superficie cerrada (el círculo abrazando los dos
signos integrales se usa para indicar precisamente que se trata de una superficie cerrada) con la
cual evaluamos el flujo neto de líneas de fuerza que están atravesando dicha superficie cerrada.

La derivación de la fórmula clásica que expresa el teorema de la divergencia no es un asunto


difícil. Para obtenerla, consideramos una región del espacio que está inmersa en un campo
vectorial F (el cual puede representar las líneas de fuerza de un campo eléctrico, las líneas de
fuerza de un campo magnético, la velocidad de las moléculas del aire moviéndose en cierta
dirección del viento, etc.) Subdividimos esta región volumétrica en pequeños “cubitos” iguales
de volumen dV y determinamos el flujo neto de líneas de fuerza entrando a través de una cara
del cubito y saliendo por la cara opuesta:

Si hay divergencia dentro del cubito, entonces la densidad de líneas de fuerza que salen por la
cara opuesta será mayor que la densidad de líneas de fuerza que entran por la cara principal,
pero si la densidad es la misma entonces no hay divergencia alguna en esa dirección. Tenemos
que considerar además la cara superior del cubito y la cara inferior por la posibilidad de que
aunque no haya divergencia alguna en el sentido frontal-trasero del cubito sí pueda haber
divergencia en el sentido superior-inferior. Y tenemos que considerar también las caritas
laterales para determinar si hay un incremento o decremento en las líneas de fuerza que puedan
estar entrando o saliendo por las caras laterales. Hecho esto, vamos juntando los demás cubitos
tomando en cuenta que el flujo de líneas de fuerza que salen por la cara de un cubito debe ser
igual al flujo de líneas de fuerza que entran por esa misma cara cuando se considera al cubito
adyacente, pero por estar orientadas ambas caras en sentidos opuestos los vectores normales de
superficie n a dichas caras apuntarán en direcciones opuestas y los efectos se cancelarán. Al
final, nos quedaremos con tan sólo la parte exterior de las caras de los cubitos que coinciden con
la superficie del volumen bajo consideración.

Un caso especial que nos interesa sobremanera del teorema de la divergencia es aquél en el cual
no hay divergencia alguna del campo vectorial F, lo cual termina siendo evaluado como:

∇·F = 0
Cuando esto ocurre, entonces la integral del lado izquierdo en la fórmula que tenemos arriba del
teorema de la divergencia termina siendo cero, dejándonos tan sólo con lo siguiente:

Esto significa que en donde no hay divergencia el flujo neto de líneas de fuerza que atraviesan
una superficie cerrada es igual a cero. Si hay líneas de fuerza en la región, entonces hay tantas
líneas de fuerza atravesando una superficie cerrada de dicha región como líneas de fuerza
saliendo de la misma, lo cual dá un flujo neto de cero.

Si queremos extender el teorema de la divergencia hacia la Teoría de la Relatividad, la fórmula


dada arriba no nos es suficiente ya que está definida para un espacio tri-dimensional. En el caso
que nos ocupa, la Teoría de la Relatividad, necesitaríamos definir a la divergencia en un espacio
de cuatro dimensiones, a la cual podemos llamar la 4-divergencia.

La pregunta que nos hacemos ahora es: ¿podemos extender el teorema de la divergencia hacia el
4-espacio de la Teoría de la Relatividad? Esto equivale a preguntarnos primero si podemos
replantear el teorema de la divergencia en notación tensorial, la herramienta matemática que
nos permite “saltar” del limitado espacio tri-dimensional hacia un espacio multi-dimensional de
cualquier número de dimensiones.

PROBLEMA: Expresar el teorema de la divergencia usando notación tensorial.

Defínase un campo tensorial de orden uno F = (Fα), y denótese como nα al vector unitario
normal que va asociado a cualquier punto sobre una superficie cerrada S que encierra a un
volumen V. Entonces, en notación tensorial, el teorema de la divergencia puede ser escrito de la
siguiente manera:

En el lado izquierdo tenemos una operación de contracción tensorial llevada a cabo sobre la
derivada del tensor F (obsérvese que no es una diferenciación covariante), mientras que en el
lado derecho tenemos un producto escalar de dos tensores, el tensor contravariante Fk y el
tensor covariante nk. Hemos logrado expresar el teorema de la divergencia en notación tensorial,
y por lo tanto debe ser válido en todos los marcos de referencia.

Tenemos ya el teorema de la divergencia en notación tensorial. ¿Pero podemos extenderlo hacia


un espacio N-dimensional que incluya al 4-espacio de la Teoría de la Relatividad? La respuesta
es afirmativa. Todo lo que tenemos que hacer es reemplazar a la integral triple por una N-
integral (una integral cuádruple tratándose del 4-espacio de la Teoría de la Relatividad) y
reemplazar a la integral doble por una integral N-1. La invariante Fk,k es la divergencia de Fk. Y la
invariante Fknk es el producto escalar de Fk y nk análoga al producto A·n en notación vectorial.

PROBLEMA: Determinar si los siguientes campos vectoriales exhiben divergencia.

a) F = 5 i - 3 j + 7 k + 2 l

b) V = [(x3)² - 1] e1 + 4 (x2)² e2 - 2 (x1 + x2 + x4)² e3 - 8 e4

a) En este 4-espacio estamos utilizando los vectores de base ortogonales i, j, k y l cuyas


propiedades son:

i·i = j·j = k·k = l·l = 1

i·j = i·k = i·l = j·k = j·l = k·l = 0

La 4-divergencia para el campo vectorial dado es:

∇·F = Fα,α = Fi,i + Fj,j + Fk,k + Fl,l

Fα,α = ∂Fi/∂xi + ∂Fj/∂xj + ∂Fk/∂xk + ∂Fl/∂xl

Siendo F = Fα = (5, -3, 7, 2) un campo vectorial cuyas componentes son todas constantes
numéricas, tenemos entonces:

Fα,α = 0 + 0 + 0 + 0

Fα,α = 0
Siendo la divergencia igual a cero, este campo vectorial no exhibe divergencia alguna en ninguna
región del 4-espacio, de modo tal que en cualquier superficie cerrada el flujo neta de líneas de
fuerza que entran a dicha superficie será igual al flujo neto de líneas de fuerza que salen de dicha
superficie.

b) Este problema es casi idéntico al anterior. Lo único que realmente cambia es que en vez de
utilizar para los vectores unitarios de base la notación i, j, k y l estamos usando la
notación e1, e2, e3 y e4 en coordenadas generalizadas, que a fin de cuentas viene representando
exactamente lo mismo.

La 4-divergencia para el campo vectorial dado V es:

∇·V = Vα,α = V1,1 + V2,2 + F3,3 + F4,4

Vα,α = ∂V1/∂x1 + ∂V2/∂x2 + ∂V3/∂x3 + ∂V4/∂x4

Vα,α = 0 + 8 + 0 + 0

Vα,α = 8

En este caso, el campo vectorial V exhibe una divergencia que podemos ver que ocurre a lo largo
de la coordenada generalizada x2, la cual es positiva. Esto significa que las líneas de fuerza van
aumentando en intensidad en el sentido positivo de la coordenada x 2, posiblemente como
resultado de alguna fuerza de atracción que hace que las partículas se aceleren en dicha
dirección. No hay divergencia alguna en el sentido de la coordenada x 1, ni en el sentido de las
coordenadas x3 y x4.

Hemos logrado redefinir al teorema de la divergencia para un espacio multi-dimensional. Pero


no debemos olvidar que el teorema de la divergencia fue desarrollado dentro del contexto de un
espacio tri-dimensional Euclideano, ciertamente plano. ¿Pero podemos redefinirlo para que sea
válido también dentro de un espacio multi-dimensional curvo?

PROBLEMA: Obtener la fórmula para el teorema de la divergencia en el 4-espacio de la


Teoría de la Relatividad.
No tenemos que batallar mucho para resolver este problema. Todo lo que tenemos que hacer es
tomar la fórmula obtenida en la entrada anterior para la evaluación de la divergencia de un
campo tensorial general F:

Pasamos el denominador que está en el lado derecho de esta ecuación hacia el lado izquierdo:

y nos preparamos así para llevar a cabo una integración cuádruple en ambos lados sobre un 4-
volumen:

Simplificaremos la notación del 4-volumen infinitesimal con la siguiente abreviatura más


compacta:

d4x = dx1dx2dx3dx4

con la cual tenemos:

Si ponemos atención, veremos que el lado derecho de esta ecuación no involucra diferenciación
covariante alguna, sólo involucra derivadas parciales simples, y por lo tanto podemos aplicar la
versión tensorial del teorema de la divergencia substituyendo el lado derecho de la ecuación que
se lleva a cabo sobre un 4-volumen por la integral cerrada sobre la 4-superficie:
Este resultado que acabamos de obtener demuestra que el teorema de la divergencia también es
aplicable hacia un espacio multi-dimensional como el espacio-tiempo curvo de la Relatividad
General. La aplicación de la fórmula requiere del lado izquierdo de la ecuación el cálculo de la
divergencia Fα;α (¡utilizando la derivada covariante!) sobre un 4-volumen (un volumen
propio en el sentido utilizado en la Teoría de la Relatividad) y el cálculo del “flujo” sobre una 3-
superficie (una superficie propia en el sentido utilizado en la Teoría de la Relatividad).

¿Qué interpretación geométrica (visual) podemos darle a un teorema que relaciona una “3-
superficie” con un “4-volumen”?

Del mismo modo en el que una esfera tri-dimensional encierra un volumen acotado por la
superficie de la esfera, una 3-esfera o hiperesfera encierra un 4-volumen, quedando definido
de modo categórico el “interior” y el “exterior” de la hiperesfera. Así como la 2-esfera es la
superficie bi-dimensional en el espacio tri-dimensional Euclideano (x,y,z) dada por la ecuación:

x² + y² + z² = r²

en donde r es el radio de la esfera, del mismo modo la 3-esfera es la superficie tri-dimensional


en el 4-espacio Euclideano (x,y,z,w) dada por la ecuación:

x² + y² + z² + w² = r²

en donde r es el radio de la 3-esfera. Es importante recalcar que la 2-esfera del 3-espacio es


incapaz de poder encerrar un 4-volumen finito en un 4-espacio en virtud de que con cuatro
coordenadas disponibles en el 4-espacio, la ecuación de la 2-esfera:

x² + y² + z² = r²

se puede mantener como válida para un valor finito del radio r pese a que la cuarta coordenada
(w) puede ser variada desde -∞ hasta +∞, aceptando volúmenes infinitos. Se requiere
forzosamente de una (N-1)-superficie para poder encerrar un N-volumen.

Pero la 3-esfera no es la única superficie que podemos definir geométricamente (o mejor dicho,
matemáticamente) en un 4-espacio. Del mismo modo en el que un cubo-tridimensional encierra
un volumen acotado por tres pares de caras que definen a la superficie total del cubo,
un hipercubo cuatri-dimensional encierra un 4-volumen acotado por cuatro pares de caras que
definen a la 3-superficie de un hipercubo. Como no es posible dibujar en un pedazo de papel
plano (o en el monitor de una computadora) un hiper-cubo, nos conformaremos con dibujar una
de las “caras” de una de las hipersupericies que encierran al 4-volumen. Lo haremos sobre un
diagrama espacio-tiempo como corresponde a la perspectiva geométrica de la Teoría de la
Relatividad en la que la “cuarta coordenada” es la coordenada del tiempo:

Las hipersuperficies de las que estamos hablando aquí son unas “superficies” muy curiosas, ya
que están medidas no en metros cuadrados ni en centímetros cuadrados sino en metros cúbicos
o en centímetros cúbicos. ¡Y el 4-volumen está medido no en metros cúbicos sino en metros
cuárticos!

En las coordenadas Cartesianas de un plano bi-dimensional, el elemento infinitesimal de área


sobre el cual podemos llevar a cabo una integración está dado por:

dA = dx dy

Y en un espacio tri-dimensional, los elementos infinitesimales de superficie posibles en


coordenadas Cartesianas sobre los cuales podemos llevar a cabo una integración son los
siguientes:

dS = dx dy

dS = dx dz

dS = dy dz

Hasta aquí estamos hablando de elementos infinitesimales de 2-superficie (se acostumbra usar
también la palabra 2-especie para definir este concepto). En un espacio 4-dimensional,
podemos definir también elementos infinitesimales de 2-superficie, siendo posibles seis en
coordenadas generalizadas:

dS = dx1 dx2

dS = dx1 dx3

dS = dx1 dx4

dS = dx2 dx3

dS = dx2 dx4

dS = dx3 dx4

Sin embargo, si de lo que estamos hablando es de elementos infinitesimales de 3-superficie,


estos serán los siguientes en el 4-espacio de la Teoría de la Relatividad (para mayor simplicidad,
igualaremos la constante c de la velocidad de la luz a la unidad, con lo cual podemos escribir la
coordenada temporal simplemente como dt en lugar de cdt):

d3S = dx dy dz

d3S = dt dy dz

d3S = dx dt dz
d3S = dx dy dt

Hay pues cuatro pares de caras para definir las hipersuperficies del hipercubo. En el diagrama
de arriba que muestra un 4-volumen acotado por cuatro hipersuperficies, se muestran dos caras
de la hipersuperficie xyz (denotadas en el diagrama simplemente como hiper-superficie x1
e hiper-superficie x2 ante la imposibilidad de poder dibujar en el plano las otras dos
coordenadas) en las cuales el triplete (x,y,z) permanece constante conforme variamos la
coordenada t, y las dos caras de la hipersuperficie tyz (denotadas en el diagrama simplemente
como hiper-superficie t1 e hiper-superficie t2 ante la imposibilidad de poder dibujar en el plano
las otras dos coordenadas) en las cuales el triplete (t,y,z) permanece constante conforme
variamos la coordenada x.

Si tenemos un flujo cuatri-dimensional F = (Ft,Fx,Fy,Fz) atravesando un hipercubo como el


mostrado parcialmente en el diagrama, entonces para el cálculo del total neto de dicho flujo que
aparece en el lado derecho de la ecuación del teorema de la divergencia tensorial podemos
definir vectores normales unitarios n perpendiculares a cada una de las hipersuperficies al igual
que como se acostumbra hacerlo en el Análisis Vectorial. Para el diagrama de arriba, tendremos
los siguientes vectores normales a cada una de las cuatro hipersuperficies:

Obsérvese que el vector unitario normal a la hiper-superficie t1 tiene un signo opuesto (negativo)
al de la hiper-superficie t2 (positivo) en virtud de que esta normal “hacia afuera” del 4-volumen
apunta “hacia atrás” en el tiempo. Y en lo que respecta al vector unitario normal a la hiper-
superficie x1, este tiene signo negativo porque la hipersuperficie está orientada en dirección
opuesta a la hiper-superficie x2.

Para calcular el flujo neto a través del hipercubo mostrado, hay que calcular el flujo a través de
los cuatro pares de hipersuperficies. En el caso del diagrama mostrado arriba, el cálculo
involucra la suma de las siguientes integrales (todas son integrales triples, pero se ha utilizado
un solo símbolo para simplificar la notación; y del mismo modo se ha omitido la raíz cuadrada
del determinante g en virtud de que siendo g un número la raíz cuadrada de dicho número
también lo es y podemos sacarlo fuera de la integral):

Podemos definir otra hiper-región del 4-volumen acotada por la hiper-superficie y1 y la hiper-
superficie y2 así como por la hiper-superficie z1 y la hiper-superficie z2 evaluando el flujo con la
siguiente totalización de integrales:

Podemos juntar bajo un mismo proceso de integración el cálculo del flujo de un campo
vectorial F a través de las hipersuperficies de dos caras opuestas del hipercubo de la manera
siguiente:
En este caso, Ft(t2) es la componente de flujo del campo vectorial F que atraviesa la hiper-cara
del hipercubo al salir fuera del 4-volumen en la misma dirección en la cual está orientada la
cara, mientras que Ft(t1) es la componente de flujo del campo vectorial F que atraviesa la cara
opuesta del hipercubo. Si el flujo neto (sumado) de ambas caras es cero, entonces hay tantas
líneas de fuerza entrando como líneas de fuerza saliendo a través de dicho par de caras
opuestas del hipercubo.

Sumando todas las contribuciones de las caras opuestas del hipercubo, 4 pares de caras en total,
obtenemos el flujo neto de líneas de fuerza a través del hipercubo como lo indica el lado derecho
de la ecuación de arriba para el teorema de la divergencia en un espacio multi-dimensional:

Sólo nos falta un detalle por aclarar. Para que el teorema de la divergencia que acabamos de
derivar extendido hacia un espacio 4-dimensional que puede ser curvo o plano sea creíble como
enunciado tensorial, tenemos que demostrar que el elemento infinitesimal de 4-volumen que
aparece en el lado izquierdo de la ecuación:
es una invariante, algo que no hemos hecho. Esto lo demostraremos con los siguientes dos
problemas.

PROBLEMA: Demostrar que

en donde g = det G, es un tensor relativo.

Partiendo del tensor métrico g, los elementos gpq de dicho tensor a partir de los cuales se obtiene
el determinante g de la representación matricial de los componentes de dicho tensor se
transforman tensorialmente de acuerdo con la relación:

Tomando determinantes en ambos lados de la ecuación tenemos entonces:

en donde hemos aplicado como paso intermedio la bien conocida propiedad de los
determinantes que nos dice que el determinante del producto de dos matrices cuadradas de
igual tamaño A y B es igual al producto de los determinantes de cada matriz, o sea |AB| =
|A||B|.

Pero |∂xp/∂xj| es simplemente el Jacobiano J de la transformación. A manera de ejemplo, el


Jacobiano J de las coordenadas rectangulares (x,y,z) con respecto a las coordenadas esféricas
(r,θ,φ) se acostumbra representarlo de modo más explícito de la siguiente manera:
Otra forma de representar el Jacobiano, en este caso usando coordenadas generalizadas para un
espacio multi-dimensional, es la siguiente:

que representa en general:

De este modo, podemos regresar a la relación en la que estábamos trabajando escribiéndola de


la siguiente manera:

g=J·Jg

g = J² g

Tomando la raíz cuadrada de ambos lados, obtenemos:


Esto nos demuestra que la raíz cuadrada del determinante g del tensor métrico g es un tensor
relativo. En el caso en el cual el Jacobiano sea igual a la unidad, el tensor relativo será
simplemente un tensor común y corriente sin una constante de “amplificación”.

PROBLEMA: Demostrar que:

es una invariante.

Empezaremos la demostración con la siguiente relación:

Usando el resultado del problema anterior, podemos escribir la relación de la siguiente manera:

El Jacobiano J para esta transformación escrito en forma abreviada será simplemente J =


|∂x/∂x|:

Y en base a la bien conocida relación del cálculo multivariables:

Esto se simplifica a lo siguiente:


Con esto, lo que tenemos en el lado derecho es simplemente el elemento infinitesimal de
volumen dV en un espacio N-dimensional. Se concluye que:

En palabras llanas, el elemento infinitesimal de volumen en el espacio N-dimensional en la


forma en la que se ha definido arriba es una invariante.

Siendo el elemento infinitesimal de volumen dV una invariante en el espacio N-dimensional, si


Φ es también una invariante se concluye que:

Del mismo modo, repitiendo los mismos pasos, podemos obtener un enunciado similar para la
invariancia de las superficies en el espacio N-dimensional, con lo cual el lado derecho de la
ecuación del teorema de la divergencia para un espacio N-dimensional ya sea plano o curvo
queda plenamente justificado desde el punto de vista tensorial.

Así, la 4-divergencia de un campo tensorial V de orden uno que en un espacio multi-


dimensional plano está definida bajo la siguiente fórmula general de contracción tensorial
(obsérvese el uso de la coma que indica diferenciación parcial simple):

quedará ahora redefinida para espacio multi-dimensional curvo como (obsérvese el uso del
semicolon en lugar de la coma que indica diferenciación covariante):

Hemos logrado redefinir exitosamente el concepto de la divergencia hacia un espacio multi-


dimensional que puede ser plano o curvo, y en el camino hemos logrado extender también el
teorema de la divergencia hacia estos espacios multi-dimensionales. Pero hasta ahora lo hemos
hecho manejando únicamente campos tensoriales (vectoriales) expresados como tensores
contravariantes de orden uno. Esto no nos será suficiente en el estudio de la Relatividad
General. Téngase en cuenta que en la Teoría de la Relatividad debemos considerar que hemos
pasado del 4-vector energía-momentum (un tensor de orden uno) al tensor contravariante
de segundo orden energía-tensión T = (Tμν), de modo tal que en la Teoría de la Relatividad
tenemos que extender el concepto de la divergencia de un tensor hacia un tensor de orden dos.

¿Es posible extender el concepto de la divergencia para que abarque tensores de orden general
que inclusive puedan ser tensores mixtos?

La respuesta a esta pregunta es afirmativa, y la definición matemática de divergencia para un


tensor general mixto con respecto a su k-índice contravariante es la siguiente que involucra la
operación tensorial de contracción mediante la igualación de índices:

Ha llegado el momento de que, en base a lo que hemos visto arriba, le echemos un vistazo al
tensor energía-impulso (o tensor energía-tensión) que aparece en la ecuación tensorial
fundamental de la Teoría General de la Relatividad.

En la Teoría Especial de la Relatividad, en un espacio-tiempo plano, seguimos utilizando


derivadas parciales para la obtención de la divergencia de un tensor, y la divergencia del
tensor T = (Tμν) se acostumbra escribirla de la manera siguiente:

Tμν,ν

utilizando la notación de la coma para denotar las derivadas parciales. Por otro lado, la
divergencia del tensor T = (Tμν), extendida hacia el espacio-tiempo curvo de la Relatividad
General, resulta ser:

Tμν;ν

utilizando la notación del semicolon para denotar la derivada covariante. Este es un ejemplo de
la regla “la coma va hacia un semicolon”, bajo la cual si tenemos algún enunciado que es
válido en un espacio-tiempo plano (en un marco inercial de referencia) propio de la Teoría
Especial de la Relatividad, entonces para escribir el enunciado de modo tal que sea válido dentro
de la Relatividad General reemplazamos la coma por un semicolon, y en vez de evaluar
derivadas parciales evaluamos derivadas covariantes.

El concepto de la divergencia del tensor energía-tensión T = (Tμν) juega un papel muy


importante en todo lo que concierne a la Teoría de la Relatividad, porque expresa el principio de
la conservación de la energía-momentum. Para la Teoría Especial de la Relatividad, esto se
enuncia de la siguiente manera expresando la conservación local de la energía:

Tμν, ν = 0

Y para la Relatividad General, el enunciado equivalente de la conservación local de la energía-


momentum es:

Tμν; ν = 0

Como puede verse, la diferencia entre ambas expresiones está en la coma y el semicolon. En el
caso de la Teoría Especial de la Relatividad se aplica la diferenciación parcial ordinaria,
mientras que en la Teoría General de la Relatividad se aplica la diferenciación covariante.

La importancia del hecho de que la divergencia del tensor energía-tensión T = (Tμν) pueda ser
utilizada para resumir el principio de la conservación local de la energía (o mejor dicho, el
principio de la conservación local de la energía-momentum) ha llevado a un segmento
apreciable de la comunidad científica a considerar esto como “la tercera ley de la Relatividad
General” (las otras dos siendo la ecuación tensorial básica y la ecuación geodésica).

En el estudio del tensor de Riemann se descubre que en lo que respecta al tensor de curvatura
de Einstein G, el cual expresa tensorialmente la curvatura del espacio-tiempo, la divergencia
del tensor de Einstein es igual a cero en todos los puntos de una métrica Riemanniana
cualquiera. Si tomamos como base la ecuación tensorial básica de la Relatividad General:

G = 8πGT

entonces al expresar dicha ecuación tensorial en notación de componentes:

Gαβ = 8πGTαβ

y al tomar la derivada covariante de la misma en ambos lados efectuando al mismo tiempo una
operación de contracción con la igualación de índices para así obtener en el lado izquierdo la
divergencia del tensor de Einstein G y obtener del lado derecho la divergencia del tensor
energía-tensión T:

Gαβ ; β = 8πGTαβ ; β

entonces si la divergencia del tensor de Einstein es cero la divergencia del


tensor Tnecesariamente debe ser cero también. Esto significa que el hecho de que la divergencia
del tensor de curvatura de Einstein sea cero automáticamente implica el principio de la
conservación de la energía-momentum en la Teoría de la Relatividad, tanto la Especial como
la General. Esto lo podemos expresar con una doble implicación lógica:

Gαβ ; β = 0 ⇔ Tαβ ; β = 0

El tensor energía-tensión
En la ecuación tensorial fundamental de la Relatividad General, el tensor T que aparece en el
lado derecho de dicha ecuación:

G = 8πGT

conocido como el tensor energía-tensión, el tensor energía-impulso y también como tensor


energía-momentum, es la extensión del concepto básico del 4-vector energía-momentum
utilizado en el espacio-tiempo plano de cuatro dimensiones de la Teoría Especial de la
Relatividad, generalizado hacia un espacio-tiempo curvo.

Antes de intentar dar un significado físico al tensor T cuatri-dimensional de la Relatividad


General, empezaremos por dar una interpretación a un tensor en un espacio ordinario de tres
dimensiones utilizado en los estudios de la teoría de la elasticidad, del cual parte precisamente
el origen de la palabra tensión interpretada en el sentido usual de la mecánica clásica.

Imaginemos por un momento que tenemos en nuestras manos un bloque cúbico hecho de hule,
al cual le ponemos encima en su cara superior la palma de nuestra mano mientras que la cara
inferior la dejamos reposar en contacto sobre la superficie de una mesa de madera con la cual
haya suficiente fricción para que el bloque de hule permanezca en la misma posición al irse
deformando conforme empezamos a aplicar una fuerza superficial lateral en la cara superior del
bloque a la cual llamaremos σ, produciendo una tensión mecánicasobre la superficie del mismo
capaz de deformar ligeramente al bloque en el sentido en el cual aplicamos la tensión.
Conociendo el coeficiente de elasticidad del hule, podemos calcular sin problema alguno el
grado de deformación del bloque de hule suponiendo que la cara inferior que está en contacto
con la mesa permanece inmóvil.

Si la cara superior del bloque de hule la identificamos con un sistema de coordenadas


Cartesianas situando simétricamente una esquina de la cara superior del bloque de hule en el
origen de dichas coordenadas, entonces podemos aplicarle la tensión en una dirección que
coincida con el eje-x. Del mismo modo, podemos aplicarle la tensión en una dirección que
coinicida con el eje-y. Pero si le aplicamos la tensión en una dirección que no coincida ni con el
eje-x ni con el eje-z, entonces la tensión estará caracterizada por cuatro componentes posibles:
σxx, σxy, σyx, y σzz. Estos cuatro componentes pueden ser agrupados dentro de un solo símbolo
que representa a los cuatro, un tensor covariante (o contravariante) de orden dos en un
espacio de dos dimensiones, al cual por comodidad llamaremos σ.

La situación se complica si además de aplicar una tensión mecánica a la cara superior del bloque
de hule le aplicamos también una tensión mecánica hacia abajo, en la dirección de un tercer eje-
z. En tal caso, tenemos una distribución más elaborada de tensiones como nos lo muestra la
siguiente figura:

En este caso, tenemos un total de nueve componentes, los cuales también pueden ser agrupados
dentro de un solo símbolo que representa a los nueve componentes, un tensor covariante (o
contravariante) de orden dos en un espacio de tres dimensiones.

Si lo que estamos describiendo es un mismo y único fenómeno físico, entonces la deformación


del bloque de hule que tenemos arriba debe ser exactamente la misma si imprimimos una
rotación al sistema de coordenadas con el que estamos describiendo los componentes.
Naturalmente, al girar el sistema de coordenadas, las componentes individuales van a cambiar,
y si tenemos expresiones matemáticas en función de dichos componentes, también van a
cambiar. Pero el símbolo σ bajo el cual agrupamos a dichos componentes sigue siendo el
mismo. De este modo, si en coordenadas generalizadas -usando notación (x1, x2, x3)- tenemos la
siguiente situación:

entonces tras imprimir una rotación al sistema de coordenadas tendremos algo como lo
siguiente:
Ahora bien, puesto que el sistema de coordenadas indicado -coordenadas Cartesianas- es un
sistema de coordenadas arbitrario, lo podemos reemplazar por otro siempre y cuando el
fenómeno físico que está siendo descrito no cambie al cambiar el sistema de coordenadas.
Naturalmente, para ciertos problemas habrá un sistema de coordenadas cuyo uso será mil veces
preferible a los demás sistemas de coordenadas que podamos utilizar en virtud de la
simplificación que podamos obtener en nuestros cálculos matemáticos bajo cierto sistema. De
cualquier manera, lo que no cambiará notacionalmente en lo absoluto es el símbolo del
tensor T bajo el cual se agrupan los componentes. Un cierto tensor T podrá ser descompuesto en
los componentes propios de un sistema de coordenadas rectangulares o en los componentes
propios de un sistema de coordenadas esféricas, pero el tensor en sí no cambia en nada.

Ahora veremos más a fondo lo que nos representa el tensor energía-tensión que aparece en la
Relatividad General. En coordenadas generalizadas, las componentes de dicho tensor de orden
dos para el cual utilizaremos aquí notación contravariante se acostumbran exhibir mediante una
matriz como la siguiente:

Aunque un cuádruplo de coordenadas generalizadas lo podemos representar de la siguiente


manera con los índices empezando desde uno:

(x1, x2, x3, x4)

en muchos textos se acostumbra comenzar la simbolización numérica indexal desde cero:

(x0, x1, x2, x3)

extendiéndose dicha representación al mismo tensor energía-tensión de modo tal que tenemos
un componente como T00. Esto no debe representar problema alguno, y el contexto del trabajo
científico o del libro de texto consultado debe ser suficiente para dejar en claro cuál es la
convención seguida.
Antes de continuar, es importante dejar una cosa en claro:

El tensor de Einstein (simbolizado como G) y el tensor métrico g son dos cosas


completamente distintas que no deben ser confundidas en ningún momento y bajo
ninguna circunstancia.

Es hasta cierto punto desafortunado el que para poder representar a la matriz que agrupa a los
componentes del tensor métrico g se acostumbre usar con cierta frecuencia la misma letra G que
la que usamos para representar al tensor de curvatura de Einstein; y más desafortunado aún el
que la misma letra se utilice para representar a la constante G de la gravitación universal. Para
evitar ambigüedades, podríamos inventar nuevos símbolos, pero esto simplemente reemplazaría
una confusión con otra al requerir el aprendizaje de símbolos venidos de otros alfabetos, razón
por la cual nos apegaremos aquí al uso de los símbolos más tradicionales.

Una característica fundamental que tomamos como dada es que los componentes del tensor
energía-tensión T son simétricos, o sea T = (Tij) = (Tji) al igual que los componentes del
tensor de curvatura de Einstein G que está al otro lado de la ecuación deben serlo
consecuentemente. Si se desea, se puede llevar a cabo un interesante ejercicio matemático
suponiendo que ni el tensor G (y por lo tanto tampoco el tensor T) son simétricos, pero esto
complica enormemente las cosas y no resulta claro que una suposición así podría llevarnos a
ninguna conclusión útil, de modo que nos aferraremos a la suposición esencial de la simetría en
estos tensores a lo largo de esta obra.

A primera vista, para quienes están acostumbrados a pensar en términos de la física clásica,
deberá parecerles extraño que para poder describir a la densidad de la energía y el momentum
vistos desde marcos de referencia distintos se requiera de un tensor de orden dos sin ser
suficientes los vectores N-dimensionales, pero el tensor de orden dos resulta ser indispensable.
Para describir la energía y el momentum relativistas de una sola partículaciertamente nos basta
un 4-vector. Pero para poder describir un gas de partículas, o para poder
describir campos (como el campo electromagnético) necesitamos de un tensor de orden dos que
nos pueda combinar la densidad de la energía (energía por unidad de volumen), el flujo de
energía (o la densidad del momentum que en realidad vienen siendo lo mismo) y el flujo de
momentum, algo que excede las capacidades de un simple vector.

Considérese una caja en reposo de dimensiones Δx, Δy y Δz de volumen V = ΔxΔyΔz que


encierra un total de N partículas:

Por una vieja costumbre cuyo origen se desconoce a ciencia cierta, dentro de la Relatividad
General a esta colección de partículas flotando en estado de reposo dentro de la caja se ha dado
por llamarle polvo, aunque en realidad esta designación tiene poco que ver con eso que se
acumula en los muebles. La densidad de partículas en dicha caja, el número de partículas por
unidad de volumen que llamaremos n, será N/V. Ahora bien, la energía en reposo de cada
partícula, de acuerdo con la Teoría Especial de la Relatividad, será m0c². Habiendo un total de N
partículas en la caja, la energía total contenida en dicha caja será Nm 0c². La densidad de
energía en dicha caja que llamaremos ρ será igual a la energía total dividida entre el volumen de
la caja:

ρ = Nm0c²/V = nm0c²

Pongamos ahora a la caja en movimiento a lo largo de la dirección del eje-x con una velocidad V.
Por los efectos de la contracción relativista de longitud:
Δx se reducirá a Δx' por un factor de √1 - V²/c², entanto que las longitudes perpendiculares a la
dirección del movimiento permanecerán iguales. Esto significa que el número de partículas por
unidad de volumen ahora será:

n/√1 - V²/c²

Pero la densidad de partículas no es lo único que cambia al ponerse la caja en movimiento. La


energía en reposo de cada partícula aumenta en un factor de 1/√1 - V²/c². Consecuentemente, la
densidad de energía de la caja para un observador que ve a la caja en movimiento aumenta no
en un factor de 1/√1 - V²/c² sino en dos factores de dicha cantidad, resultando en un factor
combinado de aumento:

Siendo el factor de aumento en la densidad de energía no 1/√1 - V²/c² sino:

1/(1 - V²/c²)
podemos ver que nos será imposible representar a la densidad de energía simplemente como un
vector (un tensor de orden uno) como lo habíamos estado haciendo al estar haciendo cambios
de un marco de referencia a otro. De hecho la densidad de energía resulta ser el principal
componente de un tensor de orden dos, precisamente el tensor energía-tensión.

En términos algo crudos, podemos visualizar al tensor energía-tensión como algo que nos
describe el flujo de la energía-momentum en el espacio-tiempo ya sea plano o curvo. Es
importante aclarar aquí otro punto de confusión considerable entre los principiantes: la energía-
tensión T (un tensor de orden dos) y la energía-momentum (un vector, el cual a su vez es un
tensor de orden uno) son dos cosas completamente diferentes. La energía-tensión es un objeto
de orden mayor (un tensor de orden dos) construído conceptualmente a partir del vector
energía-momentum (un tensor de orden uno).

Existen varias interpretaciones matemáticas que se le pueden dar al tensor energía-tensión. Una
de ellas nos dice que el tensor energía-tensión es algo que llamamos un mapa bi-linearde una
representación vectorial de un elemento de 4-volumen a la representación vectorial del 4-vector
energía-momentum contenido dentro de dicho elemento de 4-volumen. Otra de ellas radica en
un álgebra conocida como álgebra Clifford (conocida también como álgebra geométrica)
desarrollada por William K. Clifford que nos demuestra que la forma correcta de representar a
un volumen es como un vector, aunque esto tal vez parezca extraño a quienes están
acostumbrados a pensar que algo que se mide en litros o en metros cúbicos se le pueda asignar
una dirección. Pero esto no debe parecernos tan extraño si recordamos que al hablar acerca del
flujo de un campo de vectores (campo vectorial) a través de una superficie también nos ha sido
posible representar a una porción de superficie dA como un vector ndA mediante un vector
normal (perpendicular) n trazado en cada punto de dicha superficie. Esto no es lo único extraño
de las álgebras Clifford. Otra característica de tales álgebras es que en ellas es posible sumar
cantidades escalares (las cuales no tienen dirección ni sentido) a cantidades vectoriales, de
modo tal que no es inusual encontrar en dichas álgebras operaciones tales como:

C=e+V

en donde e es un escalar y V es un vector. Hay quienes encuentran esto demasiado incómodo y


comparan la suma de escalares y vectores como el llevar a cabo una suma de manzanas y
naranjas pese a que esto ocurre todo el tiempo cuando preparamos una ensalada de frutas. Las
álgebras Clifford eventualmente nos llevan a lo que llamamos el cálculo exterior en el cual
encontramos definido el producto cuña Λ (wedge product) que entre sus características tiene la
propiedad de que la “suma” de dos vectores no es conmutativa porque el orden en el cual se
toma la suma (simbolizada como uΛv) nos dá el sentido de la rotación que podemos asignar a
dicha operación:

La ruta de análisis basada en las álgebras Clifford en la que hablamos de vectores, bivectores y
trivectores es precisamente la ruta de ataque que siguen Charles Misner, Kip Thorne y John
Archibald Wheeler en su venerable y voluminoso libro Gravitation, pero seguir esta ruta nos
sacaría fuera del ámbito del cálculo tensorial en el que hemos estado trabajando, razón por la
cual omitiremos adentrarnos en este tema. Las álgebras Clifford y el cálculo exterior son útiles
para darnos un poco más de comprensión en el tema que estamos tratando, pero no son
absolutamente indispensables. Einstein pudo obtener y desarrollar sus ecuaciones de campo
manteniéndose por completo dentro del ámbito del cálculo tensorial, y aquí podemos hacer lo
mismo.

Lo primero que haremos será “construír” un tensor de curvatura de Einstein G. Podemos


hacerlo recurriendo a las coordenadas Cartesianas rectangulares que utilizamos en la Teoría
Especial de la Relatividad para denotar las coordenadas de un objeto en un marco de referencia
4-dimensional:

(ct, x, y, z)

Pero siendo los tensores objetos matemáticos que permanecen invariantes al pasar de un
sistema de coordenadas a otro, podemos darnos el lujo de unir la coordenada temporal con el
sistema de coordenadas esféricas para así especificar los cuatro componentes de un 4-espacio de
la manera siguiente:

(t, r, θ, φ)

A continuación, acomodaremos estos cuatro componentes en un renglón a un lado de los


mismos cuatro componentes acomodados formando una columna, como si fuésemos a construír
una tabla con ambos:
Con este “esqueleto” procedemos a escribir adentro del espacio vacío uno a uno los
componentes del tensor de curvatura de Einstein. Podemos escribirlos como los componentes
de un tensor covariante de orden dos, los componentes de un tensor mixto, o los componentes
de un tensor contravariante de orden dos, todo es cuestión de gustos que al fin y al cabo
podemos “subir” y “bajar” los índices a nuestro antojo con la ayuda del tensor métrico g. Lo
haremos aquí representándolos como los componentes contravariantes de un tensor de orden
dos:

Esto automáticamente nos fija la manera en la cual tenemos que escribir los componentes del
tensor energía-tensión T, también como componentes de un tensor contravariante de orden dos,
dada la igualdad tensorial:

G = 8πGT

que nos lleva a:


Como podemos ver, la representación matricial de los componentes del tensor energía-
tensión T no parece darnos mucha información sobre la naturaleza de los mismos. La
interpretación de su significado físico se antoja un reto. Pero ello se debe a que no hemos
considerado al 4-vector energía-momentum como el verdadero punto de partida para obtener
una interpretación física. Recordemos cómo el 4-vector energía-momentum:

(E/c, p) = (E/c, p1, p2, p3)

en cierta forma deriva del 4-vector de coordenadas del espacio-tiempo Lorentziano al obtener
primero de éste el 4-vector velocidad y posteriormente el 4-momentum con la inclusión de la
masa en reposo m0. Podemos establecer una correspondencia entre la representación matricial
dada arriba para T y una “tabla” que consta de cuatro renglones y cuatro columnas en la cual
acomodamos como tabulador horizontal a los componentes del 4-vector posición y en la cual
acomodamos como tabulador vertical a los componentes del 4-vector energía-momentum:
Para los componentes del tensor energía-tensión T cuyo significado físico se dará a
continuación, se acostumbra utilizar como guía la siguiente definición general:

Tab = _____________________________________
flujo de momentum a atravesando una superficie de b constante

Y al hablar aquí del momentum estamos hablando de 4-momentum.

Es importante tener presente que en el 4-espacio de la Teoría de la Relatividad tenemos no tres


sino cuatro superficies que en un sistema de coordenadas Cartesianas (rectangulares) podemos
identificar de la siguiente manera: (1) una superficie de t = constante (la que corresponde a la
coordenada “cero” o la coordenada temporal), (2) una superficie de x = constante, (3) una
superficie de y = constante, (4) una superficie de z = constante. Al hablar acerca de un flujo de
energía-momentum a través de una superficie como la superficie x en realidad estamos
hablando acerca de un flujo a través de todas las superficies de x = constante. A continuación
tenemos una representación esquemática de un flujo de energía-momentum a través de tres de
los cuatro tipos de superficie:

En sentido vertical, de abajo hacia arriba, tenemos un flujo de energía-momentum a través de


varias superficies de t = constante (la primera superficie podría representar un tiempo de 1
segundo, la segunda superficie podría representar un tiempo de 2 segundos, y así
sucesivamente). No es necesario que algo se esté moviendo de un lado a otro para que ocurra
este flujo, puesto que basta con que una partícula u objeto esté en reposo absoluto para que el
reloj que marca el tiempo siga avanzando. La partícula “avanza” en el tiempo. Pero en el sentido
del eje-x, la partícula u objeto ciertamente está cambiando de posición continuamente, pasando
de una hipersuperficie plana x a otra. Aquí si hay “movimiento”, aquí si hay un “flujo”
observable con nuestros sentidos. Lo mismo se puede decir acerca de un flujo que ocurre a lo
largo del eje-y atravesando los planos de y = constante. Y lo mismo puede decirse acerca de un
flujo que ocurre a lo largo del eje-z atravesando los planos de z = constante, aunque no haya sido
posible ya representarlo dentro de la figura de arriba.

El primer componente que identificaremos dentro del tensor energía-tensión T arreglado con
sus componentes identificadores en forma de “tabla” -en los cuales hemos puesto en el
tabulador horizontal a los componentes del 4-vector posición y en la cual hemos puesto en el
tabulador vertical a los componentes del 4-vector energía-momentum- es el que está situado en
la esquina superior izquierda, de color amarillo, identificado como el componente T00 en
muchos libros de texto. Este es un componente extremadamente importante del tensor energía-
tensión T. Este componente puede leerse directamente como el 0-momentum (masa relativista,
que es a su vez energía) de un fluído que está fluyendo no en alguna dirección en particular sino
fluyendo en el 0-espacio (el tiempo) como ocurre con un observador que está en reposo en un
diagrama espacio-tiempo de Minkowski. Este, por lo tanto y sin lugar a dudas, es el componente
que nos suministra la densidad de la masa relativista (el equivalente energético de la masa
dividido entre el cuadrado de la velocidad de la luz en conformidad con la relación E =
mc²) simbolizada como ρ, y en un marco de referencia estático nos representa la
cantidad total de masa-energía sumada al combinado total de todos los demás tipos de energía
(electromagnética, calorífica, energía de rotación, etc.).

Si todo lo que tenemos en el marco de referencia para el cual se está especificando el tensor
energía-tensión T es un cuerpo o una colección de partículas (polvo) en absoluto reposo,
entonces el componente T00 será la única entrada en el tensor; todos los demás componentes
serán iguales a cero. Sin embargo, si ponemos dicho cuerpo o dicha colección de partículas en
movimiento en cierta dirección, entonces habrá una transferencia o flujo de masa-energía de un
lugar a otro. Pero es importante tener en cuenta que dicho “movimiento” no se llevará a cabo
simplemente a una velocidad ordinaria V en tres dimensiones, sino que se llevará a cabo a
una 4-velocidad relativista que el tensor energía-tensión de orden dos debe estar preparado
para manejar. Esto nos lleva al verdadero punto de origen del tensor energía-tensión T. Del
mismo modo en que el 4-momentum P unifica los conceptos clásicamente dispares de la energía
y el momentum por medio del 4-vector velocidad U:

P = m0U

no debe sorprendernos que el equivalente requerido para la Relatividad General se base en la


extensión directa de este concepto generalizándolo con el producto tensorial directo del 4-
vector velocidad U consigo mismo, reemplazándose a la masa en reposo (que es también el
equivalente a una energía en reposo en base a la relación E = m0c²) con la densidad de la masa
del conjunto de partículas “flotantes” que constituyen el “polvo”:

T=ρU⊗U

Es recomendable tomarse un poco de tiempo para comparar ambas expresiones antes de seguir
adelante.

En un sistema arbitrario de coordenadas xμ en el cual la 4-velocidad del polvo es U = (Uμ), una


vez identificada la densidad de energía (energía por unidad de volumen) del polvo como ρ
entonces todas las componentes contravariantes posibles del tensor T estarán dadas en notación
de componentes por:

Tμν = ρ Uμ Uν

Es momento de recordar la definición básica de la 4-velocidad, la cual es:

U = (U0, U1, U2, U3) = (γc, γv1, γv2, γv3)

Con esta definición, podemos escribir la definición dimensionalmente correcta del componente
T00:

T00 = ρ U0U0 = ρ (γc)(γc) = γ²c²ρ

Dimensionalmente hablando, esta relación explica el por qué dividiendoT00 entre c² nos
proporciona una densidad de masa (el factor gamma es adimensional).

Habiendo identificado el significado físico de T00, ahora para mayor comprensión haremos aquí
un cambio de coordenadas y utilizaremos las coordenadas Cartesianas rectangulares en lugar de
las coordenadas esféricas con las que comenzamos arriba, con lo cual los componentes del
tensor energía-tensión T que vamos a identificar quedan destacados de la siguiente manera:
Esto significa que haremos:

(E/c, p) = (E/c, p1, p2, p3) = (E/c, px, py, pz)

Hecho este ligero cambio y en base a la definición general que se ha dado arriba procederemos a
identificar a los componentes T0j, para j ≠ 0, los cuales son:

T0j = ρ U0U j = ρ (γc)(γvj) = γ²cρv j

Dimensionalmente hablando, esto nos dice que T0j es el flujo de masa relativista (energía) en la
dirección hacia la cual apunta la velocidad v j. Es así que tenemos a T01 (de color ciano) como
el flujo de masa (energía) a través de la superficie 1 (la superficie perpendicular al eje-x).
Obsérvese que al no ser ambos índices del tensor energía-tensión iguales a la componente
temporal como ocurre con T00 = Ttt, queda liberado uno de los índices para poner las cosas en
movimiento, la situación que antes era estática se vuelve dinámica. Pero en coordenadas
Cartesianas tenemos otras dos coordenadas, de modo tal que podemos identificar al siguiente
componente (también de color ciano), el componente T02, como el flujo de masa (energía) a
través de la superficie 2, (la superficie perpendicular al eje-y), y podemos identificar al
siguiente componente (también de color ciano), el componente T03 como el flujo de masa
(energía) a través de la superficie 3 (la superficie perpendicular al eje-z).

¿Cambiarían en algo estas últimas definiciones si en lugar de coordenadas Cartesianas


hubiéramos utilizado coordenadas esféricas? En nada, ya que en coordenadas esféricas si
especificamos algo como la fijación de uno de los ángulos a un valor determinado estamos
anclando una coordenada angular dejando libres las otras dos coordenadas (la coordenada
radial y la otra coordenada angular), justo lo que necesitamos para definir una superficie en
coordenadas curvilíneas, de modo tal que aquí también tendríamos un flujo de masa (energía) a
través de una 2-superficie:

En general, si utilizamos coordenadas generalizadas, podemos identificar a T0i como el flujo de


masa (energía) a través de la superficie xi (la cual puede ser x1, x2 o x3).

Por último, tenemos que para i ≠ 0 y j ≠0:

Tij = ρUiU j = ρ (γvi)(γvj) = γ²ρvivj

Esto lo podemos interpretar como el i-momentum fluyendo en la j-dirección por unidad de área
por unidad de tiempo atravesando la superficie de j = constante.

PROBLEMA: Demostrar que los componentes

Tij = ρUiU j = ρ (γvi)(γvj) = γ²ρvivj

para i ≠ 0 y j ≠0 del tensor energía-tensión T se pueden interpretar como un flujo de i-


momentum fluyendo por unidad de área por unidad de tiempo a través de una superficie-j.

Los pasos para llegar a esta interpretación se detallan a continuación:


En el primer paso, simplemente multiplicamos y dividimos por un elemento infinitesimal de
tiempo dt y un elemento infinitesimal de la superficie dAj que está siendo atravesada por la
masa (energía) en movimiento. En el segundo paso, el producto de vj y dt nos dá la distancia
infinitesimal recorrida en ese tiempo dt por la masa en movimiento, distancia que multiplicada
por dAj nos dá el elemento infinitesimal de volumen dV:

La densidad de masa ρ la podemos tomar como un elemento infinitesimal de masa


propia dm0 dividida entre un elemento infinitesimal de volumen dV. En el tercer paso,
agrupamos bajo un mismo paréntesis al elemento infinitesimal de masa propia dm0 y a la
velocidad vjformando de este modo el elemento infinitesimal de momentum dPi. Lo que
tenemos a fin de cuentas es un flujo de i-momentum fluyendo a través de la superficie-j.
De este modo, podemos identificar al primer componente diagonal de color café ubicado en
T11 como el 1-momentum fluyendo en la 1-dirección por unidad de área por unidad de tiempo. El
flujo de momentum por unidad de tiempo equivale clásicamente a una fuerza F = d(mv)/dt que
está siendo ejercida por dicho momentum sobre la hipersuperficie 1 = constante. Y siendo ésta
una fuerza por unidad de área, lo cual es ni más ni menos que la presión ejercida por el “polvo”,
se trata precisamente de la presión que está ejerciendo el polvo sobre una superficie
perpendicular a la dirección 1 a lo largo de la cual está fluyendo el polvo (que en este caso
tomamos como el eje-x):

Del mismo modo, identificamos al segundo componente diagonal de color café ubicado en
T22 como el 2-momentum fluyendo en la 2-dirección por unidad de tiempo por unidad de área,
lo cual podemos interpretar también como la presión que ejerce el polvo sobre una superficie
perpendicular a la dirección 2 a lo largo de la cual está fluyendo el polvo (que en este caso
podemos tomar como la superficie perpendicular al eje-y). Y finalmente, identificamos al tercer
componente diagonal de color café ubicado en T33 como el 3-momentum fluyendo en la 3-
dirección, lo cual podemos interpretar también como la presión que ejerce el polvo sobre una
superficie perpendicular a la dirección 3 a lo largo de la cual está fluyendo el polvo (que en este
caso podemos tomar como la superficie perpendicular al eje-z).

Veamos ahora los componentes del tensor energía-tensión T = (Tij) que corresponden a los
bloques de color verde, los componentes “cruzados”. Un término como T12 vendría siendo la
transferencia de 1-momentum en la 2-dirección. ¿Pero cómo puede ser esto posible? se
preguntarán quizá algunos. ¿Cómo es posible que algo que está fluyendo única y exclusivamente
en la dirección del eje-x transfiera algún efecto a una coordenada que le es perpendicular? Una
transferencia de este tipo de una coordenada a otra sólo puede llevarse a cabo a través de algún
tipo de fricción o de viscosidad en el fluído, precisamente el tipo de fenómeno que dió origen a la
creación del concepto matemático del tensor. De allí provienen precisamente las designaciones
para los componentes como σxy y σyz del tensor que nos describe las tensiones mecánicas en el
bloque de hule descrito arriba. De no ser por este tipo de transferencias “cruzadas” de una
coordenada a otra, no necesitaríamos de los tensores.

En cuanto a los componentes del tensor energía-tensión T = (Tij) con j = 0 que corresponden a
los bloques de color rojo, el componente T10 es identificado como el flujo de 1-momentum a
través de una superficie de t = constante, lo cual viene siendo la densidad del momentum a
lo largo de la dirección 1. Obsérvese que hay una diferencia muy sutil en la interpretación
física que se ha dado arriba para T01 (el flujo de la componente de masa-energía del 4-vector
energía-momentum a través de la superficie 1) y la definición que se está dando aquí para T 10.
Esto, desde luego, puede causar consternación después de haberse afirmado que el tensor
energía-tensión es simétrico, lo cual implica necesariamente que T01 = T10. ¿Seguimos hablando
de lo mismo o estamos hablando de dos cosas diferentes? En las aplicaciones prácticas que se
han dado hasta la fecha del tensor energía-tensión T, no se han encontrado aún circunstancias
en las cuales Tij ≠ Tji para i ≠ j ni se han concebido ejemplos en los cuales ocurra tal anomalía.
Sin embargo, esto podría muy bien cambiar con el advenimiento de una Teoría Cuántica de la
Gravedad, y tendría la repercusión inmediata de que los componentes del tensor de
Einstein G tampoco serían simétricos. De hecho, hay miembros respetables de la comunidad
científica que han estado investigando activamente esta posibilidad, aunque aún no nos es
posible “ver” claramente cómo ensamblar las piezas de este rompecabezas que eludió al mismo
Einstein.

Además del término de polvo que usamos arriba para describir a una colección de partículas en
reposo, en la Relatividad General manejamos también el término de fluídocomo “algo que fluye”
sin impedimento mecánico alguno, sin fuerzas de fricción internas entre sus sub-elementos
adyacentes de volumen que obstaculicen el movimiento del fluído en general. Específicamente,
estamos hablando de un fluído perfecto, aquél en el cual no hay rozamientos o viscosidades o
fricciones internas ni transferencias de calor, aquél para el cual todos los términos espaciales
Tij del tensor energía-tensión T en que i ≠ j son iguales a cero. El fluído perfecto es la
generalización del concepto del gas ideal usado en la termodinámica.
Para un fluído perfecto, si no hay transferencias de calor, en el marco de referencia comóvil(el
marco de referencia en el cual el fluído está instantáneamente en reposo) los componentes T0i =
Ti0 del tensor energía-tensión T tendrán un valor de cero, ya que la energía puede fluír de un
lado a otro únicamente si las partículas pueden fluír también. Y en lo que respecta a la ausencia
de viscosidad, esto significa que las fuerzas deben ser siempre perpendiculares a la superficie, lo
cual implica que todos los términos espaciales Tij del tensor energía-tensión Ten que i ≠ j deben
ser iguales a cero, lo cual implica a la vez que T en su representación matricial debe ser una
matriz diagonal. Y puesto que la ausencia de viscosidad es algo que debe ser independiente de
los ejes espaciales de las coordenadas, la matriz debe seguir siendo diagonal para todos los
marcos de referencia comóviles del fluído. La única matriz que puede permanecer diagonal en
todos los marcos de referencia debe ser un múltiplo de la matriz identidad, y por lo tanto todos
sus términos diagonales deben ser iguales. La superficie-x sólo tendrá sobre ella una fuerza que
viene del eje-x, y lo mismo se puede decir para las otras dos superficies. Estas fuerzas por
unidad de área que deben ser todas iguales en un fluído perfecto es lo que llamamos la presión.
De este modo, tenemos que para las componentes espaciales del tensor T se debe tener
Tij = pδij en donde p es la presión y δij es el tensor delta Kronecker.

Y así, de acuerdo con lo que hemos visto, un fluído perfecto (visto desde un marco de referencia
en reposo, sin fricción alguna, bajo una métrica Lorentziana) tendrá el siguiente tensor energía-
tensión (se ha dado aquí a la velocidad de la luz cuyo cuadrado divide a las componentes p el
valor de uno con el fin de simplificar la escritura de la matriz):

en donde ρ es la densidad de masa (energía) del fluído (el componente T00 en este caso) en
kilogramos por metro cúbico y p es la presión ejercida por el fluído en la dirección especificada
(los componentes T11, T22 y T33) en newtons por metro cuadrado. No es difícil verificar que si el
fluído está en movimiento a una 4-velocidad U = (Uμ) en donde Uμ = dxμ/dτ con respecto a otro
marco de referencia, los componentes del tensor energía-tensión se pueden escribir
tensorialmente en notación de componentes de la siguiente manera:

Tab = (ρ + p/c²) UaUb + p gab


siendo g = (gab) el tensor métrico del espacio-tiempo que estamos considerando como
Lorentziano bajo la métrica:

g00 = - c²____g11 = g22 = g33 = 1

gij = 0____para i ≠ j

A modo de ejemplo, en un marco de referencia comóvil, el único componente de la 4-velocidad


que no es cero es el componente temporal, con lo cual U0U0 = (1)(1) = 1 y para a= b= 0 tenemos:

T00 = (ρ + p/c²) U0U0 + p g00 = ρ

En notación tensorial más compacta, la fórmula se puede escribir de la siguiente manera:

T = (ρ + p/c²) U⊗U + g-1

Un fluído con términos de viscosidad o elementos anómalos agregaría términos “cruzados” a la


fórmula, lo cual no es deseable a menos de que haya una buena razón para ello.

Hemos escogido representar aquí a los componentes del tensor energía-tensión T como los
componentes de un tensor contravariante de orden dos, pero igualmente podríamos haber
escogido una representación covariante T = (Tab) para los mismos, estamos en completa libertad
de hacerlo siempre y cuando en las operaciones tensoriales acomodemos los índices de modo tal
que las operaciones tensoriales (tales como la contracción ocasionada por los índices repetidos
de acuerdo a la convención de sumación y la derivada covariante de algún tensor o tensores) se
sigan llevando a cabo como se deben llevar a cabo. Así, lo que aquí menos llamado T 00 en otros
libros y publicaciones será llamado T00 o inclusive T11 si se escoge numerar los índices de las
coordenadas generalizadas a partir de uno en lugar de a partir de cero, porque en la Teoría de la
Relatividad todo es relativo, inclusive ésto.

PROBLEMA: ¿Cuál será la representación del tensor relativista energía-tensión a escala


astronómica para un fluído no relativista como una nebulosa o una estrella de secuencia
principal?

En un fluido no relativista como una nebulosa o una estrella de la secuencia principal, todos los
componentes del tensor de energía-tensión son nulos o de muy poca importancia, salvo el
elemento T00 que corresponde a la densidad de masa-energía y que es el único que contribuye
sensiblemente a la atracción gravitatoria y a la curvatura del espacio-tiempo. Naturalmente, si
queremos medir la contracción de volumen producida por la masa-energía presente en una
determinada región, tenemos que aplicar las ecuaciones de campo dadas por la fórmula
tensorial fundamental de la Relatividad General.

PROBLEMA: Demuéstrese que si el tensor energía-tensión T representa la energía-


momentum de un fluído perfecto, entonces dicho tensor puede ser utilizado para expresar la
ley de la conservación de la energía y el momentum. (No es necesario recurrir a la derivada
covariante para resolver este problema).

Considérese el siguiente corte seccional de un elemento cúbico de lados L del fluído a lo largo
del plano-z (estamos considerando únicamente a los componentes espaciales del tensor):

Supondremos que el flujo de energía se puede llevar a cabo a través de cualquiera de los lados
del cubo. Tómese por ejemplo la cara d del cubo, de color azul. La razón del flujo de energía a
través del área L² dicha cara es:

L²T0x (en x = 0)
Del mismo modo, la razón del flujo de energía a través del área L² de la cara opuesta del cubo, la
cara b, debe ser:

- L²T0x (en x = L)

Este término tiene un signo negativo puesto que representa energía fluyendo fuera del volumen
del cubo, mientras que el término anterior tiene un signo positivo puesto que representa energía
fluyendo hacia adentro del volumen del cubo.

El flujo neto de energía en el sentido del eje-x será igual a la suma de los dos términos
anteriores, o sea:

L²T0x (en x = 0) - L²T0x (en x = L)

Esto a su vez debe ser igual a la contribución a lo largo del eje-x a la razón de aumento (o
disminución) de energía en el interior del cubo, o sea:

∂(L3T00)/∂t

Del mismo modo, para la cara a del cubo, de color rojo, la razón del flujo de energía a través del
área L² dicha cara es:

L²T0y (en y = 0)

y la razón del flujo de energía a través del área L² de la cara opuesta, la cara c, debe ser:

- L²T0y (en y = L)

Enunciados similares aplican al flujo de energía en las caras del cubo situadas en el plano-z.

Sumando todas las contribuciones de flujo de energía al interior del volumen del cubo que
aumentarán (o disminuirán) la densidad de energía del cubo, tenemos:

∂(L3T00)/∂t = _____________
L²T0x (en x = 0) - L²T0x (en x = L)
+ L²T0y (en y = 0) - L²T0y (en y = L)
+ L²T0z (en z = 0) - L²T0z (en z = L)
A continuación, podemos dividir todo entre L3 y tomar el límite L → 0. Al hacer esto, podemos
aplicar la definición de la derivada ordinaria (¡no es necesaria aquí la derivada covariante puesto
que estamos trabajando en el marco de referencia comóvil!):

Con esto, la expresión se nos reduce a:

Podemos escribir esto de una manera más compacta usando la notación de la coma y pasando
todo del lado izquierdo:

T00,0 + T0x,x + T0y,y + T0z,z = 0

Añlicando la convención de sumación para índices repetidos, esto se reduce a:

T0j, j = 0

Esta es precisamente la ley de la conservación de la energía.

Del mismo modo, repitiendo los mismos pasos, encontramos que el momentum también debe
ser conservado. La única diferencia es que el índice 0 debe ser cambiado a cualquier coordenada
espacial que corresponda al componente del momentum que debe ser conservado. La ley
general para la conservación de la energía-momentum del tensor energía-tensión T debe ser por
lo tanto:

Tαβ, β = 0

Esto que acabamos de derivar es válido para un espacio-tiempo plano, Lorentziano, o sea en el
ámbito de la Teoría Especial de la Relatividad. Si queremos que el resultado sea válido para un
espacio-tiempo curvo, o sea en el ámbito de la Relatividad General, la coma debe ser
reemplazada por un semicolon, lo cual significa que la diferenciación ordinaria debe ser
reemplazada por una diferenciación covariante.

PROBLEMA: Usando la relación Tαβ, β = 0, demuéstrese que para un sistema acotado en el


cual T = (Tαβ) = 0 afuera de cierta región acotada de espacio:

Sobreentendiéndose que la integral es una integral triple llevada a cabo sobre un 3-volumen,
usaremos a nuestro favor la simetría del tensor métrico, con lo cual T0α, α = Tα0, α y:

Se ha utilizado en el último paso la identidad Tαβ, β = 0 haciendo β = 0.

Algo que resulta ser de extrema utilidad al estar manejando tensorialmente asuntos que tienen
que ver con la conservación de ciertos parámetros físicos es el hecho de que el teorema de
Gauss, extendido al 4-espacio relativista, nos permite convertir leyes diferenciales (que
involucran derivadas) de conservación en leyes integrales de conservación. Con el fin de dejar
esto aclarado, utilizaremos como referencia el 4-vector posición relativista definido de la
siguiente manera (con los índices corriendo de 1 a 4 en vez de correr de 0 a 3):

(x1, x2, x3, x4) = (ct, x, y, z)

y desarrollaremos unos resultados trabajando primero sobre un 4-vector general T = (Tμ), el


cual puede representar cualquier cantidad, y tras esto sobre un 4-tensor de orden dos Q = (Qμν)
que extiende de modo natural el resultado obtenido para el 4-vector T.

PROBLEMA: Demostrar que si un 4-vector T = (Tμ) satisface la relación:

o bien:

y si los componentes de Tμ son diferentes de cero en una región espacial finita, entonces la
integral sobre un 3-espacio (tomando dentro del integrando a la primera componente -la
componente temporal- del vector T):

es una invariante.

La demostración de este teorema requiere el empleo del teorema de Gauss generalizado hacia
un 4-espacio, en donde una integral de volumen es equivalente a una integral llevada a cabo
sobre una superficie que encierra a dicho volumen:

siendo dSμ un elemento infinitesimal de una 3-superficie que encierra un 4-volumen, con lo cual
la integral puesta en el lado izquierdo de esta fórmula es una integral cuádruplemientras que la
integral en el lado derecho de la fórmula es una integral triple que se debe llevar a cabo sobre
una 3-superficie cerrada. A continuación tenemos una “rebanada” del 4-volumen sobre el cual
se deben llevar a cabo las integraciones (hay otros dos diagramas espacio-tiempo que se pueden
construír para x2 y x3):
En este diagrama espacio-tiempo de Minkowski en el cual los ejes verticales son los ejes
temporales, las hipersuperficies A y C son seleccionadas de modo tal que los componentes
(espaciales) de Tμ se desvanecen en A y en C (obsérvese que las normales a las superficies A y C
son perpendiculares al eje temporal x1). Esto siempre es posible porque se supone que la región
sobre la cual los componentes de Tμ son diferentes de cero es de extensión finita. La superficie B
es seleccionada de modo tal que sea perpendicular al eje-x1 (obsérvese que la normal dS1 es
paralela a x1) mientras que la superficie D es seleccionada de modo tal que sea normal
(perpendicular) al eje-x1 (aunque no lo parece, esto debe ser obvio tomando en cuenta la forma
en la cual se construyen los diagramas de Minkowski para el sistema de referencia S’ que se
supone en movimiento). Aquí los xμ y los xμ son coordenadas en dos marcos de referencia
inerciales (Lorentzianos) arbitrarios. Haciendo uso del hecho de que TμdSμ es un escalar
(teniendo por lo tanto el mismo valor en todos los marcos inerciales de referencia), el lado
derecho del teorema de Gauss como está enunciado arriba nos permite afirmar que:

∫∫∫T1 dS1 + ∫∫∫ T1 dS1 = 0

∫∫∫T1 dS1 = - ∫∫∫ T1 dS1

y puesto que:

dS1 = - d3x___dS1 = d3x ___(con signos diferentes, véase el diagrama de arriba)


se deduce entonces que:

∫∫∫T1 d3x = ∫∫∫ T1 d3x

y por lo tanto

∫∫∫T1 d3x

es una invariante.

El argumento utilizado para llevar a cabo esta demostración también nos sirve para confirmar
que la integral I es una constante en el tiempo; sólo basta considerar el límite en el que ambos
marcos inerciales de referencia son idénticos (S = S’) de modo tal que x1coincida con
x1 y x2 coincida con x2.

Ahora generalizaremos el resultado anterior de un vector a un tensor de orden dos. Supóngase


que tenemos un 4-tensor de orden dos Q = (Qμν) que satisface la condición:

Sea también A = (Aμ) un 4-vector cuyos coeficientes no varían con respecto a su posición en el
espacio-tiempo (tomémoslos como meras constantes numéricas). Entonces AQ = AνQμν = (Tμ)
= T debe satisfacer la relación:

y por lo tanto:

debe ser una invariante por el resultado que obtuvimos en el problema anterior. Sin embargo,
recurriendo a la convención de sumación para índices repetidos, podemos escribir:

I = AμBμ
en donde:

Se sigue entonces de la ley del cociente para tensores (la cual nos dice que si B es un tensor
cualquiera y si el producto XB nos produce otro tensor C, o sea XB = C, entonces la
cantidad X es también un tensor) que si AμBμ es una invariante para un Aμ arbitrario
(recuérdese que lo hemos definido como un 4-vector cuyas componentes no varían con respecto
a su posición en el espacio-tiempo, siendo meras constantes numéricas), entonces Bμ se debe de
transformar como un 4-vector (constante en el tiempo). En pocas palabras:

∫∫∫Qμ d3x

es una invariante.

Los dos resultados que hemos obtenido, tanto para un 4-vector como para un 4-tensor de orden
dos, son los que nos permiten convertir leyes diferenciales de conservación en
leyes integrales de conservación.

Un ejemplo de la aplicación de lo que hemos obtenido consiste en demostrar que a partir de la


ley de la conservación para la carga eléctrica, ∂μJμ = 0, se encuentra que la carga total contenida
en cierta región es a la vez constante en el tiempo e invariante para todos los marcos de
referencia.

PROBLEMA: Demostrar que la ley de la conservación de la carga eléctrica, escrita en forma


diferencial:

∂μJμ = 0

implica el resultado de que la carga total contenida en cierta región es a la vez constante en el
tiempo e invariante para todos los marcos de referencia.

La expresión ∂μJμ = 0 es una ley diferencial de conservación. Usando los resultados anteriores y
tomando en cuenta que de acuerdo a la electrodinámica el componente temporal del 4-
vector J es igual a J1 = cρ en donde ρ es la densidad de la carga eléctrica (carga por unidad de
volumen), podemos escribir la ley integral de conservación de la siguiente manera:

Una vez expresada de esta manera la ley integral de conservación de la carga eléctrica, la
conclusión es inmediata: la carga eléctrica es constante en el tiempo y es una invariante para
todos los marcos de referencia.

En este último problema hemos dado un salto breve hacia el tema de la electrodinámica
relativista (el cual trataremos más a fondo en entradas posteriores) con el fin de que el lector se
vaya acostumbrando y se vaya familiarizando con el tratamiento tensorial de casi todo lo que
tiene que ver con los temas fundamentales de la física.

El tensor energía-tensión que hemos estudiado aquí es uno que tiene que ver con la materia
como fuente primaria de masa-energía para provocar una curvatura del espacio-tiempo. Pero no
es la única fuente para producir tal cosa. Posteriormente estudiaremos otro tensor, el tensor
electromagnético energía-tensión, en el cual la energía es la contenida en un campo
electromagnético. Cualquier fuente de energía, trátese de energía nuclear, energía solar, lo que
sea, todo ello tendrá su propio tensor energía-tensión, y el efecto total combinado sumado
tensorialmente (componente a componente) será lo que producirá la curvatura geométrica del
espacio-tiempo. Esto significa que el tensor T en las ecuaciones de campo de la Relatividad
General es en realidad una suma de tensores, todos ellos expresados necesariamente en el
mismo sistema de coordenadas (y desde luego en el mismo sistema de unidades), de modo tal
que las ecuaciones de campo de la Relatividad General son realmente:

G = 8πG (T1 + T2 + T3 + ...)

Sin embargo, y para fines prácticos, podemos limitarnos a trabajar con el tensor que hemos
estudiado aquí, porque es el único que a fin de cuentas produce una curvatura apreciable que
puede ser confirmada a través de las observaciones astronómicas.

Electrodinámica relativista I
Aunque este tema correponde más bien a la Teoría Especial de la Relatividad que a la
Relatividad General, se ha puesto aquí siguiendo no sólo la metodología pedagógica que
indica que los temas deben ser puestos en orden ascendente de dificultad sino tomando en
cuenta el hecho de que el tratamiento del tema requiere de un conocimiento previo del análisis
tensorial que no se acostumbra dar en un curso introductorio de la Teoría Especial de la
Relatividad pero que es mandatorio antes de entrar de lleno en el tema de la Relatividad
General. Este tema requiere de cierta familiaridad con las nociones básicas del
electromagnetismo.

Antes de que hubiera una Teoría de la Relatividad, ya había una teoría matemática del
electromagnetismo en la cual se inspiró Einstein, a grado tal que su primera publicación se
tituló “Sobre la electrodinámica de los cuerpos en movimiento”. Estudiar los orígenes de las
ideas de Einstein invariablemente lleva a cualquiera a estudiar los tratados del matemático
James Clerk Maxwell basadas en la tesis de que en los fenómenos electromagnéticos lo que
importa es el movimiento relativo de las cargas eléctricas y los campos eléctricos en
movimiento.

Empezaremos con el estudio de una señal viajera que en cierto instante de tiempo podemos
visualizar como estacionaria con la siguiente forma de onda que corresponde a una onda
senoidal alternando entre valores positivos y negativos:

La ecuación que nos describe una onda de este tipo cuya amplitud (que puede ser la amplitud de
un campo eléctrico E o de un campo magnético B) es A es la siguiente:

y(x) = A sen(kx)
en donde k es una constante numérica conocida como la constante de propagación cuya única
función es “estirar” o “comprimir” la onda senoidal horizontalmente.

Si queremos poner a la onda estacionaria de arriba en movimiento, basta con modificar la


expresión agregando la variable tiempo t de la siguiente manera:

y(x) = A sen(kx - ωt)

en donde ω es otra constante numérica cuya función es fijar la velocidad a la cual se está
desplazando la señal hacia la derecha (si queremos que la señal se desplace hacia la izquierda al
ir aumentando el valor de t en el sentido positivo, reemplazamos el signo negativo con un signo
positivo).

La ecuación anterior es válida en una sola dimensión medida a lo largo del eje-x. Pero si
queremos describir una onda senoidal viajando en un espacio tri-dimensional Cartesiano,
reemplazamos a la variable x por el vector posición x = (x1,x2,x3) multiplicado en producto
escalar vectorial por el vector de propagación k = (k1,k2,k3) de modo tal que:

k · x = (k1,k2,k3) · (x1,x2,x3) = k1x1 + k2x2 + k3x3

De este modo, llegamos a la siguiente ecuación de onda en donde haremos un ligero cambio de
notación para denotar la amplitud instantánea como φ y la amplitud máxima como φ 0:

φ(x) = φ0 sen(k · x - ωt)

Otra ecuación igualmente válida es la siguiente en la cual usamos la función cosenoidal en lugar
de la función senoidal:

φ(x) = φ0 cos(k · x - ωt)

Usando la ecuación de Euler:

eiθ = cos θ + i sen θ

podemos escribir:

φ = φ0 exp i(k · x - ωt)


Esta es la ecuación general de una onda viajera plana de amplitud φ0 medida por un observador
en reposo. Esperamos que, desde la perspectiva de la Teoría de la Relatividad, la ecuación de
esta onda viajera para otro observador en movimiento relativo con respecto al observador en
reposo, tenga la misma forma (invariante):

φ’ = φ0 exp i(k’ · x’ - ωt’)

La onda plana debe seguir siendo plana porque la transformación del marco de referencia S al
marco de referencia S’ es una transformación linear (transformación de Lorentez).

A continuación llevaremos a cabo la construcción de un 4-vector que llamaremos K, un 4-vector


de propagación que añadiremos a nuestra lista de 4-vectores. Para ello, escribiremos los
“factores de fase” de las ondas φ y φ’ de la siguiente manera como el producto vectorial escalar
de dos vectores de dos componentes cada uno:

k · x - ωt = k · x + (iω/c)(ict)

k · x - ωt = (k, iω/c) · (x, ict)

k · x - ωt = K · X

y del mismo modo:

k’ · x’ - ωt = (k’, iω/c) · (x’, ict) = K’ · X’

Ahora bien, habiendo hecho x4 = ict, con lo cual:

X = (x, x4) = (x1, x2, x3, x4)

no nos debe quedar ninguna duda de que este es un 4-vector posición, y de que el producto
escalar K · X es una invariante, o sea:

K’ · X’ = K · X

Se concluye que K es un 4-vector de propagación cuyas componentes espaciales son las mismas
de k y cuya cuarta componente, la componente temporal, es iω/c. Siendo así, las cuatro
componentes del 4-vector K se deben transformar de manera idéntica a como se transforman
las componentes del 4-vector posición X. Esta similitud nos permite obtener las ecuaciones de
transformación del 4-vector K para pasarlo de un sistema de referencia S a otro sistema de
referencia S’. Haciendo una comparación con la fórmula para la componente temporal t’ que
obtuvimos en la entrada previa “Rotaciones y transformaciones” para la transformación
generalizada de Lorentz:

puesto que t en esta fórmula se corresponde con ω/c² y puesto que x se corresponde con k,
tenemos entonces el siguiente resultado:

Si la velocidad del marco de referencia S’ con respecto al marco de referencia S es v, y si θ es el


ángulo entre los 3-vectores k y v, entonces con k = ω/c² obtenemos la siguiente expresión que
nos proporciona la frecuencia de la onda electromagnética en el sistema S’:

ω’ = γω [1 - (v/c) cos θ]

que podemos escribir de la siguiente manera:

Esta, desde luego, es la fórmula para el desplazamiento Doppler relativista.

Ahora bien, para una “nube de carga eléctrica”, en un sistema de referencia S en donde la carga
eléctrica está en reposo, un elemento infinitesimal de carga eléctrica dq está dado por el
producto de la densidad de carga eléctrica ρ0 y un elemento infinitesimal de volumen:

dq = ρ0 dV

Si bajo un esquema relativista la carga eléctrica es algo que debe ser conservado, entonces la
carga eléctrica dq, vista desde un sistema de referencia S’ en movimiento, debe permanecer
invariable, esto es:

dq = ρ0 dV = ρ0 dV’ = dq’

en donde:

dV = dx1 dx2 dx3__en S

dV’ = dx’1 dx’2 dx’3__en S’

Si S’ se mueve a lo largo del eje-x1 de S con una velocidad V, entonces dx’2 = dx2 y dx’3 = dx3,
pero dx’1 experimentará una contracción relativista de longitud igual a:

dx’1 = dx1√1 - V²/c²

Entonces:

ρ0 dV = ρ dV’ = ρ dx’1 dx’2 dx’3 = ρ dx1 dx2 dx3√1 - V²/c²

ρ0 dV = = ρ dV √1 - V²/c²

Esto se traduce en una variación de la densidad de carga eléctrica por unidad de volumen de
acuerdo con la relación:

ρ = ρ0 /√1 - V²/c²

De este modo, la densidad de carga eléctrica ρ de un sistema en movimiento está relacionada


con la densidad de carga local ρ0 de la misma manera en que la masa y la masa propia están
relacionadas. La ley de la conservación de la carga eléctrica se sigue aplicando a la carga
total pero no a la densidad de carga eléctrica.

Clásicamente, en el 3-espacio Euclideano, la densidad de corriente eléctrica J es simplemente la


cantidad de carga por unidad de tiempo que está atravesando una superficie en un momento
dado:
En la figura de arriba, una corriente eléctrica de 4 amperes está circulando a través de un
conductor cuyo tramo inicial tiene una superficie transversal S 1 igual a 4 centímetros, la cual se
reduce a una superficie transversal S2 igual a 1 centímetro cuadrado. Obviamente, la densidad
de corriente eléctrica es cuatro veces mayor en el segundo tramo del conductor que en el
primero, esto es precisamente lo que nos mide el J tridimensional. La corriente de carga
eléctrica I que está atravesando una superficie está dada por la siguiente definición vectorial:

siendo n un vector unitario normal a la superficie que está siendo atravesada por la corriente y
siendo J = (Jx, Jy, Jz). Por su parte, el 4-vector densidad de corriente J = (Jμ) está definido como
se ha indicado arriba, siendo ρ la densidad de carga eléctrica de modo tal que la carga
infinitesimal dQ en un volumen pequeño está dada por ρd 3x, o bien, para la carga completa
encerrada en un 3-volumen Euclideano:

Q = ∫∫∫ ρ dx dy dz

Resulta obvio que en la teoría relativista la densidad de corriente eléctrica J y la densidad de


carga eléctrica ρ no pueden ser entidades físicas independientes puesto que una carga eléctrica
que permanece estática en un sistema de referencia en reposo S se nos convertirá en una
distribución de corriente eléctrica en un marco de referencia móvil. Esto nos proporciona la
justificación que necesitamos para juntar la densidad de corriente eléctrica Jy la densidad de
carga eléctrica ρ en un 4-vector J de la siguiente manera:

J = (cρ, J)

J = (cρ, ρu)

J = (cρ0 /√1 - V²/c², uρ0 /√1 - V²/c²)

J = ρ0 (c /√1 - V²/c², uρ0 /√1 - V²/c²)

J = ρ0 (γc, γu)

Aquí podemos reconocer casi de inmediato lo que tenemos entre los paréntesis. Es el 4-vector
velocidad U que ya habíamos visto con anterioridad al introducir el tema de los 4-vectores. Es
así como llegamos al siguiente resultado básico:

J = ρ0 U

Puesto que ρ0, la densidad de carga eléctrica local medida en el sistema de referencia en reposo
S, es una invariante escalar, y U es un 4-vector, el 4-vector velocidad, J debe poseer las mismas
propiedades de transformación de U y por lo tanto también es un 4-vector.

Ya se ha mencionado con anterioridad cómo para desarrollar la Teoría Especial de la Relatividad


Einstein se inspiró en la teoría del electromagnetismo de Maxwell, en la cual tampoco hay
observadores privilegiados capaces de poder detectar el movimiento absoluto. Siendo así, no nos
debe extrañar el que las ecuaciones de campo del electromagnetismo son invariantes
bajo las transformaciones de Lorentz.

En la electrodinámica clásica, tanto el vector del campo eléctrico E = (E1,E2,E3) como el vector
del campo magnético B = (B1,B2,B3) no son 4-vectores, constan de tres componentes. Sin
embargo, las seis componentes E1, E2, E3, B1, B2 y B3 pueden ser utilizadas para definir un tensor
antisimétrico como lo veremos a continuación. En el procedimiento, utilizaremos la convención:

(x1, x2, x3, x4) = (ct, x, y, z)


PROBLEMA: Se puede definir un tensor antisimétrico F = (Fμν) mediante las siguientes
relaciones:

F1i = - Ei __(i = 2, 3, 4)

F24 = B2___F32 = B3___F43 = B1

Encontrar todas las demás componentes a partir de estas relaciones y acomodarlas en un


arreglo matricial.

Puesto que F es un tensor antisimétrico, entonces todos los elementos en la diagonal principal
de la matriz deben ser iguales a cero:

F11 = F22 = F33 = F44 = 0

Por otro lado, puesto que F1i = - Ei para i = 2, 3, 4:

F12 = - E1___F13 = - E2___F14 = - E3

y en virtud de la antisimetría:

F21 = E1___F31 = E2___F41 = E3

Más aún:

F24 = B2___F32 = B3___F43 = B1

y en virtud de la antisimetría:

F42 = - B2___F23 = - B3___F34 = - B1

Tenemos todos los elementos que necesitamos para acomodarlos en la siguiente matriz:
Este tensor es mejor conocido como el tensor de Faraday, y logra unifica en un 4-espacio las
tres componentes del vector campo eléctrico E con las tres componentes del vector campo
magnético B.

Si en vez de utilizar sub-índices numéricos para representar los componentes alineados con las
coordenadas generalizadas de los componentes de E y B utilizamos lo que realmente significan
dichos sub-índices en coordenadas Cartesianas (rectangulares) entonces el tensor de Faraday
que tenemos arriba, un tensor contravariante de orden dos, se puede escribir del siguiente modo
menos confuso:

Es importante tomar nota de lo siguiente: los sub-índices numéricos empleados para distinguir
las componentes de E y de B no se corresponden directamente con los índices numéricos
empleados para distinguir los 16 componentes del tensor de Faraday.

Una cosa que suele sorprender a algunos principiantes en el tema de la Relatividad General es
que el tensor métrico g, muy característico de la métrica que describe la curvatura del espacio-
tiempo en un 4-espacio relativista, pueda ser utilizado también para subir los índices de los
componentes de un tensor electromagnético, tomando en cuenta el hecho de que el
electromagnetismo y la gravedad son dos fenómenos físicos diferentes. No lleva mucho tiempo
adaptarse a esta nueva idea siempre y cuando nos mantengamos en el ámbito de la Teoría
Especial de la Relatividad, llevándonos a sospechar eventualmente que el campo
electromagnético y el campo gravitacional tal vez puedan ser unificados bajo un solo esquema
matemático, y de hecho esto sucedió como lo demuestró el trabajo de Kaluza-Klein al respecto.
Aceptando esto como un hecho, podemos utilizar al tensor métrico g del espacio-tiempo plano
de la Teoría Especial de la Relatividad para bajar ambos índices del tensor de Faraday dado
arriba. Podemos obtener el tensor de Faraday con dos índices covariantes bajando cada índice
del tensor de Faraday que se acaba de dar arriba con la ayuda del tensor métrico g = (gαβ) que
corresponde al elemento de línea propio de un 4-espacio Lorentziano en donde hacemos c = 1
para fines de simplificación:

la operación del descenso de los dos índices se puede representar de la siguiente manera:

Fαβ = gαγ Fγδ gδβ

La ecuación anterior es una ecuación tensorial en notación de componentes que requiere llevar a
cabo una doble sumatoria sobre los índices repetidos. El cómputo se puede facilitar si en lugar
de la ecuación tensorial utilizamos la ecuación matricial correspondiente:

Podemos multiplicar las dos primeras matrices y multiplicar el producto resultante por la
tercera matriz, o podemos multiplicar las últimas dos matrices y multiplicer el producto
resultante por la primera matriz, el resultado será el mismo en virtud de la propiedad asociativa
de la multiplicación de matrices. Multiplicando la segunda matriz por la tercera matriz
obtenemos lo siguiente:
A continuación pre-multiplicamos esta matriz por la primera matriz para así obtener los
componentes del tensor de Faraday en su representación tensorial covariante:

Este es el tensor de Faraday en su representación como un tensor covariante:

Resulta obvio que los elementos de Fαβ se pueden obtener a partir de los elementos de Fαβcon la
simple inversión de los signos de los componentes de E, o sea sustituyendo E por -E.

Al igual que como lo hicimos arriba, podemos representar los componentes de los
campos E y B mediante notación Cartesiana que nos puede ahorrar equivocaciones y
confusiones:

Otra variante del tensor de Faraday que resulta extremadamente útil es el tensor dual de
fuerza del campo electromagnético o simplemente el tensor de fuerza del campo
electromagnético, para cuya obtención definimos primero el siguiente tensor (o mejor
dicho, pseudotensor) ε = (εαβγδ) de orden cuatro totalmente antisimétrico:

εαβγδ = + 1 para α = 1, β = 2, γ = 3 y δ = 4 o cualquier permutación par de índices

εαβγδ = - 1 para cualquier permutación impar de índices

εαβγδ = 0 si dos índices son iguales

Con esta definición, y llevando a cabo las sumatorias para la evaluación de componentes
individuales, obtenemos el siguiente tensor de fuerza del campo electromagnético:
Comparando este tensor con el tensor Fαβ, podemos ver que lo podemos obtener de Fαβhaciendo
los cambios E → B y B → - E en Fαβ .

De este modo, al igual que como ocurre con la Teoría Especial de la Relatividad en la cual el
espacio y el tiempo son unificados bajo un solo concepto en un espacio-tiempo cuatri-
dimensional como un vector que incluye los componentes de ambos, en el electromagnetismo de
Maxwell el campo elétrico y el campo magnético también pueden ser unificados bajo el tensor
de orden dos conocido como el tensor de Faraday en donde B = (Bx,By,Bz) es la
parte magnética del campo electromagnético expresada en sus tres componentes espaciales
Cartesianas, y E = (Ex,Ey,Ez) es la parte eléctrica del mismo campo electromagnético.

¿Podemos recuperar las ecuaciones del electromagnetismo de Maxwell a partir del tensor de
Faraday? La respuesta es afirmativa, pero para ello necesitamos de la ayuda de dos ecuaciones
diferenciales adicionales, siendo la primera de ellas la siguiente:

En notación de la coma utilizada para simbolizar derivadas, esta ecuación se escribe de la


manera siguiente (aquí no empleamos a la derivada covariante simbolizada con el semicolon
puesto que todo lo que está siendo desarrollado aquí pertenece al campo de la Teoría Especial de
la Relatividad):

PROBLEMA: Demuéstrese que la ecuación que se acaba de proporcionar nos conduce


directamente al principio de la conservación de la carga eléctrica Jμ,μ= 0.

Escribiendo la relación con un ligero cambio de notación, en su forma explícita:

La condición matemática para la conservación de la carga eléctrica, J μ,μ= 0, requiere que


tomemos la derivada con respecto xμ, lo cual en conformidad con la convención para índices
repetidos activa la sumación de términos. Tomando, pues, la derivada con respecto a x μ en
ambos lados de la ecuación:

Sin embargo, el tensor de Faraday F = (Fαβ) es antisimétrico, o sea que Fμν = - Fνμ, lo cual implica
a su vez que:

en donde hemos invertido también el orden de la diferenciación dado que en la diferenciación


ordinaria (a diferencia de lo que ocurre con la derivada covariante) el orden de la diferenciación
no altera el resultado final. Pero en el lado derecho de la ecuación los índices que tenemos son
índices monigote, los cuales podemos renombrar como δ, λ, ξ, lo que queramos, siempre y
cuando mantengamos la misma forma. Aquí simplemente cambiaremos μ por ν y viceversa:

Lo que tenemos entonces es una expresión del tipo a = -a. Pero ninguna cantidad puede ser
igual al negativo de la misma, a menos de que esta sea cero. Se concluye que el lado izquierdo de
la expresión debe ser igual a cero, dejándonos únicamente con:

Jμ,μ = 0

que es la condición para la conservación de la carga eléctrica.

PROBLEMA: Obtener la primera ley del electromagnetismo de Maxwell, ∇·E = 4πρ, a


partir del tensor de Faraday.

Empezamos con la relación dada arriba, escrita en su forma más explícita:


Poniendo β = 1 en la expresión y desarrollando la sumatoria de acuerdo a la convención de
sumación para índices repetidos, tenemos lo siguiente:

Puesto que F11 = 0, se ha puesto de color rojo el primer término, con lo cual sólo nos quedan tres
términos en el lado izquierdo de la ecuación. Para mayor claridad, se harán de lado las
coordenadas generalizadas y se escribirán los componentes del tensor de Faraday en función de
las coordenadas rectangulares Cartesianas regulares. Substituyendo los valores del tensor de
Faraday de conformidad con lo que tenemos arriba:

Se ha subsituído el valor correspondiente al primer componente J1 en el 4-vector J = (Jβ) que


como se definió arriba es igual a cρ. No nos lleva mucho tiempo identificar lo que tenemos en el
lado izquierdo de la ecuación; se trata de la divergencia del vector de campo eléctrico E.
Entonces lo anterior se puede simplificar y escribir como:

∇·E = 4πρ

Esta es precisamente la primera ley de Maxwell que nos describe la divergencia de las líneas de
fuerza del campo eléctrico E para una carga eléctrica puesta dentro de una superficie cerrada.

PROBLEMA: Obtener la ley de Maxwell:

a partir del tensor de Faraday.

Usaremos la misma ecuación diferencial utilizada en el problema anterior, esta vez poniendo β =
2, β = 3 y β = 4. Empezaremos con β = 2:
Puesto que F22 = 0, se ha puesto de color rojo el segundo término, con lo cual sólo nos quedan
tres términos en el lado izquierdo de la ecuación. Nuevamente, para mayor claridad, se harán de
lado las coordenadas generalizadas y se escribirán los componentes del tensor de Faraday en
función de las coordenadas rectangulares Cartesianas regulares. Substituyendo los valores del
tensor de Faraday de conformidad con lo que tenemos arriba:

Reacomodando, tenemos nuestra primera relación:

Procediendo de la misma manera, obtenemos para β = 3:

Finalmente, para β = 4, obtenemos:


Pero las tres relaciones obtenidas se pueden simplificar metiéndolas en una sola con la ayuda
del operador rotacional que consiste en tomar el producto cruz del operador diferencial
vectorial ∇ con el campo magnético y utilizar las relaciones en el orden requerido para obtener la
ecuación de Maxwell pedida. A partir de su definición, el vector rotacional definido sobre un
vector A en función de sus tres componentes espaciales es obtenido mediante el siguiente
determinante:

Haciendo esto obtenemos la ley de Maxwell pedida al principio del problema.

Nos faltan otras dos ecuaciones de Maxwell que aún no hemos obtenido a partir del tensor de
Faraday. Para obtenerlas, necesitamos una segunda ecuación diferencial que es la siguiente en
función del tensor dual de fuerza del campo electromagnético (se muestran tanto la
representación compacta como la representación explícita):

Esta ecuación ciertamente es lo más compacto que pueda haber resumiendo una gran cantidad
de información en unos cuantos símbolos. Sin embargo, podemos obtener lo mismo mediante
otra ecuación en la cual utilizamos el tensor de Faraday covariante de dos, la cual se encuentra
con mayor frecuencia en los libros de texto:
En notación explícita la misma fórmula se escribe de la siguiente manera:

Y en notación de componentes recurriendo a la coma para representar la derivada parcial, la


fórmula toma el siguiente aspecto:

PROBLEMA: A partir del tensor de Faraday, obténgase la ley de Maxwell que afirma que la
divergencia vectorial de un campo magnético cualquiera es igual a cero.

Para esta demostración utilizaremos los índices espaciales del tensor de Faraday, evitando el uso
del índice temporal (el índice 1). Haciendo α =2, β = 3 y γ = 4, cualquiera de las últimas tres
ecuaciones que se acaban de dar arriba se traducen en lo siguiente:

Reemplazando cada uno de los valores de los componentes de acuerdo a su posición notacional
en el tensor covariante de Faraday, obtenemos entonces:

o bien:
El lado izquierdo lo reconocemos de inmediato como la divergencia del vector del campo
magnético B, lo cual se representa de forma más compacta con la ayuda del operador diferencial
∇ como:

∇·B = 0

Si utlizamos cualquier otra combinación de índices que excluya al índice 1, obtendremos


exactamente el mismo resultado. No cuesta mucho trabajo darse cuenta de que todas las
combinaciones posibles de índices 2, 3 y 4 (no repetidos en un mismo término) generan la ley de
Maxwell que afirma que no hay monopolos (“cargas”) magnéticos, formando las líneas del
campo magnético siempre trayectorias cerradas. Esta es pues la primera ecuación que podemos
extraer de la ecuación diferencial.

PROBLEMA: Obtener la ley de Maxwell:

a partir del tensor de Faraday.

Obviamente, puesto que la coordenada del tiempo aparece en esta ecuación, tenemos que
involucrar al índice 1 en la ecuación diferencial dada arriba. Una posibilidad es haciendo α =1, β
= 2 y γ = 3, con lo cual tenemos lo siguiente:

Reemplazando cada uno de los valores de los componentes de acuerdo a su posición notacional
en el tensor covariante de Faraday, obtenemos entonces:

Reacomodando los términos llegamos a lo siguiente:


Probando otras combinaciones de índices, todas las cuales incluyen al índice 1, podemos obtener
otras dos ecuaciones:

Nuevamente, y al igual que como ocurrió arriba, las tres relaciones se pueden simplificar
metiéndolas en una sola con la ayuda del operador rotacional ∇ aplicado al campo eléctrico E,
obteniendo así la ecuación de Maxwell pedida.

Existe otra manera de definir la ecuación diferencial a partir de la cual podemos obtener del
tensor de Faraday las últimas dos ecuaciones de Maxwell que se acaban de demostrar, y esta
consiste en utilizar el tensor de Faraday contravariante F = (Fαβ) en lugar del tensor de Faraday
covariante. Para ello, partiendo de la definición del símbolo ∂ α, cuyas componentes en el 4-
espacio son:

le subimos el índice a este símbolo con la ayuda del tensor métrico conjugado basado en la
métrica del espacio-tiempo plano:

obteniendo de este modo el símbolo ∂α cuyas componentes son:


Una vez que nos hemos puesto de acuerdo en esto, la ecuación diferencial puede ser escrita de la
siguiente manera:

La ventaja de esta simbolización es que podemos escribirla de inmediato con solo observar que
los índices de un término al siguiente siguen un orden de permutación cíclico. La desventaja es
que tenemos que ser cuidadosos al momento de reemplazar los índices generales por índices
numéricos en las derivadas parciales. A modo de ejemplo, si usamos la combinación α =3, β = 1
y γ = 2, entonces la expansión de la expresión nos dá:

Esto es lo mismo que lo que ya habíamos obtenido previamente.

PROBLEMA: Obtener la doble contracción tensorial FαβFαβ. ¿Qué conclusión se puede extraer
del resultado?

Si de conformidad con la convención de sumación para índices repetidos llevamos a cabo la


sumación sobre α, la primera expansión de la expresión nos producirá el siguiente resultado:

Llevando a cabo ahora la segunda expansión sobre β, obtenemos lo siguiente:


Sustituyendo valores:

FαβFαβ =______________________
(0)(0) + (E1)(- E1) + (E2)(- E2) + (E3)(- E3)
+ (- E1)(E1) + (0)(0) + (B3)(B3) + (- B2)(- B2)
+ (- E2)(E2) + (- B3)(- B3) + (0)(0) + (B1)(B1)
+ (- E3)(E3) + (B2)(B2) + (- B1)(- B1) + (0)(0)

FαβFαβ =_________________
- E1² - E2² - E3² - E1² + B3² + B2²
- E2² + B3² + B1² - E3² + B2² + B1²

FαβFαβ = 2(B1² + B2² + B3²) - 2(E1² + E2² + E3²)

FαβFαβ = 2(B² - E²)

Puesto que tanto B² como E² son escalares, se concluye que la cantidad FαβFαβ es un escalar
invariante de Lorentz.

PROBLEMA: Si aplicamos una rotación de Lorentz en el 4-espacio a un tensor de


FaradayF suponiendo que el movimiento entre los dos marcos de referencia está limitado a un
movimiento relativo a lo largo del eje-x común, las componentes (espaciales) del campo
eléctrico E y el campo magnético B entre ambos marcos de referencia están relacionadas de la
siguiente manera (la derivación de las relaciones fue llevada a cabo en la entrada titulada
“Gimnasia de índices”):
E1 = E1___E2 = γ(E2 - βB3)___E3 = γ(E3 + βB2)

B1 = B1___B2 = γ(B2 + βE3)___B3 = γ(B3 - βE2)

Usando estas relaciones, demostrar que el producto E·B es una invariante Lorentziana.

E·B = E1B1 + E2B2 + E3B3

E·B = (E1)(B1) + [γ(E2 - βB3)][γ(B2 + βE3)] + [γ(E3 + βB2)][γ(B3 - βE2)]

E·B = E1B1 + γ²(E2 - βB3)(B2 + βE3) + γ²(E3 + βB2)(B3 - βE2)

E·B = E1B1 + γ²(E2B2 + βE2E3 - βB2B3 - β²E3B3)


+ γ²(E3B3 - βE2E3 + βB2B3 - β²E2B2)

E·B = E1B1 + γ²(1 - β²)E2B2 + γ²(1 - β²)E3B3

E·B = E1B1 + E2B2 + E3B3

E·B = E·B

De este resultado se puede sacar una conclusión importante. Siendo el producto E·B una
invariante de Lorentz, si el campo eléctrico E es perpendicular al campo magnético B en un
marco de referencia S, entonces ambos seguirán siendo perpendiculares en cualquier marco de
referencia S’.

PROBLEMA: Descomponiendo vectorialmente los campos E y B en sus componentes


paralelas y perpendiculares al eje del movimiento relativo entre los marcos de referencia,
demostrar que el campo eléctrico y el campo magnético no pueden tener una existencia
independiente el uno del otro.

Si descomponemos los campos E y B en sus componentes paralelas y perpendiculares al eje del


movimiento relativo entre los marcos de referencia S y S’, entonces podemos escribir lo
siguiente (se recurrirá aquí a la comilla en lugar de la barra horizontal superior para denotar los
vectores en el marco de referencia S’ con el fin de que no se pueda confundir la barra horizontal
superior con la flecha puesta también encima para simbolizar la naturaleza vectorial de cada
campo):

Inspeccionando las relaciones puestas al principio del problema anterior, podemos


generalizarlas para escribir las siguientes relaciones vectoriales válidas para el campo eléctrico:

Para el campo magnético también obtenemos relaciones similares, las cuales difieren de las del
campo eléctrico mediante un simple intercambio de un signo dentro del paréntesis además del
intercambio de las literales E y B:

Estos resultados nos indican que el campo eléctrico y el campo magnético no pueden tener una
existencia independiente el uno del otro. Un campo eléctrico puro E (sin la presencia de campo
magnético alguno) en el sistema de referencia S se transforma en campos eléctrico y magnético
en el sistema de referencia S’. Pero no existe velocidad alguna menor que la velocidad de la luz
que permita la existencia de un campo magnético puro B en el sistema de referencia S’. En pocas
palabras, si existe un marco de referencia Lorentziano en el cual el campo sea completamente
eléctrico, es imposible encontrar otro marco de referencia Lorentziano en el cual el campo sea
completamente magnético. De este modo, así como el espacio y el tiempo han dejado de tener
una existencia independiente el uno del otro (matemáticamente hablando) y han sido unificados
en un 4-vector como un solo concepto, el del espacio-tiempo, del mismo modo el campo
eléctrico y el campo magnético tampoco tienen una existencia independiente el uno del otro,
habiendo sido unificados bajo el tensor de Faraday. Esta es a fin de cuentas la razón de ser del
tensor de Faraday, el llevar a cabo a su máximo la unificación de las leyes del
electromagnetismo.
Sumando vectorialmente las componentes paralelas y perpendiculares de cada campo y
simplificando, podemos demostrar que la transformación general de los campos eléctrico y
magnético está dada por las siguientes relaciones:

Nuevamente, estas relaciones demuestran que E y B no tienen existencia independiente. Un


campo puramente eléctrico o puramente magnético en un sistema de referencia aparecerá como
una mezcla de ambos en cualquier otro sistema de referencia. De este modo, en vez de hablar
separadamente del campo eléctrico E y del campo magnético B, más apropiadamente uno debe
de hablar del campo electromagnético Fαβ.

Electrodinámica relativista II
Aunque este tema correponde más bien a la Teoría Especial de la Relatividad que a la
Relatividad General, se ha puesto aquí siguiendo no sólo la metodología pedagógica que
indica que los temas deben ser puestos en orden ascendente de dificultad sino tomando en
cuenta el hecho de que el tratamiento del tema requiere de un conocimiento previo del análisis
tensorial que no se acostumbra dar en un curso introductorio de la Teoría Especial de la
Relatividad pero que es mandatorio antes de entrar de lleno en el tema de la Relatividad
General. Este tema requiere de cierta familiaridad con las nociones básicas del
electromagnetismo.

El tensor de Faraday F tiene otras aplicaciones además de las que ya hemos visto previamente.
Una de ellas consiste en utilizarlo para definir dentro del ámbito de la electrodinámica clásica
la densidad de fuerza de Lorentz o 4-fuerza electromagnética de Minkowski f β de la
siguiente manera:

Esta definición se basa en la definición del siguiente 4-vector (contravariante) densidad de


corriente J:
J = (Jα) = (cρ, J) = (cρ, Jx, Jy, Jz)

Puesto que es la expresión covariante del tensor J la que es utilizada en la definición de la


densidad de fuerza de Lorentz, necesitamos bajar el índice con la ayuda del tensor métrico gque
corresponde a la métrica de la Teoría Especial de la Relatividad:

(Jα) = (gαμJμ) = (cρ, - Jx, - Jy, - Jz) = (cρ, - J)

PROBLEMA: Demostrar que la densidad de la fuerza Lorentz es igual a un 4-vector con los
siguientes componentes temporal y espacial:

Para β = 1 (componente temporal) la definición de la fuerza de Lorentz nos proporciona lo


siguiente:

Puesto que F11 (puesto en rojo) es igual a cero, ello nos deja únicamente tres términos cuya
substitución nos resulta en lo siguiente:

Para β = 2 (primer componente espacial) la definición de la fuerza de Lorentz nos proporciona


lo siguiente:
Substituyendo valores y haciendo uso de la definición del producto cruz de dos vectores,
tenemos entonces:

Procediendo de idéntica manera, obtenemos las otras dos componentes espaciales de f βque
resultan ser:

Juntando los cuatro resultados obtenidos obtenemos así la expresión que deseábamos
demostrar para la 4-densidad de fuerza de Lorentz.

Hablando en términos generales, las fuerzas dinámicas, las fuerzas en movimiento, no tienen
cabida dentro de la Teoría de la Relatividad, y esto se aplica no solo a la atracción de la gravedad
que es generada no como resultado de una fuerza de atracción de un cuerpo sobre otro sino
como resultado del campo con el cual un cuerpo genera en torno suyo una curvatura en el
espacio-tiempo; se aplica también a los fenómenos eléctricos y magnéticos. Quizá la ley más
básica que podamos encontrar en la electroestática es la ley de Coulomb, pre-relativista, que
nos dice en similitud con la ley de gravitación universal de Newton: “dos cuerpos cargados
eléctricamente se atraen en proporción directa del producto de sus cargas y en razón inversa del
cuadrado de la distancia que los separa”. Esta ley, expresada matemáticamente en unidades del
sistema MKS (metro-kilogramo-segundo) tiene la siguiente forma:
El problema esencial con la ley de Coulomb, al igual que el problema con la ley de la gravitación
universal de Newton, es que están basadas en el concepto de la “acción a distancia”, el cual
supone que entre dos cuerpos que están separados una distancia que (teóricamente) podría ser
medida en miles de millones de kilómetros existe una fuerza invisible que los
conecta instantáneamente. En principio, si uno de los cuerpos es alejado del otro, la fuerza
entre ambos cambia instantáneamente, sin que el límite natural impuesto por la velocidad de la
luz presente obstáculo alguno para la “acción a distancia” instantánea. En la ley de Coulomb no
aparece la velocidad de la luz, e inclusive ni siquiera aparece el tiempo como factor limitante a la
variación de la fuerza de atracción o repulsión electroestática. Esto significa que si ponemos a
una carga eléctrica en movimiento sus efectos sobre todas las demás cargas eléctricas del
Universo será transmitido instantáneamente, lo cual por sí solo despierta sospechas y dudas.

Las limitaciones impuestas por la ley de Coulomb para el análisis de las cargas eléctricas en
movimiento pueden ser superadas con la ayuda de las leyes del electromagnetismo de Maxwell,
las cuales son relativísticamente correctas. Esto requiere el abandono definitivo del concepto
Coulombiano de la “fuerza eléctrica de atracción o repulsión entre dos cargas eléctricas”
substituyéndolo por el concepto del campo generado por dichas cargas. A continuación tenemos
dos cargas, una carga positiva de dos unidades (q = +2) y una carga negativa de una unidad (1 =
-1), mostrándose los campos eléctricos generados en torno a cada carga y la forma en la que
interactúan tratándose de cargas eléctricas de signos opuestos:
En la misma figura se han trazado dos trayectorias, tanto la de una carga positiva que sale
disparada (repelida) por la carga eléctrica positiva y que es atraída por la carga eléctrica negativa
(trayectoria de color rojo), así como la de una carga negativa que sale disparada (repelida) por la
carga eléctrica negativa y que es atraída por la carga eléctrica positiva (trayectoria de color azul).
En la siguiente figura tenemos una partícula que sale disparada y repelida con tal fuerza y en tal
dirección por la carga positiva que no alcanzará a encaminarse hacia la carga negativa,
pudiéndose ver que a lo largo de su trayectoria su vector velocidad (flechita de color verde) no
necesariamente será perpendicular a las líneas del campo:

A continuación tenemos dos simulaciones de “fotografías instantáneas” con varias cargas


eléctricas de signos diversos cercanas unas a las otras, en las cuales podemos ver la manera en la
cual interactúan entre sí los campos de dichas cargas:
Del análisis de las cargas eléctricas puntuales (suponiendo toda la carga eléctrica concentrada
en un punto) en movimiento, con la ayuda de las ecuaciones de Maxwell se pueden obtener no
sin poco esfuerzo los potenciales Liénard-Wiechert que describen el efecto
electromagnético clásico de una carga eléctrica en movimiento en términos de un campo
potencial vectorial A y un potencial escalar V. Es importante señalar que los potenciales
Liénard-Wiechert preceden a la Teoría de la Relatividad, lo cual explica las dificultades
empleadas en obtener clásicamente dichos potenciales a partir de las leyes de Maxwell sin el
beneficio de la filosofía relativista.

Para obtener el campo eléctrico E producido por una carga en movimiento, podemos recurrir al
procedimiento pre-relativista partiendo de los potenciales Liénard-Wiechert. O podemos utilizar
en nuestra ventaja los resultados obtenidos con la ayuda de la Teoría de la Relatividad a través
del tensor de Faraday. Ya vimos en una entrada previa que cuando sometemos al tensor de
Faraday F a una transformación de Lorentz, los tres componentes del campo eléctrico
original E = (E1,E2,E3) y del campo magnético original B = (B1,B1,B3) están relacionados con los
componentes de los campos ya transformados E = (E1,E2,E3) y B= (B1,B2,B3) mediante las
siguientes relaciones:

E1 = E1___E2 = γ(E2 - βB3)___E3 = γ(E3 + βB2)

B1 = B1___B2 = γ(B2 + βE3)___B3 = γ(B3 - βE2)

De conformidad con la filosofía relativista, en vez de considerar la fuerza eléctrica descrita por
ley de Coulomb consideraremos el campo eléctrico E generado por una carga puntual en
reposo a una distancia r de dicha carga, definido de la siguiente manera (r es el vector radial, de
magnitud variable r):

Estamos interesados en obtener el campo eléctrico generado por esta carga tal y como sería visto
por un observador situado en un sistema de referencia S’ en movimiento relativo con respecto al
sistema de referencia S dentro del cual la carga eléctrica está en reposo, un sistema que se
mueve a una velocidad uniforme V a lo largo del eje-x1 de S. Por conveniencia, consideraremos
el campo electrico medido por el observador en S’ cuando los orígenes de ambos marcos de
referencia coinciden, y designaremos a este instante t = t’ = 0.

Puesto que una carga eléctrica en reposo no genera campo magnético alguno, B = 0 en el
sistema de referencia S, o sea que todas las componentes de B deben ser iguales a cero.
Entonces las ecuaciones de transformación de S a S’ nos dicen que debemos tener lo siguiente:

E1 = E1___E2 = γ(E2 - βB3) = γE2___E3 = γ(E3 + βB2) = γE3

En el momento t = t’ = 0, las coordenadas son por transformación inversa de Lorentz:

x1 = γx1___x2 = x2___x3 = x3

La distancia radial r del punto de origen en donde está centrada la carga eléctrica al punto de
observación (o medición) está dada entonces por la siguiente relación:
De este modo, las componentes del campo eléctrico generadas por la carga eléctrica en
movimiento (al estar en el sistema de referencia S’) serán:

o bien, juntando las tres componentes en un solo vector E:

En el sistema de referencia S’ la proyección del vector posición r de la carga en movimiento


sobre el eje-x1 será:

x1 = r cos θ

Y del mismo modo:

r² = (x1)² + (x2)² + (x3)²

Entonces:

(x2)² + (x3)² = r² sen² θ

Por lo tanto:

(γx1)² + (x2)² + (x3)² = γ² r² cos² θ + r² sen² θ

(γx1)² + (x2)² + (x3)² = r² [γ² cos² θ + sen² θ]


(γx1)² + (x2)² + (x3)² = r² [cos² θ/(1 - β²) + sen² θ]

(γx1)² + (x2)² + (x3)² = r² [cos² θ + sen² θ - β² sen² θ]/(1 - β²)

(γx1)² + (x2)² + (x3)² = γ² r² [1 - β² sen² θ]

Con esto, el vector del campo eléctrico de la carga en movimiento resulta ser:

en donde r es un vector radial unitario apuntando radialmente hacia afuera (o hacia adentro) de
la carga puntual. Esto lo podemos escribir también de la siguiente manera:

Este es el mismo resultado, pre-relativista, obtenido laboriosamente a partir de los potenciales


definidos en partes primero por Alfred-Marie Liénard en 1898 e independientemente por Emil
Wiechert en 1900.

Otro resultado que podemos obtener desde la óptica relativista con lo que ya hemos visto es
la ley de Biot-Savart que nos proporciona la inducción magnética B producida por un
alambre infinitamente largo que transporta una corriente eléctrica:
Clásicamente, para obtener la ley que nos proporciona la magnitud de B a cierta distancia
(perpendicular) al hilo conductor, primero subdividimos el hilo en segmentos infinitesimales de
longitud:

y llevando a cabo una integración sobre la contribución infinitesimal dB al campo producida por
cada elemento infinitesimal de corriente:

B = ∫dB

obtenemos la siguiente expresión:

Para obtener este mismo resultado por la vía de la relatividad, suponemos primero un hilo
cargado eléctricamente acomodado a lo largo del eje-x1 de S, de modo tal que la distribución de
cargas eléctricas sobre el hilo estará en reposo para un observador situado justo a un lado del
hilo en el sistema de referencia S. Pero si ponemos al hilo de cargas en movimiento longitudinal
con respecto a nosotros (o bien si nos desplazamos paralelamente al eje a velocidad constante)
poniéndonos así en un sistema de referencia S’, entonces para nosotros el hilo tendrá el
equivalente real de una corriente eléctrica. Si hay una densidad uniforme de carga lineal ρ a lo
largo del hilo en S, entonces en cualquier elemento infinitesimal de longitud dx 1 habrá una carga
eléctrica ρdx1. De acuerdo con la ley de la conservación de la carga eléctrica, hay una cantidad
igual de carga contenida en el intervalo dx1 en un sistema de referencia S que esté en
movimiento relativo con respecto a S, con lo cual:

ρ dx1 = ρ dx1

Puesto que en el sistema de referencia S no hay campo magnético alguno al estar las cargas en
reposo, si tomamos las relaciones dadas arriba:

B1 = B1___B2 = γ(B2 + βE3)___B3 = γ(B3 - βE2)

tenemos entonces:

B1 = B1___B2 = γβE3___B3 = - γβE2

Por lo tanto, el campo magnético dB debido a un elemento de carga móvil ρdx1 en S’ será:

Con las relaciones obtenidas por la vía del tensor de Faraday tenemos entonces:

Usando lo que hemos visto con anterioridad para el caso de una carga eléctrica individual en
movimiento, llegamos a lo siguiente:

o bien:
En forma similar a como ocurre en la derivación clásica (pre-relativista) de la ley de Biot-Savart,
obtenemos el campo total B integrando esta última expresión sobre la longitud total (infinita) de
la distribución de cargas:

B = ∫dB

Llevando a cabo la integración por los procedimientos usuales del cálculo:

En el sistema de referencia S’, la magnitud de la corriente es:

I = ρβc

mientras que la distancia (perpendicular) desde la línea de cargas móviles (el eje x1) hasta un
punto a una distancia r0 es:

Combinando lo que hemos obtenido, tenemos entonces la expresión final para B, que es:

B = 2I/cr0

Esta es precisamente la ley Biot-Savart.

Las predicciones hechas por estas leyes, formuladas antes del arribo de la Teoría de la
Relatividad, son relativísticamente exactas, y no requieren de modificación alguna que tome en
cuenta la velocidad de las cargas, sobre todo para velocidades cercanas a la velocidad de la luz.
Lo que hemos visto ha establecido una conexión entre el electromagnetismo de Maxwell y la
Teoría Especial de la Relatividad. Pero no hemos establecido ninguna conexión entre el
electromagnetismo y la Relatividad General. Esto lo podemos hacer en cierta forma a través del
tensor energía-tensión como lo veremos a continuación.

El tensor energía-tensión T de las ecuaciones de campo de la Relatividad General es


extraordinario en el sentido de que incluye todas las energías posibles habidas y por haber: la
energía equivalente de una masa, la energía térmica, la energía de rotación, la energía de
movimiento lineal, la energía de enlace entre dos átomos, la energía de enlace nuclear; y desde
luego, la energía electromagnética. Y si la energía que estamos considerando es energía
electromagnética pura, el tensor que empleamos para estos casos es el tensor
electromagnético energía-tensión o tensor electromagnético energía-momentum,
el cual puede ser definido de la siguiente manera:

Una ligera variante de la fórmula se obtiene llevando a cabo la subida del índice μ como lo indica
la contracción de Fμλ con el tensor gαμ, aunque esto nos resulta en la pérdida de la simetría que
exhiben los dos términos dentro del paréntesis:

Esta definición está basada en el tensor de Faraday F que ya vimos previamente, y en el tensor
métrico conjugado g-1 = (gμν) para el espacio-tiempo Lorentziano definido aquí como ya lo
hemos visto previamente:

g11 = 1___g22 = g33 = g44 = - 1

gij = 0___para i ≠ j

PROBLEMA: Obtener los componentes del tensor electromagnético energía-tensión T a


partir de la definición dada anteriormente.
Empezaremos con el componente T11, para lo cual hacemos las substituciones α = β = 1 en la
definición del tensor energía-tensión T para el campo electromagnético:

Puesto que la métrica es diagonal, en el primer término dentro de los paréntesis el único valor
de μ para el cual g1μ no será cero es μ = 1. Por otro lado, en el segundo término tenemos la doble
contracción FαβFαβ del tensor de Faraday, la cual ya vimos previamente que nos produce la
expresión 2(B² - E²). Expandiendo la sumatoria que nos resulta en el primer término de
acuerdo con la convención de sumación para índices repetidos, después de haber puesto g 11 = 1,
tenemos entonces:

A continuación, substituímos cada uno de los elementos tomándolos tanto del tensor de Faraday
en su forma contravariante Fαβ como del tensor de Faraday en su forma covariante Fαβ,
obteniendo con esto (se recuerda aquí nuevamente que los sub-índices numéricos dados a las
tres componentes espaciales tanto del campo elétrico E como del campo magnético B no tienen
relación directa con los índices numéricos empleados para identificar a las componentes del
tensor electromagnético energía-tensión T, al igual que como ocurre en el caso del tensor de
Faraday F):

Simplificando con el hecho de que E·E = E² = Ex² + Ey² + Ez² = E1² + E2² + E3²:
Finalmente llegamos a lo siguiente:

Como se ha destacado con la simbolización en color azul, el componente T 11 resulta ser una
expresión muy importante que encontramos en los cursos introductorios de la electrodinámica
clásica mucho antes de que se tenga conocimiento alguno de lo que es un tensor. Se trata de
la densidad de energía del campo electromagnético, la energía del campo
electromagnético por unidad de volumen. Esta cantidad puede considerarse como una especie
de energía potencial. La cantidad ∫ε dv (una integral volumétrica) es considerada usualmente
como la energía del campo electromagnético. El concepto de una energía almacenada en un
campo en lugar de residir dentro de una partícula es un concepto básico del campo
electromagnético, y se corresponde. El componente T11 se corresponde con lo que ya habíamos
visto previamente cuando identificamos el componente T11 en el ámbito de la Relatividad
General como la densidad de masa-energía ρ.

A continuación, llevaremos a cabo la evaluación del componente T12 repitiendo los pasos que
acabamos de efectuar, haciendo α = 1 y β = 2 en la definición del tensor electromagnético
energía-tensión:

Puesto que g12 es igual a cero, se ha destacado de color rojo indicándose así con ello que se
llevará a cabo la eliminación del segundo término, dejándonos únicamente con:

Llevamos a cabo la expansión de la sumatoria de acuerdo con la convención de sumación,


destacando de antemano los componentes del tensor de Faraday que son iguales a cero:
Substituyendo los valores de cada componente de los tensores de Faraday covariante y
contravariante que se requieren en este caso, tenemos lo siguiente:

En la tercera línea se ha efectuado una conversión de los índices numéricos a las coordenadas
espaciales Cartesianas para que sea más claro lo que se va a llevar a cabo. La forma del término
entre los paréntesis es la misma que la de un producto cruz, cuyos componentes en coordenadas
rectangulares referidas a un triplete de vectores unitarios de base i, j y k, tiene la definición
usual que se le dá al producto cruz mediante el determinante de la siguiente matriz:

En base a esto, podemos ver que la componente producida por el producto cruz corresponderá
al vector ExB que apunta a lo largo de la coordenada espacial x2 = x, o sea:

Procediendo de modo similar, obtenemos las otras dos componentes que corresponden a los
elementos espaciales del tensor T colocados a lo largo del primer renglón en su representación
matricial, los cuales apuntan a lo largo de las coordenadas espaciales x3 = y y x4 = z
respectivamente:
De igual manera, se puede verificar que las tres componentes que corresponden a los elementos
espaciales del tensor T colocadas a lo largo de la primera columna son las siguientes:

Para obtener esto último, no es necesario llevar a cabo las evaluaciones detalladas a partir de la
definición, porque el tensor electromagnético energía-tensión de la electrodinámica T, al igual
que el tensor energía-tensión T de la Relatividad General, es simétrico.

A esto último podemos darle una interpretación física inmediata apelando a la definición
del vector de Poynting S, el cual en unidades Gaussianas está dado por la relación:

El vector de Poynting nos expresa el flujo de energía electromagnética a través del espacio
libre, y nos proporciona la cantidad de energía electromagnética que está pasando a través de
una superficie por unidad de área por unidad de tiempo.

Habiendo determinado las componentes que corresponden al primer renglón y a la primera


columna de la matriz que representa al tensor electromagnético energía-tensión, si borramos el
el primer renglón y la primera columna de la matriz nos queda una sub-matriz. Esta sub-matriz,
con un signo negativo antepuesto, es mejor conocida como el tensor de tensión de
Maxwell (Maxwell stress tensor), la cual podemos representar como [TM]. A continuación
procederemos a determimar el elemento T23 que corresponde a esta sub-matriz de acuerdo a la
definición del tensor completo T dada arriba.
Expandiendo la sumatoria de acuerdo a la convención de sumación:

A continuación, substituímos los componentes del tensor de Faraday covariante y


contravariante en esta expresión, pero para evitar una posible confusión de los sub-índices
numéricos empleados en la designación de los componentes de E y B con los índices del tensor
emplearemos la notación correspondiente a las coordenadas rectangulares Cartesianas:

Procediendo de modo semejante, obtenemos lo siguiente:

Ahora evaluaremos el componente T22 que corresponde a una de las entradas diagonales del
tensor tensión de Maxwell:

En el primer término, la expansión de la sumatoria sobre μ sólo es efectiva para μ = 2 en virtud


de que para cualquier otro valor g2μ es igual a cero. Sacándolo fuera del paréntesis y
substituyéndolo por su valor g22 = -1 tenemos entonces:

Obsérvese con atención que no hemos puesto μ = 2 en el segundo término, en virtud de que los
índices no son índices libres sino índices monigote al llevar a cabo la doble sumatoria sobre
ambos índices como lo requiere la convención de sumación.

El segundo término nos debe resultar familiar, ya que en un problema anterior se demostró que
la expresión FαβFαβ es igual a 2(B² - E²). Substituyendo este resultado y llevando a cabo la
sumación en el primer término tenemos entonces:

Substituímos ahora los componentes de los tensores de Faraday covariante y contravariante


empleando en los sub-índices de los componentes (espaciales) de los campos E y B la notación
usual de coordenadas rectangulares Cartesianas para obtener así:

Puesto que:

B² = Bx² + By² + Bz²

Bx² - B² = - Bz² - By²

tenemos entonces:
lo cual podemos simplificar llegando a la siguiente relación:

Procediendo de igual forma, encontramos que los componentes T33 y T44 son los siguientes:

Tenemos ya pues los elementos que forman parte de la sub-matriz 3x3 que constituye el tensor
tensión de Maxwell.

No cuesta mucho trabajo verificar que los resultados que acabamos de obtener se pueden
obtener también mediante la siguiente fórmula:

en la cual i = 1, 2, 3 y j = 1, 2, 3. Los índices numéricos en esta última fórmula no son los índices
del tensor energía-tensión del campo electromagnético, son los índices que corresponden e
identifican a los elementos de la representación matricial del tensor tensión de Maxwell.

La selección de componentes a ser utilizados dependerá de cada situación en particular, como lo


demuestra el siguiente ejemplo.

PROBLEMA: Construír la representación matricial del tensor tensión de Maxwell para el


caso en el cual tenemos un campo eléctrico estático.
En este caso, el campo magnético B = 0 y los elementos de la matriz se reducen a los siguientes:

Los resultados que hemos obtenido para el tensor energía-tensión del campo electromagnético
se pueden resumir de la siguiente manera:

De este modo, si tomamos los elementos principales comunes del tensor electromagnético
energía-tensión T agrupándolos de acuerdo con el significado común que se les puede dar,
tenemos los siguientes cuatro sub-grupos:

En forma similar a como ocurre con el tensor energía-tensión T de la Relatividad General, el


elemento Tμν del tensor electromagnético energía-tensión se puede interpretar como el flujo de
la μ-componente del 4-momentum P = (Pμ) del campo electromagnético a través
del hiperplano xν = constante, y representa la contribución del electromagnetismo a la fuente
del campo gravitacional en la Relatividad General.

Podemos representar los sub-bloques de los que consta el tensor electromagnético energía-
tensión usando la definición de la densidad del momentum del campo electromagnético gdada
en función del vector de Poynting (no se confunda con el símbolo utilizado para representar al
tensor métrico):

Con esto, la representación en sub-bloques del tensor T = (Tαβ) es:

Mediante un poco de gimnasia de índices podemos obtener las siguientes representaciones


equivalentes del tensor electromagnético energía-tensión:

PROBLEMA: Demostrar que el tensor energía-tensión del campo electromagnético tiene una
traza de cero.

La traza del tensor T la obtenemos sumando los elementos de la diagonal principal de su


representación matricial (aquí usaremos la convención de sumación con los índices repetidos):

tr {T} = Tμμ

tr {T} = T11 + T22 + T33 + T44


Ya vimos arriba que el componente T11 es ε, la densidad de energía del campo electromagnético,
con lo cual:

tr {T} = ε + Tkk

en donde hemos representado (recurriendo nuevamente a la convención de sumación


empleando índices repetidos) como Tkk a la suma de los componentes espaciales diagonales del
tensor T. Puesto que tenemos que llevar a cabo la suma de T22 + T33 + T44, los agruparemos aquí
nuevamente en preparación para la adición de los mismos:

Tenemos entonces:

Haciendo uso del hecho de que:

E² = Ex² + Ey² + Ez²

B² = Bx² + By² + Bz²

podemos sumar las “columnas” para obtener entonces:


lo cual se reduce finalmente a:

y dado que:

concluímos entonces que:

tr {T} = 0

Con el tensor energía-tensión del campo electromagnético T en nuestras manos, si queremos


saber cómo un campo electromagnético puede producir una curvatura en el espacio-tiempo todo
lo que tenemos que hacer es substituírlo en las ecuaciones de campo de la Relatividad General.
Si el tensor energía-tensión T en cierta región del espacio-tiempo tiene como únicas
componentes las que corresponden al campo producido por un campo electromagnético en el
espacio libre siendo por lo tanto el tensor electromagnético energía-tensión, entonces las
ecuaciones de campo de Einstein son conocidas como las ecuaciones Einstein-Maxwell se
pueden escribir en notación de componentes de la siguiente manera (la adición de la la
permeabilidad magnética μ0 se ha efectuado aquí con el propósito de que la expresión sea
dimensionalmente correcta en el sistema internacional de unidades SI):

Si la constante cosmológica del Universo es puesta igual a cero (Λ = 0) como terminó haciéndolo
Einstein, las ecuaciones Einstein-Maxwell se reducen a:
En principio, de acuerdo con esto último y aunque los efectos son insignificativamente
minúsculos, el campo electromagnético tiene la capacidad para provocar una curvatura en el
espacio-tiempo. Puesto que un fotón de luz es esencialmente un corpúsculo de energía
electromagnética, el torrente de fotones con los cuales el Sol está bañando constantemente a la
Tierra permitiendo que la vida florezca en nuestro planeta tiene la capacidad para producir en
conjunto una pequeñísima curvatura en el espacio-tiempo. En pocas palabras, la luz puede
provocar los efectos típicos de una atracción gravitatoria. Esta es una conclusión
sorprendente, no prevista por la ley de la gravitación universal de Newton, tomando en cuenta
que ni en los tiempos de Newton ni en los tiempos modernos de hoy se considera que el fotón
pueda tener masa alguna. A un fotón se le puede asignar una “masa” en función de su energía E
= hf y en base a la equivalencia relativista E = mc², pero carece de masa en reposo. Esto significa
que, ni más ni menos, algo que carece de masa puede ejercer una atracción gravitatoria a
causa de la curvatura que provoca en el espacio-tiempo.

Electrodinámica relativista III


Aunque este tema correponde más bien a la Teoría Especial de la Relatividad que a la
Relatividad General, se ha puesto aquí siguiendo no sólo la metodología pedagógica que
indica que los temas deben ser puestos en orden ascendente de dificultad sino tomando en
cuenta el hecho de que el tratamiento del tema requiere de un conocimiento previo del análisis
tensorial que no se acostumbra dar en un curso introductorio de la Teoría Especial de la
Relatividad pero que es mandatorio antes de entrar de lleno en el tema de la Relatividad
General. Este tema requiere de cierta familiaridad con las nociones básicas del
electromagnetismo.

El tensor de Faraday F, tan importante para el tratamiento tensorial dado a la electrodinámica


clásica, puede ser a su vez definido en términos de un potencial electromagnético A utilizándolo
como punto de partida, a manera de axioma o postulado Euclideano, para el desarrollo de todo
lo demás. La definición del tensor de Faraday en su forma covariante sobre esta base es la
siguiente:
El potencial electromagnético A es, desde luego, un tensor, cumpliendo con la definición básica
de un tensor:

PROBLEMA: Demostrar que, bajo una transformación de coordenadas al pasar de un


sistema de referencia S a otro sistema de referencia S’, la definición del tensor de Faraday Fen
función del potencial electromagnético A cumple con la definición fundamental de un tensor.

En el sistema de referencia S’, la definición covariante del tensor de Faraday F, si es que ha


permanecido realmente invariante en forma, debe tener el siguiente aspecto:

Puesto que A es un tensor, lo podemos substituír aquí por su definición tensorial básica:

Desarrollando y simplificando tenemos entonces:


Lo último es precisamente la definición de un tensor covariante de orden dos. Se concluye que el
tensor de Faraday, definido en términos del potencial electromagnético A, es un tensor.

Siendo el tensor de Faraday F un tensor, en el pleno sentido de la palabra, podemos tomar la


derivada covariante de dicho tensor, lo cual nos introduce los símbolos de Christoffel de la
siguiente manera (como siempre, usamos el semicolon para denotar la derivación covariante y
la coma para denotar la derivación ordinaria):

Fαβ;γ = Fαβ,γ - ΓμαγFμβ - ΓμβγFαμ

Se vuelve necesario advertir aquí que la reformulación tensorial de las leyes de la


electrodinámica de Maxwell sólo es válida para las leyes de Maxwell en el vacío, o sea para
campos electromagnéticos propiamente dichos, conocidas también como las leyes
“microscópicas” de Maxwell. Para las leyes “macroscópicas” de Maxwell aplicadas a materiales
de todo tipo, la presencia de dichos materiales establece un marco de referencia fijo con lo cual
las leyes dejan de ser covariantes. Las ecuaciones de Maxwell para el campo electromagnético
macroscópico en la materia pueden ser deducidas de las ecuaciones de Maxwell postuladas para
el campo electromagnético microscópico. La influencia de la materia es lo que dá origen a
una densidad de carga eléctrica microscópica y a una densidad de corriente eléctrica
microscópica. Como tales, los electrones producen cambios espaciales rápidos en el campo
electromagnético.

El tensor de Faraday es utilizado tanto en el estudio de los campos electromagnéticos como de


las cargas eléctricas en movimiento. Para que las formulaciones tensoriales puedan ser
covariantes, invariantes en forma al pasar de un sistema de referencia S a otro sistema de
referencia S’, es necesario reformular las variaciones con respecto al tiempo en función del
tiempo propio (local) τ medido por un observador situado en el sistema en reposo, y se vuelve
necesario reformular también las definiciones dadas clásicamente en el 3-espacio Euclideano de
modo tal que puedan ser enunciadas en función de 4-vectores. Un buen ejemplo de ello lo
tenemos en la ecuación de Lorentz para una carga eléctrica en movimiento. Clásicamente, el
campo eléctrico E está dado en función de la fuerza de atracción (o repulsión) FE que actúa
sobre una carga de prueba situada a cierta distancia de la carga puntual que está generando
dicho campo, mientras que la fuerza FB que actúa sobre una carga en movimiento cuando está
viajando dentro de un campo de inducción magnética B está dada en función del producto cruz
de la velocidad u de la carga y la intensidad B del campo magnético.

La fuerza total F que actúa sobre la carga será igual a la suma vectorial de FE y de FB:

Puesto que, clásicamente, la fuerza dinámica actuando sobre una partícula es por definición
igual al cambio en su cantidad de movimiento, dp/dt, el lado izquierdo de la expresión anterior
lo podemos escribir de la siguiente manera:

Esta es la ecuación de fuerza de Lorentz, una expresión clásica pre-relativista, válida en el


3-espacio Cartesiano únicamente para velocidades suficientemente bajas en comparación con la
velocidad de la luz. Vamos a tratar ahora de reformular esta última ecuación para que sea
covariante, invariante bajo transformaciones de Lorentz. Antes de continuar, es importante
aclarar de antemano que un postulado esencial en la electrodinámica relativista es el de
la invariancia de la carga eléctrica, o sea que la carga eléctrica de una partícula es una cantidad
cuya magnitud no cambia, se conserva absolutamente sin variar al pasar la partícula de un
sistema de referencia a otro. La invariancia de la carga bajo transformaciones de Lorentz, o más
concretamente, la independencia de la velocidad de la carga observada de una partícula, es algo
establecido experimentalmente que no resulta de teoría alguna.

En la ecuación de fuerza de Lorentz, el momentum p de la partícula consta de tres


componentes:

p = (px, py, pz)

Si este momentum p forma parte de un 4-vector, tal vector no puede ser otro más que el 4-
vector energía-momentum P que ya hemos estudiado con anterioridad:

P = (pα) = (p1, p) = (E/c, px, py, pz)

Pero el 4-momentum relativista P es simplemente el producto de la masa propia mo por cada


una de las componentes de la 4-velocidad U = (Uα) de la Teoría Especial de la Relatividad, o sea:

P = (moU1, moU) = moUα

Si usamos el tiempo propio (local) τ en lugar del tiempo absoluto t para la diferenciación,
entonces la ecuación de fuerza de Lorentz puede ser escrita de la siguiente manera para el 4-
espacio:

El lado izquierdo lo podemos poner también en función de la 4-velocidad U = (Uα):

Podemos introducir además el tensor de Faraday F para escribir de este modo ambos lados de la
4-fuerza de Lorentz en notación tensorial de componentes:
Ambos lados de esta expresión están escritos en función de la 4-velocidad U. Si queremos
escribirlos en función de la 4-posición, entonces la expresión resultante es la siguiente:

PROBLEMA: De la definición básica del 4-vector densidad de corriente J:

J = (cρ, J)

podemos ver que la carga eléctrica total Q en cualquier marco de referencia es:

en donde la integración múltiple se extiende sobre una hipersuperficie t = constante. Si


definimos a n como un vector unitario normal a esta hipersuperficie, demostrar que:

En un 3-espacio Euclideano, el 3-vector n = (n1, n2, n3) es un vector unitario normal


(perpendicular) a un elemento de una 2-superficie dS, de modo tal que el flujo de un vector A a
través de dicha superficie es:

A · dS = A · n dS = (A1, A2, A3) · (n1, n2, n3) dS

= (A1n1 + A2n2 + A3n3) dS = Aα nα dS

En el 4-espacio relativista, el flujo neto a través de una 3-superficie quedará definida de la


misma manera, como AαnαdS. Si en el 2-espacio tenemos que llevar a cabo una doble
integración para cada sección de superficie atravesada por el campo vectorial A, en el 3-espacio
tenemos que llevar a cabo una triple integración para cada 3-superficie. Si llevamos a cabo la
evaluación de la integral del vector J = (Jα) sobre una superficie, entonces el flujo total cuando
la integración se lleva a cabo sobre una hipersuperficie t = constante está dado por:
Obviamente, las últimas tres integrales se desvanecen al llevarse a cabo las integraciones sobre
una hipersuperficie t = constante. Esto nos produce la expresión que se deseaba demostrar para
la obtención de la carga eléctrica total Q en un 4-espacio relativista.

Hasta aquí hemos visto que un campo eléctrico E y un campo magnético B no poseen una
existencia verdaderamente independiente ni poseen separadamente cada uno de ellos una
invariancia Lorentziana, y hemos visto que ambos son a su vez meros componentes del tensor
de Faraday F, el cual sí es una invariante de Lorentz, el cual es la descripción invariante de los
campos electromagnéticos dentro de la Teoría de la Relatividad. Hemos analizado, desde el
punto de vista relativista, lo que ocurre cuando consideramos una carga eléctrica que está en
reposo en un marco de referencia y que vista desde otro marco de referencia se encuentra en
movimiento. También hemos estudiado cómo una línea infinitamente larga cargada
eléctricamente, si es vista por un observador moviéndose a lo largo de un eje paralelo a dicha
línea, produce la inducción propia de un campo magnético B. La concordancia plena entre la
electrodinámica clásica y la Teoría General de la Relatividad es algo que no se pone a discusión.
Sin embargo, al tratar de extender la electrodinámica clásica hacia marcos de
referencia acelerados, no tardamos en toparnos con problemas al tratar de compaginar los
resultados con las conclusiones obtenidas mediante la Relatividad General para el caso del
campo gravitacional. Antes de entrar en detalle sobre los problemas que confrontamos al tratar
de “pegar” a la electrodinámica clásica con la Relatividad General, estudiaremos el caso de una
carga eléctrica que está siendo sometida a una aceleración constante. El libro convencional
“Classical Electrodynamics” de John David Jackson utilizado ampliamente para el estudio de la
electrodinámica en programas de postgrado al igual que muchos otros textos inspirados en este
libro adoptan la postura de que la potencia de la radiación emitida por una carga eléctrica que
está siendo acelerada depende exclusivamente de la aceleración. El punto usual de partida es la
definición del vector de Poynting S. No es difícil demostrar que la potencia de la energía
electromagnética está dada por la siguiente fórmula conocida como fórmula de Larmor para
velocidades suficientemente bajas en comparación con la velocidad de la luz:

siendo q la carga eléctrica de la partícula y siendo a = (ax, ay, az) la aceleración en coordenadas
Cartesianas rectangulares. Esta fórmula tiene además la propiedad de que es una invariante de
Lorentz, pese al hecho de que sólo es válida para velocidades suficientemente bajas en
comparación con la velocidad de la luz.

PROBLEMA: Sin recurrir a cálculos detallados, demostrar que la fórmula de Larmor es una
invariante de Lorentz que conserva su forma tras un cambio de marcos de referencia.

La potencia de la energía electromagnética que está siendo radiada por la carga eléctrica que
está siendo acelerada está dada por la razón de la pérdida de energía, - dW/dt, tal y como se
observa y se mide en el sistema de referencia S. Del mismo modo, en el sistema de referencia S’,
la pérdida de energía está dada por - dW’/dt’. Pero W es proporcional a la primera componente
del 4-vector energía-momentum (E/c, px, py, pz), mientras que t es proporcional también a la
primera componente de un 4-vector, el vector posición (ct,x,y,z), y en este caso ambas
cantidades están sujetas a la misma transformación de Lorentz, con lo cual la los factores
comunes de conversión Lorentziana tanto en el numerador como en el denominador se
cancelan, dejándonos con la misma expresión. Se concluye que la fórmula de Larmor es una
invariante de Lorentz, y puede ser escrita para el sistema de referencia S’ de la siguiente manera:

Sin embargo, tanto en el sistema de referencia S como en el sistema de referencia S’, la fórmula
de Larmor es sólo válida para velocidades suficientemente bajas en comparación con la
velocidad de la luz, de modo tal que la fórmula de Larmor no es covariante. El primer paso
consistirá en modificar la fórmula para que ésta sea covariante, tensorial. La reformulación de la
3-aceleración a como una 4-aceleración A se puede efectuar mediante una contracción tensorial
en el 4-espacio de la siguiente manera empleando la convención de sumación por la vía de los
índices repetidos:
AμAμ

De este modo, la fórmula de Larmor covariante queda escrita del siguiente modo especificada
para el 4-espacio en lugar del 3-espacio:

Esta es la fórmula de Larmor expresada en forma covariante. Pero aún no es una fórmula
relativísticamente correcta. Puesto que en la fórmula original de Larmor tanto la
aceleración a en el sistema de referencia S’ como la aceleración a en el sistema de referencia S
son 3-aceleraciones, el paso lógico consiste en reemplazar la 3-aceleración con una 4-
aceleración A = (Uα), obtenida directamente de la diferenciación con respecto al tiempo propio
(local) τ de la 4-velocidad U = (Uα) empleada en la Teoría Especial de la Relatividad, la cual en
nuestra introducción a los 4-vectores vimos que era igual a:

U = (Uα) = (γc, γu)

siendo u la 3-velocidad. La diferenciación de la 4-velocidad U con respecto al tiempo propio τ


viene siendo entonces:

Para poder llevar a cabo la contracción tensorial de A μ con Aμ como se indica arriba, necesitamos
la forma covariante de la 4-aceleración A, la cual obtenemos con la ayuda del tensor métrico g =
(gαβ) que corresponde al espacio-tiempo Lorentziano de la Teoría Especial de la Relatividad, con
lo cual obtenemos lo siguiente tras bajar el índice de A μ:
Pero el tiempo t y el tiempo propio τ están relacionados mediante la expresión relativista para la
dilatación del tiempo t = γτ. Entonces de inicio tenemos que tener algo como lo siguiente para el
4-vector velocidad U:

De este modo, tenemos lo siguiente:

Este paso anterior era necesario porque nuestro punto de partida fue una relación especificada
no en el tiempo propio τ sino en el tiempo del observador externo t, y esto nos introduce un
factor γ al ponerlo todo en función de los 4-vectores relativistas, algo que tenemos que agregar a
la relación final que obtengamos.

Con lo que tenemos arriba, el procedimiento de desarrollo para obtener la 4-aceleración


relativista que tenemos que utilizar en la versión covariante de la fórmula de Larmor es directo.
El álgebra es un poco laboriosa y no será reproducida aquí. Sin embargo, una simplificación que
podemos utilizar en los procedimientos algebraicos para ahorrarnos varios pasos es la siguiente:
Con lo anterior llegamos por fin a la siguiente fórmula de Larmor relativista:

El término entre los paréntesis es esencialmente un término relativista de aceleración. Podemos


poner esta ecuación en una forma un poco más útil, en lo que a interpretación de resultados
físicos se refiere, recurriendo a la definición del producto cruz de dos vectores especificado del
siguiente modo:

y recurriendo también a la definición del producto escalar de dos vectores especificado del
siguiente modo:

Con estas dos relaciones vectoriales, podemos efectuar la siguiente manipulación del término
relativista dentro los paréntesis en la fórmula de Larmor:
La fórmula relativista de Larmor toma entonces la siguiente forma:

En un movimiento de aceleración lineal el 3-vector velocidad u siempre será paralelo al 3-vector


aceleración du/dt, de modo tal que el segundo término dentro del paréntesis se desvanece
proporcionándonos la energía electromagnética emitida por la carga acelerada moviéndose
siempre en una misma dirección. Y en un movimiento en el cual el 3-vector velocidad u está
cambiando de dirección constantemente, siendo perpendicular al 3-vector aceleración du/dt
como ocurre en el caso de los aceleradores de partículas tales como el ciclotrón y el sincrotrón, el
segundo término contribuirá a la radiación emitida, y es precisamente éste término el que pone
un límite práctico a la velocidad que se le pueda imprimir a partículas atómicas y sub-atómicas
en un acelerador rotatorio. Haciendo la simplificación β = u/c y metiendo la constante c²
tomándola del denominador del factor externo para meterla en el primer témino dentro del
paréntesis, juntándola con la otra constante c² que está en el segundo término para incorporarla
del mismo modo en cada udel segundo término, tenemos otra variante de la fórmula de Larmor
relativista, válida para cualquier velocidad:

PROBLEMA: Obtener una fórmula para la potencia de la energía electromagnética radiada


en función del cambio de la energía cinética K de la partícula con respecto a la distancia
recorrida (= dK/dx) para una aceleración lineal. Suponiendo para los aceleradores
electroestáticos lineales de partículas una ganancia de 10 MeV/metro, demuéstrese que bajo
tales condiciones la pérdida de energía por radiación es despreciable.

Ya hemos visto previamente en otra entradas que la energía cinética relativista K está dada por
la fórmula:

K = (γ - 1) m0c²

Tomando la derivada de K con respecto al tiempo y usando un resultado obtenido arriba


tenemos entonces:
Con la ayuda de la regla de la cadena, podemos obtener dK/dx de la siguiente manera:

Despejando esto último para poner todo en función de la aceleración du/dt:

Reemplazando esto en la expresión para la potencia radiada en el caso de que la aceleración es


lineal con la velocidad u y la aceleración du/dt colineares (apuntando en la misma dirección)
obtenemos la expresión deseada:

Evaluaremos ahora la potencia electormagnética radiada para un valor de dK/dt = 10


MeV/metro. Podemos llevar a cabo los cálculos numéricos de una manera más elegante y menos
propensa a errores escribiendo lo anterior de la siguiente manera:
Con estos cambios, en el denominador tenemos a la energía en reposo m 0c² de la partícula, que
para un electrón es igual a 0.511 MeV. Y en el numerador tenemos una cantidad (q²/m0c²) que
resulta ser igual a una longitud que en este caso viene siendo el radio clásico del electrón que
fue obtenido por Thomson con la siguiente fórmula en el sistema de unidades Gaussianas:

Para que esto sea cierto, tenemos que utilizar para la unidad fundamental de carga un valor de
4.8·10-10 statcoulombs (o bien 4.8·10-10 esu ó electrostatic unit, siendo el statcoulomb una
unidad cuya conversión al sistema SI es 1 statcoulomb ≈ 3.33564×10−10 coulombs). Empleando
valores numéricos tenemos entonces que la potencia radiada será:

{[2(2.82·10-13 metro)(3·1010 cm/seg)]/[3(0.511 MeV)]}/{10 MeV/100 cm}²

≈ 11·10-5 MeV/segundo

La fracción de la potencia que es perdida por radiación electromagnética para esta partícula, en
este caso un electrón que suponemos que está viajando a velocidades relativistas, será entonces:

(11·10-5 MeV/segundo)/[(10 MeV/100 cm)(3·1010 cm/seg)]

≈ 3.67·10-14

Esta es una fracción despreciable, y tiene una consecuencia que será relevante para nuestra
discusión posterior: es prácticamente imposible obtener de una partícula que está siendo
acelerada linealmente información experimental que confirme la exactitud de las fórmulas
relativistas para la radiación electromagnética radiada por una carga acelerada.

En realidad, hay un pequeño detalle que hemos pasado por alto con el fin de no embrollar más
los cálculos teóricos. Si una partícula es acelerada produciendo con ello un campo
electromagnético de radiación, el movimiento posterior de la partícula indudablemente será
modificado por este campo de radiación. Este fenómeno es conocido teóricamente
como reacción de radiación o amortiguamiento por la radiación (radiation damping).
De cualquier manera, en lo que hemos visto acerca de cargas eléctricas y consecuentemente
campos eléctricos acelerados todo hasta aquí parece ser consistente, libre de conflictos internos.
Consideraremos ahora cómo empiezan a surgir dificultades en cuanto entra en el panorama la
Relatividad General.

Si aceptamos en toda su extensión el principio fuerte de equivalencia de la Relatividad General,


la equivalencia plena entre la gravedad y la aceleración, la sola idea de que la radiación
electromagnética es una función de la aceleración de una carga eléctrica se vuelve problemática,
porque bajo este contexto un objeto puede estar estacionario en el mismo lugar y acelerándose
al mismo tiempo. Por ejemplo, un objeto cargado eléctricamente puede estar en reposo sobre la
superficie de la Tierra, y sin embargo está sujeto también a una aceleración gravitatoria g de
aproximadamente 9.8 metros/seg². Es precisamente esta aceleración gravitatoria la que
ocasiona que una masa tenga peso (W = mg), y que ese peso sea menor en la superficie de un
cuerpo celeste con menor atracción gravitatoria (como la Luna) o mayor en la superficie de un
cuerpo celeste con mayor atracción gravitatoria (como el planeta Júpiter), siendo el peso igual a
cero cuando el objeto está flotando libremente en el espacio. Podemos decir con plena certeza
que un objeto que permanece estacionario sobre la superficie de la Tierra no está radiando
energía electromagnética, al menos desde el punto de vista de observadores co-estacionarios. Si
estuviese radiando energía electromagnética, tendríamos entonces una fuente perpetua y
gratuita de energía. Puesto que la fuerza de empuje que sostiene al cuerpo en su lugar en la
superficie terrestre no actúa a lo largo de distancia alguna, el trabajo hecho por esta fuerza es
cero. Entonces no se está metiendo energía alguna en el objeto, de modo tal que si el objeto
estuviese emitiendo energía electromagnética (y suponiendo que la energía interna del objeto
permanece constante) tendríamos una violación del principio de la conservación de la energía.

Naturalmente, podríamos poner en tela de duda la aserción de que no se está haciendo trabajo
alguno por la fuerza de empuje que mantiene al objeto en la superficie de la Tierra. Si
imaginamos una cápsula herméticamente sellada en caída libre, y si dentro de dicha cápsula un
objeto se está acelerando (hacia arriba) de forma tal que mantiene la misma altura relativa en
relación a la fuente gravitatoria externa, podríamos decir que dentro de la cápsula hemos estado
haciendo un trabajo sobre el objeto al ir aumentando su velocidad (hacia arriba) dentro de la
cápsula, relativa a la cápsula misma, pese a que desde el punto de vista (externo) de la fuente
gravitatoria (la Tierra) el objeto permanece estacionario y no se ha efectuado trabajo alguno
sobre el objeto. Esto no debe sorprendernos, puesto que el trabajo y la energía cinética son
entendidos como conceptos relativos, pero nos conduce a la conclusión inusual de que la
radiación electromagnética también debe ser un concepto relativo. La relatividad que ya nos
debe ser familiar de la energía cinética se corresponde con la simetría que hay entre marcos de
referencia distintos, es decir, siempre podemos encontrar un marco inercial (Lorentziano) de
referencia con respecto al cual cualquier objeto (en un instante dado) tiene una energía cinética
igual a cero por estar el objeto instantáneamente en reposo en dicho marco de referencia que
hemos llamado el marco de referencia comóvil. El considerar partículas cargadas
eléctricamente en presencia de un campo gravitacional parece sugerir de igual modo que
siempre podemos encontrar un sistema de coordenadas (al menos localmente) con respecto al
cual un objeto cargado eléctricamente no emite radiación electromagnética alguna en un
instante dado, aunque la partícula pueda estar emitiendo radiación electromagnética con
respecto a otro sistema de coordenadas.

También podemos cuestionar el hecho de que las ecuaciones de la electrodinámica realmente


impliquen el hecho de que una carga eléctrica que se esté acelerando necesariamente deba
radiar energía electromagnética. Sorprendentemente, este asunto es un asunto que no se ha
zanjado del todo en la teoría clásica del electromagnetismo. La dificultad radica en saber cómo
poder dilucidar la influencia de una partícula cargada eléctricamente sobre sí misma.
Recordemos aquí que dos electrones se repelen el uno al otro con una fuerza que es
estáticamente proporcional al recíproco de la distancia que hay entre las cargas. Esto es
entendido tradicionalmente como la interacción de cada partícula con el campo eléctrico de la
otra partícula. La intensidad del campo eléctrico producido por cada carga aumenta hasta el
infinito conforme la distancia hacia la carga se aproxima a cero (suponiendo cargas puntuales,
algo que la Mecánica Cuántica considera insostenible). Pero es aquí en donde encontramos una
dificultad conceptual, porque de acuerdo con esta descripción todo electrón está situado
precisamente en un lugar en donde existe una fuerza de repulsión infinitamente grande en
contra de los electrones.

Podemos intentar manejar esto último de varias maneras. La solución más simplista consiste
simplemente en proclamar que un electrón no interactúa de modo alguno con su propio campo
eléctrico, y cuando interactúa lo hace con los campos de otras partículas. Si adoptamos éste
punto de vista, tenemos que explicar entonces el por qué una partícula cargada eléctricamente
opone una mayor resistencia a cambios en su estado de movimiento que una partícula sin carga
eléctrica alguna pero con la misma masa inercial. El análisis tradicional de las cargas aceleradas
nos dice que ésta “fuerza de reacción de radiación” aplicada a lo largo del movimiento de la
carga acelerada es la que nos proporciona el suministro de energía que es emitida en la forma de
ondas electromagnéticas. Tradicionalmente se ha explicado que esta fuerza tiene su origen en la
interacción de la partícula con su propio campo eléctrico. Por lo tanto, si proclamamos que las
partículas cargadas eléctricamente no interactúan con su propio campo, entonces tenemos que
buscar una explicación alterna a la reacción de radiación. Un candidato para tal cosa es la teoría
del absorbedor Wheeler-Feynman, la cual empieza con la idea de que toda solución válida a las
ecuaciones del campo electromagnético tiene que ser simétrica con respecto a lainversión del
tiempo (t → - t), como lo son las mismas ecuaciones del campo electromagnético, siendo la
motivación para dicha propuesta la importancia que la simetría del tiempo tiene en el estudio de
la física, y de acuerdo con la cual la resistencia adicional presentada por una partícula cargada a
cambios en su estado de movimiento se debe a ondas avanzadas emanando hacia atrás en el
tiempo de un conjunto de absorbedores en el futuro, cuyas ondas son excitadas por las ondas
retardadas emanando de la partícula hacia adelante en el tiempo. El problema con esta
explicación es que pone en aprietos al principio básico de la causalidad de la ciencia.

También podríamos argumentar que aunque la fuerza de repulsión sobre una partícula cargada
producida por su propio campo es infinita, ésta debe ser igualmente infinita en todas las
direcciones posibles, de modo tal que las fuerzas infinitas se cancelan dejando una fuerza neta
de cero sobre la partícula debida a su propio campo, al menos si la partícula está en movimiento
uniforme. Podemos suponer además que la aceleración de una partícula cargada altera esta
situación singular al irse sobreponiendo a su propio campo, ocasionando por lo tanto una fuerza
neta. La misma perturbación del campo nos produce una radiación, de modo tal que
observamos una correlación entre radiación y reacción. Sin embargo, este argumento nos lleva
demasiado pronto a conclusiones que desafían nuestra intuición, empezando por el hecho de
que la ecuación de movimiento que se obtiene basada en esta premisa implica que una carga
eléctrica que se está acelerando no emite radiación alguna. A esto se le llama generalmente
movimiento hiperbólico, porque la línea del mundo de la partícula en un diagrama espacio-
tiempo de Minkowski resulta ser una hipérbola asintótica al cono de luz. Aún más perturbador
resulta el hecho de que las ecuaciones de movimiento para una partícula cargada basadas sobre
estas consideraciones poseen soluciones de fuga(runaway) en las cuales la partícula se acelera
rápidamente hacia la velocidad de la luz. El que estas soluciones puedan ser reales o no sigue
siendo motivo de debate, pero la ausencia de radiación predicha para el movimiento hiperbólico
ha sido citada algunas veces como una forma de reconciliar el Principio de Equivalencia de la
Relatividad General con el hecho de que una partícula cargada eléctricamente en reposo sobre la
superficie de la Tierra no emite radiación electromagnética pese a que está experimentando una
aceleración propia (local) de 9.8 metros/seg². En la obra Feynman Lectures on Gravitation,
Richard P. Feynman va tan lejos como para afirmar que “hemos heredado el prejuicio de que
una carga que se está acelerando debe emitir radiación” (Feynman fue un científico prolífico
ganador del Premio Nobel que dió un gran impulso al campo de la electrodinámica cuántica o
QED - Quantum Electrodynamics), y tras hacer esta aserción argumentó que la fórmula clásica
que nos proporciona la potencia radiada por una carga que se está acelerando como
proporcional al cuadrado de la aceleración “nos ha separado del camino correcto” porque ésta
fórmula se aplica únicamente a movimientos cíclicos o acotados como los que se llevan a cabo en
los aceleradores de partículas, afirmando que el trabajo hecho por unidad de tiempo en contra
de la “fuerza de reacción de radiación” por una partícula que se está moviendo a lo largo del eje-
x es:

De acuerdo con esta fórmula, la fuerza de reacción de radiación (y por lo tanto la potencia
radiada) es proporcional a la tercera derivada de la posición, de forma tal que si la partícula se
está moviendo con una aceleración constante (con lo cual d3x/dt3 = 0) entonces la partícula no
emite radiación electromagnética alguna. Pero si esto es cierto, ¿entonces por qué estamos
acostumbrados a considerar a la radiación estrictamente como una función de la aceleración?
Feynman señala que la ecuación puede ser escrita de la siguiente manera:

en donde podemos reconocer en el primer término a la fórmula de Larmor para la potencia


radiada. Para un movimiento ondulatorio senoidal sencillo x(t) = sen(wt), el primer término es
proporcional a w4sen²(wt), el cual es definitivamente positivo (positive definite) mientras que el
segundo término es proporcional a w4cos(2wt) que oscila por intervalos de tiempo iguales entre
valores positivos y negativos. Con esto, el trabajo acumulativo integrado representado por el
segundo término sobre cualquier número entero de cicles es igual a cero, mientras que el trabajo
representado por el primer término aumenta paulatinamente. Esto explica el por qué
usualmente ignoramos el segundo término y tomamos el primer término como la definición de
la potencia electromagnética radiada, lo cual nos lleva a la conclusión errónea de que la
radiación es estrictamente una función de la segunda derivada (aceleración), cuando de hecho
es proporcional a la tercera derivada de la posición. (Dicho sea de paso, si regresamos a la
ecuación original anterior aplicándola a nuestra partícula sinusoidal, obtenemos una potencia
que es proporcional a w4cos²(wt), lo cual demuestra que el efecto del término que no es
definitivamente positivo en la segunda ecuación equivale a desplazar la fase de la potencia por
un ángulo de π/2.

Pese a las correcciones hechas por Feynman, no existe un acuerdo general en la literatura acerca
de si una carga acelerada uniformemente es capaz de radiar en el ámbito de la electrodinámica
clásica, e inclusive mucha gente rechaza las conclusiones de Feynman como absurdas. A modo
de ejemplo, en el libro “Electromagnetic Fields and Interactions” de Richard Becker
encontramos en el párrafo 4 de la Parte II el argumento de que la ecuación de Feynman es válida
únicamente para movimientos casi periódicos para los cuales todas las derivadas de la posición
son proporcionales a las potencias correspondientes de las frecuencias, señalando que “se
obtienen resultados absurdos si (la ecuación de Feynman) es aplicada a otros tipos de
movimiento, tales como el retardamiento de un electrón libre en un campo eléctrico que se
opone a su avance. En este caso, sólo la segunda derivada será diferente de cero, y la ecuación no
será capaz de predecir ningún amortiguamiento ocasionado por la radiación (esto es conocido
en los textos de la electrodinámica clásica como radiation damping). La derivación dada arriba
del amortiguamiento de la radiación no es satisfactoria, porque no está claro cómo la onda
esférica que es emitida influye en el movimiento del electrón. Para poder lograr un
entendimiento más cercano sobre la naturaleza de esta ‘auto-reacción’ es necesario calcular la
fuerza resultante sobre todos los elementos de volumen del electrón. Tipos de movimiento (tales
como el del electrón libre) sólo pueden ser tratados a la luz de un conocimiento más preciso de
la estructura del electrón”. De este modo, Becker rechaza como absurda la noción de que una
carga en movimiento uniformemente acelerado no experimenta reacción de radiación, mientras
que Feynman defiende su propuesta basándose en el Principio de Equivalencia de la Relatividad
General.

Naturalmente, sabemos que arriba de cierta frecuencia (o debajo de cierta longitud de onda, que
viene siendo el enunciado equivalente) las ecuaciones clásicas del electromagnetismo dejan de
ser válidas:
como lo muestra el contraste entre la conclusión matemática clásica de la “catástrofe del
ultravioleta” proveniente del análisis de una radiación de cavidad y los resultados obtenidos
experimentalmente. El efecto fotoeléctrico debe ser tomado en cuenta también al igual que
todos los demás efectos de naturaleza mecánico-cuántica, los cuales son incompatibles con la
concepción ondulatoria sencilla de la radiación electromagnética. De cualquier modo, aún en la
teoría cuántica de la electrodinámica encontramos que el asunto de la reacción de radiación nos
conduce a dificultades que hasta la fecha sólo han podido ser resueltas de una manera ad
hoc mediante el proceso matemético de renormalización.

Resulta interesante considerar el resultado de tratar a la radiación electromagnética


simplemente como la emisión de partículas clásicas moviéndose a velocidad constante, muy al
estilo de la teoría corpuscular de Newton. Aquí encontramos de inmediato dificultades, porque
estos corpúsculos de luz son portadores de momentum, y si se considera que son emitidos de
manera discreta (en “cuantos”) por la partícula cargada, entonces la reacción debería ser un
impulso, lo cual implica una aceleración de la partícula emisora, aunque de una duración
infinitesimalmente pequeña de tiempo. Ahora bien, si la radiación electromagnética proveniente
de esta partícula es estrictamente proporcional a la aceleración, debemos esperar que la
partícula esté radiando a una razón infinita por un un período infinitesimalmente pequeño de
tiempo debido a la reacción de la emisión de un solo corpúsculo de radiación. Podría
argumentarse que el monto total (integrado) de esta radiación es finito, pero la emisión de cada
uno de estos corpúsculos radiados le dá un impulso adicional de aceleración a la partícula
cargada eléctricamente, resultando a su vez en más radiación, y así sucesivamente. Esto nos
demuestra claramente la naturaleza problemática de las proposición dual de que la aceleración
produce radiación y de que la radiación provoca aceleración. Resulta obvio que estas dos
proposiciones deben ser balanceadas cuidadosamente para poder producir resultados bien
comportados.

En el pasaje introductorio de su primer trabajo publicado en 1905 sobre la Teoría de la


Relatividad titulado “Sobre la electrodinámica de los cuerpos en movimiento”, Einstein usa
como paradigma el movimiento relativo entre un conductor y un imán moviéndose a una
velocidad constante, destacando que es el movimiento relativo entre ambos lo que produce el
fenómeno de inducción, sin hacer referencia alguna a ningún tipo de radiación
electromagnética, destacando también que el tratamiento clásico pre-relativista (basado en las
transformaciones de Galileo) conduce a asimetrías que no están presentes en los fenómenos de
la electrodinámica. Hoy nos encontramos en una situación parecida a la que encontró Einstein
al tratar de liberar a la electrodinámica clásica de su tiempo de dichas asimetrías si intentamos
extender la filosofía relativista a cargas que están siendo aceleradas, porque si hacemos tal cosa
nos topamos nuevamente con la existencia de asimetrías que no son parte inherente de los
fenómenos bajo observación, especialmente si aceptamos plenamente la versión fuerte del
Principio de Equivalencia de la Relatividad General. Si sometemos a una partícula cargada a un
movimiento acelerado periódico mientras un conductor distante está en reposo o en
movimiento a velocidad constante, la partícula cargada emitirá radiación electromagnética con
momentum y energía bien definidos por la electrodinámica clásica, y esta radiación inducirá
corrientes pequeñas en el conductor. Por otro lado, si es la partícula la que está en reposo o en
movimiento uniforme mientras que el conductor distante es sometido a un movimiento
oscilatorio acelerado, no habrá radiación electromagnética emanada de la carga (de acuerdo con
el punto de vista tradicional) aunque de cualquier manera aparecerán corrientes en el
conductor, ahora atribuídas al campo eléctrico estático. Parece razonable sugerir que no es
justificable la distinción trazada por el punto de vista tradicional sobre las dos circunstancias
mencionadas, y el principio de la relatividad debe poder ser aplicado a las descripciones de
efectos físicos con respecto a sistemas de referencia mucho más generales. Esto es en efecto lo
que abarca la versión fuerte del Principio de Equivalencia, y es la razón por la cual Einstein
consideró a su teoría de la gravedad como una generalización y extensión del principio de la
relatividad. En 1917 Einstein escribió lo siguiente: “De acuerdo con esta concepción, uno no
puede hablar de la aceleración absoluta de un sistema de referencia, del mismo modo que en la
Teoría de la Relatividad uno no puede hablar de la velocidad absoluta de un sistema”. Sin
embargo, no todos están de acuerdo con esta observación fundamental hecha por Einstein, entre
ellos Hans Ohanian y Remo Ruffini, los cuales en su libro “Gravitation and Spacetime” escriben:
“Resulta tentador darle al principio de invariancia general la interpretación física de que la
aceleración también es relativa. Einstein llamó a su teoría de la gravedad la teoría de la
relatividad general porque él pensaba que (localmente) los fenómenos observados en un campo
gravitacional son indistinguibles de aquellos fenómenos observados en un sistema acelerado de
referencia. Sin embargo, los efectos de marea (estos no tienen nada que ver con la marea que
provoca la Luna en el nivel del mar en los puertos, son consecuencia del hecho de que las
trayectorias de dos cuerpos en caída libre convergen hacia un mismo punto cuando son
extendidas) nos permiten establecer una distinción clara entre las fuerzas gravitacionales y las
pseudo-fuerzas encontradas en los marcos acelerados de referencia. Por lo tanto es falso hablar
de una relatividad general del movimiento”. La respuesta dada por los relativistas teóricos a este
argumento es que en primer lugar la teoría de Einstein no es propiamente hablando la teoría de
la relatividad general, sino una teoría general de la relatividad, y en segundo lugar la idea de que
los efectos de marea falsifican el Principio de Equivalencia es incorrecta, la cual surge del fallo
en reconocer que la restricción de localización es tanto temporal como espacial y que, más aún,
aquellos que suponen que la “gravedad verdadera” sólo existe en donde hay una curvatura local
del espacio-tiempo, yerran en considerar circunstancias en las cuales se puede producir un
campo gravitacional perfectamente uniforme sobre una región limitada mediante un arreglo
adecuado de materia; ¿podrían realmente argumentar que no hay gravedad verdadera en tal
región sólo porque no hay una curvatura local? En este respecto, el Principio de Equivalencia no
es más que la versión en el espacio-tiempo de la proposición de la geometría Riemanniana de
que una “hoja” diferenciable es localmente Euclideana (esto lo iremos viendo con mayor detalle
en entradas posteriores).

Una de las bases de nuestro prejuicio de que la radiación electromagnética debe ser absoluta es
la noción de que la radiación está formada por esas entidades discretas identificables y
localizables que llamamos fotones, desligadas en el curso de su existencia tanto de sus entidades
emisoras como de las entidades que las absorben. Este modo de pensar es lo que ha llevado a
mucha gente a aceptar ciegamente la existencia del “fotón libre”, aunque de acuerdo a nuestra
experiencia en realidad tal cosa no existe, ya que un fotón es necesariamente emitido y
absorbido. De no ser así, no tendríamos conocimiento de su existencia. Los únicos eventos que
son directamente observables son la emisión y la absorción del fotón, no la existencia de alguna
entidad “en tránsito”. Esto está relacionado directamente con la imposibilidad de la existencia
de una onda electromagnética perfectamente monocromática (“vibrando” a una sola frecuencia
fija):
porque para que ésta sea perfectamente monocromática no debe tener principio ni fin. Si
consideramos puntos de inicio y terminación como necesariamente tiene que ocurrir con los
fotones de luz:

esto nos introduce componentes de frecuencia adicionales de acuerdo a lo que nos dice la teoría
matemática conocida como el análisis de Fourier. Inclusive es dudoso que ésta última
representación sea la que más aproxima a la realidad física, y la representación de un cuanto de
onda electromagnética podría ser también la siguiente (entre muchas otras posibles):

Se debe recordar también que una onda perfectamente monocromática no es portadora de


información alguna, y por lo tanto no está sujeta a limitación alguna de esa característica física
que llamamos su velocidad de fase. Usualmente consideramos que la limitación relativista
impuesta por la velocidad de la luz se aplica tanto a la energía como a la información, de modo
tal que esto plantea la interrogante filosófica de que algo que sea perfectamente monocromático
(si es que tal cosa realmente exista) pueda ser portador de energía alguna. Muchos de los que
han estudiado este asunto a fondo enfatizan la distinción que debe de haber entre una carga
eléctrica que ha sido uniformemente acelerada para todo el tiempo y una carga eléctrica que ha
sido acelerada por un período prolongado de tiempo pero finito. Ultimadamente esto tiene una
conexión con la distinción que pueda haber entre un fotón libre (si es que tal cosa existe) y un
fotón real que es necesariamente emitido y absorbido.

Otro punto de vista lo encontramos en el libro “Electrodynamics and Classical Theory of Fields
and Particles” de Asim Orhan Barut, publicado en 1964 y nuevamente en 1980, en el cual lleva a
cabo una derivación de la fuerza de reacción de radiación empleando como punto de partida un
simple balance de energía basado en la premisa de que la potencia electromagnética,
considerada como energía por unidad de tiempo, está dada por la fórmula de Larmor. Igualando
la integral de esta potencia electromagnética con la integral del producto de la fuerza de reacción
de radiación por la velocidad tenemos el siguiente enunciado (estamos utilizando aquí la
notación del punto puesto encima de la variable para indicar la derivada con respecto al tiempo
de la variable, y un doble punto para indicar la segunda derivada con respecto al tiempo de la
variable):

Haremos uso de la siguiente igualdad:

la cual a su vez implica lo siguiente:

De este modo, si seleccionamos un intervalo de tiempo {0,T} tal que la primera o la segunda
derivada sea cero en ambos extremos de la integral, entonces el primer término en el lado
derecho de esta expresión se desvanece, lo cual nos permite substituír esto en la ecuación del
“balance de energía” y reacomodar los miembros bajo un solo símbolo integral para obtener así:
Tras esto, Barut hace la observación de que una solución (aunque no necesariamente la única)
de esta última expresión se obtiene fijando el integrando a cero, obteniéndose así:

De este modo, hemos llegado a la fórmula original de Feynman, aunque aquí está ocurriendo
algo inusual, porque Feynman empezó su análisis con esta relación argumentando que es
aplicable a movimientos generales, tras lo cual derivó la ecuación de Barut para el “balance de
energía” como una aproximación al movimiento periódico. En contraste, Barut empezó con su
igualdad para el “balance de energía” defendiendo su validez para movimientos generales, tras
lo cual derivó la ecuación original de Feynman como una aproximación para un movimiento
periódico, precisamente el reverso del razonamiento de Feynman. Como si esto no fuese ya de
por sí suficientemente confuso, Barut concluye diciendo que: “La suposición hecha arriba de que
d²x/dt² se desvanece en t = 0 y en t = T es ciertamente verdadera para el movimiento
oscilatorio, pero esperamos que un resultado como la ecuación (5) deba ser generalmente
cierto”. Desafortunadamente, no entra en detalle del por qué deberíamos esperar ésto. Casi
todos parecen invocar la identidad:

pero no parece haber un consenso común sobre cómo deba interpretarse, y sobre qué términos
deba considerarse fundamental.

Mucha de la literatura sobre el asunto de la radiación proveniente de cargas aceleradas se enfoca


en la ecuación del movimiento Lorentz-Dirac interactuando tanto con un campo externo como
con su propio campo. Esta ecuación es el origen de la ecuación de Feynman, pero es importante
recordar que está basada en la electrodinámica clásica de partículas puntuales en vez de estar
basada en la electrodinámica cuántica, de modo tal que su relevancia física es cuestionable. El
mismo principio de incertidumbre de Heisenberg descarta cualquier posibilidad de existencia de
una partícula puntual porque de ser así, no habría límite alguno, ni siquiera teórico, para la
ubicación de una carga eléctrica con un grado ilimitado de precisión, lo cual sabemos ya que no
es posible en virtud de la naturaleza ondulatoria de la materia. Más aún, la validez de la
ecuación Lorentz-Dirac es puesta en entredicho debido a la existencia de soluciones de
fuga para la misma que presumiblemente no son observadas en el laboratorio, aunque sería
interesante considerar como podría comportarse una partícula de fuga. El problema
fundamental es que, aunque esta ecuación involucra la tercera derivada de la posición, no
podemos especificar plenamente las condiciones iniciales únicamente en términos de la posición
y la velocidad como podemos hacerlo para las ecuaciones ordinarias del movimiento. En la
mecánica teórica, el espacio fase (phase space) usual para N partículas tiene 6N dimensiones
(tres coordenadas para la dimensión y tres coordenadas para el momentum de cada partícula),
mientras que el espacio fase para una partícula cargada bajo la ecuación de Lorentz-Dirac
tendría 9N dimensiones. Típicamente, consideramos a la posición y a la velocidad (o el
momentum) como parámetros independientes libres, en el sentido de que cualquier sistema
físico puede ser postulado como residente en cualquier punto de ese espacio fase, tras lo cual irá
evolucionando de acuerdo a las leyes del movimiento. Sin embargo, ya no es tan claro el que la
posición, la velocidad, y la aceleración puedan ser considerados en el mismo sentido como
parámetros libres mutuamente independientes. Las ecuaciones de campo de la Relatividad
General proporcionan una buena ilustración de cómo leyes que son no-lineares implican
restricciones (tales como las identidades de Bianchi) sobre las condiciones iniciales permisibles,
de modo tal que no estamos libres de poder especificar un sistema en un punto arbitrario del
espacio fase. Este tipo de restricción es aplicable también a la ecuación Lorentz-Dirac, puesto
que ésta ecuación también es no-linear. Sin embargo, la existencia de soluciones de fuga
(presumiblemente irreales) nos indica un tipo más sutil de restricción sobre las condiciones
iniciales permisibles. Los puntos permisibles en el espacio fase no sólo deben satisfacer las
restricciones instantáneas, también deben ser (evidentemente) tales que nunca terminen
evolucionando hacia regiones singulares o irreales del espacio fase. Por otro lado, el desprecio
usual al campo estático “cercano” al estar analizando el campo de radicación “lejano” está
basado en la suposición de que la distancia r a la fuente es lo suficientemente grande como para
que términos proporcionales a 1/r² sean despreciables en comparación con los términos
proporcionales a 1/r, aunque los cálculos de la reacción de radiación se extienden hasta r = 0. De
cualquier manera, pese a la posición y fisicalidad dudosa de la ecuación Lorentz-Dirac, es
instructivo repasar brevemente la forma de ésta ecuación así como sus implicaciones. Después
de la re-normalización de la masa, y utilizando para la velocidad de la luz un valor igual a la
unidad con fines de simplificación, esta ecuación para una partícula de masa m y carga q se
puede escribir de la manera siguiente:
en donde U es la 4-velocidad, A es la 4-aceleración, F es la 4-fuerza de Minkowski (con los
componentes Fm = Fmnum debidos a un campo externo Fmn), τ es el tiempo propio a lo largo de la
línea del mundo de la partícula (en el diagrama espacio-tiempo de Minkowski), mientras que A²
es el invariante escalar obtenido de la contracción del vector A consigo mismo. El primer
término en el lado derecho es la fuerza de Lorentz, y el segundo término es la fuerza de reacción
de radiación. Para nuestros propósitos, el aspecto más interesante de esta ecuación es el hecho
de que la fuerza de radiación se desvanece si la aceleración propia A de la partícula es constante.
En otras palabras, la cantidad dentro de los paréntesis es igual a cero bajo estas condiciones. El
desvanecimiento de la cantidad entre los paréntesis puede ser expresado de la siguiente manera
(la derivada de la 4-aceleración se toma aquí como la segunda derivada de la 4-velocidad):

La condición de una aceleración propia constante implica que el cuadrado de la magnitud de la


4-aceleración sea también constante, igual al negativo del cuadrado de la magnitud a² del 3-
vector a con respecto al marco de referencia co-móvil instantáneo. Por lo tanto, la fuerza de
reacción de radiación se desvanece (para una carga diferente de cero) sí y solo sí el 4-vector
velocidad satisface la ecuación harmónica:

El movimiento debe ser a lo largo de una línea recta, de modo tal que podemos considerar
únicamente un movimiento a lo largo del eje-x con un tiempo de coordenada t, en cuyo caso ésta
ecuación implica lo siguiente al considerar el primer componente (temporal, que aquí
identificaremos con el índice cero como se acostumbra hacerlo en muchos textos) y el segundo
componente (espacial, a lo largo del eje-x, que aquí identificaremos con el índice 1):
en donde U0 = dt/dτ y U1 = dx/dτ. Una solución de este par de ecuaciones es la siguiente:

que representan las ecuaciones familiares de “movimiento hiperbólico”, movimiento con una
aceleración propia constante. Esta es la base para la propuesta de que una carga uniformemente
acelerada no es capaz de emitir radiación electromagnética alguna, porque la energía de
radiación presumiblemente viene del trabajo efectuado en contra de la fuerza de reacción de
radiación, el cual es igual a cero para un movimiento con aceleración propia constante, al menos
de acuerdo con la ecuación Lorentz-Dirac. Sin embargo, como ya se ha señalado con
anterioridad, esta ecuación está fincada sobre suposiciones cuestionables, y se sabe que posee
soluciones dudosas, de las cuales las más problemáticas son las soluciones de fuga. Para una
partícula cargada eléctricamente, la ecuación Lorentz-Dirac se reduce a:

Enfocándonos nuevamente a un movimiento a lo largo del eje-x, esta ecuación vectorial puede
ser descompuesta en sus componentes esenciales, el primero de los cuales es:

teniendo la condición hiperbólica U0² - U1² = 1, y una forma de asegurar automáticamente esta
condición consiste en fijar:

U0(τ) = cosh{f(τ)}____U1(τ) = senh{f(τ)}


para alguna función arbitraria f. Insertando estas dos relaciones en la ecuación anterior,
tenemos entonces:

Dividiendo lo último entre senh(f) llegamos a lo siguiente:

Integrando esto dos veces tenemos entonces:

en donde C = (2q²)/(3m0) y los símbolos k y J representan constantes arbitrarias de integración.


El componente U1 de la ecuación Lorentz-Dirac nos lleva a las mismas condiciones para f (los
componentes U2 y U3 son desde luego satisfechos con U1(τ) = U2(τ) =0), de modo que haciendo
K = kC una solución de la ecuación Lorentz-Dirac para movimiento a lo largo del eje-x en la
ausencia de fuerza alguna se puede escribir como:

Por lo tanto la velocidad de la partícula con respecto a las coordenadas (t,x) viene siendo:
La tangente hiperbólica es asintótica a ±1, de modo tal que dependiendo del signo de K la
velocidad de la partícula se aproxima rápidamente a la velocidad de la luz conforme el tiempo t
aumenta. Estas soluciones de fuga (conocidas también como soluciones “auto-aceleradas”) son
consideradas generalmente como carentes de significado físico, poniendo en entredicho la
validez de la ecuación de movimiento Lorentz-Dirac. Es interesante observar que estas
soluciones no son simétricas en el tiempo, porque la constante C = (2q²)/(3m0) es
definitivamente positiva (presumiblemente). Por lo tanto, la partícula libre con carga eléctrica se
aproxima a la velocidad de la luz en la dirección positiva de t, mientras que en la dirección
negativa de t se aproxima a una velocidad fija tanh(J). Estas soluciones serían simétricas (en el
tiempo) solo si q² o m0 pudieran ser negativos. Las rarezas de estas soluciones de fuga han
llevado a una inspección más cuidadosa de las premisas sobre las cuales se basa la ecuación
Lorentz-Dirac. Existen diferencias sutiles de interpretación cuando se intenta igualar la energía
de la radiación electromagnética emitida por una partícula con el trabajo hecho sobre la
partícula, y esto sin mencionar la dificultad en intentar aislar la masa inercial m de la “masa”
electromagnética (por ejemplo, si nos preguntamos si una partícula cargada eléctricamente
requiere la misma fuerza de empuje hacia arriba para mantenerla estacionaria sobre la
superficie de la Tierra que una partícula con la misma masa pero sin carga eléctrica, tenemos
que considerar cuidadosamente cómo la carga eléctrica puede contribuír a la masa de la
partícula. Como resultado de estas consideraciones, la ecuación Lorentz-Dirac no nos
proporciona una respuesta sobre si una carga eléctrica uniformemente acelerada es capaz de
emitir radiación electromagnética.

En síntesis, aunque la electrodinámica clásica Maxwelliana que inspiró a Einstein parece tener
una concordancia excelente con la Teoría Especial de la Relatividad, a la hora de considerar
cargas eléctricas aceleradas empezamos a ser acosados con dificultades de difícil resolución.
Una parte de estas dificultades se pueden sobrellevar dando el salto de la eletrodinámica clásica
a la electrodinámica cuántica. Pero el panorama está notoriamente incompleto en virtud de que
al considerar movimientos acelerados de cuerpos con masa, no tenemos hasta el momento algo
que nos permita transitar de la Teoría de la Relatividad hacia una Teoría Cuántica de la
Relatividad, lo cual tiene a su vez un impacto directo sobre la misma electrodinámica cuántica
al considerar que bajo una teoría cuántica de la gravedad el campo electromagnético debe ser
capaz de interactuar con el campo gravitacional pudiéndose predecir nuevos fenómenos que
hasta el momento permanecen fuera de nuestras capacidades predictivas. Una teoría cuántica
de la gravedad debe ser capaz, en principio, de poder unificar plenamente la masa inercial de
una partícula con su “masa” eléctrica que tradicionalmente hemos identificado como la carga
eléctrica de la partícula, y aunque tradicionalmente se han manejado como dos propiedades
diferentes de la misma partícula resulta obvio que ambas “masas” deben estar unificadas de un
modo fundamental que está eludiendo a nuestras mejores mentes. Esta unificación (de la cual la
unificación de la carga eléctrica con la masa inercial no es más que parte del asunto) era
precisamente lo que buscaba Einstein en su búsqueda de un gran “campo unificado”, tarea en la
cual fracasó quizá porque tal unificación requiere de una perspectiva nueva, de una forma nueva
e imaginativa de pensar y ver las cosas que resulta difícil de adoptar y asimilar del mismo modo
en que la propia Teoría de la Relatividad encontró dificultades en su aceptación por varias
décadas. O quizá lo que nos hace falta es el desarrollo de nuevas técnicas matemáticas que nos
permitan “soldar” el determinismo causalístico de la Teoría de la Relatividad con la naturaleza
probabilística de la dualidad onda-partícula de la materia, técnicas matemáticas que nos
permitan utilizar e inclusive ampliar lo que ya tenemos a la mano sin necesidad de tener que
desmoronar todo el edificio como lo hizo Einstein con la mecánica de Newton. O quizá nos
hacen falta ambas cosas. Mientras no tengamos tal teoría y tales técnicas a la mano, parece que
en contra del optimismo exagerado manifestado por algunos científicos de prestigio en el
sentido de que está cercano el momento de que en la física muy pronto ya no habrá nada nuevo
por descubrir al contar con la Teoría del Todo parece carecer de justificación. El campo sigue
abierto para todos, especialmente para las nuevas generaciones. De cualquier modo, aún con las
limitaciones teóricas ya señaladas, se siguen produciendo trabajos interesantes en el campo de
la electrodinámica relativista asociada a la Relatividad General, entre los cuales se puede
mencionar un trabajo de Amos Harpaz titulado “An electric field in a gravitational field”
(publicado en arXiv) en el cual se analiza el comportamiento de un campo eléctrico en un campo
gravitacional, encontrándose que debido a la masa (energia) del campo eléctrico éste queda
sometido a la acción de la gravedad, y su caída introduce una curvatura en el campo
gravitacional, creando una fuerza de reacción o fuerza de tensión (stress force), teniendo como
consecuencia el hecho de que la interacción de esta fuerza de reacción con la carga eléctrica
estática dá origen a la emisión de radiación. En pocas palabras, un campo eléctrico por sí solo es
capaz de emitir radiación electromagnética cuando es sometido a un campo gravitacional (sin
embargo, la emisión sólo puede ocurrir mientras el campo eléctrico se ajusta al campo
gravitacional y no después, ya que de otra manera tendríamos una fuente gratuita y perpetua de
energía en violación de los principios ya conocidos). Otro trabajo interesante es el de James M.
Nester y Chung-Ming Ko titulado “An accelerated charge is also absorbing power” (también
publicado en arXiv) en el que repiten una conclusión que es frecuentemente pasada por alto: el
que una carga eléctrica acelerada no sólo está emitiendo energía, sino que también la está
absorbiendo a una razón igual a la razón de la potencia radiada predicha por la fórmula de
Larmor, apoyando una propuesta presentada previamente por Jerzy Kijowski. Todos estos
trabajos, desde luego, están expuestos a una revisión profunda en el momento en que podamos
tener en nuestras manos una teoría que unifique plenamente a la Teoría Especial de la
Relatividad y a la Relatividad General con la electrodinámica; mientras tanto hay que seguir
trabajando con lo que ya se tiene.

La ruta geodésica I
“La menor distancia entre dos puntos es la recta que los une” - “Los elementos”, Euclides.

Efectivamente, en un plano de dos dimensiones la menor distancia entre dos puntos P y Q


cualesquiera es la recta que une a dichos puntos. En un espacio tridimensional, también la
menor distancia entre dichos puntos P y Q será la recta que los une, y esa recta podemos
imaginarla trazada sobre una superficie plana. Aunque nuestra intuición geométrica humana no
nos ayude, podemos extender esta suposición hacia un espacio de más de tres dimensiones,
elevándolo a la categoría de postulado, y de hecho podemos justificar tal suposición recurriendo
a las herramientas del cálculo infinitesimal para encontrar la distancia mínima entre dos puntos
en un espacio n-dimensional.

Pero la vieja afirmación Euclideana se nos viene abajo cuando consideramos una superficie
curva, como la superficie de una pelota o la superficie de un cilindro. Consideremos primero la
superficie de un cilindro. Un cilindro es una superficie que al igual que un rollo de papel puede
ser desenrollada y extendida sobre un plano, y sobre la superficie del mismo cilindro cuando ha
sido desenrollado la menor distancia entre dos puntos es la recta que une a dichos puntos:
Sin embargo, cuando volvemos a enrollar la superficie dándole un carácter curvo en un espacio
tridimensional, aunque para una hormiga que esté caminando sobre dicha recta nada parece
haber cambiado, para alguien que observa el enrollamiento la ruta más corta entre dos puntos
está dada por la hélice que conecta a dichos puntos:
Y como era de esperarse, la longitud de la línea no ha cambiado nada. La longitud de la línea
recta cuando el cilindro está desenrollado es exactamente la misma que cuando enrollamos el
cilindro, por el hecho de que la longitud es una cantidad escalar. Sin embargo, la línea
trazada sobre la superficie del cilindro tiene una curvatura que antes no existía cuando el
cilindro estaba extendido sobre un plano. Esto es precisamente lo que ocurre cuando la
superficie sobre la cual ocurre un movimiento es transformada de una superficie plana a una
superficie curva.

En el caso de la superficie de una pelota esférica de futbol, desde la perspectiva de un


observador externo la menor distancia entre dos puntos P y Q puestos sobre la superficie de la
pelota no es la línea recta que une a los puntos puestos en dicha pelota trazada dicha línea a
través de la pelota (lo cual requeriría perforar la pelota con un picahielos) sino el arco de círculo
máximo que pasa por dichos puntos, al cual podemos llamar “la línea más derecha posible de
todas” entre dichos puntos. Esta es la trayectoria que tomaría sobre la superficie de la pelota una
cuerda elástica tensa estirada para poner sus extremos en los puntos P y Q. Para una hormiga
que camina sobre la superficie de la pelota, y que por su tamaño no se dá cuenta de que camina
sobre una superficie curva (del mismo modo que nosotros en nuestra experiencia cotidiana no
nos damos cuenta de la redondez de la Tierra, razón por la cual hasta antes del descubrimiento
de América muchos creían que la Tierra era plana), la distancia entre dos puntos P y Q cuando
camina de frente y siempre hacia adelante sin desviarse hacia la derecha o hacia la
izquierda es una línea recta; se requiere de un ser “superior” capaz de poder ver desde una
perspectiva mucho más amplia esa superficie en la que habita la hormiga para darse cuenta de
que si la hormiga pudiera perforar de alguna manera la superficie de la pelota podría encontrar
una trayectoria más corta aún entre dichos puntos. Pero si no le es dado a la hormiga el poder
llevar a cabo esta “perforación”, si está confinada a vivir y caminar toda su vida sobre la
superficie de la pelota, jamás se dará cuenta de ello. De lo que no nos queda duda alguna es que
también en la superficie de la pelota hay una infinitud de rutas posibles para llegar del punto P
al punto Q, y de todas las rutas posibles hay una que le tomará a la hormiga el menor tiempo
posible, la cual será la menor distancia entre los dos puntos de una superficie curva, “la curva
más derecha posible” que podamos trazar entre dos puntos, a la cual designamos como la ruta
geodésica o simplemente geodésica.

Expuesto lo anterior, podemos reformular el clásico enunciado de Euclides en una forma


moderna más correcta:

“La menor distancia entre dos puntos es la geodésica que los une.”
En el espacio-tiempo plano de la Teoría Especial de la Relatividad, las geodésicas son líneas
rectas para cualquier observador. Pero en el espacio-tiempo curvo de la Teoría General de la
Relatividad, las geodésicas dejan de ser líneas rectas. Y nosotros estamos interesados en
estudiar la naturaleza geométrica de esas geodésicas en un espacio-tiempo curvo en cuatro
dimensiones porque en un espacio tal los cuerpos se mueven siguiendo rutas geodésicas. Puesto
de otra manera:

Las trayectorias elípticas que siguen los planetas en sus movimientos de traslación
alrededor del Sol son las rutas geodésicas que corresponden a un espacio-tiempo
curvo.

Esto que se acaba de enunciar representa una ruptura total con la filosofía detrás del esquema
de Newton que proclamaba la existencia de una fuerza invisible de atracción central F que era la
que mantenía a la Luna en órbita alrededor de la Tierra impidiéndole salir disparada hacia el
espacio exterior del mismo modo que se requiere de una fuerza central para mantener a un
objeto girando en torno a nosotros en una trayectoria circular:

Una forma de mantener a un cuerpo en una trayectoria circular es, efectivamente, con la
aplicación de una fuerza central que sea perpendicular a la dirección en la cual se está moviendo
el cuerpo como en la ilustración de arriba. Pero otra forma de mantener a un objeto en una
trayectoria circular sin necesidad de que exista una fuerza de atracción entre el objeto y el
punto central en torno al cual está girando el objeto es restringiendo al cuerpo en movimiento a
moverse sobre una superficie que es la que le dicta al objeto la trayectoria que debe
seguir, como lo muestra la siguiente figura:

Estrictamente hablando, la anterior representación no transmite a plenitud la idea relativista


detrás de los cuerpos desviándose de sus trayectorias rectilíneas debido a una curvatura en el
espacio-tiempo, porque en el diagrama de arriba si bien se ha eliminado el concepto de una
fuerza de atracción que provoca una desviación de la trayectoria rectilínea, la superficie
hemisférica mostrada altera la trayectoria a través de una fuerza de contacto entre el objeto y la
superficie hemisférica, aplicada por el contorno de la superficie sobre el objeto. En la Teoría de
la Relatividad, el concepto de fuerza como causante de la gravedad ha sido eliminado por
completo. La superficie curva existe, pero no es una superficie “sólida”, es una superficie dictada
por la curvatura en el espacio-tiempo causada por la gravedad, es una superficie tan “sólida”
(desde el punto de vista material) como puedan serlo el mismo tiempo y espacio.

Nos preguntamos ahora: si un cuerpo de masa m es libre para moverse inercialmente excepto
que su movimiento esté restringido a llevarse a cabo en una superficie curva, ¿cuál es la curva
trazada por el movimiento del cuerpo sobre dicha superficie? (Podemos imaginar al objeto
totalmente cubierto de tinta con la cual va dejando un rastro de su trayectoria al recorrer la
superficie curva.) De la física clásica el resultado viene siendo unageodésica de la superficie,
una curva que representa la menor distancia posible, o bien “la curva más derecha posible”. Esto
captura la esencia detrás de la propuesta de Einstein, la idea de que los cuerpos se mueven sobre
una superficie cuatri-dimensional de un espacio-tiempo curvo siguiendo una ruta geodésica.
En la física clásica tal y como fue desarrollada por Newton, un cuerpo se mueve libremente en el
espacio en torno a otro objeto excepto que su movimiento aparenta estar restringido a llevarse a
cabo dentro de una superficie bi-dimensional (el interior de una esfera o una elipse) empotrada
en un espacio tri-dimensional tal y como lo tenemos arriba. Sin embargo, en la Teoría General
de la Relatividad una masa se mueve libremente en el espacio-tiempo al estar en caída libre de
modo tal que la gravedad actúa sobre ella a través de la curvatura del espacio-tiempo. En la
física clásica, la trayectoria espacial de un cuerpo es la geodésica de lo que para nosotros parece
ser el interior de una superficie bi-dimensional, trazando la curva de menor longitud posible
sobre dicha superficie, mientras que en la Teoría General de la Relatividad la trayectoria es una
trayectoria espacio-tiempo, la cual es una geodésica del espacio-tiempo que va trazando una
curva de intervalo espacio-tiempo extremo en el espacio-tiempo. (Al utilizar la
palabra extremo para designar al intervalo, estamos dejando abierta la posibilidad de que se
pueda tratar de un mínimo o de un máximo como se acostumbra tener en los estudios
introductorios de cálculo infinitesimal).

El concepto de los cuerpos moviéndose en el espacio siguiendo rutas geodésicas en el espacio-


tiempo sin que exista una fuerza de atracción entre los mismos como lo suponía Newton parece
haber sacado por completo fuera del panorama el papel que desempeña el cuerpo central como
fuente de una fuerza de atracción gravitacional en base a la cantidad de masa M que contiene.
Sin embargo, esto no es así, ya que si bien la fuerza invisible ha dejado de existir la curvatura en
el espacio-tiempo es producida directamente por la masa M del cuerpo en torno al cual está
girando su satélite. Entre mayor sea el contenido de masa M del cuerpo central así
como su contenido de energía (esto ya no lo anticipó Newton), tanto mayor será la
curvatura del espacio-tiempo. Si no hay masa en el espacio circundante, entonces un
cuerpo cualquiera se mantendrá moviéndose en línea recta a velocidad
constante, inercialmente. De este modo, el contenido total de masa sumado al contenido
energético total de un cuerpo provoca una curvatura en su espacio-tiempo circundante que le
dice a los cuerpos que se le aproximan la trayectoria que deben seguir, la forma en la que deben
moverse, siguiendo rutas geodésicas. Esta idea la expresó Einstein en notación tensorial en
octubre de 1915 de la siguiente manera:

R = 8πGT

En notación explícita (empleando índices) la ecuación se escribe como:


Rμν = 8πGTμν

en donde Rμν es el tensor de Ricci con el cual se representa la curvatura del espacio-tiempo,
Tμν es el tensor energía-tensión, y G es la constante de gravitación universal. Sin embargo,
no le llevó mucho tiempo a Einstein el darse cuenta de que la ecuación tensorial anterior, que
representa un conjunto de ecuaciones, era incorrecta, ya que las ecuaciones resultaban ser
inconsistentes con la conservación local de la energía-momentum a menos de que la densidad
de la masa-energía-momentum del Universo fuese una cantidad constante. En otras palabras,
un ladrillo, el aire e inclusive el vacío tenían que tener la misma densidad para que lo anterior
fuese cierto. Esto requirió revisar el enunciado original, con una solución que resultó ser más
que obvia, la cual fue publicada al mes siguiente, dándonos la ecuación tensorial fundamental de
la Teoría General de la Relatividad:

que nos dice cómo la masa-energía nos provoca una curvatura en el espacio-tiempo cuatri-
dimensional, en la cual R es el escalar de Ricci y gμν es el tensor métrico con el cual ya
debemos estar familiarizados. Pero esta ecuación no nos dice cómo deben moverse los cuerpos
en el espacio en proximidad el uno del otro. Para saberlo, Einstein especificó una segunda
ecuación independiente de la primera que nos permite calcular las geodésicas que recorre un
cuerpo en movimiento en un espacio-tiempo cuatri-dimensional curvo. Es la siguiente:

En esta ecuación, la cual también es una ecuación tensorial, tenemos la presencia de


los símbolos de Christoffel Γabc.

Para poder llegar a la fórmula anterior, tenemos que hacer primero un repaso de algunos
conceptos básicos del cálculo infinitesimal.

Sabemos del cálculo infinitesimal que en un espacio bi-dimensional Cartesiano (plano xy) la
distancia entre dos puntos a(x1,y1)y b(x2,y2) cualesquiera (no necesariamente la ruta geodésica)
está dada por la siguiente relación:
PROBLEMA.- ¿Cuál será la longitud de un arco descrito por la ecuación y = x 3/2 desde
x1.=.0 hasta x2.=.1?

La derivada de la función proporcionada es:

Aplicando la fórmula obtenemos lo siguiente:


Esta es la longitud del arco de curva que une los puntos a(x1,y1) = (0,0) y b(x2,y2)=(1,1), pero no
es la geodésica entre dichos puntos. Aquí la geodésica es la línea recta que une a dichos puntos.

Introduciendo la variable tiempo, también podemos especificar la siguiente fórmula general


para describir la longitud de una línea (recta o curva) en un espacio bi-dimensional:

Al introducir el tiempo como una variable independiente en la anterior fórmula para describir
una línea (ya sea recta o curva) en un espacio plano, estamos recurriendo a lo que se conoce en
matemáticas como ecuaciones paramétricas.
PROBLEMA.- Encontrar la longitud del arco de una curva descrita por las ecuaciones
paramétricas x=t3 y y=t² situado entre los puntos (x1,y1) = (1,1) y (x2,y2) = (8,4).

En un espacio tri-dimensional, la descripción de una línea (ya sea recta o curva) por necesidad
tiene que llevarse a cabo empleando ecuaciones paramétricas, y tienen que especificarse tres
ecuaciones independientes, una para cada coordenada. A continuación tenemos un conjunto de
ecuaciones que nos especifican la trayectoria de una partícula que viaja a lo largo de una línea
recta conforme avanza el tiempo:

____x = 2 + 6t

____y = t
____z = -2 + 3t

Podemos ver la naturaleza rectilínea de este conjunto de ecuaciones con tres gráficas diferentes,
una para la variable dependiente x en función de la variable independiente t, la otra para la
variable y en función de la variable t, y y la otra para la variable z en función de la variable t.

Podemos extender fácilmente la fórmula usada para calcular la longitud de un arco en un plano
bidimensional a una fórmula que nos permita calcular la longitud de un arco de
curva tridimensional. Usando ecuaciones paramétricas, la expresión a ser usada será:

A modo de ejemplo, supóngase que se tienen las siguientes ecuaciones paramétricas que nos
trazan una curva en el espacio tridimensional:

siendo a, b y c constantes numéricas. Podemos hacer esto un poco más claro metiéndole
números al asunto. Supóngase que a.=.1, b.=.1 y c.=.2. En tal caso, se tiene el siguiente conjunto
de ecuaciones:

Tomando las derivadas para el cálculo de la longitud del arco trazado desde t1.=.0 hasta t2.=.1, se
tiene:
Por lo tanto, la longitud del arco de curva trazado desde t1.=.0 hasta t2.=.1 será:

Si hacemos una gráfica de la curva (puesto que la curva es tridimensional, lo mejor que se puede
lograr aquí es una proyección sobre un plano intentando simular los ejes tridimensionales),
vemos que las ecuaciones paramétricas describen una curva muy común, una hélice, como la
siguiente:
El lector astuto se habrá percatado de que esta curva tridimensional es precisamente como la
curva que se mostró arriba al principio de esta entrada conectando dos puntos marcados sobre
la superficie de un cilindro.

Cualquiera diría que la línea comprendida entre los puntos t1 y t2 del ejemplo que se acaba de
resolver con una longitud aproximada de 6.59 unidades no es la menor distancia posible entre
dichos puntos, y argumentaría que la menor distancia posible entre tales puntos está dada por
la recta que une dichos puntos. Puesto que las coordenadas rectangulares Cartesianas para cada
punto son:

Para t1 = 0: (x1, y1, z1) = (1, 0, 0)


Para t2 = 0: (x2, y2, z2) = (0, 1, 2)

entonces, usando la conocida fórmula Pitagórica, la longitud de la línea recta que une tales
puntos debe ser:

y efectivamente, una hormiga caminando sobre esta recta usaría menos de la mitad de su tiempo
requerido para llegar de un punto a otro siguiendo el arco de curva tridimensional. Sin embargo,
supóngase que la hélice del ejemplo es la ruta recorrida sobre un cilindro de acero sólido,
impenetrable, no siendo posible “perforar” el cilindro. Entonces no queda más alternativa que
seguir la ruta de la hélice o cualquier otra trayectoria que conecte los puntos t1 y t2.
Intuitivamente, la hélice parece ser la ruta más corta sobre la superficie de un cilindro que
conecte dos puntos cualesquiera marcados sobre la superficie del cilindro. En pocas palabras, la
hélice parece ser la geodésica que conecta los puntos t1 y t2. Pero, ¿lo es? ¿Podemos
demostrarlo? Veremos esto en mayor detalle un poco más abajo, pero antes, haremos una
reflexión sobre lo que acabamos de ver.

Hemos tomado la fórmula que nos proporciona la longitud de un arco bidimensional en un


plano, y la hemos extendido sin problema alguno para obtener una fórmula que nos proporciona
la longitud de un arco tridimensional. Pero... ¿podemos hacer lo mismo tratándose de una
curva cuatridimensional? De ser tal cosa posible, la definición tentativa para la longitud de un
arco de una 4-curva sería la siguiente:

Obsérvese que estamos metiendo aquí las coordenadas del 4-vector espacio-tiempo de la teoría
relativista. En la fórmula, se ha metido la constante c (la velocidad de la luz) para que la fórmula
sea dimensionalmente correcta (todo medido en metros). Y para poder calcular algún tipo de
derivadas, hemos metido un parámetro adicional, simbolizado como τ, a reserva de definir
posteriormente dicho parámetro, aunque nuestra intuición nos sugiere que tal parámetro bien
podría ser el tiempo local del observador viajero, el cual puesto que es medido por el observador
que lleva su propio reloj siempre marchará al mismo ritmo.

Y si hablamos de rutas geodésicas en un espacio tridimensional, debe ser posible hablar de lo


mismo en un espacio cuatridimensional. ¿Pero cómo las habremos de determinar? Tómese en
cuenta que no hemos demostrado aún ni siquiera que la hélice sea la geodésica sobre la
superficie de un cilindro en el espacio tridimensional. Obviamente, puesto que se trata de
un mínimo (la ruta más corta entre dos puntos), tendremos que echar mano de las herramientas
del cálculo infinitesimal, extendiéndolas hacia un espacio cuatridimensional.

Antes de continuar, repasemos el hecho de que el siguiente conjunto de ecuaciones


definitivamente nos describen una línea curva trazada en un espacio bi-dimensional:

____x = t²

____y = 2t - t² + 5t

mientras que el siguiente conjunto de ecuaciones definitivamente nos describen una línea curva
trazada en un espacio tri-dimensional:

____x = 2t

____y = 1+ t²

____z = 8 - t

Aparentemente, aquí tenemos una perspectiva gráfica sobre el espacio cuatri-dimensional


relativista, ya que en el anterior conjunto de ecuaciones tenemos a las cuatro variables (x,y,z,t).
Sin embargo, el problema es que las cuatro variables no son variables independientes, y una de
ellas no está en la misma categoría que las otras tres. Tenemos a tres variables dependientes y a
una variable independiente, siendo que en un espacio cuatri-dimensional puro ninguna de las
variables debe estar privilegiada sobre la otra. Esto es lo que nos obligará a buscar otro tipo de
enunciación matemática para poder especificar formalmente la determinación de la longitud de
un arco de curva en el espacio cuatri-dimensional relativista. Y aquí es precisamente en donde
entra el tensor métrico g = (gij) de 16 componentes.

En general, para poder describir el trazo que nos produce una curva en varias dimensiones,
digamos cinco, necesitaremos recurrir forzosamente a ecuaciones paramétricas, con las cuales
asociamos una n-pla de valores (posiciones) en las coordenadas (x0, x1, x2, x3, x4, ..., xn) a cada
punto específico de la curva. Así, en el 5-espacio Cartesiano, si las ecuaciones paramétricas de
una curva son:

____x0 = τ² + 1

____x1 = τ - 4

____x2 = 4 sen(τ)

____x3 = τ + 7

____x4 = 4 cos(τ)

entonces el punto de la curva para τ.=.0 estará posicionado en:

(x0, x1, x2, x3, x4) = (1, -4, 0, 7, 4)

No es necesario recurrir a visiones místicas en planos superiores de consciencia para tratar de


imaginar el comportamiento de esta curva en un 5-espacio Cartesiano. Nos basta
con proyectar sobre varios planos bi-dimensionales lo que ocurre para varios valores de τ para
poder “ver” lo que está ocurriendo en las cinco dimensiones. En el plano (x 2, x4) la curva estará
dando vueltas interminables alrededor de un círculo de radio 2 con centro en el origen del 5-
espacio Cartesiano. Y en el plano (x1, x3) la proyección de la curva sobre dicho plano nos indica
que el móvil avanza allí en línea recta, mientras que en el plano (x 0, x1) la curva sigue la
trayectoria de una parábola. Para un 5-espacio Cartesiano hay un total de nueve planos (nueve
posibles pares de combinaciones de las coordenadas), nueve proyecciones que juntas nos dan
una idea general sobre la trayectoria y forma de la curva. Esto es algo así como una “visión de
rayos X” con la cual si sacamos la placa del esqueleto de una persona de frente y otra placa de
perfil, con ambas placas podemos hacer una reconstrucción parcial tridimensional del
esqueleto. Pero podemos llevar esta estrategia más lejos aún, utilizando graficados tri-
dimensionales. Hay nueve proyecciones estereográficas posibles con las cuales podemos “ver”
mejor aún en cinco dimensiones. Y si recurrimos a una ilustración animada en donde vamos
variando una proyección tridimensional conforme va aumentando o disminuyendo una de las
otras dos variables manteniendo la quinta variable constante (ya hay programas de cómputo
que pueden llevar esto a cabo) tenemos entonces cinco proyecciones estereográficas animadas
con las cuales nos es posible “ver” mucho mejor la trayectoria de una curva en cinco
dimensiones.

Hemos visto cómo “medir” la distancia entre dos puntos diferentes en un espacio
multidimensional no necesariamente plano, pero hasta ahora no hemos visto cómo obtener
la geodésica entre dichos puntos, la ruta más corta de todas las otras rutas alternas que se
puedan trazar de un punto a otro. Para poder encontrar esa ruta óptima, para poder encontrar la
geodésica en un espacio multidimensional, tenemos que recurrir a una rama de las matemáticas
conocida como el cálculo de variaciones, en el cual la cantidad a ser minimizada (o
maximizada) aparece como una integral. La determinación de los valores extremos (máximos o
mínimos) de integrales cuyos integrandos contienen funciones desconocidas es precisamente la
clase de problemas a los cuales está dirigido el cálculo de variaciones. El más sencillo de tales
problemas consiste en la determinación de una función y = y(x) para la cual la integral

evaluada entre los puntos x0 = a y x1 = b adquiere su valor mínimo (obsérvese que con fines de
simplificación notacional se ha simbolizado la derivada de y con respecto a x con una comilla, o
sea y’). La función integrable F de las variables x, y y y’ se dá por conocida, por ejemplo:

en donde F = y√1 +(y’)². Al postularse el problema, la dependencia específica de y en x no está


prefijada, y(x) es precisamente la función desconocida que queremos encontrar. Esto es lo que
nos lleva a la derivación de la siguiente ecuación obtenida por primera vez por Euler (esta
misma ecuación fue aplicada casi al mismo tiempo por Lagrange a la mecánica para formular
sobre principios variacionales lo que hoy se conoce como dinámica Lagrangiana en la cual la
función F es reemplazada por la letra L, lo que hoy conocemos como el Lagrangiano del
sistema):

Pero antes de ver cómo podemos derivar de esta ecuación, consideremos primero un ejemplo de
una aplicación de la misma.

PROBLEMA: Hallar la curva y = y(x) con y(0) = 0 y y(a) = b que minimice la longitud del
arco que va del punto A(0,0) al punto B(a,b).

La longitud del arco en el plano Cartesiano x-y está dada por:

Aquí F = √1 +(y’)², y podemos aplicar de inmediato la ecuación de Euler, para lo cual evaluamos
primero:

∂F/∂y = 0

y:

∂F/∂y’ = (½)(1/√1 +(y’)²) 2y’

∂F/∂y’ = y’ / √1 +(y’)²

Usamos ahora directamente la ecuación de Euler:

∂F/∂y - (d/dx)(∂F/∂y’) = 0

0 - (d/dx)(y’ / √1 +(y’)²) = 0

(d/dx)[y’ {1 + (y’)²}-½] = 0
No es necesario tomar aquí la derivada con respecto a x. Para que lo que tenemos sea cierto, se
requiere que el término entre corchetes sea constante, lo cual a su vez requiere que y’ = dy/dx en
el denominador de la expresión también sea igual a una constante C, o sea:

Esto último es, desde luego, la ecuación de una línea recta. La curva extrema es por lo tanto una
recta, y se confirma el dicho de Euclides de que en un plano (Euclideano) la menor distancia
entre dos puntos es la recta que los une.

Habiendo visto el anterior ejemplo de la forma en la cual se aplica la ecuación de Euler para
poder determinar la naturaleza de la ruta mínima entre dos puntos cualesquiera, estamos en
mejores condiciones para poder entender cómo se lleva a cabo la derivación de dicha fórmula.

Considérese el siguiente diagrama:

En el diagrama, suponemos que la ruta óptima (la más corta de todas) para minimizar una
integral I bajo cierta función y(x) es la de color rojo. En el mismo diagrama se han trazado dos
rutas alternas de color verde que darían a la integral un valor mayor que el valor que
obtendríamos recorriendo la ruta de color rojo. La diferencia entre cualquier otra curva y la ruta
óptima es llamada la variación de y o δy. Sobre el eje horizontal se ha proyectado dicha
variación de color ciano. Para la ruta óptima, la variación δy al recorrer una ruta desde el
punto x0 hasta el punto x1 debe ser igual a cero. Cualquier otra ruta podemos describirla como
una función desconocida η(x) así como con un factor de escala variable que llamaremos α y el
cual nos dá la magnitud de la variación. La función η(x) es una función arbitraria excepto por el
requerimiento de que todas las rutas alternas pasen también por los puntos x0.=.a y x1.=.b en
donde la variación debe ser cero, o sea:

η(x0) = η(a) = 0

η(x1) = η(b) = 0

Entonces, si la curva óptima que extremiza (minimiza) a la integral es Y(x), cualquier otra ruta
alterna estará dada por:

y(x) = Y(x) + αη(x)

Abreviaremos notacionalmente para simplicidad sin olvidar la dependencia sobre la variable x:

y = Y + αη

Tomando diferenciales con respecto a la variable x:

y’ = Y’ + αη’

La integral I a ser extremizada es la siguiente:

I = ∫F(x, y, y’) dx

o en mayor detalle introduciendo los parámetros de variación:


y la condición para obtener un valor extremo en α = 0, análoga a la derivada dy/dx igualada a
cero en el cálculo infinitesimal ordinario será:

[∂I(α) /∂α]α = 0 = 0

Extremizamos (minimizamos) ahora la integral tomando la derivada de la integral I con


respecto al parámetro α manteniendo todo lo demás constante:

I’(α) = ∂I(α) /∂α

Esto requiere llevar a cabo una diferenciación metiendo al símbolo ∂ dentro del símbolo ∫, o sea
efectuando una diferenciación bajo el símbolo de la integral, lo cual podemos hacer en virtud de
que la diferenciación la estamos llevando a cabo con respecto a la variable α y no la
variable dx sobre la cual se efectúa la acción del integrando:

Por la regla de la diferenciación para funciones compuestas, tenemos la siguiente relación:

Usando las expresiones de arriba para ∂Y/∂α = η(x) y ∂Y’/∂α = η’(x), podemos escribir:
De este modo, la integral a ser extremizada es la siguiente:

Es evidente que en el punto extremo, haciendo α = 0, tendremos:

y = Y + αη = Y

y’ = Y’ + αη’ = Y’

Con esto, podemos expresar de la siguiente manera la integral que será llevada a cabo:

Separaremos temporalmente la integral en la suma de dos integrales para trabajar sobre el


segundo término:

Al segundo término en esta integral se le puede aplicar una integración por partes:

Puesto que η(a) = η(b) = 0, la parte integrada es igual a cero, con lo cual:
Juntando esto nuevamente con el primer término de la integral original, tenemos entonces:

Para que esto sea cierto lo que tenemos dentro del paréntesis debe ser cero, ya que siendo η
arbitrario si lo escogemos diferente de cero no hay otra forma de hacer que la expresión de la
izquierda sea igual a cero más que igualando todo lo que hay dentro de los paréntesis a cero. Se
concluye de lo anterior que:

Esta es la ecuación de Euler.

PROBLEMA: Demostrar que la geodésica sobre la superficie de un cilindro circular recto es


una hélice.

El elemento de distancia en un espacio tri-dimensional está dado por:

ds² = (dx)² + (dy)² + (dz)²

o bien:

ds = √(dx)² + (dy)² + (dz)²

Para poder expresar el elemento de distancia en coordenadas cilíndricas recurrimos a las


relaciones que conectan las coordenadas rectangulares Cartesianas (x,y,z) con las coordenadas
cilíndricas (r,φ,z):

x = r cos φ

y = r sen φ
z=z

Puesto que estamos interesados en obtener la geodésica sobre la superficie de un cilindro, en


este problema el radio r se mantendrá constante en todo momento sin ser objeto de variación
alguna. Con esto en mente y tomando diferenciales en cada una de las tres relaciones anteriores
obtenemos lo siguiente:

dx = - r sen φ dφ

dy = r cos φ dφ

dz = dz

Substituyendo estas diferenciales en la relación de la fórmula para el elemento de línea y


llevando a cabo la integración sobre la trayectoria completa, tenemos entonces:

Obsérvese que en este último paso hemos sacado fuera a la diferencial dφ y hemos utilizado
la notación de punto poniendo un punto encima de la variable z para así tener:

Esta variable z con un punto puesto encima debe ser tratada matemáticamente como si fuese
una nueva variable.

Podemos identificar de inmediato dentro del integrando a la función F que debemos utilizar
para aplicar la ecuación de Euler:
La ecuación de Euler en este caso será:

Puesto que ∂F/∂z = 0, la ecuación de Euler se nos reduce a:

Llevando a cabo la integración, obtenemos lo siguiente:

Despejando para la variable z con el punto encima:

Puesto que todo lo que está del lado derecho de la ecuación es una constante, esto significa que:

dz/dφ = constante

En pocas palabras, la geodésica entre dos puntos cualesquiera sobre la superficie de un cilindro
está dada por la hélice que conecta dichos puntos. Hemos logrado lo que nos habíamos
propuesto desde un principio. Hemos llegado así a la determinación formal de la geodésica
sobre la superficie del cilindro con el cual empezamos esta discusión.

El siguiente paso consistirá en extender el concepto de la geodésica en un espacio tri-


dimensional Euclideano hacia la geodésica en un espacio 4-dimensional propio de la Teoría de
la Relatividad, el espacio-tiempo curvo. Para ello, podemos extender sin dificultad alguna el
concepto de la ecuación de Euler usado para encontrar la longitud más corta sobre una
superficie en un espacio de tres dimensiones (como lo es el caso de una esfera) hacia el espacio
de cuatro dimensiones, obteniendo así la ecuación de la geodésica entre dos puntos cualesquiera
de dicho espacio 4-dimensional. No hay nuevos principios matemáticos involucrados ni nuevas
ideas, se trata únicamente de extender el concepto de la geodésica hacia un plano multi-
dimensional. Es precisamente así como se obtiene la ecuación general de la geodésica en un
espacio-tiempo curvo propio de la Teoría General de la Relatividad.

No hay que perder de vista el hecho de que la geodésica, por ser a fin de cuentas una distancia,
un número medido en metros, kilómetros o millas, sin dirección y sentido, es algo que
esperamos que permanezca invariable bajo cualquier transformación de coordenadas

La ruta geodésica II
Lo que hemos visto anteriormente puede ser extendido sin dificultad alguna a otros problemas
en los cuales estamos interesados en encontrar la geodésica que conecta a dos puntos diferentes
en un espacio descrito no por dos coordenadas (x1, x2) sino por tres coordenadas (x1, x2, x3).

PROBLEMA: Demostrar que la menor distancia entre dos puntos en un espacio tri-
dimensional Euclideano es una línea recta.

En un espacio tri-dimensional Euclideano, el elemento de la distancia es:

ds² = (dx)² + (dy)² + (dz)²

O bien:

ds = √(dx)² + (dy)² + (dz)²

Para poder describir una una línea cualesquiera en el espacio tri-dimensional Euclideano
necesitamos recurrir a ecuaciones paramétricas en las que en este caso cada una de las variables
que representan los tres ejes coordenados dependerá de un parámetro independiente que
llamaremos t, el cual podemos identificar como el tiempo para facilitar nuestra comprensión del
problema. En otras palabras, cada una de las variables x, y y zserán funciones del parámetro t.
Siendo así, entonces podemos llevar a cabo la integración de un punto t 1 a otro punto t2:
Para poder utilizar la ecuación de Euler con la finalidad de determinar la ruta extrema entre t 1 y
t2, identificamos en este caso a la función F de dicha ecuación como la siguiente:

Obsérvese que estamos llevando a cabo una simplificación representando cada una de las
derivadas con respecto a t mediante un punto colocado encima de cada variable y prescindiendo
de la forma explícita de representar dichas derivadas.

En este caso, tendremos tres ecuaciones de Euler, las cuales son:

Obviamente, la función F ya no depende directamente ni de x ni de y ni de z, porque estas


variables no aparecen como tales en la expresión para F (notacionalmente, una variable
cualquiera es diferente de la misma variable que tenga un punto colocado encima, y no deben
ser confundidas en el proceso de manipulación matemática). Con esto, tenemos que:

Entonces las tres ecuaciones de Euler originales se nos reducen a:


Substituyendo la relación para F en estas expresiones y llevando a cabo la integración con
respecto al tiempo obtenemos:

Combinando las tres ecuaciones obtenidas, tenemos entonces:

Llevaremos ahora a cabo una integración sobre estas expresiones de un tiempo t 1 a un tiempo
arbitrario t, obteniendo lo siguiente:

Ahora repetiremos el procedimiento integrando las mismas expresiones pero de un tiempo t 1 a


un tiempo t2 obteniendo así:
Esto nos permite hacer las substituciones apropiadas para poder obtener los valores de las
constantes de integración C1, C2 y C3 llegando a lo siguiente:

Esta es precisamente la ecuación de una recta en el espacio tri-dimensional Euclideano que pasa
por los puntos P(x1, y1, z1) y Q(x2, y2, z2).

En algunos problemas es ventajoso recurrir a ciertos “trucos” que a veces se descubren


accidentalmente y en otras ocasiones son el fruto de la experiencia y la madurez del que está
trabajando sobre problemas de esta índole. Uno de dichos trucos será detallado a continuación.

PROBLEMA: Demuéstrese que si la función F en la integral:

es independiente de la variable x, entonces la integral es un extremo si:

Fy - y’Fy’ = constante

o bien, en forma explícita:

El diferencial total de F, cuando es una función de dos variables y y y’ es:


Obsérvese que el término (∂F/∂x) dx no fue incluído en la suma de términos puesto que la
función F es independiente de x.

Dividiendo ambos lados entre el diferencial dx y simplificando mediante la toma de las


derivadas:

Tomaremos ahora la expresión:

Fy - y’Fy’

y obtendremos la derivada de la misma con respecto a x, que viene siendo:

Tomaremos ahora la derivada con respecto a x del segundo término, y reemplazaremos en el


primer término del lado derecho de esta ecuación la expansión obtenida arriba para dF/dx,
cancelando los dos términos comunes que se anulan mutuamente (puestos en color rojo):

lo cual se nos simplifica a:


Factorizando y' tenemos que esto es igual a:

Entonces tenemos que:

Por otro lado, si:

Fy - y’Fy’

es igual a una constante, entonces la derivada de esto debe ser igual a cero:

Entonces lo que tenemos se nos reduce a:

Puesto que y’ = dy/dx se asume diferente de cero, esto sólo puede ser cierto si:
que es la ecuación de Euler, la condición esencial para que haya un extremo. Por lo tanto, si:

y si F es independiente de x, entonces la integral:

será un extremo.

PROBLEMA: Encontrar la geodésica que hay entre dos puntos situados sobre la superficie de
una esfera.

Como siempre, el elemento de distancia en un espacio tri-dimensional está dado por:

ds² = (dx)² + (dy)² + (dz)²

o bien:

ds = √(dx)² + (dy)² + (dz)²

Para poder expresar el elemento de distancia en coordenadas esféricas recurrimos a las


relaciones que conectan las coordenadas Cartesianas (x,y,z) con las coordenadas esféricas
(r,θ,φ):

x = r sen θ cos φ

y = r sen θ sen φ

z = r cos θ
No es difícil demostrar mediante estas relaciones que el elemento de línea ds² está dado por:

ds² = dr² + r² dθ² + r² sen²θ dφ²

Puesto que estamos interesados en obtener la geodésica sobre la superficie de una esfera, en este
problema el radio r se mantendrá constante en todo momento sin ser objeto de variación
alguna. Esto significa que dr = 0. Entonces el elemento de línea sobre la superficie de la esfera
está dado por:

ds² = r² dθ² + r² sen²θ dφ²

ds = r √dθ² + sen²θ dφ²

Entonces, sacando fuera del radical a dφ, la distancia entre dos puntos cualesquiera 1 y 2sobre la
superficie de la esfera será igual a:

Si lo que estamos buscando es la geodésica, la ruta extrema entre los puntos 1 y 2 (la cual puede
ser un mínimo o un máximo) entonces bajo el criterio de la ecuación de Euler identificamos
como F a:

Para poder continuar, utilizaremos la siguiente representación notacional:

con lo cual podemos escribir lo siguiente:


Utilizaremos ahora la “segunda forma” de la ecuación de Euler:

con la cual podemos escribir lo siguiente:

Diferenciando y multiplicando al través por F, tenemos entonces:

Esto puede ser resuelto para dφ/dθ (obsérvese que no estamos resolviendo para dθ/dφ, en
virtud de que este ligero cambio nos resulta en una simplificación posterior para obtener la
respuesta que buscamos), produciéndonos:

Despejando para φ y llevando a cabo la integración obtenemos la siguiente relación:

en donde κ es la constante de integración y α es utilizada para representar:

α² = (1 - C²)/C²

Reescribiendo lo anterior para ponerlo en función de θ, o mejor dicho cot(θ):


cot(θ) = α sen(φ - κ)

Este es un resultado en coordenadas esféricas que no nos ilustra mucho sobre la naturaleza de la
geodésica. Para poder obtener mayor claridad, es necesario revertir a coordenadas rectangulares
(Cartesianas) multiplicando ambos miembros por r senθ para obtener después de haber llevado
a cabo la expansión de sen(φ - κ):

(α cos κ) r senθ senφ - (α sen κ) r senθ cosφ = r cosθ

Por razones que serán obvias pronto, no eliminaremos la variable r como podríamos hacerlo al
aparecer como factor en ambos lados de la ecuación.

Siendo κ y α constantes, podemos compactarlas bajo los nombres de otras constantes que las
agrupen:

A = α cos κ

B = α sen κ

Esto nos produce:

A (r senθ senφ) - B (r senθ cosφ) = r cosθ

Pero de las transformaciones de coordenadas esféricas a coordenadas Cartesianas se sabe que:

x = r senθ cosφ

y = r senθ senφ

z = r cosθ

Entonces lo que tenemos es esencialmente:

Ay - Bx = z

En el espacio tri-dimensional Euclideano, esta es precisamente la ecuación de un plano que


corta a la esfera pasando por el centro de la misma. Se concluye que la geodésica es la curva que
dicho plano forma con la intersección de la superficie de la esfera, en pocas palabras, un círculo
máximo, definido como aquél que corta a una esfera en dos partes iguales:

Obsérvese que en el caso de la geodésica de la esfera, el círculo máximo incluye tanto la


distancia máxima como la distancia mínima entre dos puntos cualesquiera de la superficie de la
esfera, dependiendo del que entre dos puntos cualesquiera sobre la superficie de la esfera nos
movamos siguiendo el camino en el cual recorremos el ángulo esférico más corto que hay entre
dichos puntos (llamémoslo ω), o el ángulo máximo que hay entre dichos puntos (2π - ω), como
nos lo muestra la siguiente figura en la cual tenemos a la izquierda (en color rojo) la ruta más
corta posible a lo largo de la geodésica y tenemos a la derecha (también en color rojo) la ruta
más grande posible a lo largo de la geodésica:
La distancia mínima será indudablemente aquella en la cual gastaremos la menor cantidad de
gasolina si nos movemos en un vehículo motorizado para llegar de un punto a otro. ¿Pero y la
distancia máxima? Aquí la cosa parecería menos clara, porque ciertamente hay muchas otras
rutas que podemos tomar siguiendo la ruta contraria tomando muchas desviaciones en el
camino. Sin embargo, sólo una de ellas será la ruta “más derecha” posible.

Este problema nos ilustra otra situación en la que los estudiantes expuestos por vez primera a la
obtención de máximos y mínimos mediante las herramientas del cálculo infinitesimal no tienen
problema alguno. En el cálculo infinitesimal, si queremos obtener el máximo o el mínimo de
alguna función, tomamos simplemente la derivada de la función e igualamos a cero, y tras esto
tomamos la segunda derivada para determinar mediante el cambio de signo si lo que tenemos es
un máximo o un mínimo (o varios máximos y varios mínimos). En el caso de la ecuación de
Euler, no existe un procedimiento general para saber de antemano si lo que hemos obtenido es
un máximo o un mínimo, todo lo que sabemos es que hemos obtenido un extremo.
Afortunadamente, en el caso que nos ocupa, la naturaleza del extremo será obvia por las
circunstancias de cada problema que se vaya considerando.

Habiendo dejado en claro la forma en la cual trabaja la ecuación de Euler para obtener el
extremo de una función F que aparece bajo el signo de una integral, y habiendo dejado en claro
también la forma en la cual se obtiene dicha ecuación, estamos preparados para dar el salto del
espacio tri-dimensional Euclideano al espacio 4-dimensional relativista, para lo cual la ecuación
geodésica deberá formularse bajo el esquema más amplio posible, el esquema del cálculo
tensorial. Pero antes de ello, haremos un repaso de la derivación de la ecuación de Euler con la
pequeña diferencia de que en esta ocasión meteremos a la variable tiempo como tal.

PROBLEMA: Demostrar que una condición necesaria para que:


sea un extremo es que:

Obsérvese que estamos utilizando la notación del punto puesto encima de la variable x, lo cual
en este caso indica que se trata de la derivada de x con respecto al tiempo, dx/dt, considerada en
sí como una nueva variable.

Procedemos en esta derivación de la misma forma como lo hicimos para la ecuación de Euler en
la que la variable tiempo no estaba involucrada explícitamente.

Sea x = X(t) la curva que hace a la integral I extrema entre los tiempos t 1 y t2. Entonces cualquier
otra curva estará dada por:

x = X(t) + αη(t)

en donde α es un factor de escala independiente del tiempo que nos dá la magnitud de la


variación y η(t) es una función desconocida arbitraria excepto por el requerimiento de que todas
las rutas alternas pasen también por los puntos t1 y t2 en donde la variación debe ser cero, o sea:

η(t1) = 0

η(t2) = 0

Entonces, si la curva óptima que extremiza (minimiza) a la integral es x = X(t), cualquier otra
ruta alterna estará dada por:

x = X(t) + αη(t)

Abreviaremos notacionalmente para simplicidad sin olvidar la dependencia sobre la variable x:

x = X + αη
Tomando diferenciales con respecto a la variable tiempo:

x’ = dx/dt = X’ + αη’

Al tomar la derivada con respecto al tiempo, en muchos textos y trabajos con la Relatividad
General se acostumbra utilizar la notación de punto poniendo un punto encima de la variable en
lugar de la comilla, y tal cosa haremos aquí también:

La integral I a ser extremizada es la siguiente:

y la condición para obtener un valor extremo en α = 0, análoga a la derivada dy/dx igualada a


cero en el cálculo infinitesimal ordinario será:

[∂I(α) /∂α]α = 0 = 0

Extremizamos (minimizamos) ahora la integral tomando la derivada de la integral I con


respecto al parámetro α manteniendo todo lo demás constante:

I'(α) = ∂I(α) /∂α

De nueva cuenta, esto requiere llevar a cabo una diferenciación metiendo al símbolo ∂dentro del
símbolo ∫, o sea efectuando una diferenciación bajo el símbolo de la integral, lo cual podemos
hacer en virtud de que la diferenciación la estamos llevando a cabo con respecto a la variable α y
no con respecto a la variable dt sobre la cual se efectúa la acción del integrando:
Al segundo término en esta integral se le puede aplicar una integración por partes:

Puesto que η(t1) = η(t2) = 0, la parte integrada es igual a cero, con lo cual:

Juntando esto nuevamente con el primer término de la integral original, tenemos entonces:

Para que esto sea cierto lo que tenemos dentro del paréntesis debe ser cero, ya que siendo η
arbitrario si lo escogemos diferente de cero no hay otra forma de hacer la expresión de la
izquierda igual a cero más que igualando todo lo que hay dentro de los paréntesis a cero. Se
concluye de lo anterior que:

Este resultado se puede extender fácilmente a cualquier cantidad n de coordenadas repitiendo


mecánicamente los pasos llevados a cabo arriba para una integral a ser extremizada que tenga la
siguiente forma:

obteniendo no una sino varias ecuaciones de Euler, un total de n ecuaciones, una para cada
coordenada:

El siguiente paso consistirá en extender el concepto de la geodésica de un espacio tri-


dimensional Euclideano hacia la geodésica en un espacio 4-dimensional propio de la Teoría de
la Relatividad, el espacio-tiempo curvo. Para ello, podemos extender sin dificultad alguna el
concepto de la ecuación de Euler usado para encontrar la longitud más corta sobre una
superficie en un espacio de tres dimensiones (como lo es el caso de una esfera) hacia el espacio
de cuatro dimensiones, obteniendo así la ecuación de la geodésica entre dos puntos cualesquiera
de dicho espacio 4-dimensional. No hay nuevos principios matemáticos involucrados ni nuevas
ideas, se trata únicamente de extender el concepto de la geodésica hacia un plano multi-
dimensional. Es precisamente así como se obtiene la ecuación general de la geodésica en un
espacio-tiempo curvo propio de la Teoría General de la Relatividad.

No hay que perder de vista el hecho de que la geodésica, por ser a fin de cuentas una distancia,
un número medido en metros, kilómetros o millas, sin dirección y sentido, es algo que
esperamos que permanezca invariable bajo cualquier transformación de coordenadas.

PROBLEMA: Derivar las ecuaciones geodésicas para un espacio multi-dimensional que


pueda ser Euclideano o no-Euclideano.

Empezaremos por la definición más general de todas que se le pueda dar a un elemento
infinitesimal de distancia, en la cual interviene desde luego el tensor métrico g:

ds² = gpq xp xq

Cabe recordar, por la importancia de lo mismo, que aquí está siendo utilizada rígidamente la
convención de sumación para índices repetidos. Esta definición general, dada por Bernhard
Riemann, puede ser utilizada para definir una distancia Euclideana como la siguiente (teorema
de Pitágoras extendido a cualquier número de dimensiones):

ds² = (x1)² + (x2)² + (x3)² + (x4) + (x5)²

o para definir un intervalo relativista en un espacio-tiempo plano:

ds² = (x1)² - (x2)² - (x3)² - (x4)

o cualquier otro tipo de distancia que queramos definir. Todo depende de la métrica.

Si en vez de utilizar simplemente ds utilizamos ds/dt, o sea la derivada con respecto al tiempo,
entonces tenemos lo siguiente (la convención de sumación seguirá vigente en todo lo que resta
de la solución del problema):

Tensorialmente hablando, lo que queremos encontrar es el extremo de:

Para ello, recurriremos a la ecuación de Euler, al igual que como lo hicimos en todos los
problemas anteriores. Pero obviamente, esto requerirá no una sino varias ecuaciones de Euler
para el caso más general que involucra varias variables, como lo es el caso de la Relatividad
General.

Haciendo la identificación:

la especificación de cada una de las ecuaciones de Euler requeridas es inmediata. Cada una de
las ecuaciones de Euler para cada una de las coordenadas xk estará dada por:
En el caso de la Relatividad General, puesto que tenemos un espacio 4-dimensional especificado
mediante cuatro coordenadas generalizadas, tendremos un sistema de cuatro ecuaciones. El
procedimiento que llevaremos a cabo será válido para cualquier espacio n-dimensional.

Obtendremos primero ∂F/∂xk:

Ahora procedemos a obtener la otra derivada:

Obsérvese que en esto se ha tenido que llevar a cabo un cambio en el sub-índice q de


gpqhaciéndolo gpk como lo muestra el siguiente paso intermedio que se empleó arriba:

en virtud de que dentro de la doble sumatoria (implícita en los sub-índices de acuerdo a la


convención de sumación):

mientras que:
e igualmente:

viniendo el factor 2 del hecho de que el tensor métrico g es simétrico, o sea gij = gji.

De lo dicho arriba para ds/dt, usando:

tenemos entonces que las ecuaciones de Euler para cada una de las coordenadas x k estarán
dadas por:

Tomando la derivada con respecto al tiempo e invirtiendo el orden de los términos (lo cual
equivale simplemente a cambiar los signos):

Obsérvese que hemos utilizado aquí la notación del doble punto o punto repetido puesto encima
de la variable para simbolizar la derivada de segundo orden de la coordenada x k. Aquí podemos
introducir los símbolos de Christoffel. Escribiendo:
tenemos entonces la siguiente conclusión:

Si tomamos a la longitud s del arco como parámetro, de modo tal que:

el resultado obtenido se nos convierte en lo siguiente:

Si multiplicamos ahora todo por grk, en el primer término tendremos primero:

con lo cual el primer término quedará convertido en lo siguiente al llevarse a cabo la contracción
sobre los índices repetidos p como lo marca la convención de sumación sobre la doble
sumatoria:

mientras que en el segundo término el efecto de multiplicar grk por el símbolo de Christoffel de
primer género será elevar el índice k de dicho símbolo convirtiéndolo en un símbolo de
Christoffel de segundo género:

De este modo, obtenemos finalmente:

Estas son las ecuaciones geodésicas para un espacio multi-dimensional que puede ser
Euclideano o no-Euclideano, el cual es mejor conocido como espacio de Riemann. Es un sistema
de ecuaciones diferenciales de segundo orden que tiene que ser resuelto para poder determinar
la trayectoria a lo largo de las geodésicas. Si llevamos a cabo un ligero cambio notacional
haciendo r = β, p = σ y q = α, revirtiendo además hacia la notación de punto, podemos poner
esto mismo en una forma que resultará familiar a quienes ya han hojeado o estudiado textos
convencionales de Relatividad General:

Esta ecuación fácilmente memorizable es también conocida como la ecuación geodésica,


junto con las ecuaciones de campo de la Relatividad General, nos dá una especificación
matemática completa para el comportamiento de un sistema físico. De este modo, cualquier
problema propio de la Relatividad General se convierte en un problema de índole meramente
matemática. Pero es importante destacar que la ecuación es completamente general, y se puede
utilizar para la búsqueda de geodésicas tanto dentro de la Relatividad General como en la
resolución de problemas clásicos como los que ya hemos visto.

En una geometría Euclideana de cuatro dimensiones, en donde todas las dimensiones son
dimensiones espaciales, la geodésica es “la línea más derecha posible de todas”. Esto es válido
para toda geometría Euclideana en donde se cumple el quinto postulado de Euclides que
nos dice: “a través de un punto externo a una recta dada sólo es posible trazar una recta paralela
a la recta dada”. Pero obviamente el quinto postulado no se cumple en una geometría no-
Euclideana como la que tiene lugar sobre la superficie de una esfera. En cualquier parte de la
esfera, si trazamos dos rectas perfectamente paralelas (por ejemplo, formando ambas un ángulo
de 90 grados con el Ecuador) y las extendemos indefinidamente sobre la superficie de la esfera,
las rectas eventualmente se encontrarán:

De cualquier manera, aún en una geometría no-Euclideana, la geodésica sigue siendo “la línea
más derecha posible de todas” entre dos puntos, sigue siendo la ruta que representa la menor
distancia posible entre dichos puntos, la que nos llevaría el menor tiempo posible recorrer. En la
geometría Euclideana, dos geodésicas inicialmente paralelas permanecen paralelas, nunca se
cruzan ni divergen la una de la otra (como ocurre sobre la superficie de un hiperboloide con
forma de silla de montar). Nosotros describimos esta situación diciendo que este tipo de
geometría es una geometría plana. Por otro lado, sobre la superficie de una esfera dos
geodésicas inicialmente paralelas convergen la una hacia la otra y eventualmente se cruzan.
Nosotros describimos esta situación diciendo que este tipo de geometría es una
geometría curva.

El lector debe prepararse ahora para una sorpresa.

Si bien en cualquier geometría Euclideana o inclusive en cualquier geometría no-


Euclideanabajo cualquier número de dimensiones espaciales que se nos antoje postular la
geodésica es la ruta que representa la menor distancia posible entre dos puntos cualesquiera, en
la geometría no-Euclideana del espacio-tiempo relativista en donde tenemos tres dimensiones
espaciales y una dimensión de tiempo la estructura de la geodésica es tal que aunque sigue
siendo “la ruta más derecha posible de todas” la geodésica no es la trayectoria mínima sino la
trayectoria máxima de todas las trayectorias posibles, en pocas palabras no es la menor
distancia posible en el espacio-tiempo sino la mayor distancia posible. Esto tiene una
consecuencia muy curiosa con la que todos estamos familiarizados. Un cuerpo que se mueva
bajo la influencia de la gravedad se moverá recorriendo la ruta que le lleva el mayor
tiempo posible recorrer de acuerdo con su reloj propio. En su libro ABC of Relativity:
Understanding Einstein publicado en 1925, Bertrand Russell llama a esto la “ley de la pereza
cósmica” - los cuerpos dejados a sí mismos se toman el mayor tiempo posible para llegar a su
destino. Un cuerpo cualquiera, dejado a sí mismo, viaja de modo tal que el tiempo que le lleva
efectuar el recorrido, de acuerdo con su propio reloj, es el mayor tiempo posible. Si hubiera
viajado tomando cualquier otra ruta de un evento a otro, el tiempo sería menor.

¿Pero cómo es esto posible?, se preguntará el lector. En primer lugar, en los problemas
matemáticos del cálculo de variaciones, una de las primeras cosas que confronta el matemático
es el hecho de que la solución que obtiene a un problema es una solución extrema, la cual no
necesariamente es un mínimo sino que puede ser también un máximo. La razón por la cual la
solución matemática al problema del recorrido entre dos puntos resulta ser la que toma el
mayor tiempo posible es porque el tipo de intervalo que estamos considerando no es un mero
intervalo espacial sino un intervalo relativista que es más análogo a la dimensión del tiempo
que a la dimensión de longitud. De este modo, la Luna en su movimiento de rotación alrededor
de la Tierra escoge su ruta de modo tal que cualquier pedacito de dicha ruta representa una
mayor “distancia” que cualquier otra ruta alterna. Pero esta es una distancia espacio-tiempo. Si
nosotros pensamos que la geodésica está dada por la menor distancia posible entre dos puntos,
entonces estamos pensando en una geodésica puramente espacial. Pero si pensamos que la
geodésica está dada por la mayor distancia posible entre dos puntos, entonces estamos
pensando en una geodésica espacio-tiempo, una geodésica relativista. Las trayectorias elípticas
de los planetas alrededor del Sol son precisamente geodésicas relativistas. Las trayectorias
parabólicas de los cometas que suelen visitarnos de vez en cuando son también geodésicas
relativistas.

Pero si un cuerpo cualquiera dejado a sí mismo viaja de modo tal que el tiempo que le lleva
efectuar cualquier recorrido, de acuerdo con su propio reloj, es el mayor tiempo posible, ¿no
podría entonces tomarse un tiempo infinitamente grande para llegar de un punto a otro?
Definitivamente, no, porque el recorrido tiene que hacerlo a lo largo de la geodésica 4-
dimensional, o sea la ruta más corta posible en el espacio-tiempo relativista. Esto es similar a los
arcos del circulo máximo que en el espacio Euclideano tri-dimensional representan la solución a
la ecuación de Euler sobre la superficie de una esfera; entre dos puntos cualesquiera uno de los
arcos cuyos extremos están situados en dichos puntos será un arco de menor longitud (mínimo)
mientras que el otro será el de mayor longitud (máximo), las geodésicas fijan la ruta a seguir, y
no hay infinitos involucrados.
Para poder estudiar en mayor detalle la forma en la cual hacemos un recorrido de un punto P a
un punto Q en el espacio-tiempo relativista, debemos considerar cualquier recorrido que
llevemos a cabo como un recorrido formado por una cantidad infinitamente grande
de intervalos relativistas infinitamente pequeños:

ds² = (dct)² - (dx)² - (dy)² - (dz)²

Toda geodésica relativista se puede considerar formada por segmentos de intervalos


relativistas infinitesimales. Aquí podemos definir tres tipos de geodésicas en el espacio-tiempo:

1) Geodésicas tipo temporal (timelike).- Aquellas en las que en un intervalo relativístico


predomina el componente temporal sobre el componente espacial,

2) Geodésicas tipo espacial (spacelike).- Aquellas en las que en un intervalo relativístico


predomina el componente espacial sobre el componente temporal

3) Geodésicas tipo luminoso (lightlike).- Aquellas en las que en un intervalo relativístico el


componente espacial es igual al componente temporal.

En la Teoría Especial de la Relatividad, dos observadores inicialmente en reposo el uno frente al


otro permanecen en reposo manteniendo una separación espacial constante, y entonces dos
geodésicas tipo temporal inicialmente paralelas se mantendrán paralelas. El mismo argumento
se puede extender hacia las geodésicas tipo espacial y tipo luminoso. Al no cruzarse jamás
dichas geodésicas, se concluye que en la Teoría Especial de la Relatividad, la geometría
del espacio-tiempo es Euclideana, es decir, plana, es una geometría en donde se cumple el
quinto postulado de Euclides que nos afirma que dos rectas paralelas se mantienen paralelas sin
cruzarse y sin divergir la una de la otra. Es el tipo de geometría descrita por las
transformaciones de Lorentz. Y en contraste, en la Teoría General de la Relatividad, la geometría
del espacio-tiempo es curva, es una geometría en donde no se cumple el quinto postulado de
Euclides porque es una geometría en donde las rectas paralelas no pueden existir.

La ruta geodésica III


Con la ecuación geodésica firmemente en nuestras manos, el siguiente paso consiste en la
aplicación de la misma para la resolución de algunos problemas con el fin de utilizarla
eventualmente en la Teoría de la Relatividad. Es importante señalar que no hay problema
relacionado con geodésicas que no podamos resolver recurriendo directamente a la ecuación de
Euler. La ventaja de la ecuación geodésica es que, además de ser fácilmente memorizable, nos
produce en esencia lo mismo que nos brinda la ecuación de Euler.

PROBLEMA: Mediante la ecuación geodésica, encontrar la geodésica entre dos puntos en un


plano Cartesiano bi-dimensional.

Para un plano Cartesiano bi-dimensional en el cual tenemos dos coordenadas:

(x1, x2) = (x, y)

habrá dos ecuaciones diferenciales, una para cada coordenada:

Puesto que, tratándose de coordenadas rectangulares Cartesianas, los símbolos de Christoffel


(resaltados en color rojo) son todos iguales a cero, las dos ecuaciones diferenciales anteriores se
reducen simplemente a:

Integrando cada una de estas ecuaciones diferenciales una vez:

dx/ds = A____dy/ds = B

en donde A y B son constantes de integración. Combinando ahora ambas ecuaciones de la


siguiente manera:

en donde hemos hecho a A/B una nueva constante m. Integrando de nuevo:


y = mx + b

Esta es la ecuación de una recta. Se concluye que en un plano bi-dimensional Cartesiano, la


geodésica entre dos puntos es la recta que los une.

PROBLEMA: Mediante la ecuación geodésica, encontrar la geodésica entre dos puntos en un


plano Cartesiano tri-dimensional.

Para un plano Cartesiano bi-dimensional en el cual tenemos dos coordenadas:

(x1, x2, x3) = (x, y, z)

habrá tres ecuaciones diferenciales, una para cada coordenada:

Nuevamente, puesto que tratándose de coordenadas rectangulares Cartesianas, los símbolos de


Christoffel (resaltados en color rojo) son todos iguales a cero, las tres ecuaciones diferenciales
anteriores se reducen simplemente a:

Integrando cada una de estas ecuaciones diferenciales obtenemos lo siguiente:

x = As + x0____y = Bs + y0____z = Cs + z0

en donde A, B, C, x0, y0, y z0 son constantes de integración. Eliminando a la variable s de cada


par de ecuaciones que podemos formar, tenemos lo siguiente:
Esta es la ecuación de una recta dentro de un espacio Cartesiano tri-dimensional. Se concluye
que en un plano tri-dimensional Cartesiano, la geodésica entre dos puntos es la recta que los
une.

PROBLEMA: Mediante la ecuación geodésica, escribir las ecuaciones diferenciales para las
geodésicas en coordenadas cilíndricas.

En coordenadas cilíndricas, especificamos un punto mediante las siguientes tres coordenadas:

(x1, x2, x3) = (r, θ, z)

Puesto que tenemos tres coordenadas, habrá tres ecuaciones diferenciales para las geodésicas en
coordenadas cilíndricas:

Para las coordenadas cilíndricas, los únicos símbolos de Christoffel diferentes de cero son los
siguientes:

Γ221 = Γθ θr = 1/r

Γ212 = Γθ rθ = 1/r

Γ122 = Γr θθ = - r

Llevando a cabo la doble sumatoria requerida en el segundo término de la ecuación geodésica


según lo requiere la convención de sumación, obtenemos para la geodésica de la coordenada
radial r la siguiente ecuación diferencial:
Repitiendo el procedimiento, tenemos la siguiente ecuación diferencial para la geodésica de la
coordenada angular θ:

Por último, tenemos la siguiente ecuación diferencial para la geodésica de la coordenada zque en
realidad viene siendo trivial:

De esta última ecuación, casi podemos ver de inmediato que para la superficie del cilindro en el
cual mantenemos la coordenada radial r constante todo el tiempo sin cambio alguno, la
geodésica vendrá siendo una hélice.

Como puede verse, los símbolos de Christoffel son en realidad todo lo que necesitamos para
escribir las ecuaciones geodésicas que correspondan a cierto sistema de coordenadas.

PROBLEMA: Mediante la ecuación geodésica, escribir las ecuaciones diferenciales para las
geodésicas en coordenadas esféricas.

En coordenadas esféricas, especificamos un punto mediante las siguientes tres coordenadas:

(x1, x2, x3) = (r, θ, φ)

Puesto que tenemos tres coordenadas, habrá tres ecuaciones diferenciales para las geodésicas en
coordenadas esféricas:
Para la solución del problema necesitamos los símbolos de Christoffel para las coordenadas
esféricas que son los siguientes:

Γ221 = Γθθr = Γ212 = Γθrθ = 1/r

Γ331 = Γφφr = Γ313 = Γφrφ = = 1/r

Γ332 = Γφφθ = Γ323 = Γφθφ = cot θ

Γ122 = Γrθθ = - r

Γ133 = Γrφφ = - r sen² θ

Γ233 = Γθφφ = - sen θ cos θ

Todos los demás símbolos de Christoffel son iguales a cero.

Desarrollaremos primero la ecuación diferencial que corresponde a la geodésica relacionada con


la coordenada radial r expandiendo la doble sumatoria implícita por la convención de sumación
en el segundo término de la ecuación geodésica:
En la expansión mostrada se han destacado de color rojo los símbolos de Christoffel que son
iguales a cero y que por lo tanto no harán contribución alguna a la doble sumatoria.

De este modo, obtenemos nuestra primera ecuación diferencial:

Desarrollaremos ahora la ecuación diferencial que corresponde a la geodésica relacionada con la


coordenada angular θ expandiendo la doble sumatoria implícita por la convención de sumación
en el segundo término de la ecuación geodésica:

De este modo, obtenemos nuestra segunda ecuación diferencial:

Por último, desarrollaremos la ecuación diferencial que corresponde a la geodésica relacionada


con la coordenada angular φ expandiendo la doble sumatoria implícita por la convención de
sumación en el segundo término de la ecuación geodésica:
De este modo, obtenemos nuestra tercera ecuación diferencial:

PROBLEMA: Mediante la ecuación geodésica, escribir las ecuaciones diferenciales para las
geodésicas sobre la superficie de una esfera.

Este problema es esencialmente similar al problema anterior, excepto que ahora vamos a fijar el
radio a un valor inalterable, manteniéndolo constante. Esto nos deja con tan sólo dos ecuaciones
que corresponden a las otras dos coordenadas a las cuales sí les está permitido variar:

Desarrollaremos primero la ecuación diferencial que corresponde a la geodésica relacionada con


la coordenada angular θ expandiendo la doble sumatoria implícita por la convención de
sumación en el segundo término de la ecuación geodésica:
En la expansión mostrada se han destacado de color rojo los símbolos de Christoffel que son
iguales a cero y que por lo tanto no harán contribución alguna a la doble sumatoria.

Utilizando los valores para los símbolos de Christoffel correspondientes a las coordenadas
esféricas dados en la solución del problema anterior, tenemos entonces la primera ecuación
diferencial que corresponde a las geodésicas sobre la superficie de una esfera:

Desarrollaremos ahora la ecuación diferencial que corresponde a la geodésica relacionada con la


coordenada angular φ expandiendo la doble sumatoria implícita por la convención de sumación
en el segundo término de la ecuación geodésica:

Utilizando los valores para los símbolos de Christoffel correspondientes a las coordenadas
esféricas dados en la solución del problema anterior, tenemos entonces la segunda ecuación
diferencial que corresponde a las geodésicas sobre la superficie de una esfera:

Es tiempo de llevar nuestros recién adquiridos conocimientos al campo de la Teoría de la


Relatividad.

Puesto que en la Teoría de la Relatividad el espacio es un espacio 4-dimensional:

(x1, x2, x3, x4)

la ecuación geodésica nos producirá un sistema de cuatro ecuaciones diferenciales. Si en vez del
parámetro longitud de arco s introducimos el parámetro tiempo propio τ usando la relación:
s = cτ

entonces tendremos el siguiente sistema de ecuaciones:

Estas son las cuatro ecuaciones que especifican la ruta geodésica que seguirán los cuerpos en
movimiento al estar inmersos los cuerpos en un espacio-tiempo curvo. Lo único que nos hace
falta para resolver el sistema de ecuaciones son los símbolos de Christoffel, los cuales dependen
a su vez directamente del tensor métrico g del cual se obtienen. Es por esto que la métrica
determina todo lo que hay que saber y que se pueda saber de un sistema de cuerpos en
movimiento libre.

En virtud del primer término en cada una de las ecuaciones diferenciales para las geodésicas,
todas ellas son ecuaciones diferenciales de segundo orden. El segundo término en cada una de
ellas involucra un producto de diferenciales que convierte al sistema en un sistema de
ecuaciones no-lineares, justo uno de los temas más difíciles a tratar, lo cual convierte a la Teoría
General de la Relatividad en una pesadilla para los físicos y en una delicia para los matemáticos.
Afortunadamente, en algunos casos especiales, sobre todo los más importantes, por razones de
simetría las ecuaciones se pueden simplificar y se puede obtener una solución exacta o casi
exacta. Pero hablando en términos generales, no existe una solución matemática general para
todos los casos posibles, cada caso tiene que ser analizado y tratado sobre sus propios méritos.
Una ayuda en esto es la plena libertad que tenemos para seleccionar el sistema de coordenadas
que más convenga a nuestros propósitos en cierto problema. Podemos inventar incluso nuestro
propio sistema de coordenadas. Sin embargo, lo que describa tal sistema de coordenadas tendrá
que ser algo compatible con las ecuaciones de campo de la Relatividad General

El transporte paralelo
Intimamente ligado con el concepto de la geodésica dentro de la Relatividad General está el
concepto del transporte paralelo.

Haremos primero una distinción entre los dos tipos diferentes posibles de curvatura que puede
haber sobre una superficie: la curvatura intrínseca y la curvatura extrínseca.
Consideremos primero la superficie de un cilindro, la cual como vimos previamente se obtiene
enrollando una hoja plana de papel. Uno puede pensar que la superficie de un cilindro es curva
puesto que dicha superficie está “redonda” en cierta dirección en torno al eje de simetría. Esta es
una curvatura extrínseca, ya que no tiene relación alguna con el espacio tri-dimensional plano
(en la hoja del cilindro) del cual forma parte. Uno puede formar la superficie de un cilindro con
el simple hecho de enrollar un pedazo plano de papel sin necesidad de tener que cortar o arrugar
el papel en lo más mínimo, de modo tal que la geometría intrínseca es la misma es la misma que
la del pedazo de papel original, es una geometría plana, lo cual significa que la distancia original
entre dos puntos cualesquiera sobre la superficie del papel sigue siendo la misma antes y
después del enrollamiento. Las líneas paralelas trazadas sobre la hoja plana de papel original
siguien siendo paralelas después de haber sido enrollado el papel para formar un cilindro, lo
cual implica que al permanecer invariable la validez del quinto postulado de la geometría
Euclideana (por un punto exterior a una recta dada sólo es posible trazar una línea paralela a la
recta dada) la superficie del cilindro sigue siendo una geometría Euclideana, todos los
resultados y teoremas clásicos de la geometría Euclideana plana siguen siendo válidos sobre la
superficie de un cilindro (la suma de los ángulos internos de un triángulo cualquiera es igual a
180 grados, el cuadrado de la hipotenusa de un triángulo rectántulo es igual a la suma de los
cuadrados de los catetos, etc.) Para una hormiga confinada a vivir sobre la superficie de un
cilindro, la superficie del cilindro sería una superficie plana en todos sentidos, no tendría forma
alguna de detectar la curvatura haciendo mediciones extremadamente precisas de ángulos sobre
dicha superficie. Lo único curioso que encontraría es que viajando hacia adelante siempre en
línea recta, después de una cantidad finita de tiempo descubriría asombrada haber regresado al
mismo punto en el cual empezó su travesía. La geometría intrínseca de una hoja n-dimensional
considera únicamente la relación que pueda haber entre los puntos de las trayectorias
confinados a su superficie, mientras que la geometría extrínseca proviene del considerar a dicha
superficie como parte de un espacio formado por un mayor número de dimensiones como lo es
el caso de la superficie del cilindro. De este modo, la geometría extrínseca descansa sobre la
suposición de la existencia de espacios multidimensionales con un mayor número de
dimensiones.

En la Relatividad General, cuando hablamos de la curvatura del espacio-tiempo, estamos


hablando de una curvatura intrínseca, puesto que todas las líneas del mundo están confinadas
a permanecer en un espacio cuatri-dimensional; en la Relatividad General en su formulación
original no hay espacios de cinco dimensiones o más. Desde la perspectiva de la Relatividad
General, si habitamos en un mundo que forma parte de algo que ocupe más de cuatro
dimensiones, ello no es cosa que nos concierna, puesto que de cualquier manera no podemos
salir fuera hacia esa “quinta dimensión”; lo único en lo que estamos interesados es en la
geometría intrínseca del espacio-tiempo.

La superficie del cilindro es intrínsecamente plana. Pero si empezamos a considerar la superficie


de una esfera, entonces las cosas cambian dramáticamente. Para darnos cuenta de ello,
considérese la siguiente figura en la cual tenemos un triángulo esférico formado por el área
delimitada por tres círculos máximos (que son las geodésicas o “líneas rectas” sobre la superficie
de una esfera):

Sobre la superficie de una esfera como ésta, la geometría deja de ser Euclideana. En ella, dos
líneas inicialmente paralelas dejan de ser paralelas desde el momento en que son trazadas. Si
trazamos sobre la geodésica AB dos líneas muy cercanas entre sí que sean perpendiculares a
dicha geodésica, eventualmente terminarán cruzándose. Por otro lado, la suma de los ángulos
internos α, β y γ del triángulo ABC ya no es igual a 180 grados, y de hecho siempre será mayor
que 180 grados. Podemos trazar sin dificultad alguna sobre la superficie de una esfera un
triángulo cuyos ángulos internos sean todos ángulos rectos, y cuya suma será igual a 270 grados:

Otra diferencia que podemos encontrar la tenemos si trazamos sobre una hoja plana un
“triángulo” hecho con curvas, el cual podemos tomar como la proyección de un triángulo
esférico sobre una imagen tomada por una cámara fotográfica, y empezando en un punto de
dicho triángulo empezamos a trazar líneas horizontales que para nosotros serán líneas
perfectamente paralelas:

Si empezamos desde el punto A trazando una línea recta con forma de flecha (de color rojo)
representando un vector, y nos vamos desplazando en sentido contrario a las manecillas del
reloj hasta llegar al punto B y después al punto C para finalmente regresar al punto A, trazando
más líneas horizontales al ir haciendo el recorrido, al regresar al punto A el vector final será
paralelo al vector inicial, ambos apuntarán en la misma dirección. Pero si llevamos a cabo un
procedimiento similar sobre la superficie de una esfera, entonces tenemos algo interesante:
En este caso, supóngase que empezamos trazando flechas perfectamente paralelas a lo largo de
la geodésica que va desde el punto A hasta el punto N (el cual podemos tomar como el polo
Norte). Estas flechas o vectores serán desde luego las tangentes a la geodésica que va desde el
punto A hasta el punto N. De la misma manera, una vez que hemos llegado al punto N, trazamos
una paralela a la última tangente que construída al llegar a N pero moviéndonos a lo largo de la
geodésica que va desde el punto N hasta el punto B, lo cual significa que la paralela trazada será
una perpendicular al arco NB, y tras esto vamos trazando otras perpendiculares iguales a lo
largo del arco NB, todas las cuales serán paralelas entre sí, hasta llegar al punto B. Hasta aquí,
todo parece en orden.

Ahora supóngase que continuamos el procedimiento después de haber llegado desde el punto N
hasta el punto B trazando rectas paralelas, y empezamos a trazar más paralelas yéndonos del
punto B hasta el punto A. Recuérdese que todas estas rectas las estamos trazando mediante
escuadra y compás tan paralelas como no es posible.

Es al completar el circuito llegando al punto A cuando nos topamos con una sorpresa. La línea
“paralela” en el punto A al llegar a dicho punto desde el punto B no apunta en la misma
dirección que la de la línea “paralela” inicial. De hecho, el campo vectorial ha experimentado
una rotación de α grados en nuestra construcción sobre la superficie esférica. De este modo, si
partimos desde un punto cualquiera del globo terráqueo siguiendo una ruta geodésica y vamos
trazando tangentes sobre dicha ruta, todas las cuales serán paralelas entre sí al irlas trazando, y
continuamos trazando más paralelas conforme hacemos el recorrido que correspondería a una
trayectoria sobre las líneas de un triángulo esférico, entonces al completar un circuito cerrado
encontramos que las líneas han dejado de ser paralelas. Es el circuito cerrado el que ha dado
origen a la discrepancia.

La construcción que acabamos de llevar a cabo es conocida como el transporte paralelo,


porque vamos “transportando” una paralela de un punto a otro trazándolas tan paralelas la una
a la otra como nos sea posible. Pero por lo que acabamos de ver, no nos es posible intentar
definir -sobre una hoja de trazado curva- campos vectoriales globalmenteparalelos. Aún nos es
posible definir un paralelismo local, especificando cómo mover un vector de un punto a otro
sobre una hoja de trazado curva de modo tal que el vector trasladado mantenga la misma
dirección y la misma longitud, pero el resultado de tal transporte paralelo dependerá del tipo de
curvatura y sobre todo de la ruta seguida, por lo que no se puede afirmar de modo general que
un vector trazado en un punto A sea paralelo a otro vector B sobre una superficie curva.

En la siguiente figura tenemos un vector V (de color rojo) que ha sido objeto de un transporte
paralelo a lo largo de una curva en la cual una tangente cualquiera de dicha curva es un
vector U (de color azul) que viene siendo igual a U = dx/dλ en donde dλ es un parámetro que
puede ser un segmento infinitesimal de arco o un intervalo infinitesimal de tiempo:

Existe un método de aproximación de primer orden con cierta justificación matemática sobre
el paralelogramoide de Levi-Civita para ir construyendo (transportando) un vector V a lo largo
de una ruta geodésica, conocido como la escalera de Schild, ilustrado en el siguiente
diagrama:

El método de construcción es el siguiente:

(1) Empezamos con un segmento de geodésica como el que muestra la figura de arriba, sobre el
cual está puesto el vector V = A0X0 que es el vector que será movido a lo largo de la geodésica
mediante el transporte paralelo.

(2) Seleccionamos otro punto A1 sobre la geodésica que esté cercano al punto A0, en la dirección
hacia la cual será movido el vector original.

(3) Trazamos una recta que conecte la punta del vector A 0X0 con el punto A1, y hecho esto
marcamos el punto medio de dicha recta, que aquí llamaremos P 1.

(4) Constrúyase la geodésica A0P1 y extiéndase la misma hasta el punto X1, de modo tal que la
longitud paramétrica de A0X1 sea el doble de la longitud A0P1.

(5) Finalmente, constrúyase la geodésica A1X1, con lo cual el vector original ha sido desplazado
en transporte paralelo hacia una nueva posición.

La figura muestra dos peldaños de la escalera.

Para poder continuar adelante, daremos ahora un repaso a la estructura matemática que está
detrás de los conceptos de la tangente a una curva espacial en un punto cualquiera de dicha
curva.

Intuitivamente, el concepto de la recta tangente a una curva espacial no ofrece mucha dificultad.
En la siguiente figura:

en donde sobre la superficie del paraboloide se ha trazado una curva espacial (de color rojo, la
cual no necesariamente es la geodésica sobre dicha superficie) se ha trazado una recta tangente
a dicha curva espacial (de color verde). Y en la siguiente figura, tenemos dos parábolas planas,
una de color rojo y la otra de color azul, cada una de las cuales tiene trazada su propia recta
tangente en un punto común a ambas (del mismo color que hace corresponder a la curva
espacial con la tangente que le toca):
Como puede verse en ambas figuras, la tangente puesta en cierto punto P de una curva espacial
apunta en la misma dirección hacia la cual se está moviendo en el espacio dicho punto. A cada
punto de una misma curva espacial corresponderá una tangente diferente.

Podemos definir formalmente a la tangente de una curva en un punto P de dicha curva como el
proceso límite de varias secantes trazadas a través de dicho punto en donde la distancia hentre
los dos puntos P y Q de una secante sobre la curva se va disminuyendo arbitrariamente hasta
que h toma un valor infinitesimalmente pequeño:
En un sistema tri-dimensional de coordenadas Cartesianas, si tenemos una curva espacial cuyas
componentes en cada uno de los tres ejes están especificadas con funciones independientes de
un parámetro como t (en función del tiempo) o como s (en función del arco de longitud de la
curva):

x = x(t)___y = y(t)___z = z(t)

entonces si agrupamos estas componentes en un triplete ordenado al cual podemos designar


como U:

U = [x(t), y(t), z(t)]

el vector tangente dU/dt (o dU/ds, en su caso) estará dado simplemente por la derivada
respectiva de cada componente:

Para simbolizar lo mismo, se acostumbra usar también la notación de los vectores unitarios de
base, los cuales son de longitud 1 y que en coordenadas Cartesianas son i, j y k, con lo cual:

Otra notación alterna con vectores unitarios de base utilizada frecuentemente en muchos textos
es la siguiente:

Todas estas notaciones sirven para indicar exactamente lo mismo, un triplete ordenado de
elementos que deben mantenerse separados para efectos de cálculo matemático.

Para distinguir a un vector tangente dU/dt de longitud arbitraria obtenido sobre un punto P de
una curva espacial de un vector tangente unitario cuya longitud es siempre igual a la unidad,
tenemos que dividirlo entre la expresión que nos dé la magnitud ║dU/dt║ de dicho vector.
Podemos denotar a este último como T:

T = (dU/dt) /║dU/dt║

PROBLEMA (5): Suponiendo que una curva C está definida por las ecuaciones paramétricas
x = x(s), y = y(s), z = z(s), en donde s es una longitud de arco de la curva C medida desde un
punto fijo en C, demostrar que si r es un vector posición de cualquier punto en la curva C
entonces dr/ds es un vector tangente unitario a la curva C en dicho punto.

Si r es el vector posición que nos dá las coordenadas de la punta de un vector flecha a partir del
origen (0,0,0), entonces:

r = (x, y, z)

Podemos representar el triplete de componentes en vectores unitarios de base i, j y k para


simplificar el desarrollo de la solución:

r=xi+yj+zk

Tomando la derivada con respecto a un elemento infinitesimal de longitud, el vector:

es una tangente a la curva recorrida por la punta del vector posición en base al procedimiento de
construcción dado arriba. La magnitud de este vector está dada por:

Usando la relación Pitagórica para un elemento infinitesimal de longitud:

ds² = dx² + dy² + dz²


Reagrupando y usando la relación tenemos entonces que:

║dr/ds║ = √(dx² + dy² + dz²)/(ds)²

║dr/ds║ = √(dx² + dy² + dz²)/(dx² + dy² + dz²)²

║dr/ds║ = 1

Entonces el vector tangente ║dr/ds║ = 1 es un vector unitario.

PROBLEMA: (1) Encontrar un vector unitario tangente a cualquier punto sobre la curva
espacial cuyas ecuaciones paramétricas son las siguientes:

x = t² + 1

y = 4t - 3

z = 2t² - 6t

y (2) encontrar la tangente unitaria en el punto en donde t = 2.

(1) Para encontrar un vector tangente a cualquier punto sobre la curva, obtenemos primero:

dx/dt = 2t

dy/dt = 4

dz/dt = 4t - 6

En notación de triplete, el vector tangente a cada punto de la curva está dado por:

dr/dt = (2t, 4, 4t - 6)

Y en notación con vectores unitarios de base, podemos escribir la misma respuesta ya sea como:

dr/dt = (2t) i + 4 j - (4t - 6) k


o como:

dr/dt = (2t) e1 + 4 e2 - (4t - 6) e3

Ambas notaciones sirven para indicar exactamente lo mismo, un triplete ordenado de elementos
que deben mantenerse separados para efectos de cálculo matemático.

La longitud de este vector tangente dr/dt es algo que puede variar de un punto a otro sobre la
curva espacial. Para que el vector tangente sea unitario en cualquier punto de la curva, tenemos
que dividirlo entre la magnitud de dicho vector, la cual es:

║dr/dt║ = √(dx/dt)² + (dy/dt)² + (dz/dt)²

║dr/dt║ = √(2t)² + (4)² + (4t - 6)²

Usando notación de vectores unitarios de base, el vector tangente unitario T sobre cualquier
punto de la curva será:

T = (dr/dt) /(║dr/dt║)

(2) En el punto t = 2, el vector tangente unitario será;

Haremos ahora un repaso de otro concepto que utilizaremos en nuestra discusión posterior, el
concepto de la derivada direccional. Para ello, definiremos primero el operador
diferencial del o nabla en tres dimensiones en coordenadas rectangulares (Cartesianas) de la
siguiente manera:
Siendo este operador un operador vectorial, aplicarlo sobre una función escalar φ cualesquiera
nos producirá un campo vectorial, el campo vectorial ∇φ, al cual se le dá el nombre
de gradiente.

Recurriendo a coordenadas generalizadas xk, podemos extender también la definición del


operador vectorial ∇ de tres dimensiones a un espacio 4-dimensional:

PROBLEMA: Encontrar el gradiente de las siguientes funciones escalares:


(1) φ = x² + y² + z²

(2) φ = 5 + 2x -4xy² + 3z

(3) φ = xyz

(4) φ = x² - y² - z²

Usando notación de vectores unitarios de base:

(1) ∇φ = 2x i + 2y j + 2z k

(2) ∇φ = (2 - 4y²) i - 8xy j + 3 k

(3) ∇φ = yz i + xz j + yz k

(4) ∇φ = 2x i - 2y j - 2z k

La componente del vector gradiente ∇φ que apunta en la dirección de un vector unitario Vse
obtiene con el producto escalar de ambos, o sea ∇φ·V, y se define formalmente como
la derivada direccional de la función escalar φ a lo largo de la dirección del vector V.
Geométricamente hablando, en cierta forma es igual a la magnitud de la proyección del vector
∇φ en la dirección hacia la cual apunta el vector V. Físicamente, esto se interpreta como la razón
de cambio de φ en la dirección de V en cierto punto preseleccionado del espacio a lo largo de
una trayectoria.

PROBLEMA: Encontrar la derivada direccional del siguiente campo escalar:

φ = x²yz + 4xz²

en el punto (1, -2, -1) en la dirección del vector:

v = (2, -1, -2)

El primer paso en la solución de este problema consiste en la determinación del campo vectorial
∇φ a partir del campo escalar φ mediante la aplicación del operador vectorial ∇ a φ. Lo haremos
aquí usando notación de vectores unitarios de base en lugar del triplete ordenado de números
con el objeto de simplificar la lectura de los pasos:

∇φ = ∇(x²yz + 4xz²)

∇φ = (2xyz + 4z²) i + x²z j + (x²y + 8xz) k

En el punto (1, -2, -1), el vector que pertenece al campo vectorial ∇φ tiene el siguiente valor:

∇φ = (4 + 4) i + (-1) j + (-2 - 8) k

∇φ = 8i - j - 10k

Antes de encontrar la derivada direccional en el punto (1, -2, -1) en la dirección del vector v= (2,
-1, -2), normalizaremos dicho vector para que tenga una longitud igual a la unidad:

V = v / ║v║

V = (2 i - j - 2k) /√(2)² + (-1)² + (-2)²

V = (2 i - j - 2k) /3

V = (2/3) i - (1/3) j - (2/3) k


La derivada direccional que estamos buscando la obtenemos tomando el producto escalar de los
vectores ∇φ y V:

∇φ · V = [8i - j - 10k ] · [(2/3) i - (1/3) j - (2/3)] k

∇φ · V = (8) (2/3) + (-1) (-1/3) + (-10)(-2/3)

∇φ · V = 37/3

En virtud de que la derivada direccional es positiva, esto nos dice que φ está aumentando en
esta dirección.

Si hemos de definir lo que hemos visto arriba en términos un poco más elegantes y más
formales, usando coordenadas generalizadas, podemos decir que si tenemos una función escalar
φ que dependa de varias coordenadas x1, x2, x3, ..., etc.:

a lo largo de un vector v (tangente a una curva espacial):

entonces la derivada direccional de esa función escalar φ a lo largo del vector v está definida
mediante el límite:

Esta definición intenta resumir todo lo que ya se ha señalado arriba, y en realidad no es más que
la representación formal del producto escalar:

∇φ(x) · v

que frecuentemente se resume simplemente como:


Habiendo visto ya lo que es la derivada direccional, estamos preparados para ver lo que es
la derivada absoluta de un tensor, la cual se representa con la siguiente simbología en el caso de
un tensor covariante A:

Esta simbología así como el uso de la palabra “derivada absoluta” son desafortunados porque
pudieran dar la falsa impresión de que la derivada absoluta de un tensor equivale simplemente a
la diferenciación de un tensor, lo cual no es así, porque la derivada absoluta es la
extensión al cálculo tensorial del concepto de la derivada direccional, y como lo
vimos arriba, la derivada direccional no es simplemente la diferenciación de un vector, sino que
es algo sobre lo cual se aplica posteriormente un producto vectorial escalar con una tangente
para obtener la proyección

Aclarado lo anterior, definimos a la derivada absoluta de un


tensor o derivada intrínseca de un tensor de la siguiente manera en caso de que se trate
de un tensor contravariante Tj:

Compárese esta definición con la definición de la derivada direccional. Al igual que en el caso de
la derivada direccional en donde tenemos que obtener primero el vector gradiente ∇φ mediante
la aplicación del operador diferencial vectorial ∇, también para obtener la derivada absoluta
tenemos que obtener la derivada covariante del tensor T, lo cual es simbolizado
como Tj,q mediante la notación de la coma puesta en el sub-índice del tensor antes de la
letra q que representa a la coordenada general con respecto a la cual se toma la derivada
covariante. Al igual que en el caso de la derivada direccional en donde vamos a efectuar a cabo el
producto escalar del vector gradiente ∇φ con el vector V que es la tangente a la curva espacial
sobre la cual se lleva a cabo la operación, en la derivada absoluta también efectuamos una
operación de producto escalar con cada uno de los componentes dx q/dt que agrupados bajo un
vector vienen siendo también una tangente a una curva espacial. Y al igual que en el caso de la
derivada direccional en donde llevamos a cabo un producto escalar entre los vectores ∇φ y V, en
el caso de la derivada absoluta igualmente llevamos a cabo un producto interno entre los
tensores Tj,q y dxq/dt mediante una operación de contracción como lo requiere la convención de
sumación para índices repetidos, lo cual a fin de cuentas viene siendo lo mismo que la toma del
producto escalar entre ambos tensores. Obsérvese el uso de la palabra intrínseca en el otro
nombre que se le puede dar a la derivada absoluta de un tensor. Esto tiene una connotación
geométrica directa con el concepto de la curvatura intrínseca dado arriba al inicio de esta
entrada. Es precisamente de lo que se trata. Obsérvese también que el resultado final de las
operaciones combinadas en el caso de la derivada absoluta viene siendo un tensor del mismo
tipo y del mismo orden que el tensor original. Esto quiere decir que si obtenemos la derivada
absoluta de un tensor contravariante de orden uno, el resultado será también un tensor
contravariante de orden uno.

PROBLEMA: Partiendo del tensor contravariante Ai, y formando el producto interno de la


derivada covariante Ai, j con el vector tangente dxi/dt a una curva espacial, demostrar la
siguiente relación:

Todas las operaciones y demostraciones a ser llevadas a cabo en problemas de este tipo tienen
su punto de partida en una definición tensorial como la siguiente:

El primer paso consiste en tomar la derivada covariante del tensor Ai:

Tomamos ahora el producto interno (contracción) entre este tensor y el tensor dx q/dt:
Multiplicando para remover paréntesis:

Pero por la regla de la cadena, el primer término en el lado derecho de la ecuación es


simplemente la derivada ordinaria de dAi/dt. Simplificando, llegamos a la relación que se quería
demostrar desde un principio.

Para un tensor covariante , también podemos definir una derivada absoluta. La definición es
casi idéntica a la dada anteriormente:

PROBLEMA: Partiendo del tensor covariante Ai, y formando el producto interno de la


derivada covariante Ai, j con el vector tangente dxi/dt a una curva espacial, demostrar la
siguiente relación:

La resolución de este problema se lleva a cabo en forma casi idéntica al problema anterior, la
única diferencia siendo que utilizamos la derivada covariante para un tensor del tipo covariante
en lugar de un tensor del tipo contravariante, lo cual se refleja en la diferencia de los signos del
segundo término de la derivada absoluta de un tensor cuando se trata de un tensor covariante (-
) y de un tensor contravariante (+).

Por una mera ligera conveniencia y sin ninguna otra razón más que esta, trabajaremos sobre la
derivada absoluta de un tensor contravariante.
Si T = (Ti) es un tensor (contravariante), entonces la derivada (Ti, j) de dicho tensor (siguiendo
las reglas para la derivada de un tensor con lo cual entran en el panorama los símbolos de
Christoffel) también lo es. Supóngase que vamos a tomar el producto interno de este
tensor T con otro tensor U = (dxi/dt) que viene el vector tangente a una curva espacial C
cuyos i componentes (tres componentes en caso de un espacio tri-dimensional) son a su vez
funciones de un parámetro t ( xi = xi(t) ):

Como ya lo vimos, a este producto se le designa como la derivada absoluta del tensor a lo largo
de la curva espacial C siendo sus componentes:

Una cosa que debemos aquí es que en un sistema de coordenadas en los que los componentes
del tensor métrico gij son constantes numéricas los símbolos de Christoffel se convierten todos
en cero, con lo cual la diferenciación absoluta se nos reduce a lo que ya habíamos visto antes, a
la derivada direccional de un vector. Lo que en el Análisis Vectorial llamamos derivada
direccional en el Análisis Tensorial lo llamamos derivada absoluta, estando ambos conceptos
siempre definidos a lo largo de una curva espacial, pero siendo siempre el concepto de la
derivada absoluta más general y más extenso que el de la derivada direccional.

PROBLEMA: Demostrar que la diferenciación absoluta se convierte en diferenciación


ordinaria: (1) en el caso del espacio tri-dimensional Euclideano manejado con coordenadas
rectangulares Cartesianas, y (2) en el caso del espacio-tiempo Lorentziano (Minkoswki) que
corresponde a la Teoría Especial de la Relatividad.

(1) En el caso del espacio tri-dimensional Euclideano manejado con coordenadas rectangulares
Cartesianas, en donde el elemento de distancia ds está dado por:

ds² = dx² + dy² + dz²

los componentes del tensor métrico g son:


g11 = g22 = g33 = 1, y gij = 0 para i ≠ j

y por lo tanto todos los símbolos de Christoffel serán iguales a cero. Entonces:

se reduce a:

y la diferenciación absoluta se convierte en diferenciación ordinaria.

(2) En el caso del espacio-tiempo Lorentziano (Minkoswki) que corresponde a la Teoría Especial
de la Relatividad, el elemento de distancia ds lo podemos escribir como:

ds² = c²dt² - dx² - dy² - dz²

con lo cual los componentes del tensor métrico g son:

g11 = 1, g22 = g33 = g44 = -1, y gij = 0 para i ≠ j

y por lo tanto todos los símbolos de Christoffel serán iguales a cero, produciéndonos el mismo
resultado que la parte anterior.

Resulta obvio que todo lo que se ha definido arriba para un espacio tri-dimensional se puede
extender sin problema alguno hacia un 4-espacio o inclusive a espacios de dimensiones
mayores; y más aún, podemos llevarlo hacia espacios multidimensionales en donde hay
curvatura a causa de un sistema de coordenadas en el que no todos los componentes del tensor
métrico gij son constantes numéricas.

En un marco de referencia inercial (Lorentziano), toda la geometría Euclideana sigue siendo


perfectamente válida. Las líneas paralelas permanecen paralelas. Del mismo modo, la suma de
los ángulos internos de un triángulo cualquiera frente a un observador en reposo miden 180
grados:
y seguirán midiendo 180 grados cuando el triángulo se pone en movimiento a una velocidad
constante frente al observador después de que todos los efectos relativistas han sido tomados en
cuenta (las distancias paralelas a la dirección del movimiento se contraen mientras que las
distancias perpendiculares permanecen iguales):

Sin embargo, si el triángulo es puesto en un marco de referencia acelerado, la suma de los


ángulos internos del triángulo ya no será igual a 180 grados, e inclusive las líneas rectas del
triángulo dejarán de ser líneas rectas, se volverán líneas curvas. La geometría dejará de ser
Euclideana para convertirse en una geometría no-Euclideana.
Considérese ahora un plano Euclideano, sin curvatura alguna en la tercera dimensión espacial,
en el cual se toma un vector V que está situado inicialmente en el punto A de un cuadrado y al
cual se le arrastra mediante el procedimiento de transporte paralelo alrededor de los bordes del
cuadrado, pasando por los puntos B, C y D hasta regresarlo al punto original de partida:

Después de completar de completar el recorrido completo ABCDA hasta volver al punto de


origen, el vector arrastrado mediante el transporte paralelo continúa apuntando en la misma
dirección que aquella a la que apuntaba al empezar el recorrido. Esto no ocurre en presencia de
alguna curvatura, como en el caso en el cual se ha trazado un cuadrado como el de arriba muy
grande sobre la superficie de una esfera. El transporte paralelo proporciona entonces una
manera de poder determinar la curvatura de un espacio tridimensional o de un espacio-tiempo
relativista. En un espacio-tiempo plano(Lorentziano) dV/dλ = 0. Vectorialmente hablando, esto
significa que un vector V objeto de transporte paralelo no solo no cambia de magnitud al ser
desplazado, ni siquiera cambia de dirección (sin embargo, en una región suficientemente
pequeña, el espacio curvo se vuelve prácticamente plano. Esta aproximación nos permite
considerar a un espacio-tiempo curvo formado por una cantidad enorme de “mosaicos” espacio-
tiempo planos).

En el caso de un 4-espacio como el que se utiliza en la Teoría de la Relatividad, el vector


tangente U se puede definir de la siguiente manera en función del parámetro τ a partir del
vector posición x:
El parámetro es, desde luego, el tiempo propio τ medido por el reloj que viaja con el observador
en movimiento.

Considérese ahora la siguiente curva espacial en la cual se han trazado vectores tangentes sobre
dicha curva identificados como U y sobre la cual se ha tomado un vector V al cual se le ha
aplicado el procedimiento de transporte paralelo:

Con la ayuda de la regla de la cadena podemos escribir lo siguiente tomándolo como algo
matemáticamente válido (utilizamos derivadas ordinarias para cada dxi/dτ en virtud de que
cada componente xi es función de una sola variable que es el parámetro τ, mientras que usamos
derivadas parciales para las componentes ∂Vα/∂xi en virtud de que el vector V es una función
no de una sino de varias variables xi):
Inspeccionando esto que acabamos de escribir, nos percatamos de que podemos representarlo
de una manera más compacta como el producto interno (escalar) de un vector cuyas
componentes son dxi/dτ por otro vector cuyas componentes son ∂Vα/∂xi. Esto lo podemos
representar de dos maneras, ya sea en notación matricial (compacta o explícita) o recurriendo a
notación de doble sumatoria usando índices repetidos. Optaremos aquí por esta última porque
está más de cerca con el espíritu del tratamiento tensorial que se le dá a la Teoría de la
Relatividad. Si repasamos lo que vimos arriba, no nos debe llevar mucho tiempo para darnos
cuenta de que el vector cuyas componentes son dxi/dτ en realidad es el vector U = (Uβ) que es la
tangente a la curva espacial. Esto significa que la expansión anterior la podemos representar de
la manera siguiente:

Obsérvese que en la segunda línea hemos recurrido a la notación de la coma para representar la
derivada parcial de Vα con respecto a xβ. Pero si repasamos lo que tenemos arriba, no tardamos
en caer en la cuenta de que lo que tenemos en UβVα,β es esencialmente la definición de la
derivada absoluta del tensor (vector) V. Pero si como vimos arriba, en un espacio-
tiempo plano (Lorentziano) dV/dλ = 0, entonces el enunciado siguiente:

Uβ Vα , β = 0

es esencialmente la definición del transporte paralelo del vector V a lo largo del vector
tangente U trazado sobre la curva espacial. Pero esta es una expresión tensorial, válida en
cualquier marco de referencia. Por lo tanto, aplicando la regla de “la coma va hacia un
semicolon”, reemplazando con ello a la derivada ordinaria con la derivada covariante (la cual
involucra ya a los símbolos de Christoffel), tenemos entonces la siguiente expresión:
Uβ Vα ; β = 0

Esta es la definición invariante (válida para cualquier marco de referencia) del transporte
paralelo del vector V a lo largo del vector tangente U. En otras palabras, si UβVα,β = 0 entonces
dV/dλ = 0, y viceversa. La definición invariante del transporte paralelo es a veces presentada de
manera algo críptica aunque compacta de la siguiente manera:

cuyo lado izquierdo se acostumbra leer como “la derivada covariante de V tomada a lo largo del
vector tangente U”. Este es otro caso de una selección desafortunada de simbología, puesto que
el operador diferencial vectorial nabla ∇ nunca se aplica directamente sobre un vector, se aplica
sobre un campo escalar transformando a dicho campo escalar en un campo vectorial, del mismo
modo que en manipulaciones matemáticas no se acostumbra anexarle sub-índices a dicho
operador, y mucho menos sub-índices vectoriales.

Regresando al espacio plano, tenemos en él las líneas más importantes que se puedan trazar en
dicho espacio, que son las líneas rectas. Un postulado básico de la geometría Euclideana nos
dice que dos rectas paralelas que son inicialmente paralelas permanecerán paralelas cuando son
prolongadas. Esto no significa que podamos utilizar a la distancia que haya entre dos líneas para
determinar si son paralelas cuando son continuadas, porque ambas líneas pueden experimentar
una curvatura manteniéndose la distancia entre ambas constante (como lo que ocurre en las
carreteras en donde al tomar una curva la distancia entre ambos lados de la carretera
permanece más o menos constante). Lo que significa el que dos rectas permanezcan paralelas
cuando son continuadas es que ambas permanezcan moviéndose siempre en una misma
dirección, de modo tal que la tangente a una línea sea paralela a la tangente trazada sobre la
misma línea en un punto previo o posterior. De hecho, la línea recta es la única curva en el
espacio Euclideano capaz de llevar a cabo un transporte paralelo sobre su propio vector
tangente. En un espacio curvo también podemos trazar líneas “tan derechas como sea posible”
demandando el transporte paralelo del mismo vector tangente. Estas líneas ya las vimos en las
entradas previas. Son las geodésicas. Recuérdese cómo habíamos definido a las geodésicas como
“las líneas más derechas posibles entre dos puntos cualesquiera”. Simbólicamente, este
requerimiento matemático para tener “líneas tan derechas como sea posible” se puede
representar de la siguiente manera:
Utilizando notación de componentes, lo anterior se puede expresar de la siguiente manera en
forma menos críptica y más susceptible a la manipulación matemática
haciendo V = U en la definición invariante del transporte paralelo del vector V a lo largo del
vector tangente U:

Uβ Uα ; β = 0

Aplicando la definición de la derivada covariante como nos lo pide el semicolon (metiendo


dentro del panorama a los símbolos de Christoffel), y manteniéndonos dentro de la notación de
componentes, lo anterior se nos convierte en:

UβUα,β + Γαμβ UμUβ = 0

Si identificamos a λ como un parámetro medido a lo largo de la curva (ya sea un elemento de


arco o un elemento de tiempo propio medido por un observador que viaja con su reloj a lo largo
de la curva) de modo tal que el vector tangente pueda ser escrito como Uα = dxα/dλ; esto puede
ser simplificado aún más, pero para ello necesitamos probar el siguiente resultado intermedio:

Uβ · ∂/∂xβ = d/dλ

Puesto que, de un paso previo:

dVα/dλ = Uβ Vα , β

entonces:

de lo cual se infiere que:

Tenemos además que:


Es así como llegamos al siguiente sistema de ecuaciones:

O bien:

Esto último tiene ya un aspecto que nos debe resultar familiar. Es la ecuación geodésicaque
ya habíamos obtenido anteriormente por medio del cálculo de variaciones recurriendo a la
ecuación de Euler, y que hemos obtenido ahora aquí mediante argumentos de índole física.
Como podemos constatar, la ruta geodésica, el transporte paralelo y la curvatura del espacio-
tiempo son conceptos que están íntimamente ligados

La derivada absoluta
En la entrada anterior titulada “El transporte paralelo”, se definió a la derivada absoluta de un
tensor T = (Ti) como la contracción de la derivada covariante de dicho tensor (Ti; q) con otro
tensor dxq/dt que sea un vector tangente a una curva espacial. El resultado de estas operaciones
es un tensor del mismo tipo y del mismo orden que el tensor original (contravariante de orden
uno). Dada la importancia del concepto, llevaremos a cabo aquí algunos ejercicios de práctica
para familiarizarnos mejor con las propiedades y las aplicaciones de la derivada absoluta que
nos permiten llevar a cabo la tensorialización de la física clásica, trasladando posteriormente
los resultados hacia la física relativista.

La metodología para la obtención de la derivada absoluta es la misma en todos los casos:


a) Se toma la derivada covariante del tensor proporcionado.

b) Se escribe la expresión que denota a las componentes de la tangente con la cual se llevará a
cabo la contracción.

c) Se lleva a cabo la contracción de ambas aplicando la convención de sumación para índices


repetidos.

PROBLEMA: Obténganse las derivadas absolutas de cada uno de los siguientes tensores, los
cuales suponemos que son funciones diferenciales de la variable t:

1) La invariante Φ

2) Tk

3) Tj

(1) Empezando con Φ, podemos recurrir a la notación del semicolon en el sub-índice para
simbolizar a la derivada covariante de Φ como Φ;q; y designando como dxq/dt a
las qcomponentes de la tangente a la curva espacial sobre la cual queremos llevar a cabo la
derivación absoluta, las operaciones que tenemos que llevar a cabo aparecen en el punto de
partida usual para la obtención de una derivada absoluta:

Si Φ es una invariante, entonces al tomar la derivada covariante del mismo los símbolos de
Christoffel son todos iguales a cero, con lo cual Φ,q se nos convierte simplemente en ∂Φ/∂xq(el
semicolon va hacia una coma):

Entonces lo que tenemos para llevar a cabo la operación de contracción, sumando sobre los
índices repetidos, es lo siguiente:
Pero por la regla de la cadena, lo que tenemos en el lado derecho es simplemente la derivada
ordinaria de Φ con respecto a t, o sea dΦ/dt. Entonces:

En este caso, la derivada absoluta viene siendo igual a la derivada ordinaria.

(2) Como en (1), recurrimos a la notación del semicolon en el sub-índice para simbolizar a la
derivada covariante del tensor covariante Tk como Tk;q; y designando como dxq/dt a
las qcomponentes de la tangente a la curva espacial sobre la cual queremos llevar a cabo la
derivación absoluta, las operaciones que tenemos que llevar a cabo aparecen en el punto de
partida usual para la obtención de una derivada absoluta:

El siguiente paso consiste en implementar la derivada covariante del tensor covariante T = (Tk):

Removiendo paréntesis y simplificando:

(3) Como en (1), recurrimos a la notación del semicolon en el sub-índice para simbolizar a la
derivada covariante del tensor contravariante Tj como Tj;q designando como dxq/dt a
las qcomponentes de la tangente a la curva espacial sobre la cual queremos llevar a cabo la
derivación absoluta, con lo cual las operaciones que tenemos que llevar a cabo aparecen en el
punto de inicio usual para la obtención de una derivada absoluta:
Tomamos ahora la derivada covariante del tensor contravariante T = (Tj):

Removiendo paréntesis:

Simplificando:

PROBLEMA: Obténgase la derivada absoluta del tensor contravariante de orden dos U=


(Uab).

Simbolizando a la derivada covariante del tensor contravariante de orden dos Uab como Uab;q y
designando como dxq/dt a las q componentes de la tangente a la curva espacial sobre la cual
queremos llevar a cabo la derivación absoluta, podemos escribir lo siguiente:

Tomando la derivada covariante de U y efectuando la contracción tensorial con dxq/dt


obtenemos:
PROBLEMA: Obténgase la siguiente derivada absoluta de un tensor mixto T de orden dos, el
cual suponemos que es una función diferenciable de la variable t:

Simbolizando a la derivada covariante del tensor mixto Tjk como Tjk;q y designando
comodxq/dt a las q componentes de la tangente a la curva espacial sobre la cual queremos llevar
a cabo la derivación absoluta, podemos escribir lo siguiente:

El siguiente paso consiste en tomar la derivada covariante del tensor mixto, lo cual nos
introduce a los símbolos de Christoffel dándonos lo siguiente:

Removiendo los paréntesis y simplificando:

PROBLEMA: Obténgase la siguiente derivada absoluta de un tensor mixto T de quinto orden,


el cual suponemos que es una función diferenciable de la variable t:
Simbolizando a la derivada covariante del tensor mixto Tjklmn como Tjklmn;q y designando
como dxq/dt a las q componentes de la tangente a la curva espacial sobre la cual queremos llevar
a cabo la derivación absoluta, podemos escribir lo siguiente:

La expansión de la derivada covariante del tensor mixto de quinto orden nos conduce al
siguiente paso intermedio:

Removiendo el paréntesis y simplificando el primer término con la ayuda de la regla de la


cadena llegamos a la siguiente respuesta final:

PROBLEMA: Demostrar que la derivada absoluta de cualquier tensor métrico g = (gjk) es


igual a cero.

La derivada absoluta del tensor métrico está dada por la relación:


Pero ya se demostró en una entrada anterior que la derivada covariante del tensor métrico
(resaltada de color rojo en esta expresión) es cero.

Se concluye que, en general, la derivada absoluta del tensor métrico es igual a cero:

PROBLEMA: Demostrar que la derivada absoluta de cualquier tensor métrico conjugadog-1:


= (gjk) es igual a cero.

La derivada absoluta del tensor métrico conjugado está dada por la relación:

Pero ya se demostró en una entrada anterior que la derivada covariante del tensor métrico
conjugado (resaltada de color rojo en esta expresión) es cero.

Se concluye que, en general, la derivada absoluta del tensor métrico conjugado es igual a cero:

PROBLEMA: Demostrar que la derivada absoluta del tensor delta Kronecker δ = (δjk) es
igual a cero.

La derivada absoluta del tensor delta Kronecker está dada por la relación:
Pero ya se demostró en una entrada anterior que la derivada covariante del tensor delta
Kronecker (resaltada de color rojo en esta expresión) es cero.

Se concluye que, en general, la derivada absoluta del tensor delta Kronecker es igual a cero:

PROBLEMA: En el cálculo diferencial ordinario, el diferencial del producto de dos


funciones u y v es igual al producto de la primera función u por la diferencial dv de la segunda
más la segunda función v por la diferencial du de la primera:

d(uv) = udv + vdu

Esta regla es conocida como la regla de Leibniz. Demostrar que para la derivada absoluta
también tenemos una regla similar.

En el cálculo tensorial, las expresiones para las funciones u y v se convierten en


tensores Ty S. Por definición de la derivada absoluta, la derivada absoluta del producto de los
tensores T y S será:

en donde se ha utilizado la notación del semicolon para indicar la toma de la


derivada covariante con respecto a la coordenada xk.

En una entrada previa ya se demostró la aplicabilidad de la regla de Leibniz al tomar la derivada


covariante del producto de dos tensores. Aplicando dicha regla aquí en el lado derecho de la
ecuación, tenemos entonces lo siguiente:
A continuación removemos los paréntesis introduciendo a dxk/dt de una manera que nos servirá
para la simplificación posterior:

No cuesta trabajo reconocer lo que tenemos en el lado derecho. En el primer término tenemos a
la derivada absoluta del tensor T multiplicada por el tensor S. Y en el segundo término tenemos
al tensor T multiplicado por la derivada absoluta del tensor S:

Esta es precisamente la regla de Leibniz, aplicada en el caso de la derivada absoluta.

PROBLEMA: Demostrar que al tomarse la derivada absoluta de un producto de tensores,


tanto el tensor métrico como el tensor métrico conjugado pueden tratarse como si fuesen
constantes.

Si tomamos la derivada absoluta del tensor métrico g estando multiplicado por un tensor
contravariante T de primer orden, podemos ver en el siguiente desarrollo en el cual aplicamos la
regla de Leibniz y aplicamos también el hecho de que la derivada absoluta del tensor métrico es
igual a cero:

que el tensor métrico g puede tratarse como si fuese una constante al evaluar la derivada
absoluta de un producto de tensores.
En el caso del tensor métrico conjugado se logra el mismo resultado siguiendo el mismo
procedimiento:

De la misma manera, obtenemos el resultado de que el tensor delta Kronecker puede tratarse
como si fuese una constante al momento de tomar una derivada absoluta.

En la diferenciación absoluta, tanto el tensor métrico como el tensor métrico conjugado como
el tensor delta Kronecker pueden tratarse como si fuesen constantes.

PROBLEMA: Obtener la siguiente derivada absoluta del producto de los tensores U y V:

En este problema podemos utilizar ventajosamente el resultado del problema anterior aplicando
la regla de Leibniz:

Aplicamos ahora en cada término la definición de lo que es la derivada absoluta:

La expansión en cada término de la derivada covariante nos conduce al resultado final:


PROBLEMA: Demostrar que la velocidad instantánea de una partícula es un tensor de orden
uno.

Definamos un sistema de coordenadas utilizando super-índices, de modo tal que la posición de


la partícula en un espacio tri-dimensional esté especificada por el vector posición x = (xk).
Clásicamente, en este sistema de coordenadas, la velocidad instantánea de la partícula será el
vector velocidad v = (vk) dado por:

En otro sistema de coordenadas x = (xp). la velocidad instantánea v = (vp) de la misma partícula


estará dada por:

Si teniendo a la mano la velocidad instantánea v = (vk) queremos determinar la velocidad


instantánea en otro sistema de coordenadas alterno, la relación de transformación para lograrlo
es muy sencilla, ya que está dada por la regla de la cadena:

Pero esta es precisamente la definición matemática de un tensor contravariante de orden uno.

Si en vez de un sistema de coordenadas utilizando super-índices hubiéramos usado un sistema


de coordenadas con sub-índices, el resultado habría sido casi el mismo, habríamos obtenido un
tensor también de orden uno, pero covariante, sin cambio alguno en el significado físico.

Se concluye que la velocidad instantánea de una partícula es un tensor de orden uno.

Clásicamente, la definición de la aceleración instantánea está dada por la relación a = dv/dt. El


problema con esta definición de aceleración es que no es invariante bajo una transformación
de coordenadas. No hay forma en que la derivada ordinaria de la velocidad con respecto al
tiempo se pueda se pueda hacer invariante bajo una transformación de coordenadas, o lo que es
lo mismo, la definición clásica de aceleración instantánea no es un tensor.

PROBLEMA: Demostrar que la aceleración, definida clásicamente como la derivada de la


velocidad instantánea de un objeto con respecto al tiempo, no es un tensor.

A continuación, tenemos en el lado izquierdo la expresión para la aceleración de un objeto


medida en el sistema de coordenadas x = (xk) = (x1,x2,x3), y tenemos en el lado derecho la
expresión para la aceleración del mismo objeto medida en el sistema de coordenadas x = (xj) =
(x1,x2,x3)

No existe forma alguna con la cual podamos “conectar” matemáticamente estas dos expresiones
de segundo orden de modo tal que una se pueda transformar en la otra de acuerdo con la
definición del tensor.

Se concluye que la definición clásica de la aceleración instantánea que se enseña en los cursos
elementales de física y en los cursos de Análisis Vectorial no es una invariante bajo un cambio de
sistema de coordenadas.

Sin embargo, hay una forma muy fácil de redefinir el concepto de aceleración para que esta
pueda ser también invariante bajo un cambio en un sistema de coordenadas, y esta consiste
simplemente en tomar la derivada absoluta de la velocidad:
Esta es precisamente una de las principales motivaciones para el desarrollo del
cálculo tensorial o “cálculo diferencial absoluto”. Aún si la Teoría de la Relatividad
nunca hubiese existido por no haber nacido aún Einstein u otro científico que la descubriera, el
interés en poder obtener definiciones físicas válidas dentro de cualquier sistema de coordenadas
habría sido motivación suficiente para desarrollar esta herramienta matemática. La obtención
de la derivada absoluta justifica con creces el tiempo invertido en el desarrollo de los nuevos
conceptos que hemos estudiado. Estamos habilitados ya para poder llevar a cabo toda
la tensorialización de la física.

PROBLEMA: Obtener una expresión para la aceleración instantánea de un objeto definida de


modo tal que que tenga las propiedades de un tensor.

Empezaremos con una nueva definición de la aceleración a = (ak) definiéndola como la derivada
absoluta de la velocidad con respecto al tiempo:

Aplicaremos ahora de modo riguroso la definición de la derivada absoluta tal y como se ha


especificado arriba, definida como la derivada covariante (de la velocidad en este caso) a lo largo
de la trayectoria sobre la cual se lleva a cabo el movimiento mediante una operación de
contracción tensorial:

Expandiendo la derivada covariante tenemos entonces:


Como la velocidad instantánea v = (vk) = (dxk/dt) sí es un tensor, podemos reemplazar esta
expresión en el primer término obteniendo así:

En esta última expresión se ha hecho un ligero cambio en el super-índice s de vsrenombrándolo


como p haciendo lo mismo en el símbolo de Christoffel para que no se pierda la sumación
requerida por la convención de sumación para índices repetidos. Haciendo un intercambio en
los sub-índices del símbolo de Christoffel usando la propiedad de simetría de dicho símbolo, y
escribiendo a vp en su forma explícita como la derivada de la posición con respecto al tiempo,
llegamos a nuestra nueva definición de aceleración, tensorial en el pleno sentido de la palabra:

Escrita de esta manera, la aceleración instantánea nos debe resultar familiar como una ecuación
diferencial de la geodésica, lo cual era de esperarse porque el móvil se está acelerando
precisamente a lo largo de la curva geodésica sobre la cual se está desplazando de un punto a
otro.

Una vez definida tensorialmente la aceleración instantánea, podemos revisar una de las leyes
más veneradas de la física clásica, la segunda ley de Newton, que nos dice que “la fuerza es igual
al producto de la masa de un cuerpo multiplicada por la aceleración que dicha fuerza produce en
dicho cuerpo”.

PROBLEMA: Expresar la segunda ley de Newton en forma tensorial.

La segunda ley de Newton para una masa M que permanece invariante y es independiente del
tiempo, escrita tanto en notación vectorial compacta como en notación de componentes, es la
siguiente:
Obviamente, esto no es algo que pueda permanecer invariante en forma bajo un cambio de
coordenadas, porque para que ello ocurra la derivada ordinaria tienen que ser reemplazadas por
la derivada absoluta. Podemos utilizar el resultado del problema anterior para escribir la ley de
Newton en forma tensorial:

Esta fórmula es válida dentro de la física clásica pre-relativista. Pero si vamos a hacer la
transición hacia la física relativista, tendremos que contender con el hecho de que, para fines
teóricos, en una gran mayoría de los casos la definición de fuerza dinámica ha pasado a ser una
pieza de museo, empezando por el hecho de que la masa M de un cuerpo en movimiento deja de
ser invariante, sumado a la eliminación por completo del concepto de la fuerza de atracción
gravitacional entre dos cuerpos como causante del movimiento de dichos cuerpos en el espacio
libre. De cualquier manera, seguiremos requiriendo del concepto de la derivada absoluta, el cual
volverá a mostrarnos su cara en cuanto veamos la derivación desde el punto de vista geométrico
del tensor de curvatura de Riemann.

El concepto de la derivada absoluta nos lleva de modo casi natural a otro concepto importante
en las matemáticas puras: el álgebra Lie. Considerando a dxβ/dt como un vector velocidad U =
(Uβ) en un espacio N-dimensional, para un tensor V = (Vα) podemos escribir:
Esta derivada absoluta la podemos interpretar como la componente α de la derivada covariante
del vector V a lo largo de la trayectoria trazada por el vector tangente U, representada en
algunos textos como:

PROBLEMA: Si tomamos la definición fundamental de la derivada absoluta de un tensorV a


lo largo de una trayectoria curva cuya tangente es el vector U, escrita en notación de
componentes como:

UβVαβ

e invertimos los papeles de U y V definiendo la siguiente derivada absoluta de U:

VβUαβ

y restamos el uno del otro:

UβVαβ - VβUαβ

tenemos entonces la definición de algo nuevo que se simboliza como:

Demostrar que:

La demostración en este caso es trivial. Invirtiendo los papeles de U y V dentro del corchete se
tiene para un componente α:
Si esta relación es cierta para todo componente α de los tensores de primer orden U y V,
entonces debe ser cierta en lo general, y podemos escribir:

[U,V] = - [V,U]

Esto que hemos definido sobre un par de campos vectoriales se conoce como el corchete
Lie (Lie bracket), en honor al matemático Sophus Lie que lo concibió por vez primera, y nos
conduce directamente al estudio de un importante campo de las matemáticas. El corchete Lie
toma dos campos tensoriales (vectoriales) U y V, y define a partir de los mismos un nuevo
campo tensorial (vectorial) [U,V] que tiene propiedades interesantes. Más aún, a lo que
acabamos de definir se le puede dar una interpretación como una derivada Lie simbolizada
como:

Lo más relevante para nosotros es que a través del álgebra Lie y de la derivada Lie tenemos a la
mano la definición de un campo tensorial en donde no se requieren los símbolos de Christoffel.
Es importante entender, físicamente hablando, lo que hemos llevado a cabo. La ruta o
trayectoria a lo largo de la cual se toma la derivada absoluta ha sido reemplazada por una
familia completa (infinita) de trayectorias. Ha sido reemplazada, en efecto, por un campo
vectorial. La derivada Lie evalúa esencialmente el cambio de un campo vectorial a lo largo
del flujo de otro campo vectorial.

Si partimos de la definición convencional del gradiente mediante la cual con el operador


diferencial nabla (∇) aplicado sobre un campo escalar f en un espacio N-dimensional:

f = f (x1,x2,x3,...,xα,...,xN)

obtenemos a partir del campo escalar f un campo vectorial :


conocido como el gradiente del campo escalar f, entonces podemos entresacar un componente
α entre cualesquiera de sus demás componentes con la siguiente notación simbólica:

Tomemos ahora el componente α de otro vector U definido sobre el mismo espacio N-


dimensional (con una misma cantidad de componentes o coordenadas) y multipliquémoslo por
la igualdad anterior, obteniendo así:

Este componente α lo podemos representar simbólicamente de la siguiente manera en notación


vectorial más compacta:

Ahora bien, si tomamos el correspondiente componente α de un tercer campo vectorial V y lo


multiplicamos por lo anterior, el componente producido se puede representar de la manera
siguiente:

A continuación tenemos en forma más explícita lo que estamos definiendo con esto último:

Dejemos temporalmente esto a un lado y volvamos a la definición del corchete Lie en notación
de componentes:
Si en vez del campo vectorial V metemos en el corchete Lie el producto del campo escalar f por
el mismo campo vectorial V, entonces tendremos lo siguiente en el lado derecho de la igualdad:

Desarrollando la derivada del primer término de acuerdo con la regla de Leibniz, tenemos:

Reacomodando y reagrupando los términos:

Se han renombrado los índices en el último término teniendo en cuenta que son índices
monigote al fin y al cabo. Si observamos detenidamente, podemos ver que lo que tenemos en el
primer término es un corchete Lie, el corchete Lie [U,V], en notación de componentes. Y el
segundo término puede ser substituído por el resultado intermedio que habíamos dejado
pendiente arriba. Esto nos lleva a lo siguiente:

Pero si esto es válido para todos y cada uno de los componentes α desde α = 1 hasta α = N,
entonces podemos prescindir de la notación de componentes para llevar a cabo la
representación simbólica de una manera más compacta:
Ahora bien, en el lado izquierdo de esta igualdad tenemos básicamente lo que podemos
considerar como la derivada Lie de f V con respecto a U:

Y en el lado derecho de la igualdad tenemos en el primer término la derivada Lie de V con


respecto a U que en notación Lie podemos representar como:

Por último, en el tercer término del lado derecho de la igualdad, tenemos lo que podemos definir
como la derivada Lie del campo escalar f con respecto al campo vectorial U, representado de la
siguiente manera:

Es así como usando notación Lie podemos escribir el resultado obtenido anteriormente de la
siguiente manera en la forma de una regla de Leibniz para el operador derivativo Lie:

Los resultados que hemos obtenido nos muestran que es posible definir para campos tensoriales
(vectoriales) en un espacio N-dimensional un operador derivativo sin necesidad de tener que
recurrir a coeficientes de conexión (símbolos de Christoffel) o inclusive a una métrica, siendo
por lo tanto el álgebra Lie y la derivada Lie conceptos de naturaleza muy fundamental.

Varias áreas de la Relatividad General se pueden estudiar y desarrollar con la ayuda de la


derivada Lie, para lo cual hay que pagar el costo ineludible de una mayor sofisticación
matemática. Sin embargo, esto no se cubrirá aquí más a fondo por no ser absolutamente
indispensable para nuestros propósitos.

El tensor de Riemann I
En la Teoría General de la Relatividad, hay tres tensores que nos interesan para estudiar y
especificar la curvatura de un espacio-tiempo curvo: el tensor de Einstein G, el tensor de Ricci y
el tensor de Riemann R. El tensor de Einstein es obtenido a partir del tensor de Ricci, y a su vez
el tensor de Ricci es obtenido a partir del tensor de Riemann, de modo tal que queremos
estudiar y tener muy en claro lo que es el tensor de Riemann puesto que todo lo relacionado con
la curvatura en un espacio multi-dimensional deriva de dicho tensor.

El tensor de Riemann surge como consecuencia del análisis involucrado en dar respuesta a lo
que parece ser una pregunta sencilla. Empezando con un tensor covariante V = (Vi) y tomando
la derivada covariante del tensor primero con respecto a la coordenada x j y luego con respecto a
la coordenada xk nos produce un tensor de tercer orden:

((Vi); j); k = (Vi); jk = Vi; jk

¿Pero que tal si tomamos primero tomando la derivada covariante del tensor primero con
respecto a la coordenada xk y luego con respecto a la coordenada x j?:

((Vi); k); j = (Vi); kj = Vi; kj

¿Es importante el orden en el cual se lleve a cabo la diferenciación, o se puede decir que en
general Vi; jk = Vi; kj?

En la diferenciación parcial ordinaria, no parece haber duda alguna al respecto, ya que las
diferenciaciones múltiples se pueden llevar a cabo en el orden que sea:

Pero al estar trabajando con tensores, ya vimos que la diferenciación se tiene que llevar a cabo
con nuevas reglas para que el objeto diferenciado pueda comportarse también como un tensor,
se tiene que llevar a cabo usando la derivada covariante.

La respuesta a nuestra interrogante resulta ser una negativa rotunda, y tratándose de tensores el
orden de la diferenciación sí es importante.

PROBLEMA: Demostrar que

Vp;qr - Vp;rq
no es igual a cero, y que por lo tanto el orden de la diferenciación covariante sí afecta el
resultado final.

En el primer paso, evaluaremos primero la derivada covariante múltiple Vp;qr aplicando al pie de
la letra la definición de la derivada covariante para un tensor covariante:

A continuación llevaremos a cabo la diferenciación covariante aplicando de nuevo al pie de la


letra la definición de la derivada covariante para un tensor covariante:

El siguiente paso consiste en remover los paréntesis para tener lo siguiente:

Hemos obtenido ya Vp;qr. Repitiendo el procedimiento dado arriba, podemos obtener también
Vp;rq, pero no es necesario hacerlo todo de nuevo, ya que basta con intercambiar el orden de los
índices para obtener Vp;rq. Hecho esto, si restamos Vp;rq de Vp;qrobtenemos entonces:
Podemos renombrar los índices para poner en los cuatro términos al tensor Vj como producto:

Esto nos permite llevar a cabo la siguiente factorización:

A menos de que los símbolos de Christoffel sean todos iguales a cero, lo cual no ocurre en un
espacio multi-dimensional plano, Vp;qr y Vp;rq no son iguales, son diferentes, y son diferentes
precisamente en una cantidad como la mostrada en color azul entre los paréntesis. Dicha
cantidad:

simbolizada tensorialmente como Rjpqr es precisamente lo que se conoce como el tensor de


Riemann. El que Vp;qr ≠ Vp;rq tiene consecuencias geométricas profundas que serán analizadas
posteriormente.

El tensor de curvatura de Riemann, o simplemente tensor de Riemann, es un tensor de


orden cuatro, de modo tal que los componentes de dicho tensor no pueden ser visualizados con
una representación matricial como ocurre con el caso de un tensor métrico g de orden 2.
Estrictamente hablando, podemos definirlo como un tensor covariante de orden cuatro o bien -
con la ayuda del tensor métrico g para subir el primer índice- como un tensor de orden (1,3), o
sea un tensor covariante de orden 1 y contravariante de orden 3. En notación de índices, por lo
tanto, es representado ya sea como Rabcd o como Rabcd. En el caso Rabcd (todos los cuatro índices
abajo) llamamos al tensor un tensor de Riemann del primer género ó primera
especie (first kind) mientras que en el caso Ra bcd (el primer índice elevado) llamamos al tensor
un tensor de Riemann del segundo género ó segunda especie (second kind).

PROBLEMA: ¿Qué ventaja puede tener la representación del tensor de Riemann R como un
tensor de primer género Rabcd sobre su representación como un tensor de segundo
género Rabcd en notación de componentes?

Por la forma en que ha sido definido arriba el tensor de Riemann de segundo género como el
“factor” que nos mide la no-conmutatividad de las diferenciaciones covariantes de segundo
orden, debe resultar obvio que en un espacio 4-dimensional, por ejemplo, dicho tensor constará
de 4x4x4x4 = 256 componentes, y si partimos “a la inversa” de cada una de las
componentes Rabcd del tensor de primer género podemos obtener las 256 componentes que
corresponden a la representación Rabcd del segundo género con la ayuda del tensor métrico
conjugado g-1 = (gab) para subir el primer índice. El problema con esto es que al subir el primer
índice inevitablemente habrá muchas componentes en las cuales el segundo, el tercero o el
cuarto índice o varios de ellos puedan ser igual al primero, como la componente Rφtrφ, y esto se
puede interpretar erróneamente como algo que invoca automáticamente la activación de la
convención de sumación para índices repetidos. Al tensor de Riemann se le puede aplicar,
desde luego, una operación de contracción tensorial mediante igualación de índices; esto es
precisamente lo que se lleva a cabo con el tensor de Ricci, pero la definición original del tensor
de Riemann de segundo género excluye la aplicación automática de la convención de sumación
para índices repetidos. Esta es la razón del por qué varios autores contemporáneos hacen una
mescolanza en la cual después de haber obtenido el tensor de Riemann de segundo género como
lo hemos hecho arriba pasan casi de inmediato al uso del tensor de Riemann de primer género
sin explicar claramente la razón que los orilló a ello (puesto que la operación de contracción
tensorial se lleva a cabo entre un índice contravariante y un índice covariante, al estar todos los
índices abajo en el tensor de Riemann de primer género no se aplica de ningún modo la
convención de sumación y entonces no hay confusión alguna). Esta es una de las consecuencias
de que el tensor de curvatura de Riemann o simplemente tensor de curvatura o
simplemente tensor de Riemann, el cual es una generalización de la curvatura de Gauss K a
dimensiones más altas, haya sido introducido en 1862 por Riemann y desarrollado en 1869 por
Christoffel como una forma de describir completamente la curvatura en cualquier número de
dimensiones mediante un “pequeño monstruo” mucho antes de que Einstein introdujera su
convención de sumación para índices repetidos. Desafortunadamente tenemos una situación en
la que por un lado los componentes del tensor de Riemann de segundo género Rabcd pueden ser
obtenidos mediante una simple fórmula como podemos verlo en la expresión que tenemos
arriba aunque bajo el riesgo de que en un momento de distracción se pueda interpretar
accidentalmente la repetición del índice superior y alguno de los índices inferiores como una
invocación automática a la convención de sumación, mientras que por otro lado para obtener los
componentes del tensor de Riemann de primer género Rabcd en el cual no hay confusión se
tienen que ir bajando con la ayuda del tensor métrico el índice en cada uno de ellos, lo cual nos
duplica la cantidad de trabajo.

A menos de que se indique lo contrario, y esto tiene que ser estudiado y aclarado para cada
caso en particular, en la evaluación de los componentes del tensor de Riemann de segundo
género no se aplica automáticamente la convención de sumación para índices repetidos.

Formalmente, y en base al resultado obtenido al principio, el tensor de Riemann del segundo


género se puede definir a partir de los símbolos de Christoffel (los cuales no son tensores) de la
siguiente manera (¡obsérvese con detenimiento el uso de la derivada parcial ordinaria, indicado
por la coma puesta antes del índice utilizado para la diferenciación!):

Ra bcd = Γabd,c - Γabc,d + Γaμc Γμbd - Γaμd Γμbc

Puesto de manera más explícita:

Ra bcd =__________________________

∂(Γabd)/∂xc - ∂(Γabc)/∂xd + Γabc,d + Γaμc Γμbd - Γaμd Γμbc

Si utilizamos el tensor de Riemann para el estudio de un espacio de cuatro dimensiones como


ocurre en el caso del espacio-tiempo de la Teoría General de la Relatividad, cada uno de los
cuatro sub-índices del tensor de Riemann puede representar una de cuatro variables diferentes,
así que un tensor de Riemann está especificado por un total de 4x4x4x4 = 256 componentes, lo
cual nos puede parecer intimidante. Sin embargo, debido a las simetrías que presenta este
tensor, no todas las componentes son independientes, lo cual reduce el número de componentes
que tienen que ser calculadas de 256 a 36. Una de tales simetrías en el intercambio del tercer y
cuarto índice es la siguiente:

Ra bcd = - Ra bdc

Imponiendo además la condición adicional:

Ra bcd + Ra cdb + Ra dbc = 0

el número de componentes independientes puede ser reducido posteriormente a 21, y si se


satisface una identidad adicional el número de componentes puede ser reducido a 20.

Poniendo las componentes del tensor de Riemann R = (Rαβμν) del primer género en función de
las componentes de un tensor métrico g, podemos obtener la siguiente expresión (de nueva
cuenta, las comas en los sub-índices indican derivadas parciales ordinarias):

Rαβμν = (gαν,βμ - gαμ,βν + gβμ,αν - gβν,αμ)/2

Del mismo modo, trabajando sobre esta última relación podemos obtener varias identidades
que resultan ser de gran utilidad para la evaluación de todos los componentes Rαβμν para cierta
métrica. La primera identidad nos dice que si intercambiamos los primeros dos índices (α y β)
entonces obtendremos el mismo componente pero con el signo invertido, lo cual equivale a decir
que Rαβμν es antisimétrico en el primer par de índices:

Rαβμν = - Rβαμν

La segunda identidad nos dice que si intercambiamos los últimos dos índices (μ y ν) entonces
también obtendremos el mismo componente pero con el signo invertido, lo cual equivale a decir
que Rαβμν es antisimétrico en el segundo par de índices:

Rαβμν = - Rαβνμ

La tercera identidad nos dice que si intercambiamos el primer par de índices (α y β) con el
segundo par de índices (μ y ν) entonces obtendremos el mismo componente, lo cual equivale a
decir que Rαβμν es simétrico en el intercambio de los dos pares de índices:

Rαβμν = Rμναβ
Y por último, la cuarta identidad, nos dice que:

Rαβμν + Rανβμ + +Rαμνβ = 0

Esta última identidad es conocida como la primera identidad de Bianchi.

PROBLEMA: A partir de la definición del tensor de Riemann de primer género, demostrar las
identidades:

Rαβμν = - Rβαμν

Rαβμν = - Rαβνμ

Rαβμν = Rμναβ

Rαβμν + Rανβμ + +Rαμνβ = 0

1) A partir de la definición de los componentes Rαβμν en función de los componentes derivados


del tensor métrico:

Rαβμν = (gαν,βμ - gαμ,βν + gβμ,αν - gβν,αμ)/2

intercambiamos los índices α y β obteniendo lo siguiente:

Rβαμν = (gβν,αμ - gβμ,αν + gαμ,βν - gαν,βμ)/2

y tras un simple reacomodo:

Rβαμν = (-gαν,βμ + gαμ,βν - gβμ,αν + gβν,αμ)/2

Rβαμν = - Rαβμν

2) Procediendo como lo hicimos arriba, intercambiando los últimos dos índices μ y ν:

Rαβνμ= (gαμ,βν - gαν,βμ + gβν,αμ - gβμ,αν)/2

y reacomodando:
Rαβνμ = (-gαν,βμ + gαμ,βν - gβμ,αν + gβν,αμ)/2

Rαβνμ = - Rαβμν

3) Intercambiando el primer par de índices con respecto al segundo par de índices (lo cual debe
ser interpretado como dos operaciones, la primera siendo el intercambio de los índices α y μ, y
la segunda siendo el intercambio de los índices β y ν):

Rμναβ = (gμβ,να - gμα,νβ + gνα,μβ - gνβ,αμ)/2

Podemos efectuar un ligero reacomodo de índices, haciendo además uso del hecho de que las
derivadas parciales ordinarias se pueden llevar a cabo en cualquier orden, esto es:

gαβ,νμ = gαβ,μν

obteniendo así lo siguiente:

Rμναβ = ( gμβ,αν - gμα,βν + gνα,βμ - gνβ,αμ)/2

Por otro lado, puesto que el tensor métrico es simétrico, tenemos que:

gαβ = gβα

con lo cual lo anterior se nos reduce a:

Rμναβ = (gβμ,αν - gαμ,βν + gαν,βμ - gβν,αμ)/2

y con otro ligero reacomodo:

Rμναβ = ( gαν,βμ - gαμ,βν + gβμ,αν - gβν,αμ)/2

Rαβμν = Rμναβ

4) Finalmente, escribiendo la suma de los tres términos involucrados en la primera identidad de


Bianchi tras obtener los otros dos términos mediante un intercambio de índices, y simplificando
con la ayuda de la simetría de los componentes del tensor métrico:

Rαβμν + Rανβμ + Rαμνβ =


(gαν,βμ - gαμ,βν + gβμ,αν - gβν,αμ)/2
(gαμ,νβ - gαβ,νμ + gνβ,αμ - gνμ,αβ)/2
(gαβ,μν - gαν,μβ + gμν,αβ - gμβ,αν)/2

obtenemos el resultado final deseado, la primera identidad de Bianchi:

Rαβμν + Rανβμ + Rαμνβ = 0

PROBLEMA: Trabajando sobre un espacio de cuatro dimensiones y con la ayuda de las


identidades demostradas en el problema anterior, demuéstrese que estas identidades reducen
el número de componentes independientes de Rαβμν de 4x4x4x4 = 256 componentes a 6x7/2 =
21 componentes.

Puesto que Rαβμν = - Rβαμν, si hacemos α = β entonces tenemos Rααμν = - Rααμν, lo cual sólo puede
ser cierto si Rααμν es cero. Del mismo modo, puesto que Rαβμν = - Rαβνμ, si hacemos μ = ν entonces
tenemos Rαβμμ = - Rαβμμ, lo cual sólo puede ser cierto si Rαβμμ es cero. Esto quiere decir
que Rαβμν = 0 en todos los casos en los que los primeros dos índices o en los que los últimos dos
índices sean iguales. Con esto en mente, iremos contando los componentes que pueden ser
diferentes de cero de acuerdo a tres tipos de posibilidades:

Tipo A: Este es el caso en el cual el primer par de índices es igual al segundo par de índices
siendo el primer índice en un par menor que el segundo índice en el mismo par, o sea todas las
posibilidades de Rαβαβ siendo α menor que β. Aquí podemos listar las siguientes posibilidades
para un espacio de cuatro dimensiones:

R1212 , R1313 , R1414 , R2323 , R2424 , R3434

Tenemos un total de seis componentes independientes, que de acuerdo a las leyes de la


combinatórica es igual a nA = nC2 = n(n-1)/2 para un espacio de n dimensiones (la cantidad de
combinaciones posibles de n objetos tomados dos a la vez), o sea

nA = 4(4-1)/2 = 4·3/2 = 6 componentes

para un espacio de 4 dimensiones.

Tipo B: Este es el caso en el cual el primer índice es igual al tercer índice siendo el segundo
índice y el tercer índice diferentes, o sea todas las posibilidades de Rαβαγ siendo β menor que γ.
Aquí podemos listar las siguientes posibilidades para un espacio de cuatro dimensiones:

R1213 , R1214 , R1314, R2123 , R2124 , R2324

R3132 , R3134 , R3234 , R4142 , R4143 , R4243

Tenemos un total de doce componentes independientes, que de acuerdo a las leyes de la


combinatórica es igual a nB = 3·nC3 = n(n-1)(n-2)/2 para un espacio de n dimensiones, o sea

nB = 4(4-1)(4-2)/2 = 4·3·2/2 = 12 componentes

para un espacio de 4 dimensiones.

Tipo C: Este es el caso en el cual todos los índices son diferentes, teniendo como posibilidades
a Rαβγδ ó a Rαγβδ , siendo α menor que β, siendo β menor que γ, y siendo γ menor que δ. Aquí
podemos listar las siguientes posibilidades para un espacio de cuatro dimensiones:

R1234 , R1324

Tenemos un total de dos componentes independientes, que de acuerdo a las leyes de la


combinatórica es igual a

nC = 2·nC4 = n(n-1)(n-2)(n-3)/12

para un espacio de n dimensiones, o sea

nC = 4(4-1)(4-2)(4-3)/12 = 4·3·2·1/12 = 2 componentes

para un espacio de 4 dimensiones.

Sumando las contribuciones individuales de cada uno de los tres tipos de componentes,
podemos obtener una fórmula general que nos dá la cantidad de componentes independientes
del tensor de Riemann para un espacio de n dimensiones:

n = nA + nB + nC

n = n(n-1)/2 + n(n-1)(n-2)/2 + n(n-1)(n-2)(n-3)/12


n = 6n(n-1)/12 + 6n(n-1)(n-2)/2 + n(n-1)(n-2)(n-3)/12

n = [6n² - 6n + 6n3 - 18n² + 12n + n4 - 6n3 +11n² - 6n]/12

n = n² (n² - 1) /12

Para un espacio de cuatro dimensiones, la fórmula general que acabamos de obtener nos dá:

n = 4² (4² - 1) /12 = 16 (16 -1) /12 = (16)(15)/12 = 20

PROBLEMA: Hacer un listado de los componentes independientes de Rαβαγ para un espacio


de cinco dimensiones.

Utilizando la clasificación de tres tipos dada en el problema anterior, tenemos los siguientes
componentes independientes del tensor de Riemann para un espacio de cinco dimensiones:

Tipo A: Rαβαβ siendo α menor que β:

R1212 , R1313 , R1414 , R2123 , R1515

R2323 , R2424 , R2525

R3434 , R3535

Tipo B: Rαβαγ siendo β menor que γ:

R1213 , R1214 , R1215 , R1314 , R1315 , R1415

R2123 , R2124 , R2125 , R2324 , R2325 , R2425

R3132 , R3134 , R3135 , R3234 , R3235 , R3435

R4142 , R4143 , R4145 , R4243 , R4245 , R4345

R5152 , R5153 , R5154 , R5253 , R5254 , R5354


Tipo C: Rαβγδ , siendo α menor que β, siendo β menor que γ, y siendo γ menor que δ:

R1234 , R1235 , R1245 , R1345 , R2345

R1324 , R1325 , R1425 , R1435 , R2435

Hay diez componentes del tipo A y diez componentes del tipo C, los cuales sumados a treinta
componentes del tipo B nos dá un total de 50 componentes, lo cual está de acuerdo con la
fórmula general:

n² (n² - 1) /12 = 5² (5² -1) /12 = (25)(24)/12 = 50

PROBLEMA: ¿Cuántos componentes independientes de Rαβαγ puede haber para un espacio de


tres dimensiones? ¿Cuáles son estos componentes?

Para un espacio de tres dimensiones, el número de componentes posibles es, de acuerdo a la


fórmula general:

n² (n² - 1) /12 = 3² (3² -1) /12 = (9)(8)/12 = 6

Estos componentes son los siguientes:

R1212 , R1313 , R2323 , R1213 , R2123 , R3132

El tensor de Riemann II
Antes de continuar queremos dejar en claro lo que entendemos por una hoja.

El concepto de hoja (en inglés se le llama manifold), conocida también como carta en muchos
textos de geometría diferencial escritos en castellano (aquí nos limitaremos a llamarle
simplemente hoja porque es la palabra que mejor transmite la idea del concepto del que estamos
hablando), es precisamente lo que su nombre indica; se trata de una superficie suave y continua
sobre la cual se pueden aplicar los conceptos del cálculo infinitesimal, se puede obtener una
derivada. A continuación tenemos un ejemplo de una hoja que podríamos llamar silla de
montar:
Al empezar a cubrir el tema del tensor de Riemann, lo hicimos formulándonos una simple
pregunta, sobre si el orden de la diferenciación al tomar una derivada covariante tras otra era
indiferente respecto al orden en que se tomasen las derivadas, o si el orden de la diferenciación
importaba, encontrándose que el orden de la diferenciación sí es relevante, con la diferencia
entre una expresión y la otra cuantificada por el tensor de Riemann.

Hay otra manera de llegar al tensor de Riemann, y esta es mediante el uso del concepto
del transporte paralelo, porque el tensor de Riemann es de hecho una descripción matemática
de la curvatura intrínseca de una hoja. Para ello, recurrimos al transporte paralelo de un
vector V alrededor de una trayectoria cerrada que nos regrese al punto de origen después de
darle una vuelta completa a un pedazo de superficie. Identificaremos a este pedacito de
superficie como un “parche de coordenadas” (coordinate patch) cortado con unas tijeras
imaginarias de la hoja (manifold) mostrada en la figura de arriba. De este modo, imaginemos en
nuestra hoja un pedacito muy pequeño de superficie cuyos cuatro lados coinciden con las líneas
de coordenadas x1 = a, x1 = a + δa, x2 = b y x2 = b + δb:
Empezando desde el punto A, llevaremos a cabo el transporte-paralelo de un vector V a lo largo
de la coordenada x2 = b = constante llevándolo desde la coordenada x1 = a hasta la coordenada
x1 = a + δa para situarlo en el punto B. Tras esto, para la segunda trayectoria, trasladamos
mediante transporte paralelo al vector V a lo largo de la coordenada x1 = a + δa = constante
desde el punto B hasta el punto C llevándolo desde la coordenada x2 = b hasta la coordenada
x2 = b + δb. Hecho esto, para la tercera trayectoria trasladamos mediante transporte paralelo al
vector V a lo largo de la coordenada x2 = b + δb = constante desde el punto C hasta el
punto D llevándolo desde la coordenada x1 = a + δa hasta la coordenada x1 = a. Y por último,
para la cuarta trayectoria, trasladamos mediante transporte paralelo al vector V a lo largo de la
coordenada x1 = a = constante desde el punto D hasta el punto A llevándolo desde la coordenada
x2 = b + δb hasta la coordenada x2 = b, regresándolo al punto de partida y completando de este
modo un circuito cerrado.

La trayectoria completa del vector V a lo largo de la retícula de coordenadas (x1, x2) es:

Ruta 1: A(a, b) → B(a + δa, b)

Ruta 2: B(a + δa, b) → C(a + δa, b + δb)

Ruta 3: C(a + δa, b + δb) → D(a, b + δb)

Ruta 4: D(a, b + δb) → A(a, b)


Tomaremos ahora una enunciación simbólica usual de la operación de transporte paralelo (en la
cual el símbolo ∇ no representa al operador vectorial diferencial usual) que representa al
transporte paralelo del vector V a lo largo de la trayectoria U:

y haremos U = e1 simbolizando con esto el transporte paralelo del vector V a lo largo del vector
tangente a la coordenada x1:

Para fines de cálculo, tensorialmente hablando, esta simbolización en realidad no es más que
la derivada absoluta o derivada intrínseca que involucra dos operaciones distintas: (1) la
obtención de la derivada covariante de V y (2) la contracción tensorial con el vector U:

Expandiendo la sumatoria múltiple en la operación de transporte paralelo que estamos


considerando, llevada a cabo a lo largo de e1, tenemos entonces:

U1Vα;1 = 0

Aquí podemos aplicar directamente la definición de la derivada covariante a V α (usaremos la


notación de la coma para denotar la diferenciación parcial con respecto a la coordenada x1:

U1(Vα,1 + Γαμ1Vμ) = 0

Puesto que la trayectoria (y consecuentemente la tangente a la trayectoria) a lo largo de la


coordenada x1 no es nula, entonces el factor entre los paréntesis debe de serlo:

Vα,1 + Γαμ1Vμ = 0

Vα,1 = - Γαμ1Vμ
o bien, explícitamente:

Con esto, si llevamos a cabo una integración de cada una de las componentes de V = (Vα) desde
el punto A hasta el punto B:

tenemos entonces lo siguiente con el resultado que hemos obtenido:

Procediendo del mismo modo, obtenemos lo siguiente para la ruta que lleva mediante
transporte paralelo al vector V desde el punto B hasta el punto C:

Para la ruta que lleva mediante transporte paralelo al vector V desde el punto C hasta el
punto D tenemos lo siguiente:

Y por último, la ruta que lleva mediante transporte paralelo al vector V desde el punto Dhasta el
punto A está dada por la siguiente relación:
Obsérvese que, intencionalmente, el vector Vα(A) que parte del punto A y el vector Vα(A) que
llega al punto A después de un recorrido completo se han simbolizado de color distinto, uno azul
y el otro rojo. Esto se debe a que después de recorrer el circuito completo el vectorV apuntará a
una dirección diferente en relación a la dirección a la cual apuntaba al iniciar el recorrido en
virtud de haberse hecho el recorrido sobre una superficie curva(como la superficie de una
esfera). La única forma posible en la cual el vector V puede ser exactamente el mismo después
del recorrido A-B-C-D mediante el transporte paralelo es que el “parche de coordenadas”
corresponda a una superficie plana.

Si llamamos al cambio neto en el vector V = (Vα) como δVα, definido de la siguiente manera:

δVα = Vα(A) - Vα(A)

entonces este cambio neto se puede obtener sumando todas las integrales obtenidas arriba:

Además de haberse sumado los términos, se ha llevado a cabo una inversión en los límites de las
integrales de la ruta 3 (de C a D) y de la ruta 4 (de D a A), lo cual tiene como efecto matemático
la inversión de signos, y se han reacomodado las integrales para que el siguiente paso sea más
obvio.

A primera vista, se antoja de inmediato una cancelación de los términos. La integral de la ruta
1 (de A a B) puesta en color azul y con signo negativo parece que puede ser cancelada por la
integral de la ruta 3 (de C a D) puesta en color rojo, de signo positivo. Lo mismo puede decirse
para el otro par de integrales. Sin embargo, para que pueda efectuarse dicha cancelación, se
requiere para el primer par que tanto Γαμ1 como Vμ sean términos constantes, y no lo son. Serían
constantes en un espacio-tiempo plano. Pero ciertamente no son constantes en un espacio-
tiempo curvo. Puesto de otra manera:

Y lo mismo puede decirse para el otro par de integrales.

Ante esta situación, podemos recurrir a una aproximación de primer orden mediante una serie
de Taylor-McLaurin, la cual para una función F de dos variables x1 y x2 es la siguiente cuando es
desarrollada en torno a un punto P(x1,x2) = P(m,n):

Lo anterior lo podemos escribir de la siguiente manera (se recuerda que los super-índices no son
exponentes, son usados para denotar los componentes contravariantes de un vector):

Descartando los términos de orden superior, de esta expansión en serie de Taylor-MacLaurin


obtenemos la siguiente expresión cuando la coordenada x 1 se mantiene constante (esto ocurre al
llevar a cabo el transporte paralelo del vector V del punto A al punto B, y del punto C al
punto D):
Y de la misma manera obtenemos la siguiente expresión cuando la coordenada x 2 se mantiene
constante (esto ocurre al llevar a cabo el transporte paralelo del vector V del punto B al punto C,
y del punto D al punto A):

De este modo, podemos obtener la siguiente aproximación a un primer orden a la variación neta
del vector V al llevarse a cabo la operación de transporte paralelo :

Podemos sacar fuera de cada una de estas integrales lo que no es afectado por el proceso de
integración de acuerdo con la variable que está siendo integrada:

Las dos integrales son triviales, y llevándolas a cabo tenemos lo siguiente:


Factorizando y reagrupando:

El siguiente paso consiste en tomar las diferenciales aplicando la regla de Leibniz para la
diferencial del producto de dos funciones:

Podemos simplificar esto eliminando las derivadas de Vα utilizando para ello el resultado
derivado al principio usando además su equivalente reemplazando el índice 1 con un índice 2:

De este modo, obtenemos lo siguiente, usando la notación de la coma para indicar


diferenciación ordinaria:

δVα = δa δb [Γαμ1,2 - Γαμ2,1 + Γασ2 Γσμ1 - Γασ1 Γσμ2] Vμ

En el 4-espacio de la Relatividad General, esta expresión representa cuatro ecuaciones en virtud


de que el vector V es un 4-vector. El índice μ que tenemos puesto en el vector V en el lado
derecho es un índice libre que nos permite representar cualquiera de las cuatro componentes del
vector trasladado. También en el lado derecho de la ecuación tenemos el producto δaδb, el cual
podemos tomar como el área del “parche de coordenadas”. Ahora bien, los índices 1 y 2 aparecen
en esta expresión porque la ruta de recorrido fue seleccionada para ser llevada a cabo sobre una
superficie descrita por las coordenadas x1 y x2. Pero igual podríamos haber seleccionado otra
ruta de recorrido, como aquella en la cual utilizamos las coordenadas x 1 y x3 y consecuentemente
aparecerán los índices 1 y 3 en la expresión, o como aquella en la cual utilizamos las
coordenadas x3 y x4 y consecuentemente aparecerán los índices 3 y 4. La expresión toda es
antisimétrica en los índices 1 y 2 porque el cambio δV α en el vector V tras efectuarse la
operación de transporte paralelo debe tener el signo opuesto si uno lleva a cabo el recorrido en
la dirección contraria (en el lenguaje del Cálculo de las Formas Diferenciales conocido también
como el Cálculo Exterior esto se refleja en la anticonmutatividad de la operación cuña uΛv =
- vΛu). Si en lugar de limitarnos al uso de las coordenadas x1 y x2 modificamos ligeramente la
expresión obtenida para hacerla válida usando líneas coordenadas generalizadas x p y xqen un
espacio N-dimensional, obtenemos lo siguiente:

δVα = δa δb [Γαμp,q - Γαμq,p + Γασq Γσμp - Γασp Γσμq] Vμ

Si la longitud en el recorrido a lo largo de una de las dos coordenadas utilizadas para el viaje del
vector V es aumentado en un factor de dos, esto también aumenta el área del “parche de
coordenadas” δaδb en un factor de dos, doblando el valor de δVα. Esto significa que
δVαdepende linealmente de (δa)ep y de (δb)eq (aquí ep y eq son los vectores unitarios de base
tangentes a las líneas de coordenadas seleccionadas para llevar a cabo el viaje), y obviamente
también depende del 4-vector Vμ. Si tomamos el término entre paréntesis y lo definimos como:

Rαβμν = Γαβν,μ - Γαβμ,ν + Γασμ Γσβν - Γασν Γσβμ

entonces tenemos los componentes de un tensor R al cual si se le suministran como argumentos


el vector V (o mejor dicho, los componentes Vμ del vector V a través del índice μ) así como
(δa)ep, y de (δb)eq a través de los índices β y ν nos proporcionará δVα, el cambio en el
componente α del vector V cuando se le aplica una operación de transporte paralelo sobre una
trayectoria en una superficie curva. Esto es precisamente lo que nos fija geométricamente el
tensor de Riemann.

PROBLEMA: Demostrar la segunda identidad de Bianchi:

Rαβμν;λ + Rαβλμ;ν + Rαβνλ;μ = 0

Podemos intentar llevar a cabo directamente la diferenciación covariante ya sea sobre el tensor
de Riemann de primer género o sobre el tensor de Riemann de segundo género, involucrando
con ello a los símbolos de Christoffel que nos resultan como consecuencia de la diferenciación
covariante. Pero tal cosa no es necesaria, porque podemos llevar a cabo una
diferenciación ordinaria si utilizamos primero un marco inercial (Lorentziano) de coordenadas.
Tomando la relación correspondiente al tensor de Riemann de primer género:

Rαβμν = (gαν,βμ - gαμ,βν + gβμ,αν - gβν,αμ)/2

y llevando a cabo la diferenciación ordinaria con respecto al parámetro λ tenemos lo siguiente:

Rαβμν,λ = (gαν,βμλ - gαμ,βνλ + gβμ,ανλ - gβν,αμλ)/2

De esta relación, usando el hecho de que el tensor métrico g es simétrico ( gab = gba) y el hecho
de que las derivadas parciales ordinarias conmutan, obtenemos la segunda identidad de
Bianchi.

PROBLEMA: Sabiendo de antemano que en una 2-superficie la curvatura Riemanniana-


Gaussiana K está definida de la siguiente manera:

siendo g el determinante del tensor métrico g, obtener la expresión correspondiente a Kpara la


siguiente métrica:

Del elemento de línea ds² obtenemos los siguientes componentes que corresponden al tensor
métrico g:

g11 = 1/(x1) ²___g22 = 1/(x1) ²

g12 = g21 = 0

así como los siguientes componentes que corresponden al tensor métrico conjugado g-1:
g11 = (x1) ²___g22 = 1/(x1) ²

g12 = g21 = 0

Con esto podemos obtener los símbolos de Christoffel que nos permitirán obtener al
componente del tensor de Riemann que estamos buscando, R1212.

Cuando los tres índices del símbolo de Christoffel son iguales como en el caso de Γ 111, tenemos
que recurrir a la relación explícita sin haber atajos posibles:

Γαμν = gαβ (- gμν,β + gνβ,μ + gμβ,ν)/2

Γαμν = gαβ (- ∂gμν/∂xβ + ∂gνβ/∂xμ + ∂gμβ/∂xν)/2

Entonces:

Γ111 = g11 (- ∂g11/∂x1 + ∂g11/∂x1 + ∂g11/∂x1)/2

Γ111 = {(x1) ²} {∂g11/∂x1}/2

Γ111 = {(x1) ²} {- 2 (x1) -3}/2

Siendo la métrica una métrica diagonal, sin componentes “cruzados”, podemos llevar a cabo la
evaluación de los otros símbolos de Christoffel mediante las relaciones simplificadas para
métricas diagonales que ya obtuvimos en una entrada previa, las cuales son:

Empezamos con la evaluación de Γ122:


A continuación llevamos a cabo la evaluación del símbolo de Christoffel Γ 221 que por la
propiedad de simetría de los símbolos de Christoffel de segundo género es igual a Γ 212:

Como no requerimos el símbolo de Christoffel Γ222 para la obtención de R1212, no se llevará a


cabo aquí la evaluación del mismo.

Para la obtención de R1212 utilizamos la relación general que nos dá los componentes del tensor
de Riemann:

Rαβμν = Γαβν,μ - Γαβμ,ν + Γασμ Γσβν - Γασν Γσβμ

la cual en este caso se nos convierte en:

R1212 = Γ122,1 - Γ121,2 + Γ1σ1 Γσ22 - Γ1σ2 Γσ21

R1212 = ∂Γ122/∂x1 - ∂Γ121/∂x2 + Γ1σ1 Γσ22 - Γ1σ2 Γσ21

La evaluación detallada se muestra a continuación:


En cuanto al determinante del tensor métrico, g, este será:

g = g11 g22 - g12 g21

Siendo g12 = g21 se tiene entonces:

g = g11 g22 - (g12)²

La evaluación de la curvatura K en base a la fórmula dada es la siguiente:

Finalmente:
Esta curvatura no depende de las coordenadas, y por lo tanto la superficie descrita por esta
métrica es una superficie de curvatura constante. Una curvatura igual a cerocorresponde a la
curvatura de una superficie plana. Una curvatura positiva constante corresponde a una
superficie como la de la esfera. Y una superficie de curvatura negativa constante corresponde a
algo como un hiperboloide.

En el espacio-tiempo de 4 dimensiones, de las 20 componentes del tensor de Riemann la esencia


de diez de ellas es capturada por el tensor de Ricci obtenido mediante una contracción del
tensor de Riemann que será discutida posteriormente, mientras que la esencia de las diez
restantes es capturada por otro tensor conocido como el tensor de Weyl:

En el manejo que se llevará a cabo del tensor de Riemann en otras entradas posteriores, tanto el
tensor de Ricci como el escalar de Ricci que se pueden considerar como trazas del tensor de
Riemann (el concepto de traza se toma prestado de la definición dada a la traza de la diagonal
principal de una matriz como la suma de los elementos de la diagonal principal) obtenidas
mediante el proceso de contracción tensorial. En ocasiones es deseable considerar por separado
aquellas partes del tensor de Riemann que son removidas por el tensor de Ricci y el escalar de
Ricci. Para ello inventamos el tensor de Weyl que es básicamente el tensor de Riemann con
todas sus contracciones posibles removidas. Usando la notación de paréntesis cuadrados en los
sub-índices que representa simbólicamente una antisimetrización:
el tensor de Weyl queda definido de la siguiente manera (la definición que se dé al tensor de
Weyl depende del número de dimensiones, en este caso suponemos una dimensión de cuatro):

En la práctica, la obtención de los componentes del tensor de Weyl resulta mucho más fácil si
simplemente obtenemos primero todos los componentes del tensor de Ricci, y removemos estos
últimos de los componentes del tensor de Riemann, en lugar de andar usando fórmulas
demasiado elaboradas.

La ecuación de desviación geodésica


El tensor de Riemann tiene una importancia fundamental a la hora de calcular la desviación de
dos líneas inicialmente paralelas cuando se desplazan a través de una superficie curva. Si bien
en un espacio dimensional plano las líneas paralelas nunca se cortan, esta regla no es aplicable
en el caso de las superficies curvas de geometría elíptica. Supóngase que dos viajeros salen del
Ecuador en dirección norte. En ambos casos, el ángulo que la trayectoria de su barco forma con
el Ecuador es inicialmente de 90º, por lo que se trata de dos líneas inicialmente paralelas. Sin
embargo, conforme los viajeros se van desplazando hacia el norte, su distancia recíproca se hace
cada vez más pequeña hasta que se hace nula en el Polo Norte, que es donde se encuentran sus
trayectorias de viaje. Para calcular la tasa de aproximación entre las dos geodésicas utilizamos la
siguiente ecuación conocida como laecuación de desviación geodésica:

en donde dξβ y dξν representan el recorrido desde el Ecuador de ambas líneas geodésicas y ξ μ la
distancia de separación entre ellas. Al hablar de una desviación geodésica, en ningún momento
estamos diciendo que cualquiera de los dos objetos inicialmente paralelos puestos en
movimiento se desviará de su ruta geodésica. La desviación de la que se está hablando es de la
trayectoria que ambos objetos tendrían si continuaran moviéndose siguiendo rutas paralelas al
estar en un espacio-tiempo plano.

En el espacio-tiempo curvo de la Relatividad General, las cosas funcionan de un modo parecido


a como funcionan en el espacio geométrico N-dimensional de Bernhard Riemann: el tensor de
Riemann determina la aceleración recíproca entre las líneas del mundo (o líneas del universo,
en el diagrama espacio-tiempo de Minkowski) de dos sistemas inerciales (p.ej. dos asteroides
que se acercan progresivamente como consecuencia de su mutua atracción gravitatoria). Para
calcular dicha aceleración, aplicamos de nuevo la ecuación de desviación geodésica con una
ligera modificación introduciendo el tiempo local (o tiempo propio):

en donde dτ es un parámetro afín (en este caso el tiempo local) y uβ y uν son los 4-vectores de la
4-velocidad de cada uno de los cuerpos que, según el esquema de Minkowski, equivalen
geométricamente a campos vectoriales tangentes a ambas líneas de universo.
Esquemáticamente esto representa la aceleración de dos líneas del mundo geodésicas:

Como podemos ver, conforme se avanza en la línea temporal (hacia arriba) el tensor de
Riemann curva las geodésicas y provoca el acercamiento recíproco de las dos partículas. Las
geodésicas en un espacio-tiempo plano (Lorentziano) mantienen su separación y permanecen
paralelas, mientras que las geodésicas en un espacio-tiempo curvo no lo hacen.

Considérense dos geodésicas con vectores tangentes V y V’ que empiezan como paralelas
cercanas la una a la otra, una en un punto A y la otra en un punto A’. Llamemos λ al parámetro
afín en las geodésicas (que puede ser un elemento de arco o el tiempo local τ). Definamos ahora
un “vector de conexión” ξ (como en el diagrama de arriba) que llega a una geodésica desde la
otra, conectando puntos de ambas a intervalos iguales (como ξ 1 y ξ2 en el diagrama de arriba).
Para mayor simplicidad, adoptaremos un sistema de coordenadas (x0, x1, x2, x3) localmente
inercial en el punto A, en el cual la coordenada x0 apunta a lo largo de la geodésica (la selección
del componente-0 que es el componente temporal a lo largo de la geodésica nos ayudará en
relacionar los resultados con el caso en el cual λ es el tiempo local). Entonces en el punto A
tenemos que la única componente del 4-vector velocidad es la componente temporal
(trabajaremos con una velocidad de la luz c igual a la unidad para no estar arrastrando
innecesariamente dicha constante a lo largo de la demostración) a la cual le daremos un valor
unitario:

V = (Vα) = (1, 0, 0, 0) = (δα0)

Notacionalmente, en conformidad con lo que se ha indicado, las siguientes tres representaciones


estarán simbolizando una misma cosa:

Nuestro punto de partida será la ecuación diferencial para la ruta geodésica (ecuación
geodésica):

Puesto que estamos considerando al punto A como parte de un marco de referencia inercial
plano (Lorentziano) esto implica que para el punto A los símbolos de Christoffel en dicho punto
deben ser nulos, y en tal caso debe ser cierto lo siguiente para el punto A:
Pero el punto de la otra geodésica, el punto A’, no está en un marco de referencia plano, por lo
cual recurriendo nuevamente a la ecuación geodésica tenemos que la ecuación de la
geodésica V’ en A’ debe ser (puesto que Vα = δα0 entonces en la sumatoria sobre los símbolos de
Christoffel requerida por la convención de sumación -en virtud de los índices repetidos- el único
símbolo de Christoffel que no será cero es Γα00 , todos los demas serán iguales a cero):

Puesto que A y A’ están separados por el vector ξ, los símbolos de Christoffel en el punto A y en
el punto A’ están relacionados de la siguiente manera:

Con la relación previa, esto nos conecta los puntos de partida A y A’ de las geodésicas del
siguiente modo:

Ahora bien, la diferencia entre el componente x α que corresponde al punto A’ y el componente


xα que corresponde al punto A debe ser igual al componente ξα del vector de separación ξ entre
ambas geodésicas:

xα (A’) - xα (A) = ξα

Con esto podemos establecer una conexión entre las geodésicas y el vector de separación
metiendo las relaciones anteriores en esto último obteniendo así:
Haremos ahora un pequeño paréntesis. En el lado izquierdo de esta última ecuación tenemos a
la segunda derivada ordinaria de ξ con respecto al parámetro afín, o sea d²ξ/dλ². Esto es
perfectamente válido dentro de un espacio-tiempo plano, Lorentziano. El problema es que no
estamos trabajando dentro de un espacio-tiempo plano, estamos trabajando dentro de un
espacio-tiempo curvo. Y al trabajar en un espacio-tiempo curvo, para que los resultados puedan
ser válidos en cualquier sistema de coordenadas tenemos que reemplazar a la derivada ordinaria
por la derivada covariante. Y en este caso, no basta con llevar a cabo una sola diferenciación
covariante, tenemos que llevar a cabo dosdiferenciaciones covariantes. Para la obtención de
la velocidad (de cambio) de ξ requerimos de la primera derivada covariante de ξ, y para obtener
la aceleración de ξ usamos la segunda derivada covariante de ξ, lo cual será válido
(tensorialmente) para cualquier sistema de coordenadas.

Si representamos a la primera derivada covariante del vector ξ = (ξα) con respecto al parámetro
λ como (obsérvese el uso del semicolon con el cual indicamos una diferenciación covariante):

ξα; λ

entonces podemos representar a la segunda derivada covariante del vector ξ = (ξα) con respecto
al parámetro λ como (obsérvese de nueva cuenta el uso del semicolon con el cual indicamos una
diferenciación covariante):

(ξα; λ) ; λ

Es importante aclarar aquí que algunos autores de reconocido prestigio representan esta
segunda derivada covariante de una manera como la siguiente:

∇v∇v ξ

Aunque cada autor es libre de inventar la notación que le plazca, esta selección del símbolo
nabla (∇) para denotar una derivada covariante es desafortunada por el hecho de que en una
gran cantidad de textos y trabajos científicos el símbolo ∇ está reservado para representar
al operador diferencial vectorial ∇ = (∂/∂x, ∂/∂y, ∂/∂z). El operador diferencial vectorial ∇ y la
diferenciación covariante representan dos conceptos completamente distintos (el primero ni
siquiera involucra símbolos de Christoffel). Y la colocación de un vector (V) como sub-índice
después del símbolo ∇ no ayuda mucho en aclarar la posible confusión en virtud de que se puede
malinterpretar como una derivada absoluta o derivada intrínseca, la cual aunque ciertamente
es una operación matemática que especifica una diferenciación covariante también va aparejada
con la contracción tensorial con el vector en cuestión que viene siendo la tangente de la curva a
lo largo de la cual se lleva a cabo la diferenciación covariante.

Para evitar confusiones, nos mantendremos fieles a la simbología que hemos estado usando en
entradas anteriores.

La definición de la derivada covariante nos dá la primera derivada del tensor contravariante (ξ α)


con respecto a λ (que en este caso es x0) de la siguiente manera de acuerdo a la definición de
derivada covariante:

En virtud del índice repetido β en el segundo término que activa a la convención de sumación, el
segundo término se expande a cuatro términos de Christoffel de segundo género en un 4-espacio
correspondiendo a las cuatro componentes de ξβ. Tenemos un índice libre, q, pero en virtud de
que ambas geodésicas son inicialmente paralelas también la geodésica que parte de A se
trasladará a lo largo de la coordenada x0 (la componente temporal), siendo las otras tres
componentes iguales a cero para las otras tres coordenadas (no lo serían si las geodésicas en los
puntos A y A’ apuntaran en direcciones diferentes que involucraran a las otras tres coordenadas
que son las coordenadas espaciales estando lo más anti-paralelas que pudieran estar). Tomando
esto en cuenta e invocando la propiedad de los símbolos de Christoffel de segundo género que
nos dice que son simétricos en el intercambio de los dos índices inferiores, lo anterior lo
podemos escribir del siguiente modo:
Llevándose a cabo el cambio de ξα únicamente con respecto a la primera coordenada (la
coordenada temporal), podemos reemplazar a la diferenciación parcial ∂ξα/∂λ por la
diferenciación ordinaria dξα/dλ, escribiendo así:

Esta es la primera derivada covariante de ξ = (ξα). Pero estamos interesados en


la segunda derivada covariante de ξ. Esto nos requiere aplicar de nueva cuenta la definición de
derivada covariante. Es así como habiendo utilizado el hecho de que los símbolos de Christoffel
son iguales a cero en el punto A llegamos a lo siguiente:

Removiendo el paréntesis tomando la diferenciación indicada con respecto a λ tenemos lo


siguiente:

Puesto que el factor dξβ/dx0 es igual a cero, el tercer término se nos hace cero quedándonos
únicamente:

Aquí podemos introducir el resultado que habíamos obtenido previamente


para d²ξα/dλ²obteniendo de este modo lo siguiente:

En este punto revertiremos a notación simbólica más compacta habiendo quedado claro aquello
de lo que estamos hablando, usando la coma sencilla para indicar las diferenciaciones
ordinarias:

(ξα; λ) ; λ = - Γα00,β ξβ + Γαβ0,0 ξβ

Factorizando ξβ:

(ξα; λ) ; λ = (Γαβ0,0 - Γα00,β) ξβ

Esto se puede simplificar aún más si recurrimos a la definición del tensor de Riemann:

Rαβμν = Γαβν,μ - Γαβμ,ν + Γα σμ Γσ βν - Γα σν Γσ βμ

Poniendo ceros en el lugar en donde están los primeros dos sub-índices (β y μ) tenemos
entonces:

Rα00ν = Γα0ν,0 - Γα00,ν + Γα σ0 Γσ 0ν - Γα σν Γσ 00

El tercer término y el cuarto término se nos anulan, quedándonos únicamente los dos primeros
términos. En el primer término podemos hacer un reacomodo en los dos primeros sub-índices
haciendo uso del hecho de que el símbolo de Christoffel de segundo género es simétrico en sus
índices inferiores y de que esta simetría se mantienen en pie al tomarse la derivada ordinaria de
dicho símbolo de Christoffel:

Rα00ν = Γαν0,0 - Γα00,ν

Si tomamos el lado derecho de esta ecuación:

Γαν0,0 - Γα00,ν

y hacemos una comparación con lo que habíamos obtenido previamente:

(ξα; λ) ; λ = (Γαβ0,0 - Γα00,β) ξβ

podemos ver que podemos reemplazar en esto último lo que está dentro de los paréntesis por el
símbolo del tensor de Riemann con los dos índices que se han puesto en ceros. Es así como
llegamos a lo siguiente:

(ξα; λ) ; λ = Rα00β ξβ
Desde el principio hemos supuesto que (Vα) = (δα0). Entonces V0 = δ00 = 1, lo cual nos permite
escribir lo siguiente:

(ξα; λ) ; λ = Rα00β (1)(1) ξβ

(ξα; λ) ; λ = Rα00β (V0)(V0) ξβ

Esto es válido en lo que respecta a una coordenada, la coordenada temporal. Pero todas las
cuatro coordenadas están al mismo nivel (en inglés se acostumbra decir on equal footing),
ninguna de ellas está privilegiada sobre la otra. Esto significa que la generalización del resultado
que acabamos de obtener se puede enunciar de modo completamente general de la manera
siguiente:

(ξα; λ) ; λ = Rαμνβ (Vμ)(Vν) ξβ

en donde Vμ es el 4-vector velocidad que corresponde a una de las geodésicas y Vν es la 4-


velocidad que corresponde a la otra geodésica. Esta es esencialmente la ecuación de desviación
geodésica.

Si tomamos el parámetro λ como el tiempo local o tiempo propio τ, entonces podemos hacer:

(ξα; λ) ; λ = d²ξ/dτ²

con lo cual:

d²ξ/dτ² = Rαμνβ (Vμ)(Vν) ξβ

Esta es la ecuación de desviación geodésica, desde la perspectiva de la Relatividad General,


enunciada al principio de esta entrada.

La ecuación de desviación geodésica puede ser derivada de modo más riguroso (y más
satisfactorio desde el punto de vista matemático formal) mediante algo que llamamos la
segunda variación covariante del Lagrangiano de una partícula puntual, o bien de la primera
variación de un Lagrangiano combinado. El resultado que obtenemos a fin de cuentas es
exactamente el mismo.
PROBLEMA: Dimensionalmente hablando, ¿qué es lo que estamos midiendo con el
tensor Rαμνβ a la luz de la ecuación de desviación geodésica?

ξ es un 4-vector cuyas cuatro componentes son medidas en unidades de longitud (metros).


Tomando al parámetro τ como el tiempo propio (tiempo local), medido en segundos, entonces
en el lado derecho de la ecuación de desviación geodésica d²ξ/dτ² tiene unidades de
metros/(segundo)², con lo cual estamos midiendo una aceleración, la aceleración con la cual se
está acortando la longitud del 4-vector ξ. Puesto que cada componente de la 4-velocidad Vμ así
como de la 4-velocidad Vν está medido en metros por segundo, entonces la ecuación de
desviación geodésica:

d²ξ/dτ² = Rαμνβ (Vμ)(Vν) ξβ

tiene la siguiente expresión dimensional en unidades del sistema MKS:

Simplificando:

Para que esta ecuación pueda ser dimensionalmente correcta, se requiere que tenga unidades de
metros-2, o sea:

Siendo los metros cuadrados algo que corresponde a una dimensión de superficie, esto nos mide
algo por unidad de área. Recordemos en una de las derivaciones del tensor de Riemann cómo el
tensor de curvatura fue obtenido a partir de un “parche de coordenadas” tomado de la hoja que
representa la 2-superficie bajo consideración. Si todos los componentes del tensor de Riemann
son iguales a cero, esto significa que estamos situados en un espacio Euclideano plano. Pero si
tan sólo uno de los componentes del tensor de Riemann es diferente de cero, entonces estamos
situados en un espacio curvo (o mejor dicho, en un espacio-tiempo curvo). Esto significa que
podemos equiparar a Rαμνβ como una medida de la curvatura por unidad de área del espacio
dimensional bajo consideración. A mayor magnitud de cualquiera de los componentes del
tensor de Riemann Rαμνβ , tanto mayor será la curvatura por unidad de área del “parche de
coordenadas” sobre el cual se está midiendo dicha curvatura

La geometría Euclideana y la Relatividad


Un tema que frecuentemente causa mucha confusión entre los principiantes en el estudio de la
Teoría de la Relatividad es el hecho de que, formalmente hablando, por un lado tenemos que la
definición matemática de lo que es un espacio Euclideano, si tomamos la definición al pie de la
letra, nos dice que el espacio-tiempo de la Teoría Especial de la Relatividad no es Euclideano;
mientras que por otro lado se nos dice que el espacio-tiempo de la Teoría Especial de la
Relatividad es un espacio-tiempo plano que suponemos Euclideano.

Empezaremos con una de tantas definiciones de un espacio Euclideano que se dan en los libros
de texto, todas ellas equivalentes:
“Una métrica Riemanniana g = (gij) especificada en un sistema de coordenadas generalizadas
(xi) será la métrica Euclideana sí y solo sí bajo una transformación permisible de las
coordenadas, g = (δij).”

En pocas palabras, la métrica es Euclideana si el elemento de línea puede reducirse a una suma
de cuadrados todos ellos con signos positivos. Dado cualquier elemento de línea, la forma de
saber si se cumple esta condición es reducir el elemento de línea a una suma de cuadrados y ver
si todos los signos que anteceden a los componentes son positivos. Hay varias maneras de lograr
esto. Una de ellas es el método de Lagrange. Dicho método será discutido con un ejemplo.

Supóngase que tenemos una expresión cuya suma de términos es la siguiente:

Q = x1² + 2x2² - 3x3² - 6x1x2 + 8x1x3 - 4x2x3

Para reducir a Q a una suma de términos cuadráticos eliminando los componentes “cruzados”
como x1x2, recogemos primero todos los términos que involucran a x 1:

Q = x1² - 6x1x2 + 8x1x3 + 2x2² - 3x3² - 4x2x3

A continuación, factorizamos a x1 de la manera mostrada:

Q = x1² + 2x1(- 3x2 + 4x3) + 2x2² - 3x3² - 4x2x3


A continuación “completamos el cuadrado” de la siguiente manera con el objeto de tener la
forma a²+2ab+b²:

Q =________________
____________________________
x1² + 2x1(- 3x2 + 4x3) + (- 3x2 + 4x3)² + 2x2²

- 3x3² - 4x2x3 - (- 3x2 + 4x3)²

De este modo, tenemos adentro:

x1² + 2x1(- 3x2 + 4x3) + (- 3x2 + 4x3)² = [x1² - 3x2 + 4x3]²

Esto nos dá tras unas simplificaciones:

Q = (x1 - 3x2 + 4x3)² - 7x2² - 19x3² + 20x2x3

La simplificación que involucra a x2 y x3 se obtiene fácilmente de la siguiente manera:

- 7x2² + 20x2x3 = -7 [x2²- (20/7) x2x3] =

-7 [x2²- (20/7) x3 + (100/49) x3² ] - (100/7) x3²

Con esto tenemos entonces:

Q = (x1 - 3x2 + 4x3)² - 7 [x2 - (10/7) x3]² + (100/7) x3² - 19x3²

Q = (x1 - 3x2 + 4x3)² - 7 [x2 - (10/7) x3]² - (33/7) x3²

Hágase:

x1 = x1 - 3x2 + 4x3

x2 = x2 - (10/7) x3

x3 = (33/7) x3²
Con estas transformaciones, la expresión original queda reducida a la siguiente suma “diagonal”
de cuadrados:

Q = (x1)² - (x2)² - (x3)²

En base a la definición dada anteriormente, una métrica con esta combinación de


cuadrados no es Euclideana, en virtud de que no todos los signos que anteceden a todos los
componentes son positivos. Los componentes x2 y x3 son antecedidos por signos negativos.

De este modo, la definición matemática formal de un espacio Euclideano nos dice que un
espacio de cualquier número de dimensiones es Euclideano siempre y cuando los coeficientes de
la métrica sean todos ellos definitivamente positivos en todo momento(positive definite), lo cual
significa que con una transformación apropiada de las coordenadas de dicho espacio el elemento
de línea siempre se puede escribir de modo tal que la métrica tenga componentes con signos
positivos. Esto equivale a la extensión del teorema de Pitágoras a varias dimensiones:

ds² = (dx1)² + (dx2)² + (dx3)² + (dx4)² + (dx5)² + ...

siendo el lado izquierdo de la ecuación el equivalente del cuadrado de la “hipotenusa” del


triángulo rectángulo planar y siendo el lado derecho el equivalente de “la suma de los cuadrados
de los catetos” del mismo triángulo rectángulo planar.

Así, un espacio cuyo elemento de línea sea el siguiente:

ds² = (dx1)² - (x3)²(dx2)² + (x1)²(dx3)²

no puede ser Euclideano porque la suma de cuadrados no es definitivamente positiva, hay un


signo negativo puesto sobre el segundo término, y aquí no es posible llevar a cabo una
transformación adecuada en cada una de los coordenadas la métrica que la pueda poner en la
forma usual del teorema de Pitágoras extendido hacia varias dimensiones.

Veamos ahora la métrica para el 4-espacio de la Teoría Especial de la Relatividad, la métrica del
espacio-tiempo Lorentizano, la cual es:

ds² = (cdt)² - (dx)² - (dy)² - (dz)²


o bien:

ds² = - (cdt)² + (dx)² + (dy)² + (dz)²

En cualquiera de las dos versiones, simple y sencillamente no existe forma alguna en la cual con
alguna transformación de las coordenadas podamos poner esta métrica de modo tal que todos
los signos de las cuatro componentes tengan signos positivos.

Entonces, según la matemática formal, la geometría de la Teoría Especial de la


Relatividad no es una geometría Euclideana.

El principal requisito de naturaleza geométrica para que una geometría pueda ser considerada
como una geometría Euclideana es que dentro de dicha geometría se deben cumplir todos los
postulados y teoremas de la geometría de Euclides, por ejemplo:

1) Las rectas inicialmente paralelas deben permanecer paralelas al ser trazadas hasta el infinito
en la misma dirección sin tocarse ni separarse jamás.

2) La suma de los ángulos internos de todo triángulo debe ser igual a 180 grados.

3) Para todo triángulo rectángulo, el cuadrado de la hipotenusa es igual a la suma de los


cuadrados de los catetos.

Y el problema que enfrentamos es que en el espacio-tiempo Lorentziano, el cual se ha dicho


hasta ahora que es un espacio-tiempo plano, contrariamente a lo que nos dice la definición
matemática formal de espacio Euclideano se cumplen todos los postulados de la geometría
Euclideana.

En lo que concierne a las líneas paralelas, si trazamos en un diagrama espacio-tiempo de


Minkowski las líneas del mundo de dos observadores en resposo el uno frente al otro, las líneas
serán perfectamente paralelas en todo momento, nunca se cruzarán ni divergirán la una de la
otra, o lo que es lo mismo, una regla en reposo mantendrá la distancia entre sus dos extremos
siempre igual en todo momento:
Y en lo que concierne a dos marcos de referencia en movimiento relativo el uno con respecto al
otro, si un observador en reposo ve pasar horizontalmente (paralelamente al eje-x) a dos
cuerpos (dos naves espaciales, por ejemplo) separadas a cierta distancia la una de la otra pero
moviéndose ambas en la misma dirección (en el sentido del eje-x sin movimiento relativo alguno
con respecto al eje-y o al eje-z), las naves se mantendrán en sincronía trazando dos rectas
paralelas imaginarias en el espacio que van recorriendo. El postulado de las paralelas parece
cumplirse aquí al pie de la letra.

Pero el postulado de las paralelas de Euclides no es el único postulado que se cumple


cabalmente en el espacio-tiempo Lorentziano. También se cumple el hecho de que la suma de
los ángulos internos siempre es igual a 180 grados, ya sea que el triángulo de referencia esté en
reposo frente a un observados o que esté en movimiento en relación a dicho observador con
efectos relativistas entrando en acción.

PROBLEMA: Demostrar que en un marco de referencia Lorentziano (propio del espacio-


tiempo plano de la Teoría Especial de la Relatividad) moviéndose a una velocidad constante
con respecto a otro observador situado en un marco de referencia en reposo, la suma de los
ángulos internos de un triángulo sigue siendo igual a 180 grados.

Si tenemos un triángulo dentro de un marco de referencia que está en movimiento con respecto
a otro observador en reposo, el observador verá una contracción de Lorentz en los lados del
triángulo en la dirección del movimiento del marco móvil que supondremos que se está
desplazando a lo largo del eje-x. La única contracción que ocurre es en las distancias y
longitudes paralelas a la dirección del movimiento, las distancias perpendiculares a la dirección
del movimiento permanecen inalteradas.

Un observador que viaje dentro del marco móvil junto con el triángulo ciertamente medirá 180
grados al sumar los ángulos internos del triángulo que está a su lado. Pero un observador
externo en reposo verá una contracción de Lorentz en el sentido del movimiento del triángulo.
Sin embargo, después de haber tomado en cuenta los efectos cuantitativos ocasionados por la
contracción de Lorentz, encontrará que para el triángulo en movimiento que la suma de los
ángulos internos sigue siendo igual a 180 grados. Para demostrarlo, podemos llamar a los
ángulos internos del triángulo en reposo a, b y c; y podemos llamar a los ángulos transformados
(por los efectos de la contracción longitudinal de Lorentz) a’, b’ y c’. Entonces todo lo que
tenemos que hacer es demostrar que si:

a + b + c = 180°

entonces:

a’ + b’ + c’ = 180°

una vez que se han aplicado las relaciones de transformación de Lorentz y que se han obtenido
las fórmulas para los ángulos transformados. Esta vía de demostración puede ser algo tardada y
laboriosa.

Sin embargo, hay otra forma mucho más fácil de demostrar que en un marco de referencia
móvil, Lorentziano, propio de un espacio-tiempo plano, la suma de los ángulos internos seguirá
siendo 180 grados, y esta consiste esencialmente en demostrar el teorema de la misma manera
en la cual se demuestra para el triángulo en reposo.

Puesto que el marco de referencia móvil no es un marco de referencia acelerado, las líneas rectas
de un triángulo independientemente del ángulo que formen con la horizontal se mantendrán
como líneas rectas una vez que se ha efectuado la contracción de Lorentz. En pocas palabras, si
teníamos un triángulo en reposo formado por tres líneas rectas, después de la contracción de
Lorentz tendremos otro triángulo cuyos tres ángulos internos ciertamente serán diferentes y
cuyos tres lados también tendrán longitudes diferentes pero seguirán siendo líneas rectas.
Seguirá siendo un triángulo formado por tres líneas rectas, y por lo tanto la suma de los ángulos
internos seguirá siendo 180 grados aún tras los efectos de la contracción de Lorentz.

Con esto en mente, la demostración de que la suma de los ángulos internos de un triángulo
“comprimido” por la contracción de Lorentz es igual a 180 grados es la siguiente:

Trácese el triángulo ABC:

A través del vértice A constrúyase una línea paralela a la base del triángulo BC. Siendo paralela
la línea HK a la línea BC, esto significa que el ángulo HAB es congruente (lo cual significa
“semejante” en una relación de igualdad geométrica) al ángulo interno ABC (medido
en b° grados) por ser ambos ángulos alternos internos. De la misma manera, el ángulo CAK es
congruente al ángulo ACB (medido en c° grados) por las mismas razones.

Puesto que el ángulo HAB, el ángulo BAC (medido en a° grados) y CAK suman los tres juntos
180 grados, esto significa que:

a° + b° + c° = 180 grados

En otras palabras, la suma de los ángulos internos del triángulo “comprimido” por la
contracción de Lorentz es igual a 180 grados.
Como puede verse en la demostración, la regla de la suma de los ángulos internos de un
triángulo es una consecuencia directa del postulado de las paralelas. La demostración se llevó a
cabo trazando precisamente una línea paralela a otra. De hecho, la regla de la suma de los
ángulos internos de un triángulo es equivalente al postulado de las paralelas de la geometría
Euclideana, de modo tal que si removiéramos el postulado de las paralelas de la geometría
Euclideana (que viene siendo el quinto postulado de Euclides) y lo reemplazáramos con la regla
de la suma de ángulos internos de un triángulo, las geometrías resultantes serían idénticas en
todo sentido, excepto que tendríamos que demostrar el postulado de las paralelas a partir de la
regla de la suma de ángulos internos de un triángulo.

El argumento llevado a cabo puede ser extendido para confirmar que un triángulo rectángulo
seguirá siendo un triángulo rectángulo después de que ha sido objeto de una transformación
de Lorentz, y por lo tanto en un marco de referencia Lorentziano móvil también se sigue
cumpliendo al pie de la letra el teorema de Pitágoras después de que se hayan aplicado las
transformaciones de Lorentz (al aplicar las transformaciones de Lorentz, una recta
perpendicular a la dirección del movimiento seguirá siendo perpendicular):

Tenemos entonces lo que parece ser una contradicción monumental de conceptos. Por un lado,
la matemática formal nos dice que el espacio-tiempo de la Teoría Especial de la Relatividad no
es Euclideano, mientras que por otro lado la geometría de los marcos de referencia Lorentzianos
parece ser tal que toda la geometría dentro de ella es Euclideana. ¿Quién tiene la razón?

En realidad, no existe contradicción alguna.

Veamos más de cerca la definición del elemento de línea en la Teoría Especial de la Relatividad:
ds² = - (cdt)² + (dx)² + (dy)² + (dz)²

Si en esta definición hacemos al intervalo temporal dt igual a cero (como cuando tomamos una
fotografía instantánea de un marco de referencia en movimiento), entonces el elemento de línea
que podemos considerar como una especie de “hipotenusa” es:

ds² = (dx)² + (dy)² + (dz)²

O sea, que “la suma de los cuadrados de los catetos” es igual al cuadrado de la “hipotenusa”.
Esto sigue al pie de la letra el enunciado básico del teorema de Pitágoras. Pero lo hemos
obtenido eliminando a la componente temporal de la métrica. La componente espacial en sí es
completamente Pitagórica, y la geometría que está en acción en ella es una geometría
Euclideana. Sin embargo, considérese el caso en el cual la magnitud de la componente temporal
es exactamente igual a la magnitud de la suma cuadrática de las componentes espaciales. Siendo
así, entonces:

ds² = 0

¡Aunque el valor de la componente temporal no sea cero y la suma de los valores de las tres
componentes espaciales tampoco lo sea, la longitud de la “hipotenusa” es cero! Esto ciertamente
no está predicho por el teorema de Pitágoras en ninguna de sus formas. No es que el teorema de
Pitágoras haya dejado de ser válido, lo que sucede es que ya no hay aquí “hipotenusa” sobre la
cual pueda ser aplicado.

Y aún en el caso en el que la componente temporal no sea igual a la suma cuadrática de las
componentes espaciales, ésta en lugar de aumentar la “longitud” de la “hipotenusa”, ¡la
disminuye! Esto tampoco tiene nada de Pitagórico.

Sin embargo, aunque para el elemento de línea ds² en su totalidad la geometría no sea
Euclideana, el espacio-tiempo de Lorentz sigue siendo un espacio-tiempo plano. ¿Y qué es
entonces lo que nos puede afirmar con tanta seguridad que el espacio-tiempo de Lorentz sea
plano? ¡La curvatura de Riemann K, la cual depende del tensor de Riemann! Si la curvatura de
Riemann K es igual a cero, entonces el espacio multi-dimensional es plano. Pero si es diferente
de cero, entonces es curvo. A Einstein no le llevó mucho tiempo darse cuenta de este hecho.

Podemos convertir un espacio Lorentziano plano en un espacio curvo con el solo hecho de
dibujar el equivalente de un marco de referencia móvil plano sobre una membrana flexible (de
hule o cualquier otro material plástico), y colocar dicha membrana (estirándola) sobre la
superficie de una pelota de modo tal que la forma de la membrana se adapte a la superficie de la
pelota. En este caso, la geometría deja de ser definitivamente Euclideana bajo cualquier
concepto que se le mire, ya que el triángulo plano se convierte en un triánguloesférico en cuyo
interior la suma de los ángulos no puede ser ya igual a 180 grados. Pero para que esto ocurriera,
tuvimos que “sacar” al plano Lorentziano de su plano (valga la redundancia) y empotrarlo sobre
una dimensión adicional que equivale a una dimensión de profundidad, a una dimensión
adicional hacia el interior de la página (o de la pantalla del monitor). Y en este caso la curvatura
de Riemann K ya no será igual a cero.

Lo que se ha detallado arriba en relación a la desconexión que hay entre lo que consideramos
Euclideano y lo que consideramos plano frecuentemente es enunciado en los textos de
Geometría Diferencial y Análisis Tensorial de una manera como la siguiente:
“A la métrica que determina un espacio multidimensional se le considera planasi existe una
transformación de las coordanadas que ponga a la métrica en la siguiente forma:

ds² = ε1(dx1)² + ε2(dx2)² + ε3(dx3)² + ... + + εn(dxn)²

siendo εn = ± 1.”

La métrica del espacio-tiempo de la Teoría Especial de la Relatividad ciertamente cae dentro de


esta definición, ya que en cualquiera de sus dos versiones aparece con esta distribución de
signos. Matemáticamente hablando, no es Euclideana, puesto que no todos los signos son
positivos, pero de acuerdo a esta última definición es plana. La repartición de los signos de
acuerdo con el orden en el cual se acostumbra escribir a la métrica es conocida como la firma
de la métrica, y es simbolizada poniendo simplemente el mismo orden de los signos en el cual
aparecen escritos los coeficientes de los componentes de la métrica. Para el elemento de línea:

ds² = (cdt)² - (dx)² - (dy)² - (dz)²

la firma de la métrica es (+ - - -), mientras que para el elemento de línea:

ds² = - (cdt)² + (dx)² + (dy)² + (dz)²

la firma de la métrica es (- + + +). Es necesario estar preparado para manejar indistintamente


métricas relativistas con ambas firmas, ya que en esto no hay una convención universalmente
aceptada.

No es necesario adentrarnos en la definición de la curvatura K de Riemann para poder afirmar


que un espacio-tiempo relativista pueda ser plano o curvo. En realidad nos bastará con el tensor
de Riemann, o mejor dicho con la contracción de dicho tensor que es conocida como el tensor de
Ricci. De cualquier modo, se dará aquí la definición dada por Riemann para especificar la
curvatura de una superficie empotrada en un espacio bi-dimensional, un espacio tri-
dimensional, o un espacio n-dimensional:

La curvatura de Riemann K en realidad es una extensión hacia un espacio de cualquier número


de dimensiones de la definición de la curvatura de Gauss. Obsérvese en esta fórmula que para
que la curvatura K sea cero, es necesario que R1212 sea cero. Dada una métrica g, si evaluamos
R1212 a partir de la misma entonces podemos determinar de manera inequívoca si la métrica
representa un espacio-tiempo plano o un espacio-tiempo curvo. Esta es la razón por la cual
estamos interesados en tener una motivación suficiente para haber procedido a un estudio
aunque fuese somero del tensor de Riemann.

Asentado lo anterior, estamos ahora en condiciones de enunciar a modo de teorema


(demostrado en casi todos los buenos libros de texto sobre el tema) de lo que matemáticamente
hablando se entiende por métrica Euclideana:
“Una métrica Riemanniana g = (gij) será la métrica Euclideana sí y solo sí la curvatura
Riemanniana K es cero en todos los puntos de la métrica y además es definitivamente positiva
(la suma de los cuadrados tiene únicamente signos positivos).”

De este modo, para que una métrica sea Euclideana, en el sentido estricto y formal de la palabra,
no basta con que sea definitivamente positiva (positive definite); la curvatura Riemanniana K de
la métrica tiene que ser igual a cero en todos los puntos de la métrica.

PROBLEMA: ¿ Es Euclideana la siguiente métrica?

ds² = [(x1)² + (x2)²](dx1)² + [(x1)² + (x2)²](dx2)² + (dx3)²

La métrica ciertamente es definitivamente positiva. Pero no resulta claro que la curvatura K de


la misma sea igual a cero, y esto es algo que tenemos que determinar. Para poder evaluar el
componente tensorial R1212 necesitamos obtener primero los símbolos de Christoffel de primer
género. Con las simplificaciones usuales para acortar la cantidad de símbolos a ser calculados,
notamos primero que el coeficiente g33 de dx3 es una constante (+1) y que tanto g11 como g22 son
independientes de x3, lo cual significa que todos los símbolos de Christoffel Γ αβγ serán iguales a
cero cuando α, β o γ sea igual a 3. Haciendo:

p = (x1)² + (x2)²

tenemos los siguientes símbolos de Christoffel de segundo género que son diferentes de cero:

Γ111 = x1/p

Γ112 = Γ121 = x2/p

Γ122 = - x1/p

Γ211 = - x2/p

Γ212 = Γ221 = x1/p

Γ222 = x2/p

Con estos símbolos de Christoffel podemos proceder a la evaluación directa de R 1212 :

R1212 =

∂Γ122/∂x1 - ∂Γ121/∂x2

+ Γ122 Γ111 + Γ222 Γ121 - Γ121 Γ112 - Γ221 Γ122

Substituyendo valores y simplificando, encontramos que R 1212 = 0. No es necesario bajar el


índice de R1212 con la ayuda del tensor métrico conjugado, puesto que si R1212 es igual a cero
entonces R1212 también lo será. Y siendo R1212 igual a cero la curvatura de Riemann K también
será igual a cero. Al cumplirse al pie de la letra los dos requerimientos formales para que la
métrica sea Euclideana (definitivamente positiva, con curvatura K = 0 en todos los puntos de la
métrica), concluímos que la métrica dada es, en efecto, Euclideana.

PROBLEMA: ¿ Es Euclideana la siguiente métrica? El 4-espacio de la métrica, ¿es plano o


curvo?
ds² = (dx1)² + 4(x2)²(dx2)² + 4(x3)²(dx3)² - 4(x4)²(dx4)²

La métrica no es Euclideana porque no es definitivamente positiva a causa del signo negativo


que tenemos en el componente que corresponde a dx4. No hay transformación alguna que
podamos llevar a cabo para convertir a esta métrica en una métrica Euclideana removiéndole el
signo negativo. En lo que respecta a si el 4-espacio es plano o curvo, para ello tenemos que
evaluar el componente R1212 del tensor de Riemann. A partir de los componentes del tensor
métrico g que nos resultan del elemento de línea:

g11 = 1___g22 = 4(x2)²___g33 = 4(x3)²___g44 = - 4(x4)²

los únicos símbolos de Christoffel de segundo género para esta métrica que no son cero resultan
ser los siguientes:

Γ222 = 1/x2____Γ333 = 1/x3____Γ444 = 1/x4

Lo primero que notamos es que todos los símbolos de Christoffel de segundo género Γ αβγpara
esta métrica son cero a menos de que α = β = γ. Esto nulifica a los términos en R 1212que
involucran a derivadas parciales, dejándonos con R1212 = 0 y consecuentemente con una
curvatura Riemanniana K = 0. El 4-espacio dado es, por lo tanto, plano. Sin embargo, no es
Euclideano, al igual que como ocurrió con el caso de la métrica Lorentziana de la Teoría
Especial de la Relatividad.

En general, un espacio plano no es necesariamente Euclideano, pero un espacio Euclideano


necesariamente debe ser un espacio plano.

Los tensores de Ricci y Einstein I


Si vamos a construír una nueva teoría en la cual sepultaremos definitivamente a la ley de la
gravitación universal de Newton -basada en la noción de una fuerza invisible de atracción entre
los cuerpos- reemplazándola por algo en lo que conceptualmente habrá una curvatura en el
espacio-tiempo cuatri-dimensional causada por la presencia de masa-energía en cierta región:

curvatura geométrica = densidad de masa-energía

y si este concepto será enunciado de modo tal que será independiente del sistema de
coordenadas empleado para describirlo, entonces habiendo estado expuestos al tensor de
curvatura de Riemann nuestra primera ocurrencia tal vez será emplearlo directamente en una
igualdad tensorial como la siguiente:
R = kT

en donde k es una simple constante de proporcionalidad (como 8π). El problema con este
primer intento es que siendo el tensor de Riemann un tensor de orden cuatro la igualdad
tensorial requeriría que el tensor energía-tensión T fuera también de orden cuatro. Pero ya
vimos que para nuestros propósitos un tensor energía-tensión T de orden dos parece ser
suficiente. Entonces, más que “estirar” a T convirtiéndolo en un tensor de orden cuatro,
optaremos por convertir al tensor de curvatura de Riemann en otro tensor de curvatura de
orden dos derivado de R, siempre y cuando no estemos sacrificando algo importante. Y lo
primero que se nos viene a la mente es llevar a cabo una contracción tensorial del tensor de
Riemann igualando dos de sus índices, lo cual lo convierte en un tensor de orden dos. Esto es
precisamente lo que se logra con el tensor de Ricci. El tensor de Ricci es un tensor que se
obtiene directamente del tensor de Riemann por una contracción de dos de sus índices. La
elección del índice covariante a contraer no es fija (se aprovecha aquí la ocasión para recordar
que el proceso de contracción activa automáticamente la convención de sumación para índices
repetidos). La contracción se lleva a cabo entre el índice superior y el segundo índice inferior del
tensor de Riemann.

Al llevar a cabo una contracción del tensor de Riemann, perdemos dos de los cuatro índices que
especifican a los componentes de dicho tensor de curvatura. ¿Por qué razón es suficiente un
tensor de dos índices para describir el efecto -sobre el movimiento de los cuerpos- de la
curvatura causada en el 4-espacio de la Relatividad General por la presencia de masa-energía?
Porque para describir una 2-superficie en un espacio N-dimensional basta con especificar dos
coordenadas curvilíneas, y las trayectorias geodésicas de los cuerpos en movimiento se llevan a
cabo precisamente sobre una 2-superficie (como ocurre con un satélite artificial que le está
dando vueltas a la Tierra siguiendo la geodésica de un arco sobre una superficie esférica o
elíptica imaginaria).

Partiendo de la definición del tensor de Riemann, el cual es un tensor de orden cuatro,


contravariante de orden uno y covariante de orden 3:

Rαβμν = Γαβν,μ - Γαβμ,ν + Γασμ · Γσβν - Γασν · Γσβμ

si llevamos a cabo una contracción del primer índice y el tercer índice (el índice superior y el
segundo índice inferior), obtenemos el siguiente tensor covariante de orden dos:

Rμβμν = R1β1ν + R2β2ν + R3β3ν + R4β4ν = Rβν


que está definido precisamente como el tensor de Ricci.

En principio, otras contracciones del tensor de Riemannn son posibles. Podemos llevar a cabo
una contracción entre el primer índice y segundo índice (el índice superior y el primer índice
inferior) y el primer índice y el cuatro índice (el índice superior y el tercer índice inferior), pero
en virtud de que el tensor Rαβμν es antisimétrico en los índices α y β y en los índices μ y ν, todas
estas contracciones terminan desvaneciéndose idénticamente o reduciéndose a Rβν ó -Rβν . En
pocas palabras: El tensor de Ricci es la única contracción posible del tensor de Riemann.

PROBLEMA: A partir de la definición del tensor de Riemann, demuéstrese que el tensor de


Ricci es la única contracción posible del mismo.

Empezaremos con el tensor de Riemann:

Rαβμν = ½ (gαν,βμ - gαμ,βν + gβμ,αν - gβν,αμ)

al cual le subiremos el primer índice con la ayuda del tensor métrico g con la finalidad de poder
llevar a cabo una contracción con cada uno de los tres índices covariantes:

Rαβμν = gαxRxβμν

Rαβμν = gα1R1βμν + gα2R2βμν + gα3R3βμν + ...

Llevaremos a cabo primero la contracción entre el índice superior α y el índice inferior β


igualando ambos índices sobre la expresión anterior:

Rααμν = Rμν = gα1R1αμν + gα2R2αμν + gα3R3αμν + ...

El siguiente paso consiste en llevar a cabo la sumación sobre el índice contraído α. La expansión
se llevará a cabo agrupando los sumandos de una manera cuya razón pronto será obvia:

Rμν =______________________
g11R11μν + g12R21μν + g13R31μν + ...
+ g21R12μν + g22R22μν + g23R32μν + ...
+ g31R13μν + g32R23μν + g33R33μν + ...
A continuación apelamos a la propiedad de hemi-simetría del tensor de Riemann demostrada
previamente en una entrada correspondiente al tensor de Riemann, bajo la cual si
intercambiamos los primeros dos índices el signo del componente se invierte:

Rαβμν = - Rβαμν

con lo cual obtenemos lo siguiente:

Rμν =______________________
g11R11μν + g12R21μν + g13R31μν + ...
- g21R21μν + g22R22μν + g23R32μν + ...
- g31R31μν - g32R32μν + g33R33μν + ...

Puesto que el tensor métrico g, por su propia definición, es un tensor métrico, gij = gji, entonces
podemos introducir este hecho en lo anterior con lo que tras ello podemos proceder a la
borradura de los términos positivos que son cancelados por los términos negativos:

Rμν =______________________
g11R11μν + g12R21μν + g13R31μν + ...
- g12R21μν + g22R22μν + g23R32μν + ...
- g13R31μν - g23R32μν + g33R33μν + ...

Esto nos deja únicamente con los siguientes términos “diagonales” en nuestro acomodo de
términos :

Rμν = g11R11μν + g22R22μν + g33R33μν + ...

Sin embargo, cada uno de estos términos se va cancelando en virtud de la identidad que nos dice
que en un tensor de Riemann cuando los primeros dos índices son iguales el valor se vuelve
cero, o sea:

Rααμν = 0

Descartamos pues la primera posibilidad, la contracción entre el índice superior α y el índice


inferior β, en virtud de que no nos dá ningún resultado útil más que el valor de cero.
Llevaremos a cabo ahora la contracción entre el índice superior α y el índice inferior μ igualando
ambos índices sobre la expresión dada atrás anteriormente:

Rαβαν = Rβν = gα1R1βαν + gα2R2βαν + gα3R3βαν + ...

Procediendo como lo hicimos anteriormente, llevamos a cabo la expansión sobre la segunda


contracción:

Rβν =______________________
g11R1β1ν + g12R2β1ν + g13R3β1ν + ...
+ g21R1β2ν + g22R2β2ν + g23R3β2ν + ...
+ g31R1β3ν + g32R2β3μν + g33R3β3ν + ...

Reagrupando y usando la propiedad de simetría del tensor métrico gij = gji, podemos llevar a
cabo la siguiente simplificación:

Rβν =______________________
g11R1β1ν + g22R2β2ν + g33R3β3ν + ...
+ g21(R2β1ν + R1β2ν) + g13(R3β1ν + R1β3ν)
+ g23(R3β2ν + R2β3μν) + ...

Este definitivamente no es un tensor cero, a menos de que todas las componentes del tensor de
Riemann o todas las componentes del tensor métrico sean iguales a cero. Este es el tensor de
Ricci.

Por último, llevaremos a cabo la tercera contracción posible que podemos llevar a cabo en el
tensor de Riemann, la que se puede efectuar entre el índice superior α y el índice inferior ν
igualando ambos índices sobre la expresión dada anteriormente:

Rαβμα = Rβμ = gα1R1βμα + gα2R2βμα + gα3R3βμα + ...

Procediendo como lo hicimos anteriormente, efectuamos la expansión de la contracción sobre el


tercer índice:

Rβμ =______________________
g11R1βμ1 + g12R2βμ1 + g13R3βμ1 + ...
+ g21R1βμ2 + g22R2βμ2 + g23R3βμ2 + ...
+ g31R1βμ3 + g32R2βμ3 + g33R3βμ3 + ...
Usando la propiedad del tensor de Riemann según la cual si intercambiamos los últimos dos
índices el signo del componente se invierte:

Rαβμν = - Rαβνμ

y renombrando del lado derecho de la igualdad el índice μ como ν, obtenemos lo siguiente:

Rβμ =______________________
- g11R1β1ν - g12R2β1ν - g13R3β1ν - ...
- g21R1β2ν - g22R2β2ν - g23R3β2ν - ...
- g31R1β3ν - g32R2β3ν - g33R3β3ν - ...

Pero esto último es esencialmente lo mismo que ya obtuvimos con anterioridad en un paso
intermedio que nos conducía al tensor de Ricci, pero con el signo opuesto, o sea:

Rβμ = - Rβν

Esto no nos dá información nueva que no hubiéramos obtenido ya anteriormente. Así pues, de
todas las contracciones que podemos llevar a cabo sobre el tensor de Riemann, escrito como
Rαβμν, sólo obtenemos una contracción no trivial, precisamente el tensor de Ricci.

El tensor de Ricci era el tensor favorito de Einstein, esto en virtud de que la definición del
tensor G de Einstein para formalizar matemáticamente la curvatura en el espacio-tiempo que se
nos manifiesta como la gravedad depende directamente del tensor de Ricci. Él fue el primero en
darse cuenta de la importancia de ese tensor para la construcción de una teoría de la gravedad.
Encontrar soluciones a la ecuación fundamental de la Relatividad General equivale a buscar el
tensor de Ricci que está asociado con la solución.

En la siguiente fotografía tenemos a Einstein en una visita famosa que hizo a Mount Wilson para
agradecerle personalmente a Edwin Hubble su descubrimiento astronómico que permitió
abandonar el modelo del Universo estático por un Universo inflacionario en expansión:
En esta fotografía Einstein escribió en el pizarrón lo siguiente:

Rik = 0 ?

El signo de interrogación que puso Einstein a la derecha de la expresión indica las dudas
personales que ya albergaba sobre el modelo del Universo estático al cual se había aferrado y por
el cual introdujo en su ecuación tensorial la constante cosmológica que tiempo después llamaría
el error (intelectual) más grande de su vida.

Al presentar al mundo sus ecuaciones de campo, Einstein hizo la suposición central de que en el
espacio vacío el tensor de Ricci tiene un valor de cero:

Rμν = 0

Esta expresión constituye esencialmente la ley de gravitación universal de Einstein. La frase


“espacio vacío” significa aquí que no hay ningún tipo de materia presente (como un gas de polvo
interestelar o partículas atómicas libres) ni hay campos físicos de ninguna índole excepto el
campo gravitacional, el cual en sí no perturba este vacío a diferencia de otros campos (como el
campo electromagnético) que sí lo hacen. Las condiciones de un espacio vacío se cumplen
razonablemente bien para el espacio entre los planetas del sistema solar. El espacio-
tiempo plano obviamente satisface la ecuación arriba mostrada; las geodésicas en tal caso son
líneas rectas de modo tal que las partículas se mueven a lo largo de líneas rectas. En aquellas
regiones en donde el espacio-tiempo no es plano, la ecuación de Einstein impone restricciones al
tipo de curvatura posible. A primera vista, la ley de gravitación de Einstein no se parece en nada
al esquema de Newton. Para poder ver una similitud, debemos ver a los componentes gμν del
tensor métrico como potenciales que describen al campo gravitacional. Hay diez de ellos, en
lugar de un solo potencial que distingue a la teoría Newtoniana, y estos diez potenciales no sólo
describen al campo gravitacional sino al sistema de coordenadas empleado.

Una vez que tenemos el tensor covariante de Ricci Rμν, aplicándole a dicho tensor con la ayuda
de un tensor métrico g contravariante una contracción sobre sus dos índices obtenemos un
escalar R (un tensor de orden cero) conocido como el escalar de Ricci:

R = gμν·Rμν

el cual viene siendo a fin de cuentas el resultado de una doble contracción llevada a cabo sobre
el tensor de Riemann:

R = gμν·Rμν = gμν· gαβ·Rαμβν

Con el tensor de Ricci en nuestras manos, nuestro primer intento en construír una nueva teoría
física con los tensores R = (Rαβ) y T = (Tαβ) parecería estar solucionado. Con los dos tensores de
orden dos la curvatura geométrica del espacio-tiempo puede ser igualada con la presencia de la
masa-energía que produce dicha curvatura. Esto fue precisamente lo que hizo Einstein. Pero las
primeras aplicaciones no sólo produjeron resultados poco satisfactorios, sino inclusive
contradictorios. La teoría correcta para describir la nueva realidad física requería una
modificación del tensor de Ricci. El nuevo tensor construído modificando el tensor de Ricci
resultó ser precisamente el tensor de Einstein definido de la siguiente manera:

Resulta claro que el tensor de Einstein G es esencialmente un tensor mixto de orden dos, y la
diferencia entre el tensor de Ricci R y el tensor de Einstein G se observa con mayor claridad
viendo la representación matricial de los componentes del tensor de Einstein:
La única diferencia entre el tensor de Einstein y el tensor de Ricci estriba en la diagonal
principal, a la cual se le resta a cada uno de sus componentes la mitad del escalar de Ricci. Esta
parece una diferencia mínima. Y sin embargo, es justo lo que se requiere para que la ecuación
tensorial de la Relatividad General pueda ser utilizada para analizar y predecir fenómenos
físicos reales.

Puesto que el tensor de Ricci es un tensor simétrico, y puesto que el tensor de Einstein lo único
que hace es modificar las entradas en la diagonal principal, el tensor de Einstein también es un
tensor simétrico.

El tensor de Einstein G posee una propiedad importante: es un tensor libre de divergencia.

PROBLEMA: Demostrar que la divergencia del tensor de Einstein es cero en todos los puntos.

La solución de este problema requiere demostrar que:

Gri;r = 0

El procedimiento usual consiste en llevar a cabo una doble contracción sobre la segunda
identidad de Bianchi por medio del tensor métrico. La segunda identidad de Bianchi es:

Rαβμν;λ + Rαβλμ;ν + Rαβνλ;μ = 0

gαμ·[Rαβμν;λ + Rαβλμ;ν + Rαβνλ;μ] = 0

Rμβμν;λ - Rμβμλ;ν + Rμβνλ;μ = 0

Los dos primeros términos se convierten en las derivadas covariantes de tensores de orden dos:

Rβν;λ - Rβλ;ν + Rμβνλ;μ = 0

Hasta aquí hemos utilizado la propiedad esencial del tensor métrico según la cual:

gαβ;λ = 0
y siendo el tensor métrico conjugado una función del tensor métrico entonces:

gαβ;λ = 0

En otras palabras, hemos utilizado la propiedad de que en la diferenciación covariante el tensor


métrico y el tensor métrico conjugado pueden ser metidos y sacados fuera de la operación
comportándose como si fuesen las constantes de la diferenciación ordinaria. Por otro lado, para
meter convertir el signo positivo a signo negativo en el segundo término se ha utilizado la
propiedad de hemisimetría (antisimetría) del tensor de Riemann:

gαμ·Rαβλμ;ν = - gαμ·Rαβμλ;ν

gαμ·Rαβλμ;ν = - Rβλ;ν

Llevamos a cabo ahora una segunda contracción:

gβν·[Rβν;λ - Rβλ;ν + Rμβνλ;μ] = 0

Esto se simplifica a:

R;λ - Rμλ;μ + (- Rμλ;μ ) = 0

R;λ - 2 Rμλ;μ = 0

Entonces, haciendo uso del hecho de que:

(δμλ R);μ = δμλ (R);μ = δμλ R;μ = R;λ

lo último lo podemos reescribir de la siguiente manera:

(2 Rμλ - δμλR);μ = 0

Pero lo que tenemos dentro del paréntesis, si lo dividimos entre 2, es precisamente el tensor de
Einstein. Entonces, juntando los dos índices arriba con la ayuda del tensor métrico, obtenemos
el resultado deseado:

Gαβ;β = 0
Este es un resultado fundamental, porque si la derivada covariante del tensor de Einstein, o sea
su divergencia, es cero, entonces del otro lado de la ecuación primaria de la Relatividad General
la divergencia del tensor energía-tensión T también debe ser cero. En pocas palabras, el que la
divergencia del tensor de Einstein sea cero implica la conservación de la energía-momentum.

Como lo acabamos de hacer arriba, con la ayuda del tensor métrico podemos convertir
liberalmente al tensor de Einstein en un tensor contravariante de segundo orden:

Gαβ = Rαβ - ½gαβR = Gβα

el cual como se ha señalado aquí es un tensor simétrico. Y del mismo modo, podemos convertir
al tensor de Einstein en un tensor covariante de segundo orden:

Gαβ = Rαβ - ½gαβ R = Gβα

En general, en notación tensorial compacta:

G=R-½gR

Posiblemente algunos lectores se encuentren confundidos con el hecho de que en las


definiciones tensoriales que usan notación de componentes los índices puedan aparecer
indistintamente como super-índices (superscriptos) o como sub-índices (subscriptos). Se hace
una pausa aquí al lector para recordarle en una ecuación tensorial de orden n existe una libertad
absoluta en la forma en la cual los componentes del tensor son especificados. Por ejemplo, la
ecuación tensorial fundamental de la Relatividad General:

G = 8πT

podemos expresarla en forma de componentes ya sea como:

Gαβ = 8πTαβ

con ambos índices arriba, o como:

Gαβ = 8πTαβ

con ambos índices abajo.


Los tensores de Ricci y Einstein II
Como hemos visto, para poder desarrollar la Teoría General de la Relatividad Einstein se apoyó
no sólo en los descubrimientos y las enseñanzas del “padre” de la teoría de la electrodinámica
clásica, James Clerk Maxwell, en todo lo que tiene que ver con la unificación de las leyes básicas
del electromagnetismo emulándolo con la unificación correspondiente del espacio y del tiempo
independientes en un solo concepto único e indivisible, también se apoyó en la interpretación
geométrica del espacio-tiempo dada por Hermann Minkowski, y se apoyó en las ideas de
Bernhard Riemann que le dió al mundo las herramientas para poder analizar matemáticamente
espacios geométricos de más de tres dimensiones el cual a su vez extendió los conceptos del
matemático Karl Friedrich Gauss para el análisis de espacios curvos, resumido esto en una
materia conocida como la geometría diferencial, la cual a diferencia de la geometría clásica
de Euclides basa sus conclusiones y derivaciones en la aplicación de las herramientas del cálculo
infinitesimal (el cual no existía en los tiempos de Euclides) a planos y espacios curvos tomando
como base no sus propiedades globales (como la definición Cartesiana de la parábola que nos la
define como el lugar de los puntos tales que equidistan de un punto fijo llamado foco y una recta
fija llamada directriz) sino sus propiedades locales (tales como la curvatura Gaussiana de una
superficie, cuya definición no depende de un sistema de coordenadas utilizado para definir a
dicha superficie con una fórmula, un descubrimiento que impactó inclusive al mismo Gauss. De
cualquier manera, es precisamente en la geometría diferencial en donde se origina el uso de los
tensores como una herramienta útil en la transformación de coordenadas. Una de las
innovaciones más importantes de Bernhard Riemann fue la de considerar a la fuerza como una
variación de la métrica a través del tiempo, tesis que fue desarrollada en el año 1854 en su
escrito de habilitación como maestro bajo el título “Las hipótesis que sirven de base a la
geometría”. De este modo, en el caso de que los coeficientes de la métrica aumenten
proporcionalmente con el paso del tiempo (estamos hablando aquí de una expansión del espacio
intermedio entre dos cuerpos) nos encontramos ante lo que a nuestros sentidos parece ser una
fuerza repulsiva entre los dos cuerpos, y por el contrario si los coeficientes disminuyen con el
paso del tiempo (estamos hablando aquí de una reducción del espacio intermedio entre los dos
cuerpos) nos encontramos ante lo que a nuestros sentidos parece ser una fuerza repulsiva entre
los dos cuerpos,una fuerza que provoca que la distancia entre dos cuerpos aumente con el paso
del tiempo.

PROBLEMA: Para una métrica con el siguiente elemento de línea en un espacio 3-


dimensional:

ds² = (dx1)² + (2x1)(dx2)² + (2x2)(dx3)²


obténganse los componentes del tensor de Ricci así como el escalar de Ricci.

Para el elemento de línea proporcionado obtenemos los siguientes componentes del tensor
métrico g:

g11 = 1___g22 = 2x1___g33 = 2x2

gij = 0__para i ≠ j

Puesto que la matriz que representa a los componentes del tensor métrico g es una matriz
diagonal, esto nos permite obtener de inmediato los componentes contravariantes que
corresponden al tensor métrico conjugado g-1:

g11 = 1___g22 = 1/2x1___g33 = 1/2x2

Usando los métodos abreviados que ya vimos previamente en otras entradas para la obtención
de los símbolos de Christoffel de segundo género, obtenemos para la métrica dada lo siguiente:

Γ122 = - (∂g22/∂x1)/(2g11) = - (2)/(2g11) = - 1/g11 = - 1

Γ233 = - (∂g33/∂x2)/(2g22) = - (2)/(2g22) = - 2/4x1 = - 1/2x1


Puesto que el espacio es un espacio de tres dimensiones, con n = 3 sólo hay seis componentes
para el tensor de Riemann en este espacio métrico que son potencialmente diferentes de cero y
que requieren ser evaluados: R1212, R1313, R2323, R1213 , R2123 y R3132, . Con esto en mente,
procedemos a obtener primero los componentes del tensor de Riemann del segundo género:

R1212 = ∂Γ122/∂x1 - ∂Γ121/∂x2 + Γr22Γ1r1 - Γr21Γ1r2

Aquí el tercer término se expande a una sumatoria cuyos componentes son cero. Sólo el cuarto
término se expande a un término que no es cero:

R1212 = 0 - 0 + 0 - Γ221Γ122

R1212 = - (1/2x1) (-1)

R1212 = 1/2x1

Del mismo modo:

R1313 = 0

R2323 = 1/4x1x2

R1213 = 0

R3132 = 1/4x1x2

Esto nos resulta en los siguientes componentes del tensor de Riemann de primer género:
R1212 = g11R1212 = (1) (1/2x1) = 1/2x1

R2323 = g22R2323 = (2x1) (1/4x1x2) = 1/2x2

R3132 = g33R3132 = (2x2) (1/4x1x2) = 1/2x1

teniéndose un total de seis componentes en virtud de las relaciones de hemisimetría


(antisimetría) aplicables a los componentes del tensor de Riemann del primer género:

R1221 = - R1212

R2332 = - R2323

R3123 = - R3132

Tenemos lo que necesitamos para proceder a evaluar los componentes del tensor de Ricci que no
es más que la contracción del tensor de Riemann Ra bca:

Puesto que la métrica es una métrica diagonal, o sea gij = 0 para i ≠ j, podemos poner el lado
derecho de la ecuación tensorial en función de los componentes del tensor de Riemann del
primer género de la siguiente manera:

Rij = g11 R1ij1 + g22 R2ij2 + g33 R1331

De este modo, obtenemos los componentes requeridos del tensor de Ricci:

R11 = g22 R2112 = - 1/[4(x1)²]

R22 = g11 R1221 + g33 R3223 = - 1/2x1 - 1/[4(x1)²]

R33 = g22 R2332 = - 1/[4(x1x2)]

R12 = g33 R3123 = - 1/[4(x1x2)]


R21 = g33 R3213 = - 1/[4(x1x2)]

R13 = 0

R31 = 0

Para la obtención del escalar de Ricci únicamente necesitamos evaluar los componentes R 11,
R22 y R33 del tensor de Ricci mixto, para lo cual usamos nuevamente el tensor métrico con el fin
de llevar a cabo la elevación del índice que nos interese elevar:

R11 = g11 R11 = (1){- 1/[4(x1)²]}

R11 = - 1/[4(x1)²]

R22 = g22 R22 = (1/2x1){- 1/2x1 - 1/[4(x1)²]}

R22 = - (1/2x1)² -1/[8x1(x2)²]

R33 = g33 R33 = (1/2x2){- 1/[- 1/4x1x2]}

R33 = -1/[8x1(x2)²]

Entonces el escalar de Ricci será:

R = R11 + R22 + R33

R = - [x1 + 2(x2)²]/[2x1x2]²

El escalar de Ricci para la métrica de este problema no es un solo número único para todo el 3-
espacio, su valor depende de los valores que tomen x1 y x2, y sorprendentemente estalla
volviéndose indefinido (infinito) para x1 = 0 ó x2 = 0, algo que posiblemente no habríamos
sospechado al ver la métrica del problema por vez primera.

Como muchas otras construcciones matemáticas en espacios N-dimensionales, la métrica de


este problema no necesariamente representa algo que pueda tener un significado físico en el
mundo real, pero nos ilustra una posibilidad que debemos tener presente en todo momento al
estar evaluando los tensores de Ricci y de Einstein, debemos estar preparados mentalmente
para sorpresas inesperadas. Del mismo modo en que los dos postulados básicos de la Teoría
Especial de la Relatividad conducen directamente a los fenómenos de la dilatación del tiempo, la
contracción de longitud y la pérdida de la simultaneidad absoluta, el manejo matemático formal
de la Relatividad General nos puede conducir y de hecho nos conduce a sorpresas tales como los
agujeros negros en los cuales las cuatro dimensiones del espacio-tiempo se pueden compactar
en un solo punto, una singularidad matemática, en el que se pierde toda noción de la realidad
del mundo en que vivimos.

PROBLEMA: Del mismo modo en el que llevamos a cabo una contracción sobre el tensor de
Ricci obteniendo el escalara de Ricci, si llevamos a cabo una contracción tensorial sobre el
tensor de Einstein obtenemos un escalar conocido como el invariante de Einstein:

G = Gii

¿Cuál es la invariante de Einstein para la métrica del espacio-tiempo Lorentziano?

Por definición, para un tensor de Einstein en su representación como :

G = R - ½gR

Para el espacio-tiempo Lorentziano, la evaluación de las componentes del tensor de Riemann


muestra que son todas iguales todas a cero por tratarse de un espacio-tiempo plano, sin
curvatura, con lo cual consecuentemente todas las componentes del tensor de Ricci serán
también iguales a cero y el escalar de Ricci R será también igual a cero. Con R = 0 y R = 0, la
invariante de Einstein será;

G = G11 + G22 + G33 + G44

G = 0 + 0+ 0 + 0

G=0

El invariante de Einstein es también conocido como la traza del tensor de Einstein, en


analogía directa con la definición de la traza de una matriz que se obtiene sumando los
elementos de la diagonal principal de la matriz y la cual se representa como Tr[M]. Una
propiedad interesante de la traza de un tensor mixto M de segundo orden cuya representación
matricial en función de sus coordenadas generalizadas x está escrita como Tr[M(x)] es que
satisface la siguiente relación:

y que para un cambio muy pequeño δM (en uno o varios de sus componentes) la traza puede ser
calculada de la siguiente manera:

PROBLEMA: Demostrar que para un espacio-tiempo de cualquier tipo, ya sea plano o curvo,
se cumple la siguiente relación para la traza del tensor de Einstein:

Para la solución de este problema podemos tomar la definición del tensor de


Einstein Gescribiéndolo en notación de componentes covariantes, y llevar a cabo
una doblecontracción con la ayuda del tensor métrico g, usando en este problema una relación
que ya habíamos obtenido en una entrada previa:

gαβ gαβ= n

De este modo, los pasos de resolución son los siguientes:


Para el caso especial del 4-espacio de la Teoría de la Relatividad, esto nos dice que la traza del
tensor de Einstein es igual al negativo de la traza del tensor de Ricci:

G = [(2 - n)/2] R = [(2 - 4)/2] R = -R

Esta es la razón por la cual al tensor de Einstein también se le conoce como el “tensor de Ricci de
traza revertida” (trace-reversed Ricci tensor).

En el vacío, en la ausencia total de cualquier presencia de masa-energía, todos los componentes


del tensor energía-tensión T son iguales a cero, en cuyo caso las ecuaciones de campo de
Einstein, en notación de componentes:

se reducen a:

Efectuando la contracción de ambos miembros de esta igualdad con la ayuda del tensor métrico
conjugado g-1 = (gμν) y utilizando el hecho de que gμνgμν = 4, obtenemos:

con lo cual:
R=0

Sustituyendo esto último en las ecuaciones de campo de Einstein llegamos a lo siguiente:

Estas son las ecuaciones de campo para el vacío, y son el enunciado matemático de que en
donde no haya presencia alguna de masa-energía no habrá curvatura alguna en el espacio-
tiempo, aplicándose entonces las transformaciones de Lorentz que corresponden a la Teoría
Especial de la Relatividad para un espacio-tiempo plano. Matemáticamente, la Teoría Especial
de la Relatividad para a convertirse en un caso especial de la Teoría General de la Relatividad
para la situación en la cual no hay presencia de masa-energía o la presencia de la misma es tan
poca que la curvatura producida en el espacio-tiempo es insignificante. Esta conclusión es
considerada de una naturaleza tan fundamental que en 1979 se emitió en Suiza (país que
siempre ha reclamado para sí la verdadera nacionalidad de Einstein y del cual el mismo Einstein
siempre se consideró ciudadano hasta el final de sus días) la siguiente medalla conmemorativa
en la que aparece grabada la ecuación tensorial que acabamos de obtener, usando el mismo
estilo de escritura manuscrita de Einstein:

La otra ecuación puesta debajo de la ecuación Rμν = 0 es el enunciado matemático variacional


que afirma que la ruta que toma un cuerpo en movimiento es aquella para la cual la variación de
la integral de la trayectoria adquiere un valor extremo, lo cual a estas alturas podemos reconocer
como la ruta geodésica. De este modo, la Luna recorre una ruta geodésica en torno a la Tierra, y
los planetas y los cometas que nos visitan de fuera recorren rutas geodésicas en torno al Sol.

Las ecuaciones de campo de la Relatividad General pueden ser modificadas con la introducción
de un término constante, una constante cosmológica Λ, con la cual dichas ecuaciones escritas
en notación de componentes resultan ser:

Si repetimos el procedimiento anterior utilizado para obtener las ecuaciones de campo de


Einstein para el vacío, en esta ocasión tomando en cuenta a la constante cosmológica, con todos
los componentes del tensor energía-tensión T son igualados a cero, obtenemos lo siguiente:

lo cual nos lleva a:

R=4Λ

que nos conduce finalmente a:

Esto nos dice que si la constante cosmológica no es igual a cero entonces, inclusive en ausencia
total de cualquier rastro de masa-energía, el espacio-tiempo tendrá una curvatura
intrínseca, ya de por sí. Esta curvatura intrínseca podría ser suficiente para contrabalancear la
curvatura ocasionada por toda la masa-energía que hay en el Universo de modo tal que
tendríamos un Universo estático con una curvatura neta de cero a gran escala, un Universo
incapaz de contraerse (por efectos de la gravedad) o de expanderse. Esta fue la razón por la cual
Einstein introdujo la constante cosmológica en sus ecuaciones de campo, sólo para ser
abandonada al descubrirse que nuestro Universo es un universo en expansión continuada.

Einstein introdujo su constante cosmológica suponiéndola como un parámetro independiente,


algo característico del Universo, ya de por sí, pero el término de la misma en las ecuaciones de
campo puede ser movida “hacia el otro lado” de la igualdad, escrita como una componente del
tensor energía-tensión T para el vacío:
Puesto que este resultado vendría correspondiendo directamente con la densidad de energía ρ
en el tensor energía-tensión T, esto tiene como consecuencia inevitable que hablemos ya de
la energía del vacío dada por la siguiente relación de acuerdo a la Relatividad General:

De este modo, la existencia de una constante cosmológica Λ diferente de cero es equivalente a la


existencia de una energía del vacío diferente de cero; no hay forma en la cual podamos escapar a
esta conclusión. Es por esto que los términos constante cosmológica y energía del vacío se usan
de manera intercambiable en la Relatividad General. Curiosamente, y por otras vías
matemáticas, la Mecánica Cuántica también nos habla sobre la existencia de una energía del
vacío. Es por esto que un importante segmento de la comunidad científica alberga sospechas de
que la gran puerta de entrada hacia una teoría de la Relatividad Cuántica pueda ser esta
coincidencia que parece ser algo más que una coincidencia fortuita, máxime que en base a las
observaciones astronómicas más recientes se está descubriendo que la constante cosmológica
del Universo es, en efecto, diferente de cero, aunque por razones diferentes a las cuales había
postulado Einstein.

La interpretación física del tensor de Ricci nos lleva al verdadero significado geométrico de
todos estos tensores de curvatura.

Dos partículas pequeñas en reposo (las cuales suponemos tan diminutas que son incapaces de
producir una curvatura detectable en el espacio-tiempo) pero cercanas la una la otra se mueven
independientemente a través del espacio-tiempo siguiendo rutas geodésicas. Si el espacio-
tiempo es plano, permanecerán paralelas por siempre:
Pero si el espacio-tiempo es curvo, aunque las partículas estén en reposo se irán acercando al ir
recorriendo cada una de ellas su ruta geodésica:
Este acercamiento gradual puede ocasionar la suposición errónea de que al moverse ambas
partículas a través del espacio-tiempo se están “atrayendo” la una a la otra, como si existiese una
“fuerza de atracción” entre ellas. Esto fué lo que supuso Newton y fué lo que lo condujo a
obtener su ley de la gravitación universal. Pero tal fuerza de atracción no existe, lo único que
existe son rutas geodésicas a través del espacio-tiempo. Esto es lo que hace precisamente que el
volumen esférico de una “pelotita” de partículas en caída libre se vaya contrayendo. No hay
ninguna fuerza de atracción gravitacional entre ambas, lo único que hay es la ruta geodésica que
cada una de ellas está siguiendo. Debe resultar obvio que para poder determinar la curvatura del
espacio-tiempo necesitamos por lo menos dos partículas, una sola no basta puesto que no hay
forma de saber hacia dónde la esté acercando su ruta geodésica. La desviación que dos
partículas inicialmente paralelas tienen al irse saliendo fuera de sus rutas paralelas está dada
por la ecuación conocida como ecuación de desviación geodésica.

¿Cómo podemos determinar el aspecto correcto de la curvatura del espacio-tiempo de la cual


hemos estado hablando? En esta tarea nos resulta de gran ayuda recurrir a la gravedad
Newtoniana clásica, porque hay un cálculo muy sencillo que podemos hacer en ella relacionando
a la densidad de la materia con el acercamiento gradual de los objetos que están en caída libre,
lo cual nos indica el camino a seguir para encontrar una relación semejante en la Relatividad
General. Supóngase por un momento que la Tierra bajo nuestros pies empezara a colapsarse
bajo la acción de su propia gravedad, de modo tal que todas las fuerzas que mantienen a la roca
debajo de nosotros en pie han desaparecido como si por arte de magia. En el instante en que tal
cosa empezara a ocurrir, la superficie de la Tierra estaría aún estacionaria, de modo tal que si
nos preguntáramos “¿qué tan rápido se está encogiendo la Tierra debajo de nosotros?” la
respuesta sería “para nada, en este instante”. Sin embargo, no permanecería estacionaria por
mucho tiempo, de modo tal que podríamos preguntarnos en cambio “¿que tan rápido se
está acelerando el volumen de la Tierra hacia un valor menor?”, algo comparable a lo que ocurre
cuando ponemos un carro en movimiento, el cual en el instante t = 0 tiene una aceleración cuyo
valor no es cero pero cuya velocidad inicial de movimiento es cero. En la física Newtoniana, la
aceleración adebida a la gravedad a una distancia r de una masa m está dada por a = GM/r² en
donde G es la constante de gravitación universal. En cualquier momento el área de la superficie
de la esfera es 4πr2, y multiplicando ésta área por la aceleración “hacia abajo” nos muestra que el
volumen de la Tierra se está “acelerando” a una razón de –4πGM (se agrega un signo menos
para indicar que el volumen está disminuyendo en lugar de estar aumentando):

- (4πr2) (GM/r²) = - 4πGM

Como una proporción del volumen total de la Tierra que llamaremos V, esto es simplemente:

- (4πGM)/V = - 4πG(M/V) = - 4πGρ

en donde ρ es la densidad de masa promedio de la Tierra. Lo que hemos estado llamando una
aceleración del volumen es la razón del cambio con respecto al tiempo (primera derivada, para
la velocidad) del cambio con respecto al tiempo (segunda derivada, para la aceleración) del
volumen, de modo tal que usando la notación ∂t∂t = (∂/∂t)(∂/∂t) = ∂²/∂t² podemos escribir esta
idea del siguiente modo:

(∂t∂tV)/V= - 4πGρ

Aunque este resultado se ha obtenido para una situación en particular, sigue siendo válido para
una pequeña colección de partículas en caída libre a través de una región del espacio-tiempo en
donde la densidad sea ρ que posean juntas un volumen que cambie de acuerdo con esta última
ecuación. En el vacío en donde ρ = 0, la aceleración del volumen será también cero. Imaginemos
una pequeña nube de chatarra espacial, inicialmente sin movimiento alguno, a una gran altura
sobre la atmósfera terrestre. Si la chatarra cae en caída libre hacia abajo, la forma de la nube
cambiará; se achatará en las dos direcciones horizontales (correspondientes a las dos
coordenadas de un plano horizontal) al ir cayendo hacia el centro de la Tierra, mientras que irá
creciendo verticalmente conforme las partículas más cercanas a la Tierra experimentan una
aceleración gravitacional mayor (desde el punto de vista Newtoniano) que las partículas que
estaban más arriba. Sin embargo, estos dos efectos se cancelan, y el volumen de la nube no
experimentará aceleración alguna (esto no significa de modo alguno que la nube mantendrá un
volumen constante indefinidamente; ya que aunque la primera, la segunda y la tercera razón de
cambio sean cero la cuarta razón de cambio será negativa, y el volumen de la nube se irá
encogiendo al ir transcurriendo el tiempo), como podemos verlo en la siguiente figura en la cual
mientras que por un lado al ir cayendo el cubo hacia la masa M aumenta la longitud de la
dimensión vertical ξz del cubo en un monto (positivo) δξz va disminuyendo en montos iguales
δξx y δξy (montos negativos) en las longitudes de las dimensiones horizontales ξ x y ξy:

Al cubrir el tema del tensor energía-tensión T vimos que el componente T00 mide directamente
la densidad de la masa-energía, de modo tal que la última relación obtenida por la vía
Newtoniana nos sugiere la búsqueda de un tensor que llamaremos C, un tensor tal que su
componente C00 sea la segunda razón de cambio con respecto al tiempo de un volumen unitario
que esté acotado por geodésicas, puesto que las geodésicas son las líneas del mundo (en un
diagrama espacio-tiempo de Minkowski) de las partículas en caída libre. Podríamos entonces
tratar de relacionar al tensor geométrico C con el tensor energía-tensión T en una ecuación
relativista análoga. No resulta difícil encontrar la segunda razón de cambio (con respecto al
tiempo) de la separación entre geodésicas, esto es precisamente lo que se conoce
como desviación geodésica. La siguiente figura nos muestra dos geodésicas cercanas, PS y
QR, las cuales empiezan ambas apuntando en la dirección u, estando separadas inicialmente
por un vector unitario n (estamos trabajando con una región del espacio-tiempo lo
suficientemente pequeña como para que sea válida la comparación de vectores en puntos
diferentes describiendo la separación entre dos puntos como un vector):

Obsérvese con detenimiento que en esta figura hay en realidad cuatro geodésicas:

P→Q

P→S

Q→R

R→S

Si llevamos a cabo una operación de transporte paralelo desde una geodésica hasta la otra (de P
a Q), cambiamos el sentido de nuestro viaje moviéndonos una distancia unitaria a lo largo de la
segunda geodésica (de Q a R), regresamos hacia la segunda geodésica (de R a S) y volvemos
hasta el punto de partida (de S a P), regresaremos con un pequeño cambio δu, el cual sólo puede
ser cero en un espacio-tiempo plano, no en un espacio-tiempo curvo. Este cambio puede ser
estimado con la ayuda del tensor de curvatura de Riemann. Puesto que el plano del bucle a lo
largo del cual movimos a u está definido por los vectores u y n, y puesto que el vector que
estamos transportando es u, tenemos entonces:

δu = - R(u,n,u)

Pero u no varía en relación a las geodésicas que hay entre Q y R así como entre S y P en virtud
de que ha sido transportado-paralelamente a través de las mismas -esta es precisamente la
definición geométrica de una geodésica- de modo tal que podemos atribuír toda la discrepancia
δu a la diferencia en la dirección de las geodésicas en S y R. Puesto que ambas geodésicas
empiezan inicialmente paralelas (como el carro que es puesto en movimiento en un tiempo t = 0
con una aceleración constante pero empezando con una velocidad de cero), la primera razón de
cambio de su separación n es cero. Pero como de cualquier manera se las arreglan para adquirir
una inclinación relativa de δu, después de que las seguimos por una distancia unitaria en la
dirección u, la segunda razón de cambiode su separación es –R(u,n,u), o sea (usando notación
abreviada para la derivada covariante):

∇u∇un = - R(u,n,u)

Para calcular la segunda razón de cambio en el volumen entre las geodésicas de una nube
completa de partículas (que para fines de simplicidad supondremos como un volumen inicial de
1) tenemos que tomar la segunda razón del cambio de la distancia entre ellas para cada una de
las tres dimensiones perpendiculares a u y sumar los resultados (recuérdese que estamos
trabajando en una 4-dimensión). Pero podemos hacer todo esto haciéndolo sobre las cuatro
coordenadas a la vez, puesto que cualquier contribución que sea paralela a u siempre será cero.
Podemos hacer esto en forma abreviada definiendo un nuevo tensor,precisamente el tensor de
Ricci, representando simbólicamente el asunto de la siguiente manera

(∂u∂uV)/V = - Ricci (u,u)

Con esto se está dando a entender que el negativo del tensor de Ricci es proporcional a la
segunda razón de cambio del volumen entre las geodésicas, lo cual queremos relacionar de
alguna manera con el tensor energía-tensión. Una primera posibilidad sería la siguiente:

Ricci = 4πGT

Pero esta posibilidad nos presenta un problema. Si calculamos la divergencia del tensor de Ricci,
encontramos que esta no es cero. Se repetirá esto con énfasis para que quede claro: la
divergencia del tensor de Ricci no es cero. Esto significa que la ecuación que acabamos de
postular es incompatible con la conservación de la energía-momentum expresada como:

div T = 0

Afortunadamente, podemos contruír otro tensor que sí es libre de divergencia. Este tensor es
precisamente el tensor de Einstein.

La fórmula tensorial básica de la Teoría General de la Relatividad, G = 8πGT , en notación de


índices y sustituyendo al tensor de Einstein G por lo que realmente representa, una expresión
que involucra a esa entidad matemática Rμν conocida como el tensor de Ricci:

Rμν - (1/2) gμν R= Tμν

nos conduce a la siguiente pregunta: ¿Qué significa realmente la anterior ecuación, desde el
punto de vista tanto físico como matemático? Para lograr una respuesta satisfactoria, hagamos
primero unas cuantas manipulaciones con “gimnasia de índices” elevando al primer índice:

Rμν - (1/2) gμν R = Tμν

Hecho esto, llevemos a cabo una contracción con la igualación de índices μ = ν:

Rμμ - (1/2) gμμ R = Tμμ

Pero el primer término es simplemente la definición del escalar de Ricci R, mientras que por
otro lado al llevarse a cabo la contracción del tensor métrico se tiene para una métrica
Lorentziana que gμμ = -2 (suponiendo para la métrica una “firma” de signos + - - -). Tenemos
entonces:

R - 2R = Tμμ

R = - Taa

Este es un resultado interesante. Nos dice que el escalar de Ricci es igual a la suma de los
componentes de la diagonal principal del tensor energía-tensión T en su representación
matricial, los cuales ya sabemos que son componentes que representan a la densidad de energía
y a la presión. Tomemos ahora este resultado que acabamos de obtener para ponerlo de nuevo
en la ecuación fundamental de Einstein:

Rμν + (1/2) gμν Taa = Tμν

o bien, despejando el tensor de Ricci poniendo todo lo demás en el lado derecho:

Rμν = Tμν - (1/2) gμν Taa

Esta expresión nos permite comprender el significado del tensor de Ricci en el lenguaje de la
“convergencia” de las geodésicas (geodésicas que se van aproximando una a la otra al recorrer
ambas cierta coordenada). Imaginemos a una pequeña “pelota” de partículas de prueba en caída
libre en la cual v es el vector velocidad de una partícula puesta en medio de la pelotita.
Imaginemos que la “pelotita” tiene inicialmente un volumen V. La primera derivada con
respecto al tiempo del volumen de la pelotita es cero. Pero la segunda derivada con respecto al
tiempo no lo es. En este caso, la segunda derivada con respecto al tiempo del volumen de la
pelotita viene siendo

- Rμν vμ vν

multiplicado por el volumen V. Si conocemos esta cantidad para todas las velocidades v(que en
este caso son las velocidades tipo temporal, que son las físicamente disponibles) podemos
recontruír el tensor de Ricci Rμν. Nos resulta conveniente trabajar en el marco de referencia de la
partícula que está puesta en medio de la pelotita, lo cual nos permite utilizar las coordenadas
que corresponden a un espacio-tiempo Lorentziano en la cercanía del punto en el cual está
situada dicha partícula. En tal caso, el tensor métrico g μν adquiere el aspecto que ya conocemos
para un espacio-tiempo plano:

y por su parte va resulta ser simplemente (1, 0, 0, 0) por el hecho de que estamos considerando a
la pelotita de partículas “flotando” dentro de un marco de referencia en reposo con lo cual el
único viaje de la pelotita es a través de la coordenada temporal, la primera coordenada del 4-
vector velocidad.
Entonces, tras unas cuantas computaciones tensoriales como las que llevamos a cabo arriba,
obtenemos el componente R00 del tensor de Ricci:

Rμν vμ vν= R00

De este modo, en este sistema de coordenadas podemos afirmar que la segunda derivada del
“volumen” de la pequeña pelotita de partículas es simplemente -R00.

Veamos ahora el lado derecho de la ecuación:

Rμν = Tμν - (1/2) gμν Taa

Habiendo obtenido una expresión para R00, ponemos ahora en esta ecuación μ = 0 y ν = 0, con
lo cual obtenemos lo siguiente teniéndose en cuenta que para la métrica Lorentziana que
estamos manejando g00 = 1:

R00 = T00 + (1/2) Taa

Preguntémonos ahora, ¿que es T00? Tratándose del tensor energía-tensión T, ya sabemos que es
simplemente la densidad de energía en el centro de nuestra pelotita pequeña de partículas. ¿Y
qué es Taa? Este término es simplemente el resultado de la doble contracción gca Tac, en donde
llevamos a cabo la sumación sobre a y sobre c después de haberse llevado a cabo la doble
contracción. Esto resulta ser:

-T00 + T11 + T22 + T33

De este modo, obtenemos lo siguiente:

R00 = (1/2) [T00 + T11 + T22 + T33]

Ya sabemos qué es T00. ¿Y qué podemos decir de T11, T22, and T33? Ya lo vimos al cubrir el tema
de “El tensor energía-tensión”; estos términos representan el flujo de momentum en la dirección
del eje-x, del eje-y y del eje-z, ya vimos que en un fluído típico en estado de reposo, todos estos
términos son iguales a la presión en el sentido en el cual se está llevando a cabo el movimiento.
De este modo, una interpretación geométrica “sencilla” de la ecuación fundamental de Einstein
expresada con palabras vendría siendo la siguiente: Tómese una pelotita pequeña de partículas
de prueba moviéndose juntas en caída libre, y trabájese sobre el marco de referencia local en
reposo de la pelotita. Conforme el tiempo transcurre la pelotita cambia de volumen. Calcúlese la
segunda derivada evaluada en el tiempo de inicio (cero) y divídase entre el volumen original. El
negativo de lo que resulta es igual a de la densidad de energía en el centro de la pelotita, más el
flujo de momentum-x en la dirección de las equis, más el flujo de momentum-y en la dirección
de las yes, más el flujo de momentum-z en la dirección de las zetas. Expresado con mayor
brevedad aún y en términos más llanos, diríamos lo siguiente: Tómese una pelotita pequeña de
partículas de prueba moviéndose juntas en caída libre. Conforme pasa el tiempo, la razón a la
cual la pelotita se va comprimiento en volumen es proporcional a la densidad de la energía más
el flujo de momentum-x en la dirección de las equis, más el flujo de momentum-y en la
dirección de las yes, más el flujo de momentum-z en la dirección de las zetas. El hecho de que el
volumen de la pelotita vaya disminuyendo conforme el tiempo transcurre tiene una única
interpretación posible: la gravedad es atractiva.

Así, la interpretación física que podemos darle al tensor de Ricci tiene la siguiente visualización
que será dada a continuación, para lo cual nos referiremos al siguiente diagrama como un
diagrama que trata de representar en un espacio de tres dimensiones algo que tiene lugar en un
espacio de cuatro dimensiones (ausente en este diagrama está la coordenada X2, aunque
afortunadamente por tratarse de una esfera simétrica obtendríamos el mismo diagrama si en
vez de utilizar a X3 utilizáramos a X2):
El eje vertical corresponde a la coordenada utilizada para la medición del tiempo, y como
podemos verlo conforme va transcurriendo el tiempo el volumen de la esfera va disminuyendo.
De acuerdo con la Teoría General de la Relatividad, como consecuencia de la atracción recíproca
entre las moléculas de un gas, una masa esférica de gas reduce su volumen con un aceleración
equivalente a 4Gπρ en donde ρ es el parámetro que mide la densidad de la masa esférica de gas.
Esto es precisamente lo que intenta reproducir en el diagrama de arriba los efectos del tensor de
Ricci, concretamente su componente R00 sobre un volumen tridimensional esférico: conforme
aumenta el tiempo, dicho volumen se reduce. Se recuerda que es importante tener en cuenta que
la figura es una sobresimplificación proyectando lo que ocurre de un espacio en cuatro
dimensiones a un espacio de tres dimensiones en donde se ha retenido la coordenada del
tiempo.

En términos menos abstractos, imaginemos que estamos en una nave espacial surcando el
espacio, y que dentro de la nave tenemos una bolsita de granos de arroz que acabamos de abrir
cuidadosamente de modo tal que el movimiento de cada grano de arroz con respecto a los demás
es nulo, cero, y que todos los granitos de arroz en conjunto pese a estar separados el uno del otro
parecen formar una pelotita. Estando situados en un marco de referencia comóvil en donde todo
lo que está adentro de la nave se mueve al parejo a la misma velocidad con respecto a un
observador externo, esto sería similar a una situación en la cual la pelotita de granos de arroz
está en caída libre. Conforme va transcurriendo el tiempo, la pelotita irá cambiando de tamaño y
de forma dependiendo de la curvatura del espacio-tiempo que esté atravesando la nave, por
ejemplo al pasar cerca de un planeta o de una estrella. La pelotita podrá ir dejando su forma
esférica para ir tomando una forma elipsoidal. Todo depende del tipo de curvatura del 4-espacio
en el que esté inmersa la nave. Cada granito de arroz irá siguiendo la ruta geodésica que le
corresponda seguir. Si el volumen inicial de la pelotita de granos de arroz era Q, entonces el
volumen irá aumentando o disminuyendo por un factor de “amplificación” igual a:

- Rab va vb

Esto es, en síntesis, lo que encierra el tensor de Ricci. Y significa que, con una pelotita de “polvo”
de forma inicialmente esférica dentro de la nave, sin salir de la misma podemos obtener toda la
información que requerimos para percatarnos del tipo de curvatura del espacio-tiempo que está
atravesando la nave.

La reducción a los límites clásicos


Para situaciones en las que la gravedad es muy débil, en las que la curvatura del espacio-tiempo
es muy pequeña, la Relatividad General debe incluír a la Teoría Especial de la Relatividad como
una aproximación de primer orden, como un caso especial en el cual la Relatividad General debe
reducirse la formulación matemática de un espacio-tiempo plano, debe reducirse a las
transformaciones de Lorentz.

¿Y cómo se logra ésto?

Se logra considerando una región de espacio-tiempo que sea lo suficientemente pequeña como
para que dentro de la misma el espacio-tiempo pueda considerarse como plano. La transición de
un espacio-tiempo curvo a un espacio-tiempo plano como el que nos describen los diagramas
espacio-tiempo de Minkowski se puede visualizar en la forma en que lo muestra la siguiente
figura en grado ascendente (se recuerda al lector que la representación pictórica que se está
dando abajo es incompleta en virtud de que el espacio-tiempo plano representado en el dibujo
superior es un espacio-tiempo plano bi-dimensional típico de los diagramas de Minkowski,
siendo que el espacio-tiempo real es cuatri-dimensional; sin embargo, esta representación es
suficiente para nuestros fines didácticos):
En otras palabras, aunque el espacio-tiempo sea curvo globalmente, el espacio-tiempo puede
tomarse como plano localmente. Esto es desde el punto de vista matemático. Y de hecho fue así
como Einstein empezó a obtener la formulación matemática de la Relatividad General,
generalizando hacia un espacio-tiempo curvo lo que se sabía que era cierto matemáticamente
para un espacio-tiempo plano, lo cual requirió recurrir a las herramientas del cálculo
infinitesimal.

Y desde el punto de vista físico, la inclusión de la Teoría Especial de la Relatividad dentro de la


Relatividad General es obvia porque todo marco de referencia que esté en caída libre en
un campo gravitacional puede considerarse Lorentziano. Puesto de otra manera, así
como dentro de un elevador herméticamente sellado un ocupante en su interior no tiene forma
experimental de saber si por fuera el elevador está siendo acelerado en el espacio libre por un
motor silencioso o si el elevador se encuentra en reposo en un campo gravitacional (principio de
equivalencia de la Relatividad General), del mismo modo el ocupante del elevador no tiene
forma experimental de saber si por fuera el elevador está flotando en el espacio interestelar o si
el elevador está en caída libre en un campo gravitacional, que resultaría dentro del elevador en
un entorno de “”gravedad cero” como el que experimentan los astronautas que están orbitando
alrededor de la Tierra en la estación espacial internacional o como el que experimentó el famoso
físico inglés Stephen Hawking dentro de un avión cayendo a gran velocidad hacia la Tierra:
Lo anterior es en lo que respecta a la inclusión de la Teoría Especial de la Relatividad dentro de
la Relatividad General. Pero no sólo la Relatividad General debe incluír dentro de sí a la Teoría
Especial de la Relatividad. También debe reducirse, para el caso específico en el cual el campo
gravitacional no es muy intenso y para velocidades suficientemente bajas en comparación con la
velocidad de la luz, a la mecánica clásica, a la mecánica de Sir Isaac Newton, aunque esté basada
en conceptos filosóficos diferentes. Si hemos de aceptar las ecuaciones de campo de la
Relatividad General como válidas, estas ecuaciones se tienen que reducir al límite clásico para
un campo gravitacional débil, y el límite clásico es la ley de la gravitación universal de Newton a
la cual deben incluír como caso especial:

Podemos visualizar en torno a la Tierra un campo de fuerza apuntando hacia el centro de la


Tierra y que “jala” a todos los objetos en el espacio cercanos a la Tierra hacia ella por la fuerza de
atracción de la gravedad:

El problema que enfrentamos para comparar las predicciones de la Relatividad General con la
mecánica clásica Newtoniana es que, en la Relatividad General, el concepto de fuerza de
atracción entre dos cuerpos ha sido desterrado por completo porque tal fuerza de atracción
nunca existió. ¿Entonces cómo podemos comparar ambos conceptos? Tenemos aquí un dilema
que sólo puede ser solventado si en vez de recurrir al concepto de “fuerza” de atracción
gravitacional recurrimos a argumentos basados en la energía del campo gravitacional. Y la
energía del campo gravitacional está dada por lo que viene siendo la energía potencial del
campo gravitacional o simplemente el potencial gravitacional de la Tierra, designado
frecuentemente como U en la mecánica clásica. Este concepto representa la diferencia de
energía que posee un cuerpo a cierta distancia r 1 de la Tierra y la energía que posee a otra
distancia r2 menor o mayor. Puesto que para mover un cuerpo alejándolo de la Tierra hay que
aplicar cierta cantidad de energía, lo cual equivale a llevar a cabo un trabajo definido
clásicamente como:

W = ∫F · dr

entonces al caer el cuerpo hacia la Tierra esa energía potencial acumulada se convierte en
energía de movimiento. Por convención, decimos que al caer un cuerpo hacia la tierra cae de un
potencial mayor hacia un potencial menor. También por convención, el potencial gravitacional
producido por un cuerpo como la Tierra a una distancia infinitamente grande se toma como
cero. Esto quiere decir que el potencial U de la Tierra siempre tendrá un valor negativo, puesto
que sólo puede hacerse más negativo del valor de cero que tiene en el infinito. Por lo tanto, el
potencial estará dado por:

U = - ∫F · dr

en donde F es la fuerza de atracción universal propuesta por Newton. La expresión para la


energía potencial de un cuerpo situado a una distancia r del centro de la Tierra en comparación
con la energía potencial del cuerpo situado a una distancia infinitamente grande (y la cual es
cero) se puede obtener de la siguiente manera (estamos agregándole un signo negativo a la
fuerza de atracción puesto que, por convención, se asigna un signo menos cuando la fuerza es de
atracción y un signo más cuando la fuerza es de repulsión):
en donde como paso intermedio hemos utilizado la integral elemental del cálculo infinitesimal:

El potencial U sólo depende de la distancia que hay del cuerpo al centro de la Tierra. A cierta
distancia r fija, el potencial es el mismo. Podemos imaginar, superimpuestas sobre el campo de
fuerza gravitacional de la Tierra, esferas concéntricas imaginarias que poseen el mismo
potencial:
Con el propósito de “desconectar” a un cuerpo pequeño del efecto que dicho cuerpo produce
sobre el campo gravitacional de la Tierra, y con el propósito de darle más importancia al efecto
que la misma Tierra produce en el cuerpo sobre el cual está ejerciendo atracción gravitacional,
se acostumbra hablar del potencial gravitacional U por unidad de masa m designándolo como
φ, de modo tal que al hablar del potencial gravitacional φ (también designado como Φ) lo
estamos haciendo con la siguiente fórmula:

φ = -GM/r

Ya se ha señalado que en la Relatividad General todo lo controla la métrica que define


al elemento de línea infinitesimal ds² entre dos puntos cercanos. Se puede demostrar que para
un campo gravitacional suficientemente débil, esta distancia entre dos puntos cercanos puede
ser escrita de la siguiente manera recurriendo a la ayuda de las coordenadas Cartesianas (la
obtención de esta fórmula se llevará a cabo cuando estudiemos posteriormente en mayor detalle
la métrica de Schwarzschild):

ds² = (1 + 2φ/c²) (cdt)² - (1 - 2φ/c²) (dx² + dx² + dz²)

en donde φ es el potencial clásico Newtoniano que hemos definido arriba.

PROBLEMA: Demostrar que, para un campo gravitacional φ sumamente débil, el elemento


de línea ds² se reduce al intervalo relativista de un espacio-tiempo plano.

Si el potencial gravitacional es sumamente débil, entonces φ « 1 y podemos despreciarlo en la


relación anterior, obteniendo:
ds² = (cdt)² - dx² - dy² - dz²

Este es precisamente el intervalo relativista de un espacio-tiempo plano (Lorentziano) en el cual


se aplican las transformaciones de Lorentz, lo cual era de esperarse ya que la Relatividad
General incorpora a la Teoría Especial de la Relatividad.

En un gráfico tri-dimensional que nos muestre cómo el potencial de la Tierra se va haciendo


cada vez más negativo conforme un cuerpo se va acercando a la Tierra, tenemos la siguiente
perspectiva:

Lo que no alcanzamos a ver en el diagrama de arriba es que una vez que un cuerpo ha llegado a
la superficie de la Tierra, si en vez de tocar una superficie sólida le toca entrar por la boca de un
pozo que llega hasta el centro de la Tierra continuando su viaje, el potencial no disminuirá sino
que aumentará, y de hecho en el centro de la Tierra el potencial es cero lo cual concuerda con el
hecho de que en el centro de la Tierra no hay fuerza de gravedad alguna. Esto lo podemos ver
mejor en el siguiente diagrama que nos ilustra el potencial de la Tierra hasta su interior así
como el potencial de otro cuerpo en cercanía a la misma (por ejemplo la Luna):
PROBLEMA: Descomponer la métrica (dada aquí en unidades geometrizadas haciendo c =
1):

ds² = (1 + 2φ) dt² - (1 - 2φ) (dx² + dx² + dz²)

en dos partes, una parte Lorentziana y una parte no-Lorentziana.

La descomposición requerida se muestra a continuación:

ds² = dt² + 2φ dt² - dx² - dy² - dz² - 2φ (dx² + dx² + dz²)

ds² = dt² - dx² - dx² - dz² + 2φ {dt² - dx² - dx² - dz²}

La parte en rojo es la parte Lorentziana, propia de un espacio-tiempo plano en el cual se aplica


la Teoría Especial de la Relatividad, mientras que la parte en rojo es la parte propia de un
espacio-tiempo curvo. Obsérvese que si el potencial φ es igual a cero, lo cual equivale a decir que
estamos en una región del espacio-tiempo en donde para fines prácticos no hay atracción
gravitacional, el espacio-tiempo es plano.

Estrictamente hablando, la Teoría General de la Relatividad de Einstein no fue la primera en


darse a conocer públicamente. Ya en 1912 y en 1913 el físico teórico finlandés Gunnar
Nordström había propuesto dos teorías distintas. La primera fue rápidamente descartada,
mientras que la segunda se convirtió en el primer ejemplo de una teoría métrica de la
gravedad en la cual los efectos de la gravedad eran tratados por completo en términos de la
geometría de un espacio-tiempo curvo. Ninguna de las dos teorías fue capaz de corroborar las
observaciones teóricas y experimentales, aunque de cualquier manera la primera es de interés
porque condujo al desarrollo de la segunda, y la segunda es de interés no sólo porque constituyó
un avance importante en el camino hacia la Relatividad General sino porque se trata de una
teoría autoconsistente y autosuficiente de la gravedad, y aún es utilizada en los salones de clases
con fines didácticos sobre cómo derivar y cómo explicar las predicciones de una teoría métrica
de la gravedad. La teoría gravitacional de Nordström hizo su aparición justo cuando físicos
teóricos prominentes tales como el mismo Nordström en Helsinki, Max Abraham en Milán,
Gustav Mie en Alemania y Albert Einstein en Praga estaban ocupados tratando de crear teorías
alternas para la descripción de la gravedad. Todos estos investigadores, incluyendo al mismo
Einstein, empezaron sus esfuerzos intentando modificar la versión en la teoría de campo de la
teoría gravitacional de Newton que tan buenos resultados había dado clásicamente. En las
teorías del campo gravitacional derivadas de la filosofía Newtoniana, la ecuación de campo es
obtenida de la ecuación de Poisson ∇²φ = 4πGρ, siendo φ el potencial gravitacional, ρ la
densidad de masa y ∇² el operador Laplaciano tri-dimensional, en conjunción con la ecuación
del movimiento de Newton que nos dice que la aceleración de una partícula está dada por el
gradiente de su potencial gravitacional, o sea da/dt = - ∇φ. Una teoría gravitacional de este tipo
no puede ser relativista porque la ecuación de movimiento se basa en un tiempo “absoluto” de
coordenada t en lugar de utilizar un tiempo propio (local) τ medido por un observador local
viajando junto con la partícula en movimiento. Un defecto de la teoría de Nordström es que en
caso de que la masa concentrada inicialmente en un objeto aislado fuese dispersada como
consecuencia de una explosión, la ecuación de campo de Nordström requiere que el potencial
gravitacional repartido en todo el espacio sea “puesto al día” instantáneamente (sin que la
velocidad de la luz sea un limitante para ello) en conformidad con la filosofía Newtoniana de la
“acción a distancia”. Hermann Minkowski, el cual fue profesor de Einstein, ya había bosquejado
una teoría vectorial de la gravedad desde 1908, pero en 1902 Max Abraham destacó que ninguna
teoría de este tipo (vectorial) podía admitir órbitas estables (siendo incapaz de explicar, por
ejemplo, la estabilidad del sistema solar), siendo esta una razón por la cual Nordström giró su
atención hacia teorías escalares de la gravedad, mientras que Einstein decidió explorar campos
tensoriales.

La ecuación de campo que se obtiene de la teoría gravitacional de Nordström:

R = 24πT

para la cual en el lado derecho se utiliza la traza del tensor energía-tensión T (con
contribuciones de la masa-energía sumadas a las contribuciones energéticas de cualquier campo
no-gravitacional) manifiesta un parecido extraordinario con las ecuaciones (tensoriales) de
campo de Einstein y constituye un avance histórico significativo en la historia de la Ciencia
porque por vez primera tenemos una ecuación de campo para la cual en el lado izquierdo
tenemos una cantidad de naturaleza puramente geométrica refiriéndose a una curvatura
espacial (el escalar de Ricci R es la traza del tensor de Ricci R que a su vez es una especie de
traza del tensor de curvatura de Riemann R de orden cuatro), mientras que en el lado derecho
tenemos una cantidad que es puramente física, la traza del tensor energía-tensión T. Al tomar
conocimiento de los resultados correspondientes a la segunda teoría de Nordström, Einstein
manifestó un entusiasmo exhuberante porque no sólo las ecuaciones son elegantes y sencillas,
también implican una consecuencia importante que sería incorporada dentro de la Relatividad
General: las ecuaciones de campo para el vacío implican que, en ausencia total de masa-
energía, la curvatura debe ser cero.

La teoría del campo gravitacional de Nordström, por ser una teoría escalar, predice la misma
aceleración para una partícula de prueba sumergida en un campo gravitacional que la predicha
por la filosofía Newtoniana (la cual es también una teoría escalar), o sea GM/r², mientras que la
teoría del campo gravitacional de Einstein, por ser una teoría tensorial, predice una aceleración
que además del término GM/r² adiciona otro término que es proporcional no a la inversa del
cuadrado sino a la inversa del cubo de la distancia. Interesantemente, la teoría gravitacional de
Nordström predice un desplazamiento de frecuencia (corrimiento al rojo) gravitacional idéntico
al predicho por la teoría Einsteniana. Sin embargo, no predice deflexión alguna de la luz a
consecuencia del efecto de un campo gravitacional. La solución de la ecuación de Nordström
para el vacío produce la siguiente métrica:

en donde φ es una perturbación conformal ocasionada sobre la métrica del espacio-tiempo


plano (Lorentziano). Si llevamos a cabo una expansión del exponencial mediante series de
Taylor reteniendo únicamente el término de primer orden, la métrica se vuelve entonces:

siendo:
η11 = 1___η22 = η33 = η44 = - 1

ηij = 0_ para i ≠ j

en la cual podemos identificar a φ como el potencial gravitacional Newtoniano clásico. Como el


concepto de la fuerza de atracción gravitacional no existe en las teorías de campo, la
aproximación que llevan a cabo la mayoría de las teorías gravitacionales a la mecánica
Newtoniana (partiendo del conocimiento de que la gravitación Newtoniana se puede tomar
como una aproximación en el límite clásico de las teorías modernas de gravitación) se lleva a
cabo sobre una expresión como la última que acabamos de escribir, y es sobre ella que
llevaremos a cabo la reducción de la Relatividad General al límite clásico Newtoniano en donde
esperamos obtener una coincidencia de resultados.

A continuación analizaremos el movimiento de una partícula en caída libre en un campo


gravitacional. Denotemos el 4-momentum de la partícula como p. Para todas las demás
partículas de prueba con excepción de los fotones (que carecen de masa en reposo) este 4-
momentum es igual a m0U en donde U es la 4-velocidad. El movimiento de la partícula se lleva
a cabo a lo largo de la ruta geodésica, satisfaciéndose por lo tanto la ecuación geodésica que
puede ser simbolizada de cualquiera de las siguientes maneras:

Sabemos que el tiempo propio τ es un parámetro afín, y que si es multiplicado por una constante
cualquiera seguirá siendo un parámetro afín que puede ser simbolizado más generalmente como
λ. Esto significa que si dividimos a τ entre el masa propia m0 (que es una constante invariable)
tendremos el parámetro afín τ/m0. Se sigue que dx/d(τ/m0) es un 4-vector que también
satisface la ecuación geodésica. Pero por la definición del 4-momentum, p = dx/dτ. Esto nos
permite escribir la ecuación del movimiento para la partícula del modo siguiente:
Esta es la ecuación geodésica escrita en función del 4-momentum p en lugar de la 4-
velocidad U. En un 4-espacio, esta ecuación geodésica representa en realidad un sistema de 4
ecuaciones distintas, una para cada coordenada:

Explícitamente:

La primera ecuación representa la ecuación geodésica correspondiente a la componente


temporal mientras que las tres ecuaciones restantes corresponden a las componentes
espaciales, en conformidad con la designación de las coordenadas (ct, x, y, z). Cabe señalar que
este sistema de ecuaciones geodésicas puede ser utilizado no sólo para partículas materiales sino
también para fotones, ya que aunque los fotones carecen de masa en reposo m 0 sí poseen en
cambio un momentum bien definido (p = E/c). En el desarrollo que llevaremos a cabo aquí,
consideraremos partículas materiales que poseen una masa inercial m0 (masa en reposo).

En el límite clásico, si la partícula tiene una velocidad no-relativista en las coordenadas de la


métrica:

ds² = (1 + 2φ/c²) (cdt)² - (1 - 2φ/c²) (dx² + dx² + dz²)

podemos encontrar una forma aproximada para la ecuación geodésica. Consideraremos primero
la componente que corresponde a la primera coordenada, la coordenada temporal, cuya
ecuación geodésica será:

En virtud de tratarse de una partícula no-relativista, podemos considerar a la componente


temporal de 4-momentum, p1, mucho mayor que cualquiera de las componentes espaciales del
4-momentum pi, o sea p1 » pi. Esto podemos verlo de la relación relativista fundamental para el
4-momentum:

p = (pα) = γm0(Uα) = (γm0c, γm0u) = (γm0c, γm0ux, γm0uy, γm0uz)

p = γm0(c, ux, uy, uz)

Esto significa que podemos ignorar en la sumatoria (requerida en los índices repetidos por la
convención de sumación) términos que incluyan a p2, p3 y p4, términos tales como:

Γ122(p2)²

Por otro lado, puesto que estamos considerando una partícula material moviéndose a
velocidades suficientemente bajas en comparación con la velocidad de la luz, tenemos entonces
que V/c « 1, con lo cual:

γ = 1/√1 - V²/c² ≈ 1

Esta aproximación tendrá como consecuencia que el factor γ no aparecerá en nuestros


resultados finales.

Trabajaremos a continuación sobre el primer término de la primera ecuación geodésica, con la


notación:

Tenemos entonces, usando las aproximaciones ya señaladas:


Puesto que estamos considerando partículas materiales clásicas moviéndose a velocidades
suficientemente bajas en comparación con la velocidad de la luz, tenemos entonces que:

Δt = γΔτ ≈ Δτ

De este modo, tenemos lo siguiente:

Es así como la ecuación geodésica para la primera coordenada (la coordenada temporal) puede
ser escrita como la siguiente aproximación relativista a la mecánica clásica:

Esto nos requiere calcular el símbolo de Christoffel Γ111, lo cual se puede hacer con la fórmula
general que define a los símbolos de Christoffel de segundo género (obsérvese la permutación
cíclica de los índices siguiendo el sentido de las manecillas del reloj de término a término dentro
de los paréntesis)::

Puesto que la métrica g es diagonal, tanto [gαβ] como [gαβ] son diagonales, y los elementos
diagonales de [gαβ] son los recíprocos de [gαβ]. De este modo, g1β tiene un valor diferente de cero
únicamente para β = 1, de modo tal que siendo g11 = 1 + 2φ/c² la fórmula general para Γ111 se
reduce simplemente a:

en donde O([φ/c²]²) agrupa otros términos en del orden cuadrático y mayores, los cuales
consideraremos despreciables.

Tenemos ya la expresión que corresponde al símbolo de Christoffel Γ111 para la métrica. Al nivel
de orden más bajo en la velocidad y en φ, podemos reemplazar a (p1)² en la expresión:

por m0²c² recordando la igualdad que vimos en nuestra introducción de los 4-vectores:

(E/c)² - p² = m0²c²

así como por el valor que acabamos de obtener para Γ 111 llegando entonces a lo siguiente:

dp1/dτ = - m0 ∂φ/dτ
Esto nos dice que para un campo gravitacional φ que no está variando con el tiempo, o sea:

∂φ/dτ = 0

se tiene entonces que dp1/dτ = 0, o sea que p1 tampoco varía con el tiempo. Puesto que p1es la
componente temporal del vector 4-momentum que representa la energía de la partícula, esto
significa que la energía se conserva a menos de que el campo gravitacional esté variando con
el tiempo. Este es el mismo resultado que se obtiene en la mecánica clásica Newtoniana,
la conservación de la energía en un campo gravitacional.

En la física clásica, un asunto de la mayor prioridad lo constituyen las cantidades que son
conservadas, tales como la masa, la energía, la cantidad de momentum angular en un
movimiento circular y la carga eléctrica de un cuerpo. Del mismo modo, en la Teoría de la
Relatividad obviamente estamos interesados en el estudio de los cuerpos en movimiento, y ello
incluye a las cantidades que se puedan conservar en el curso del movimiento de un cuerpo de un
punto a otro ya sea en un espacio tri-dimensional (Newtoniano), en un 4-espacio relativista, o
en un espacio N-dimensional general (lo cual es matemáticamente posible). En lenguaje
sofisticado, usualmente nos referimos a tales cosas como isometrías, que son maneras de
mover las cosas de modo tal que preserven su tamaño y su forma. Una manera de hacerlo, a lo
largo de una ruta geodésica, es mediante el uso de los vectores Killing. Un ejemplo sencillo de
esto lo tenemos si a la longitud geográfica cada punto de la costa de Africa le sumamos 30
grados, lo cual tiene como única consecuencia la rotación del continente alrededor del globo
terráqueo (a lo largo del Ecuador) sin alterar su tamaño ni su forma. En cambio, si sumamos 30
grados a la latitud de cada punto, la forma del continente se distorsionaría de manera notable.
El vector coordenada longitud es un vector Killing, mientras que el vector coordenada latitud no
lo es. Como otro ejemplo de un campo vectorial Killing tenemos a un campo vectorial en un
círculo que apunta en sentido contrario a las manecillas del reloj y que tiene la misma longitud
en cada punto, puesto que al mover a cada punto del círculo a lo largo de dicho campo vectorial
tal cosa tiene como único efecto la rotación del círculo sin alterar nada. Expresado en forma
sencilla y más general, un campo vectorial Killing es simplemente un campo vectorial que
preserva la métrica g. Cada campo vectorial Killing implica la existencia de una cantidad que se
conserva a lo largo de una ruta geodésica. Otra forma (más geométrica) de verlo es como un
campo vectorial sobre una hoja Riemanniana que preserva el tensor métrico. Formalmente, el
campo vectorial de Wilhelm Karl Joseph Killing (conocido más comunmente como el campo
vectorial de Killing) es simplemente un vector V = (Vα) para el cual si se satisface la siguiente
ecuación a lo largo de una ruta geodésica:

entonces a lo largo de dicha geodésica tendremos una cantidad conservada pα tal que:

pαVα = constante

Como podemos verlo en el uso del semicolon en los sub-índices de la ecuación que define al
campo vectorial Killing, la definición se basa totalmente en la definición de la derivada
covariante. En virtud de que un vector Killing está definido siempre a lo largo de una ruta
geodésica, recordando la definición que se dió de la derivada Lie en la entrada titulada “La
derivada absoluta” no debe sorprendernos el hecho de que al vector de Killing se le pueda dar
una definición matemática elegante y concisa como un campo vectorial V para el cual la
derivada Lie de la métrica g con respecto a V se desvanece:

Un campo vectorial de Killing está determinado de manera única por un vector en cada punto y
por su gradiente en dicho punto, o sea por todas las derivadas covariantes del campo de Killing
en dicho punto.

En una región del espacio-tiempo en donde para fines prácticos hay una ausencia notoria de
masa-energía, con el consecuente hecho de que todas las 16 componentes del tensor energía-
tensión T = (Tμν) son iguales a cero, la ecuación tensorial básica de la Relatividad General:

G = 8πGT

adquiere la forma:

G=0

en donde 0 es el tensor cero 0. Pero el tensor de curvatura de Einstein G es igual a:

G = R - ½gR
en donde R = (Rμν) es el tensor de curvatura de Ricci, R es el escalar de Ricci y g = (gμν) es
el tensor métrico. Entonces:

R - ½gR = 0

o bien:

R = ½gR

Puesto que el escalar de Ricci R es un simple número, vemos que en el espacio vacío el tensor de
Ricci es esencialmente equivalente al tensor métrico.

Es muy importante tener en cuenta que, aunque el escalar de Ricci sea un simple número, es un
número que generalmente hablando dependerá del lugar específico en el espacio-tiempo curvo
que esté bajo consideración. Así, mientras que para un punto específico (x1, x2, x3, x4) el escalar
de Ricci poseerá el valor numérico a, en otro punto diferente (x’1, x’2, x’3, x’4) el escalar de Ricci
podrá poseer otro valor numérico b. En efecto, el escalar de Ricci representa un campo escalar,
un campo escalar que convive con el campo tensorial en el cual está situado el espacio-tiempo
curvo que estamos analizando.

Orbitas planetarias relativistas


Uno de los primeros triunfos de la ley de la gravitación universal de Newton fue que a partir de
la misma era posible derivar matemáticamente, con la ayuda de coordenadas polares, las tres
leyes obtenidas empíricamente por Johannes Kepler en 1609 y en 1618 para explicar el
movimiento de los planetas en sus órbitas alrededor del Sol.

Las tres leyes de Kepler

Primera Ley (1906): Todos los planetas se desplazan alrededor del Sol describiendo órbitas
elípticas, estando el Sol situado en uno de los focos.

Segunda Ley (1906): El radio vector que une el planeta y el Sol barre áreas iguales en tiempos
iguales (de acuerdo con esta ley, el planeta orbitante en la figura de abajo se mueve más rápido
del punto J al punto A que del punto D al punto E, siendo las áreas sombradas del segmento AJ
y del segmento DE iguales) :
Tercera Ley (1906): Para cualquier planeta, el cuadrado de su período orbital (tiempo que tarda
en dar una vuelta alrededor del Sol) es directamente proporcional al cubo de la distancia media
con el Sol.

Kepler dedujo sus leyes a partir de observaciones astronómicas precisas obtenidas por Tycho
Brahe, y aunque sabía que explicaban el movimiento planetario observado, no entendía las
razones de este comportamiento.

En su libro conocido en castellano como “El sistema del mundo”, haciendo mención a la
siguiente figura que aparece en su libro:
Newton se expresó de la siguiente manera al predecir por vez primera la posibilidad del
hombre para poder crear satélites artificiales: “Si consideramos los movimientos de los
proyectiles podremos entender fácilmente que los planetas pueden ser retenidos en ciertas
órbitas mediante fuerzas centrípetras; pues una piedra proyectada se va apartando de su senda
rectilínea por la presión de su propio peso y obligada a describir en el aire una curva, cuando en
virtud de la sola proyección inicial habría debido continuar dicha senda recta, en vez de ser
finalmente atraída al suelo; y cuanto mayor es la velocidad con la cual resulta ser proyectada
más lejos llega, antes de caer a tierra. Podemos por eso suponer que la velocidad se incremente
hasta que la piedra describa un arco de 1, 2, 5, 10, 100, 1000 millas antes de caer, de forma que
al final, superando los límites de la Tierra, pasará al espacio sin tocarla... En la figura, se
representa las curvas que un cuerpo describiría si fuese proyectado en dirección horizontal
desde la cima de una alta montaña a más y más velocidad. Puesto que los movimientos celestes
no son prácticamente retardados por la pequeña o nula resistencia de los espacios donde tienen
lugar, supongamos, para conservar la analogía de los casos, que en la Tierra no hubiera aire, o al
menos que éste está dotado de un poder de resistencia nulo o muy pequeño. Entonces, por la
misma razón que un cuerpo proyectado con menos velocidad describe el arco menor y,
proyectado con más velocidad, un arco mayor, al aumentar la velocidad, terminará por llegar
bastante más allá de la circunferencia de la Tierra, retornando a la montaña desde la que fue
proyectada. Y puesto que las áreas descritas por el movimiento del radio trazado desde el centro
de la Tierra son proporcionales a su tiempo de descripción, su velocidad al retornar a la
montaña no será menor que al principio, por lo que reteniendo la misma velocidad, describirá la
misma curva una y otra vez, obedeciendo a la misma ley”.

Antes de entrar en el estudio de las orbitas planetarias desde el punto de vista de la Relatividad
General, haremos un repaso sobre cómo es posible obtener las leyes de Kepler a partir de la ley
de la gravitación universal de Newton.

Clásicamente, para el análisis del movimiento de un cuerpo que siempre se está moviendo bajo
la influencia de una fuerza que siempre está dirigida hacia un punto central, se recurre al uso de
coordenadas polares con el origen de las mismas coincidiendo con el centro de la fuerza,
dejando abierta la posibilidad de que la órbita pueda ser circular o elíptica. En coordenadas
polares, la componente radial de una aceleración es:

y la componente transversal (angular) de la aceleración es:

Puesto que la fuerza es completamente radial por estar dirigida hacia el centro de atracción que
coincide con el origen del sistema de coordenadas, se concluye que la aceleración transversal
debe ser cero, o sea aθ = 0, con lo cual:

Integrando la expresión:

Este es precisamente el enunciado matemático de la segunda ley de Kepler, que nos dice que la
línea imaginaria que une a un planeta con el Sol barre áreas iguales en tiempos iguales. La
constante de integración resulta ser h, el momento angular L del planeta por unidad de masa M.
Entonces:

Aquí se ha introducido, siguiendo la costumbre usual, la variable auxiliar:

La fuerza radial f(r) por unidad de masa debe ser igual a la aceleración radial que se ha definido
arriba, de acuerdo con la segunda ley de Newton F = ma. Resolviendo la ecuación diferencial de
arriba con respecto al tiempo nos dá:

Aquí es precisamente en donde entra en acción la ley de la gravitación universal de Newton que
nos dice que la fuerza de atracción gravitatoria entre dos cuerpos es igual a la inversa del
cuadrado de la distancia que separa dichos cuerpos. Entonces (la masa m del planeta orbitante
no aparece explícitamente porque la fuerza ha sido designada como la fuerza por unidad de
masa):

siendo G la constante de gravitación universal y M la masa del cuerpo central que en este caso es
el Sol. Substituyendo en la ecuación anterior obtenemos lo siguiente:

Obsérvese que el lado derecho de la ecuación es igual a una constante, en virtud de que la G, M y
h son constantes (la constancia de h deviene del principio de la conservación del momento
angular). De este modo, para una fuerza de carácter gravitacional, o en general para cualquier
fuerza cuya magnitud disminuya en razón inversa del cuadrado de la distancia, el lado derecho
de la ecuación será una constante fija. Resolviendo esta ecuación diferencial obtenemos la
siguiente solución:

en donde A y θ0 = son constantes arbitrarias que nos resultan de la integración.

La ecuación para la órbita descrita por la partícula (o el planeta) es entonces:

en donde e está definida como:

Esta es una solución que puede ser reconocida como la ecuación de una sección cónica
expresada en coordenadas polares (r,θ). Aquí podemos hacer la siguiente identificación:

Para el caso que nos ocupa, tratándose de una trayectoria cerrada ésta debe ser una trayectoria
elíptica, con el centro de la fuerza ocupando uno de los focos de la elipse. Este es precisamente el
enunciado matemático de la primera ley de Kepler.

Pero en la Relatividad General, la fuerza de la gravedad deja de existir, llevándose consigo a los
museos a la ley de la gravitación universal de Newton. Ahora todo se explica en base a la
curvatura del espacio-tiempo. Ya hemos visto que la presencia de toda masa-energía ocasiona
una curvatura cuatri-dimensional en lo que de otras maneras sería un espacio-tiempo plano,
capaz de desviar la trayectoria de un rayo de luz o de un cuerpo material que pase cerca de dicho
cuerpo. Pero la curvatura cuatri-dimensional que puede ocasionar una masa-energía no sólo es
capaz de “pandear” el espacio-tiempo en torno a ella en una forma capaz de desviar la
trayectoria de los cuerpos que pasan cerca de ella como ocurre con los cometas que pasan cerca
del Sol. La curvatura puede ser tal que inclusive el espacio-tiempo es capaz de cerrarse sobre sí
mismo:

Un espacio-tiempo cerrado sobre sí mismo como el que vemos arriba en la figura de la derecha
representa una superficie en la cual el potencial gravitacional Newtoniano clásico tiene el mismo
valor. Una superficie tal es precisamente la que recorren los cuerpos en órbita como ocurre con
la Luna girando en torno a la Tierra o los planetas girando en torno al Sol, si tienen la
suficiente energía cinética para poder mantenerse viajando sobre dicha superficie. Y como
debe ser obvio, bajo el concepto relativista de la curvatura del espacio-tiempo la fuerza de
atracción universal entre dos cuerpos propuesta por Newton no existe, no hay fuerza
de atracción tal, todo lo que hay son curvaturas en el espacio-tiempo 4-dimensional del
Universo.

El problema fundamental con el nuevo esquema es que inclusive con dos cuerpos de masas
diferentes aproximándose el uno al otro no necesariamente compartiendo un mismo plano de
movimiento es que cada uno de ellos introduce su propia curvatura en el espacio-tiempo del
Universo, y la interacción entre ambas curvaturas del espacio-tiempo conforme se van
desplazando al irse aproximando los cuerpos que originan dichas curvaturas se convierte en un
problema de difícil solución matemática excepto para casos especiales (como el caso de dos
cuerpos de la misma masa orbitando como un sistema binario como si fuesen los extremos de
una mancuerna girando libremente sobre su eje de rotación así como los demás casos que
involucren algún tipo de simetría), el cual de hecho no tiene solución matemática exacta de
carácter general, y frecuentemente es necesario recurrir a simulaciones computarizadas a partir
de condiciones iniciales muy específicas para poder resolver un problema. Si en el esquema
propuesto por Newton excepto para casos especiales la interacción gravitacional entre tres
cuerpos era matemáticamente irresoluble (este es el problema conocido como el problema de
los tres cuerpos) dando lugar a comportamientos como el que se muestra en el siguiente
diagrama (la trayectoria de cada uno de los tres cuerpos está dibujada en color diferente) que
son precisamente los que dan origen a la teoría del caos:
en el esquema propuesto por Einstein la interacción entre dos curvaturas del espacio-tiempo no
necesariamente iguales (producidas por cuerpos con la misma masa) conforme se van
aproximando los cuerpos se vuelve insoluble por procedimientos analíticos exactos. La única
forma en la cual se puede resolver un problema analíticamente sin el beneficio de una
computadora es recurriendo a aproximaciones.

En el caso del sistema solar, la primera aproximación obvia consiste en suponer que, debido a
que la masa del Sol es mucho mayor que la masa de cualquiera de los planetas que giran en
torno suyo (lo cual equivale a decir que la gravedad de cada uno de los planetas no tiene efectos
significativos sobre el mismo Sol permitiendo anclar al Sol como un centro inamovible), la única
curvatura apreciable en el espacio-tiempo del sistema solar es la introducida por el mismo Sol;
del mismo modo en que podemos suponer que la curvatura producida en el espacio-tiempo en
torno a la Tierra por los satélites artificiales lanzados por el hombre es mucho menos que la
curvatura en el espacio-tiempo producida por la misma Tierra con la cual mantiene a sus
satélites girando en torno suyo. Este tipo de aproximación fue precisamente lo que Einstein
llevó a cabo cuando descubrió un efecto imposible de ser predicho por Newton para un sistema
solar consistente en un solo sol y en un solo planeta: la precesión de las órbitas del planeta
Mercurio que está girando en torno al sol. Las órbitas predichas de acuerdo con la ley de la
gravitación universal de Newton son órbitas perfectamente elípticas por toda la eternidad, con la
elipse orbitan manteniéndose exactamente en el mismo lugar por siempre. Esta es una situación
en la cual las ecuaciones del movimiento planetario de la Relatividad General no pueden ser
simplificadas para aproximar una predicción de por sí ausente en la mecánica celestial
Newtoniana. Aquí no se puede llevar a cabo ninguna reducción a un límite clásico que no existe.
La única forma bajo el esquema de Newton de producir una precesión en la órbita de un planeta
que esté girando en torno a una estrella es introducir un segundo planeta que influya
gravitacionalmente en el otro planeta. Bajo el esquema de Newton, tal cosa ocurre por sí sola sin
la necesidad de introducir planetas adicionales.

Todos los planetas girando en torno al Sol tendrán una precesión en sus órbitas de acuerdo a la
Relatividad General. Sin embargo, estos efectos sólo adquieren importancia tratándose de
planetas como Mercurio que estén lo suficientemente cerca del Sol como para que los efectos
relativistas puedan salir a relucir.

En la Relatividad General, suponiendo que tenemos un cuerpo central de masa M al cual


consideramos fijo, la ecuación de movimiento relativista planetario para una partícula
de prueba resulta estar dada por la fórmula:

en donde:

α = 3μ/c²

μ = GM

y los demás símbolos son como los que se han definido previamente.

La derivación de la ecuación de movimiento relativista, como el lector posiblemente lo sospecha


ya, se hace a partir de la métrica sin recurrir a ninguna “fuerza de gravedad”, empleando para
ello una métrica apropiada que describa una solución con simetría esférica a las ecuaciones de
campo de Einstein, siendo la métrica de Schwarzschild una de las más utilizadas para tal efecto.
El lector debería tomar una pausa para comparar la ecuación de movimiento planetario
relativista con la ecuación de movimiento planetario clásico.

A continuación llevaremos a cabo la derivación de un efecto relativista relacionado con las


órbitas planetarias: la precesión anómala de los planetas en sus órbitas en torno al Sol. Y lo
haremos en una forma muy parecida a como lo hizo Einstein en su tiempo, sin contar con el
beneficio de la solución exacta de Schwarzschild, recurriendo obviamente a aproximaciones.

En principio, todos los planetas del sistema solar poseen una precesión lenta de sus órbitas que
impide que dichas órbitas sean perfectamente elípticas. En parte, esta precesión de las órbitas
puede ser explicada con la mecánica Newtoniana mediante la influencia gravitacional causada
por la presencia de los otros planetas del sistema solar. Pero en el caso de Mercurio, el planeta
más cercano al Sol, la precesión es mayor de una manera que no puede ser explicada
recurriendo a las fórmulas de Newton.

La solución aproximada encontrada por Einstein en 1915 difiere en el componente grr de la


métrica “diagonal” especificada por la solución exacta dada por Karl Schwarzschild para un
campo esféricamente simétrico:

ds² = gtt dt² + grr dr² + gθθ dθ + gφφ dφ²

ds² = (1 - 2GM/rc²) dt² + [1 - 2GM/rc²] -1 dr² + r² dθ + r² sen² θ dφ²

por el factor q = 1-(2GM/rc²) de la manera siguiente:

Como ya se ha dicho y se volverá a repetir aquí, todo el secreto de las soluciones a las ecuaciones
de campo de la Relatividad General está en la métrica que se utilice, todo deriva de la métrica.
Schwarzschild encontró una métrica exacta, pero Einstein sin contar con la solución exacta
decidió probar su suerte sin tomar en cuenta el factor q. El error que se comete equivale a una
diferencia de segundo orden para 2GM/rc². Usando su métrica aproximada para un campo en
el vacío esféricamente simétrico, Einstein hizo algo que se puede hacer de inmediato cuando se
tiene una métrica a la mano: evaluó los símbolos de Christoffel; tras lo cual dió el siguiente paso
que se puede hacer una vez que se tiene a los símbolos de Christoffel a la mano: escribió las
ecuaciones geodésicas del movimiento. De este modo llegó directamente (tal y como se
acostumbra hacerlo en libros de texto contemporáneos) a la siguiente ecuación:

en donde x = 1/r es la inversa de la distancia radial al Sol, φ es la coordenada angular del plano
de la órbita, los símbolos A y B son constantes de integración (B resulta ser el momento angular
y A es una cantidad relacionada con la energía del cuerpo en órbita) y α = 2M en donde M es la
masa del Sol en unidades geometrizadas. Si utilizamos la métrica exacta de Schwarzschild, esta
ecuación sería exacta con q = 1, pero con la métrica aproximada de Einstein el valor de q viene
siendo 1 - α²x². Dividiendo entre q, o lo que viene siendo lo mismo, multiplicando por 1 + α²x²,
la ecuación basada en la métrica aproximada de Einstein resulta ser:

Afortunadamente, Einstein reconoció que podía hacer q = 1 sin afectar el resultado Newtoniano
de orden más bajo (o sea, el efecto más significativo), de modo tal que procedió a utilizar
directamente la ecuación:

que es precisamente la ecuación correcta y exacta, aunque Einstein creía que era tan solo una
aproximación. A partir de este punto, la mayoría de las demostraciones modernas llevan a cabo
una diferenciación de esta ecuación con respecto a φ, lo cual nos produce una ecuación
“harmónica” de segundo orden de la cual se puede inferir la precesión relativista del perihelio
del planeta. Sin embargo, Einstein en lugar de hacer esto tomó la raíz cuadrada de la inversa de
ambos lados de la ecuación, produciéndose con ello la integral elíptica del desplazamiento
angular entre los dos parámetros radiales inversos extremos x1 y x2 (al decir extremos, nos
estamos refiriendo al apogeo, la distancia a la cual el cuerpo en órbita se encuentra más alejado,
y al perigeo, la distancia a la cual el cuerpo en órbita se encuentra más cercano, aunque
tratándose del Sol las palabras correctas vendrían siendo afelio y perihelio):

Y por cierto, en caso de que llevásemos a cabo la integración sobre la distancia radial r en lugar
de llevarla a cabo sobre la distancia radial inversa x, obtendríamos un factor de r² en el
denominador, en virtud de que dx = -dr/r².

Determinar una solución explícita exacta en términos de funciones elementales para la integral
elípítica que tenemos arriba no es algo que generalmente se pueda llevar a cabo, de modo tal que
esta vía de solución no se antoja muy factible. De cualquier modo, Einstein pudo aproximar a la
integral elíptica con el grado de precisión requerido. Para lograrlo, hizo uso del hecho de que los
límites de la integración, x1 y x2, representan los recíprocos de las distancias del afelio y del
perihelio en donde la derivada de r con respecto a φ se desvanece. Por lo tanto, tenemos que
integrar entre dos cúbicas bajo el signo del radical. Tal y como lo hizo Einstein en su papel
original, designaremos a estas dos raíces α1 y α2. Designaremos también como α3 a la tercera
raíz, de modo tal que podemos escribir el polinomioque está bajo el signo de la raíz cuadrada de
la manera siguiente:

Puesto que el coeficiente de x² en el polinomio mónico en el lado izquierdo es 1/α, tenemos


entonces:

De este modo, el producto de α y de α3 se puede expresar de la manera siguiente:

Más aún, notando que las cantidades αx, αα1 y αα2 son extremadamente pequeñas en
comparación con la unidad (esto viene del hecho de que cada una de ellas es aproximadamente
igual al doble de la masa solar en unidades geometrizadas, que viene siendo una cantidad un
poco menor que 1.5 kilómetros, divida entre el radio de la órbita de Mercurio, que es de
aproximadamente 55 millones de kilómetros), podemos ver que el denominador 1 - αx en el
segundo factor representa una corrección del orden de (αx)² al factor total, de modo tal que se
puede considerar despreciable. De este modo, sin pérdida considerable de precisión, podemos
escribir:

α(x - α3) ≈ (αx - 1) [1 - α(α1 + α2)]

y por lo tanto la integral elíptica se puede escribir de la siguiente manera:

Haciendo uso de la aproximación (1  z)1/2 ≈ 1 + z/2 para valores pequeños de z, podemos


sacar el factor constante fuera de la integral, y subir el factor final, de modo tal que la integral se
puede escribir del modo siguiente:

Esta es una integral analítica, que puede ser evaluada en forma cerrada, dando como resultado:

Esta es la distancia angular del arco del apogeo (afelio) al siguiente perigeo (perihelio), de modo
tal que la longitud total del arco de un ciclo completo de un perigeo (perihelio) al siguiente es el
doble de esta cantidad, y si substraemos 2π obtenemos la precesión por ciclo. Esta es
precisamente la precesión relativista que tan afanosamente estaba buscando Einstein. El tercer
término es despreciable, de modo que tenemos el siguiente resultado:
en donde L es el semi-latus rectum de la elipse de la órbita. Metiendo valores para la masa M del
Sol en unidades geometrizadas (1.475 kilómetros) y el semi-latus rectum para la órbita de
Mercurio en torno al Sol que es 55.4430 millones de kilómetros, esto nos dá 0.1034 arcos de
segundo por revolución, y puesto que Mercurio acumula un total de 414.9378 revoluciones en
torno al Sol por siglo, esto nos dá 42.9195 segundos de arco por siglo, lo cual concuerda de
modo excelente con las observaciones astronómicas. Este fue el primer gran triunfo de la
Relatividad General, pudiendo aclarar algo que la mecánica Newtoniana simple y sencillamente
era incapaz de explicar.

La demostración llevada a cabo parecería depender de un conocimiento previo de la integral


indefinida:

pero hay que tomar en cuenta que la expresión del lado derecho (la que se obtiene tras llevarse a
cabo la integración) se simplifica considerablemente con la substitución de b o cpor la variable
x, porque para cualquiera de estos dos argumentos el segundo término se desvanece, y el primer
término se reduce a lo siguiente:

Por lo tanto, la integral definida de x = b a x = c es simplemente:

Podemos ver que en el caso a = 0 la integral definida es simplemente igual a π. Este es un


resultado tan elegante que muy posiblemente formaba parte ya del curriculum escolar de
materias al finalizar el siglo XIX, y es muy posible que Einstein (o Michele Besso o Marcel
Grossman, los dos colegas matemáticos de Einstein siempre disponibles para proporcionarle
ayuda) haya tenido conocimiento acerca de esta integral definida. Por otro lado, no es muy
difícil evaluar esta integral directamente si llevamos a cabo un cambio de variables a la variable
ω en base a la siguiente relación:

La variable x cambia de b a c conforme la variable ω cambia de - π/2 a + π/2. Tomando


diferenciales, de esta misma expresión obtenemos lo siguiente:

La substitución de esto último en la integral definida nos dá:

La integral de un término seno es un término coseno, que termina dando los mismos valores
para los límites ω = ± π/2, de modo tal que esto se desvanece dejándonos únicamente con la
ecuación:

Una discusión sobre la explicación relativista de la precesión anómala de Mercurio en torno al


Sol utilizando la métrica exacta de Schwarzschild deberá esperar a que se cubra el tema de la
solución de Schwarzschild, lo cual se llevará a cabo posteriormente.

La solución de Schwarzschild I
La solución de Schwarzschild a las ecuaciones de campo de Einstein debe ser considerada el más
importante logro de la Relatividad General en el campo de la Mecánica Celeste, porque es una
solución exacta a las ecuaciones de campo que se corresponde históricamente con el resultado
Newtoniano de la inversa del cuadrado de la fuerza de atracción universal de la teoría
gravitacional clásica.

Las ecuaciones de campo de Einstein para el espacio libre son no-lineales y por lo tanto muy
complicadas, siendo difícil obtener soluciones exactas. Hay, sin embargo, un caso especial que
puede resolverse sin muchas dificultades, el caso de un campo simétricamente
esférico y estático producido por un cuerpo esféricamente simétrico en reposo.

El punto de partida usual para una demostración como la que llevaremos a cabo será la métrica
general utilizada en el 4-espacio de la Relatividad General, aplicándose como siempre la
convención de sumación sobre los índices repetidos:

ds² = gαβ dxα dxβ

en el sistema de cuatro coordenadas generalizadas (x 0 ,x1 ,x2 ,x3). La forma límite del elemento
de línea ds² para un espacio-tiempo plano a grandes distancias del origen (r→∞) debe ser
Lorentziana, y de acuerdo a lo que vimos al estudiar la Teoría Especial de la Relatividad lo
debemos escribir como:

ds² = c²dt² - dx² - dy² - dz²

En pocas palabras, la Teoría Especial de la Relatividad es un caso especial de la Relatividad


General cuando la curvatura del espacio-tiempo se reduce a cero a grandes distancias. Esta
expresión la podemos escribir mediante coordenadas esféricas como:

ds² = c²dt² - (dr² + r² dθ² + r² sen² θ dφ²)

Para construír nuestro elemento de línea ds² que corresponde a la solución de Schwarzschild
válida a distancias cercanas al origen de un campo estático, esperamos que dicho elemento de
línea permanezca invariante bajo una inversión del intervalo de tiempo dt; esto es, ds² debe
permanecer igual al cambiar dt por -dt, ya que la condición estática nos permite utilizar un
sistema de coordenadas estático en donde los componentes gμν de la métrica son independientes
de la coordenada tiempo (t = x0). Esto nos dicta el uso de coordenadas curvilíneas en las cuales
los elementos g0i “fuera de la diagonal principal” sean cero y que el elemento de línea tenga la
forma:

g00(dt)² + gik dxi dxk

siendo los gik independientes de la coordenada tiempo t = x0. Nos referimos a esto como una
métrica estática, la cual debe ser distinguida de una métrica que es meramente independiente
del tiempo o estacionaria (como la métrica para las coordenadas cilíndricas en un espacio de
tres dimensiones).

Por otra parte, si no habrá una dirección angular preferida en el espacio, el elemento de línea
ds² debe ser independiente de un cambio de dθ a -dθ y de un cambio de dφ a -dφ. Esto requiere
que no haya términos “cruzados” en la métrica tales como dr·dθ, dθ·dφ y dr·dφ, de modo tal que
el tensor métrico debe ser completamente diagonal para el tipo de solución que estamos
buscando. La forma más general que se sujeta a las condiciones arriba viene siendo la siguiente:

ds² = Ac²dt² - (Bdr² + Cr² dθ² + Dr² sen² θ dφ²)

En virtud de nuestras suposiciones de simetría radial, las funciones A, B, C y D deben ser


funciones únicamente de la coordenada radial r:

A = A(r)____B = B(r)____C = C(r)____D = D(r)

Podemos llevar a cabo una simplificación adicional recurriendo a argumentos de simetría:


podemos suponer que las funciones C(r) y D(r) son iguales. Esto lo podemos visualizar de la
manera siguiente: un desplazamiento de arco ε = rdθ desde el polo norte corresponde a un
intervalo en el elemento de línea ds² = -Cε², y un desplazamiento de arco ε = rdφ a lo largo del
ecuador corresponde a un intervalo en el elemento de línea ds² = -Dε². Si θ y φ representan
coordenadas angulares, esperaríamos que estas cantidades fueran iguales por isotropía, lo cual
requiere que C sea igual a D. Entonces esta condición de simetría nos simplifica nuestro
elemento de línea ds² a la siguiente forma:

ds² = Ac²dt² - Bdr² - C(r² dθ² + r² sen² θ dφ²)

Este elemento de línea representa la forma más sencilla posible dictada por los elementos de
simetría. Podemos obtener una simplificación adicional mediante una selección juiciosa de la
coordenada radial.
Enfoquemos ahora nuestra atención sobre los coeficientes A y B de la expresión. Tenemos que
suponer que estos coeficientes no van a ser necesariamente unas simples constantes numéricas.
Tenemos que suponer que van a resultar ser algún tipo de función. Independientemente de qué
tipo de expresión resulten ser, de una cosa podemos estar absolutamente seguros: la métrica de
Schwarzschild se tiene que reducir necesariamente a la de una métrica plana para un
observador en reposo situado en el “infinito” (al usar aquí la palabra “infinito” estamos haciendo
alusión a una distancia lo suficientemente grande como para que los efectos ocasionados por la
masa sobre el campo gravitacional sean numéricamente insignificantes, ya que de lo contrario el
efecto gravitacional ocasionado por un cuerpo se extendería hasta el infinito). Y esta métrica es:

ds² = c²dt² - dx² - dy² - dz²

En pocas palabras, tanto A como B, ambas funciones de la distancia r (por hipótesis), se tienen
que reducir a la unidad a una distancia enorme del cuerpo que ocasiona la curvatura en el
espacio tiempo:

A(r) → 1 para r → ∞

B(r) → 1 para r → ∞

No tenemos que batallar mucho para encontrar una función matemática tentativa que se
reduzca a la unidad para valores grandes de la variable independiente. Esta función es la función
matemática exponencial:

f(x) = ex
Para grandes valores negativos de x, esta función se reduce precisamente a la unidad. La
función exponencial tiene además el atractivo de que se puede desarrollar fácilmente mediante
series de Taylor. Aunque cualquier función exponencial del tipo a bx tiene la propiedad de que se
puede reducir a la unidad para valores razonablemente grandes de x, la función exponencial
basada en el número e (la base de los logaritmos naturales) tiene además el atractivo de que la
derivada de la función exponencial nos resulta esencialmente en la misma función (a excepción
del signo), lo cual se puede traducir en posibles simplificaciones.

Con lo anterior en mente, puesto que requerimos que tanto A como B se reduzcan a la unidad
para grandes valores de r, le podemos asignar a ambas un carácter exponencial de la siguiente
manera con exponentes dependientes de r:

A(r) = eΦ(r)

B(r) = eΛ(r)

Para que se pueda cumplir el requisito de que los coeficientes A y B se reduzcan a la unidad a
grandes distancias, esto requiere que los exponentes Φ(r) y Λ(r) se reduzcan a cero a grandes
distancias:

Φ(r) → 0 para r → ∞

Λ(r) → 0 para r → ∞

Como el campo gravitacional en torno a una masa simétricamente esférica debe ser también
simétricamente esférico, dicho campo debe ser independiente de las coordenadas angulares θ y
φ, de modo tal que las posibilidades:

Φ = Φ(t, r, θ, φ)

Λ = Λ(t, r, θ, φ)

deben quedar reducidas necesariamente a:

Φ = Φ(t, r)

Λ = Λ(t, r)

Y como el campo gravitacional, además de ser esféricamente simétrico, también debe ser un
campo estático invariante con el tiempo, entonces dicho campo debe ser también independiente
de la coordenada temporal t, con lo cual:

Φ = Φ(r)

Λ = Λ(r)

que es precisamente lo que hemos venido manejando.

Las funciones Φ(r) y Λ(r) nos son por el momento funciones desconocidas a ser determinadas.
Sin pérdida de generalidad, podemos multiplicar estas funciones por una constante numérica
sin cambiar la naturaleza del comportamiento de las funciones a grandes distancias. La
constante numérica que más nos conviene es el número 2 para tener así lo siguiente:

A(r) = e2Φ(r)

B(r) = e2Λ(r)

¿Y por qué el número 2? Por el simple hecho de que, si nos fijamos bien en los términos
restantes de nuestra métrica preliminar, podemos ver que todos ellos están elevados al
cuadrado. La razón por la cual escogemos e 2Φ y e2Λ en lugar de comenzar simplemente con eΦ y
eΛ es precisamente porque todos los demás términos de la métrica están elevados al cuadrado, y
tomar esto en cuenta desde un principio puede resultar en simplificaciones posteriores.
De este modo, la métrica tentativa para un campo simétricamente esférico y estáticoproducido
por un cuerpo esféricamente simétrico en reposo tendrá el siguiente aspecto:

ds² = e2Φ(r) (cdt)² - e2Λ(r)dr² - r² dθ² - r² sen² θ dφ²

Una vez definida nuestra métrica tentativa, podemos obtener a continuación los símbolos de
Christoffel diferentes de cero que correspondan a esta métrica.

PROBLEMA: Obtener los símbolos de Christoffel para una hoja cuyo elemento de línea es el
siguiente:

ds² = e2Φc²dt² - e2Λdr² - r²(dθ² + sen²φ dφ²)

en donde Φ y Λ son funciones únicamente de la coordenada r, o sea:

Φ = Φ(r)___Λ = Λ(r)

Del elemento de línea ds² podemos ver que las 16 componentes gαβ del tensor métrico
correspondiente:

son:
Las coordenadas de este espacio cuatri-dimensional son (t, r, θ, φ), y las únicas componentes
gαβ del tensor métrico g que no son cero son:

g00 = gtt = e2Φ___g11 = grr = - e2Λ

g22 = gθθ = - r²___g33 = gφφ = - r² sen² θ

Puesto que la matriz [ gαβ] que agrupa a los componentes del tensor métrico es una matriz
diagonal, la matriz [gαβ] que agrupa a los componentes del tensor métrico conjugado también
será una matriz diagonal, y sus elementos respectivos serán simplemente los recíprocos de los
elementos de la matriz [ gαβ]. Por lo tanto, los únicos componentes del tensor métrico
conjugado g-1 que no son iguales a cero son los siguientes:

g00 = gtt = 1/e2Φ= e-2Φ___g11 = grr = - 1/e2Λ = - e-2Λ

g22 = gθθ = - 1/r²___g33 = gφφ = - 1/(r² sen² θ)

Tenemos toda la información que necesitamos para poder obtener los símbolos de Christoffel
para la métrica tentativa que estamos construyendo.

La fórmula general para la obtención de los símbolos de Christoffel es la siguiente (obsérvese la


permutación cíclica de los sub-índices de término a término dentro de los paréntesis):

Γαμν = gαβ (- gμν,β + gνβ,μ + gμβ,ν)/2

o bien, escribiendo explícitamente las derivadas parciales haciendo a un lado la notación de la


coma:

Γαμν = gαβ (- ∂gμν/∂xβ + ∂gνβ/∂xμ + ∂gμβ/∂xν)/2

Con esta fórmula podemos empezar obteniendo el símbolo de Christoffel para Γ111 = Γrrr:

Γrrr = grr (- ∂grr/∂xr + ∂grr/∂xr + ∂grr/∂xr)/2

Γrrr = {- e-2Λ}{- e2Λ·(2Λ’)}/2

Γrrr = Λ’
Puesto que la métrica es una métrica diagonal, en vez de llevar a cabo la evaluación explícita
mediante la fórmula general como lo hemos hecho arriba, podemos utilizar las relaciones de
cálculo abreviado para una métrica diagonal que son las siguientes (¡en estas fórmulas no se
aplica la convención de sumación para índices repetidos!):

Empezaremos con la evaluación del primer símbolo de Christoffel con estas fórmulas
abreviadas, el cual será Γtrr. Esta evaluación será relativamente fácil puesto que todos los
componentes de la métrica son independientes de la coordenada del tiempo en virtud de que
hemos especificado desde el principio a la métrica como una métrica de un campo estático:

Ahora llevaremos a cabo la evaluación del símbolo de Christoffel que corresponde a Γ rtt:
Continuamos con la obtención del símbolo de Christoffel Γttr:

El siguiente símbolo de Christoffel que evaluaremos será Γθθr:

Ahora evaluaremos el símbolo de Christoffel Γrθθ:


El siguiente símbolo de Christoffel que evaluaremos será Γφφθ:

Ahora llevaremos a cabo la evaluación de Γrφφ:

Por último, llevaremos a cabo la evaluación del símbolo de Christoffel Γθφφ::

Con los símbolos de Christoffel en nuestras manos podemos proceder a evaluar los componentes
del tensor de Riemann de segundo género para la métrica de Schwarzschild mediante la
fórmula:
Se recuerda que en esta fórmula para la obtención de las componentes del tensor de Riemann
no aplica la convención de sumación para índices repetidos en lo que representa el símbolo del
lado izquierdo.

A continuación evaluaremos el componente Rtrtr. Para la obtención del mismo necesitaremos lo


siguiente:

Usando estas dos relaciones y utilizando la fórmula para la obtención de los componentes del
tensor de Riemann expandiendo en la misma los productos que involucran a los símbolos de
Christoffel para los cuales sí se aplica la convención de sumación para índices repetidos,
tenemos el siguiente resultado intermedio (los símbolos de Christoffel que son iguales a cero se
han puesto de color rojo):

Substituyendo valores en los símbolos de Christoffel tenemos entonces el siguiente resultado


intermedio:
Simplificando obtenemos entonces el siguiente resultado final:

En el 4-espacio de la Teoría Relatividad, tenemos un total de 4x4x4x4 = 256 componentes


posibles para el tensor de Riemann. Pero ya vimos en una entrada previa que el número total de
componentes independientes es de hecho 21. Pero ni siquiera tenemos que calcular todas estas
21 componentes, ya que lo que estamos buscando obtener eventualmente es el tensor de Ricci, y
si lo obtenemos con la siguiente contracción tensorial en la cual sí se aplica la convención de
sumación sobre el tensor de Riemann mediante índices repeticos:

tenemos entonces que para el tensor de Ricci el cual es un tensor diagonal en este caso hay
cuatro componentes del mismo que necesitamos dadas por las siguientes relaciones:

requiriendo para ello únicamente 16 componentes del tensor de Riemann. Reemplazando a las
coordenadas generalizadas por las coordenadas específicas a la métrica de Schwarzschild
podemos ver mejor los componentes del tensor de Riemann que necesitamos para la obtención
de los componentes del tensor de Ricci:
Al llevar a cabo estas evaluaciones, los únicos componentes que no son cero resultan ser los
componentes diagonales del tensor de Ricci, que vienen siendo los siguientes (aunque los
cálculos que son algo laboriosos no son reproducidos aquí, el procedimiento de cómputo es el
mismo que el mostrado en los problemas resueltos puestos en otras entradas previas):

En el vacío, las ecuaciones de campo de la Relatividad General requieren que estas expresiones
se desvanezcan para una partícula de prueba suficientemente pequeña (con masa en el caso de
una partícula material y sin masa en reposo en el caso de un fotón luminoso) como para que esta
no produzca una curvatura en el espacio-tiempo:

R00 = R11 = R22 = R33 = 0

o bien, prescindiendo de las coordenadas generalizadas y usando las coordenadas específicas de


la métrica en cuestión:

Rtt = Rrr = Rθθ = Rφφ = 0

Estos desvanecimientos nos imponen la condición:


Como ya se mencionó arriba, a grandes distancias, para grandes valores de r, el espacio debe ser
aproximadamente plano, de modo tal que ambos Λ y Φ deben tender a cero para r → ∞:

y entonces:

Λ+Φ=0

El desvanecimiento de R22 nos resulta en lo siguiente:

(1 + rΦ’ - rΛ’) e-2Λ -1 = 0

(1 + rΦ’ - rΛ’) e-2Λ = 1

Haciendo recurso de la condición Λ’ = - Φ’ obtenida de los otros desvanecimientos tenemos


entonces:

[1 + rΦ’ - r(- Φ’)] e-2Λ = 1

(1 + 2 rΦ’) e-2Λ = 1

Substituyendo en el exponente a Λ por - Φ llegamos a lo siguiente:

(1 + 2 rΦ’) e2Φ = 1

que puede ser compactado todo como la derivada del producto de dos términos (regla de
Leibniz):

Esto se puede integrar de inmediato llevándonos a:


re2Φ = r + 2m

siendo m una constante de integración que posee unidades de longitud.

Tenemos entonces recurriendo al valor del componente g00:

g00 = e2Φ = (r + 2m)/r

g00 = 1 + 2m/r

Ahora bien, este resultado relativista debe coincidir con la aproximación Newtoniana (clásica,
pre-relativista) para grandes valores de r. Comparando la expresión relativista que acabamos de
obtener con la expresión Newtoniana para la cual el potencial gravitacional es ∇φ=-GM/r (no
confundir el potencial gravitacional φ con el mismo símbolo que usamos para denotar la
coordenada angular en el 4-espacio de la métrica esférica):

g00 = 1 + 2φ/r

podemos ver que la constante de integración m es simplemente la masa del cuerpo central que
produce el campo gravitacional. Del mismo modo, siendo Λ = - Φ, tenemos que concluír que:

g11 = grr = - e-2Λ = - (1/e2Λ)

Substituyendo estas expresiones en el elemento de línea con el que empezamos, esto nos
conduce a la siguiente respuesta final para la métrica que estamos buscando para un
campo simétricamente esférico y estático producido por un cuerpo esféricamente
simétrico en reposo:

ds² = (1 + 2m/r) c²dt² - (1 + 2m/r) -1 dr² - r²(dθ² + sen²θ dφ²)

Como ya se dijo, la constante de integración m tiene unidades de distancia, y es conocida como


la masa geométrica del cuerpo central. Restableciendo la constante c² (el cuadrado de la
velocidad de la luz) que habíamos hecho igual a la unidad para no estarla arrastrando
innecesariamente a lo largo de la derivación, dimensionalmente tenemos que la masa
geométrica en realidad es igual a:

m = GM/c²
Esto quiere decir que la métrica, dimensionalmente correcta, es la siguiente:

ds² = (1 + 2GM/rc²) c²dt² - (1 + 2GM/rc²) -1 dr² - r²(dθ² + sen²θ dφ²)

Esta es la solución matemáticamente exacta a las ecuaciones de campo de Einstein encontrada


por Karl Schwarzschild, la cual quedó huérfana al fallecer su descubridor al año siguiente de
haberla encontrado.

PROBLEMA: Demostrar que la métrica de Schwarzschild se reduce como un caso especial a


la métrica Lorentziana correspondiente a un espacio-tiempo plano.

A grandes distancias del cuerpo que está generando un campo esféricamente simétrico y
estático, podemos poner r → ∞ con lo cual tenemos en la métrica de Schwarzschild dos términos
que se desvanecen:

ds² = (1 + 2GM/rc²) c²dt² - (1 + 2GM/rc²) -1 dr² - r²(dθ² + sen²θ dφ²)

ds² = c²dt² - dr² - r²dθ² - r²sen²θ dφ²

ds² = c²dt² - (dr² + r²dθ² + r²sen²θ dφ²)

Para la conversión de coordenadas esféricas a coordenadas Cartesianas rectangulares tenemos


lo siguiente:

x = r sen θ cos φ

y = r sen θ sen φ

z = r cos θ

(dx)² + (dy)² + (dz)² = (dr)² + r²(dθ)² + r²sen²θ(dφ)²

Con esto tenemos entonces lo siguiente:

ds² = c² dt² - dx² - dy² - dz²


Esta es precisamente la métrica de Lorentz para un espacio-tiempo plano, propia de la Teoría
Especial de la Relatividad.

Todas las métricas que podamos proponer dentro de la Relatividad General para el estudio de
espacio-tiempos curvos se deben reducir a la métrica Lorentziana a distancias suficientemente
grandes del cuerpo o de los cuerpos que generan los campos gravitacionales que están
provocando la curvatura, ya que de no ser así la métrica propuesta es necesariamente una
métrica errónea. O puesto en términos más formales, la Teoría Especial de la Relatividad
es efectivamente un caso especial de la Teoría General de la Relatividad.

La solución de Schwarzschild II
Existe otra manera de obtener la métrica de Schwarzchild, y esta consiste en aproximar al
elemento de línea mediante consideraciones en las que establecemos comparaciones con las
leyes de Kepler para el movimiento planetario.

Nuevamente, consideraremos una región del espacio en torno a una masa puntual estática, para
la cual podemos suponer que la métrica tiene una simetría esférica perfecta e independiente del
tiempo. Y con la finalidad de simplificar la derivación que será llevada a cabo, recurriremos al
uso de unidades geometrizadas con las cuales se fija a la constante velocidad de la luz c con un
valor igual a la unidad, o sea c = 1.

Aún sin conocer las ecuaciones de campo de la Relatividad General, es posible dar una
derivación “heurística” (más artística que técnica) no totalmente rigurosa de la métrica de
Schwarzschild conociendo de antemano la característica de la variación de la gravedad con el
inverso del cuadrado de la distancia, el conocimiento previo de la tercera ley de Kepler para
órbitas circulares, y los intervalos nulos para trayectorias luminosas.

Designaremos a r como la coordenada espacial radial (la distancia a la masa puntual) de modo
tal que cada punto en una superficie de r constante tenga la misma geometría intrínseca y la
misma relación a la masa puntual a la cual situamos en el punto r = 0. Designemos también
como t a nuestra coordenada temporal. Cualquier superficie de r y t constantes debe poseer la
geometría intrínseca bi-dimensional de una 2-esfera, y podemos graduar el parámetro radial de
modo tal que el área superficial sea 4πr². (Puesto que a estas alturas el 4-espacio no es
necesariamente Euclideano, no estamos afirmando que r sea la “distancia radial” desde la masa
puntual. Más bien r es una coordenada radial arbitraria ajustada para darnos el área superficial
Euclideana que corresponde a una 2-esfera.) Con este ajuste de escala, podemos parametrizar la
2-superficie para cualquier valor de r y de t mediante la métrica esférica ordinaria de “latitud y
longitud”:

ds² = r² (dθ)² + r² sen² θ (dφ)²

en donde ds representa la distancia incremental sobre la superficie de una esfera ordinaria de


radio r que corresponda a desplazamientos incrementales dθ y dφ. La coordenada θ representa
la “latitud” con θ = 0 en el polo Norte y θ = π/2 en el Ecuador, y la coordenada φ representa la
“longitud” relativa a cierto meridiano arbitrario. En base a esto podemos decir que la métrica
completa del tiempo-espacio en la cercanía de una masa esféricamente simétrica debe tener la
forma:

ds² = gtt(dt)² + grr(dr)² + gθθ(dθ)² + gφφ(dφ)²

en donde gθθ = - r² y gφφ = - r² sen² θ, y tanto gtt como gφφ son funciones desconocidas de ry de
la masa central m. Naturalmente, si hacemos m = 0 entonces ambas funciones g tt y grrdeben ser
iguales a la unidad para que puedan darnos la métrica de un espacio-tiempo plano, Lorentziano,
puesto que esperamos que la métrica se vaya aplanando a distancias lo suficientemente alejadas
de la masa gravitacional.

Puesto que la métrica es diagonal, los componentes que corresponden al tensor métrico
conjugado g-1 = (gab) están dados simplemente por gaa = 1/gaa. La diagonalidad de la métrica nos
permite simplificar los símbolos de Christoffel a la siguiente relación (ni en g ααni en ninguna
otra parte de la ecuación hay sumación alguna implicada):

Por otro lado, las derivadas parciales de los coeficientes métricos que no terminan siendo cero
son las siguientes:
ajunto con ∂gtt/∂r y ∂grr/∂r que están aún por ser determinados. Insertando estas derivadas
parciales en la ecuación anterior encontramos que los únicos símbolos de Christoffel que no son
cero son los siguientes:

De esto obtenemos los coeficientes para las cuatro ecuaciones geodésicas que corresponden a un
4-espacio en la cercanía de una masa esféricamente simétrica, que son:

Aquí suponemos que en ausencia de fuerzas no-gravitatorias, todos los movimientos naturales
(tanto partículas con masa como fotones luminosos) siguen rutas geodésicas, de modo tal que
este sistema de ecuaciones nos proporciona una descripción completa de los movimientos
inerciales-gravitatorios de partículas de prueba en un campo esféricamente simétrico. Todo lo
que nos queda por determinar son los coeficientes gtt y grr, y para lograrlo es aquí cuando
recurriremos a la tercera ley de Kepler que nos dice: “Para cualquier planeta siguiendo una
órbita elíptica, el cuadrado de su período orbital (tiempo que tarda en dar una vuelta alrededor
del Sol) es directamente proporcional al cubo de la distancia media con el Sol (o la masa central
que está ejerciendo la atracción gravitatoria)”. Esperamos que una posible solución a la métrica
que estamos tratando de especificar sean órbitas Keplerianas circulares, lo cual significa que si
consideramos a r correspondiendo al menos aproximadamente a la distancia Newtoniana radial
al centro de la masa puntual, entonces debe de haber una ruta geodésica circular llevándose a
cabo a una distancia rconstante con una velocidad angular ω, y estas cantidades tienen que estar
relacionadas -al menos aproximadamente- según la tercera ley de Kepler de acuerdo con la
siguiente fórmula empírica para dicha ley:

m = r3 ω²

Si consideramos un movimiento puramente circular llevándose a cabo en el plano Ecuatorial (θ


= π/2) a un valor de r constante, entonces la métrica se reduce a:

ds² = gtt(dt)² - r² (dφ)²

Recurriremos ahora al tiempo propio (tiempo local ) haciendo ds² = (cdτ)². Si hacemos c = 1
para fines de simplificación en la demostración, tenemos entonces lo siguiente:

dτ² = gtt(dt)² - r² (dφ)²

Puesto que dr/dt = o al no variar la coordenada radial conforme la partícula de prueba se mueve
a lo largo de la ruta geodésica circular, las ecuaciones geodésicas para estas rutas circulares se
reducen a:

Multiplicando al través por (dτ/dt)² e identificando a la velocidad angular ω con la derivada de


φ con respecto a la coordenada temporal t, el lado derecho de esta última relación se convierte
en:
Para que haya consistencia con la tercera ley de Kepler, tenemos que tener a ω² igual (o
aproximadamente igual) a m/r3, de modo tal que llevamos a cabo esta substitución arriba para
obtener:

Integrando esta ecuación encontramos que el coeficiente métrico debe ser de la forma:

k - (2m/r)

en donde k es una constante de integración. Puesto que gtt debe ser igual a 1 cuando m = 0 y/o
cuando r tiende hacia el infinito, resulta claro que k = 1, de modo tal que:

Tenemos también que para un fotón alejándose en una dirección puramente radial de la masa
gravitatoria dτ = 0, de modo tal que nuestra métrica para un rayo de luz puramente radial debe
ser:

gtt(dt)² = - grr(dr)²

Considérese ahora una partícula radial de prueba situada a una distancia radial r. La ecuación
de la métrica proporciona el elemento de línea de la línea del mundo (diagrama espacio-tiempo
de Minkowski) de esta partícula de prueba:

dτ² = gtt dt²

y tenemos también la ecuación de la ruta geodésica radial para esta partícula:


El lado izquierdo de esta ecuación es la aceleración causada por la gravedad, dr²/dτ² en
unidades geométricas (con c= G = 1), lo cual es considerado como la expresión del inverso del
cuadrado de la distancia - m/r² (el signo negativo sirve para distinguir la fuerza atractiva en
contraste con la fuerza repulsiva). Combinando esto con las relaciones anteriores obtenemos
entonces:

gtt grr = - 1

Esto implica una “factorización perpendicular” de gtt = dr/dt y grr = - dr/dt en gtt(dt)² = -
grr(dr)², lo cual nos dá grr = - 1/gtt, con lo cual tenemos ya la métrica completa de Schwarzschild:

dτ² = (1 - 2m/r)(dt)² - (1 - 2m/r) -1(dr)² - r² (dθ)² - r² sen² θ (dφ)²

en unidades geometrizadas en donde la masa m tiene unidades de longitud.

El que sea posible derivar la métrica de Schwarzschild a partir de las leyes de Kepler sin tener un
conocimiento previo de las ecuaciones de campo de la Relatividad General es posible porque los
resultados obtenidos mediante las ecuaciones de campo de la Relatividad General se deben
reducir a los resultados clásicos cuando el campo gravitacional no es muy intenso.
Naturalmente, esto tiene sus limitaciones, porque en el caso de la luz, careciendo los fotones de
masa en reposo, la mecánica Newtoniana no produce efecto gravitatorio alguno sobre la luz, en
contraposición directa con lo que predice la Relatividad General.

PROBLEMA: Obtener los símbolos de Christoffel de segundo género que sean diferentes de
cero para la métrica de Schwarzschild dada como:

ds² = (1 - 2GM/rc²) c²dt² - [1 - 2GM/rc²] -1 dr² - r² dθ - r² sen² θ dφ²

De este elemento de línea ds² de la métrica de Schwarzschild obtenemos los componentes del
tensor métrico g que corresponde a dicha métrica, cuya representación matricial es la de una
matriz diagonal:
La fórmula general para la evaluación de los símbolos de Christoffel es:

Γαμν = gαβ (- gμν,β + gνβ,μ + gμβ,ν)/2

o bien, mostrando explícitamente las diferenciaciones parciales sin recurrir a la abreviatura de


la notación de la coma:

Γαμν = gαβ (- ∂gμν/∂xβ + ∂gνβ/∂xμ + ∂gμβ/∂xν)/2

Para la evaluación de Γ111 en cooordenadas generalizadas tenemos:

Γ111 = g11 (- ∂g11/∂x1 + ∂g11/∂x1 + ∂g11/∂x1)/2

o bien, haciendo a un lado las coordenadas generalizadas:

Aunque podemos evaluar todos los símbolos de Christoffel mediante la relación general, en la
obtención abreviada de los símbolos de Christoffel de segundo género para un tensor métrico
cuya representación matricial es la de una matriz diagonal podemos utilizar las relaciones de
cálculo abreviado que se reproducen a continuación (no aplica en estas fórmulas la convención
de sumación para índices repetidos):
El primer símbolo de Christoffel que obtendremos usando estos atajos será el que corresponde a
Γttr que por la propiedad de simetría para los símbolos de Christoffel de segundo género es igual
a Γtrt :

Ahora evaluaremos el símbolo de Christoffel que corresponde a Γrtt (en la segunda línea el signo
negativo de la primera línea es cancelado por el signo negativo que va con g rr):
El siguiente símbolo de Christoffel que obtendremos con los atajos será el que corresponde a
Γ222 = Γrrr (al aparecer repetido grr, el efecto de los dos signos negativos se cancela):

A continuación obtendremos el símbolo de Christoffel que corresponde a Γrθθ (el signo negativo
que porta grr se nulifica con el signo negativo que lleva gθθ):

El siguiente símbolo de Christoffel que evaluaremos será Γrφφ (el signo negativo que porta grr se
nulifica con el signo negativo que lleva gφφ):
A continuación evaluaremos el símbolo de Christoffel Γ θφφ (el signo negativo que porta gθθse
nulifica con el signo negativo que lleva gφφ):

Haremos ahora la evaluación del símbolo Γθθr:

Por virtud de la simetría en los sub-índices de los símbolos de Christoffel de segundo género, en
base a este resultado tenemos también que Γθθr = Γθrθ.

A continuación evaluaremos el símbolo de Christoffel Γφφr (al estar repetido gφφ en la fórmula
abreviada, el efecto de los dos signos negativos se cancela):
En virtud de la simetría en los sub-índices de los símbolos de Christoffel de segundo género, en
base a este resultado tenemos también que Γφφr = Γφrφ.

Por último, evaluaremos a Γφφθ:

En virtud de la simetría en los sub-índices de los símbolos de Christoffel de segundo género, en


base a este resultado tenemos también que Γφφθ = Γφθφ.

Todos los demás símbolos de Christoffel posibles son iguales a cero.

Con los símbolos de Christoffel disponibles para una métrica en particular, el montaje del
sistema de ecuaciones geodésicas del movimiento para el 4-espacio relativista es directo e
inmediato.

PROBLEMA: Obtener las ecuaciones geodésicas correspondientes a los símbolos de


Christoffel de la métrica de Schwarzschild que sean necesarias para describir el movimiento
planetario de un cuerpo sumergido en un campo gravitacional.

Al tratar el tema de la ruta geodésica, vimos que para el 4-espacio usando el tiempo propio
(local) τ como el parámetro independiente, es el siguiente (en coordenadas generalizadas):

Para un campo esféricamente simétrico basado en las coordenadas (x1, x2, x3, x4) = (t, r, θ, φ), el
sistema de ecuaciones geodésicas es el siguiente:

En cada una de las cuatro ecuaciones, por la convención de sumatoria para índices repetidos
tendríamos en principio para el segundo término una expansión a 16 términos, y siendo cuatro
las ecuaciones geodésicas del movimiento tendríamos que escribir un total de 4x16 = 64
términos adicionales para su posterior simplificación algebraica, lo cual puede parecer
intimidante. Sin embargo, como podemos verlo en los símbolos de Christoffel que obtuvimos
arriba para la métrica de Schwarzschild, en realidad hay tan solo unos cuantos que son
diferentes de cero, de modo que el trabajo real es mucho menor de lo que aparenta ser.

Llevaremos a cabo la formulación de la primera ecuación geodésica, la que corresponde a la


primera coordenada (temporal) t:

escribiendo simplemente 0 para representar los 14 términos que son iguales a cero en la
sumatoria desarrollada sin tomarnos la molestia de escribirlos explícitamente:

Del mismo modo, para la coordenada φ la ecuación geodésica será obtenida de la siguiente
manera:

La evaluación de la ecuación geodésica que corresponde a la coordenada radial r, con las


sumatorias expandidas de acuerdo a como lo pide la convención de sumación para índices
repetidos:

y que viene siendo igual a la siguiente expresión simplificada:

resulta ser la siguiente:

Podemos hacer una ligera simplificación de esta ecuación geodésica escribiéndola de la siguiente
manera:
Si a estas alturas recurrimos a unidades geometrizadas (haciendo G = 1 y c = 1) con las cuales
podemos acortar lo que tenemos que escribir, podemos escribir las siguientes ecuaciones
geodésicas abreviadas para la métrica de Schwarzschild:

No hemos obtenido aún la ecuación geodésica que corresponde a d²θ/dτ². En realidad, no la


necesitamos. Y no la necesitamos porque el movimiento del cuerpo en su ruta geodésica a través
del espacio-tiempo curvo se lleva a cabo en un plano, requiriéndose por lo tanto una sola
coordenada angular para continuar con el análisis. De cualquier modo, y con fines de
completitud, a continuación tenemos la ecuación geodésica para la coordenada angular θ:
Obsérvese que si llevamos a cabo nuestro análisis en un plano de movimiento para el cual θ =
π/2, el segundo término en esta última ecuación se desvanece en virtud de que cos(π/2) = 0, y la
ecuación geodésica se reduce a lo mismo que lo que ya tenemos para la ecuación geodésica
correspondiente a la coordenada φ, lo cual era de esperarse en virtud de que no hay razón por la
cual un desplazamiento angular deba ser privilegiado sobre otro.

Continuaremos nuestro análisis recurriendo a las unidades geometrizadas que nos permiten
tomar a la velocidad de la luz c y a la constante de gravitación universal G con valores iguales a
la unidad, o sea c = G = 1. El uso de unidades geometrizadas está justificado cuando lo que
queremos hacer es llevar a cabo un análisis cualitativo como lo haremos a continuación. Si lo
que queremos es obtener resultados numéricamente exactos en unidades convencionales,
entonces tenemos que revertir a los valores físicos reales de G y de c.

Podemos integrar de inmediato -con substitución de variables- la primera ecuación y la tercera


ecuación geodésicas para obtener así, en unidades geometrizadas:

en donde k y h son constantes de integración determinadas por las condiciones iniciales de las
órbitas. Por otro lado, si con el fin de seguir llevando a cabo nuestro análisis cualitativo (en lugar
de un análisis cuantitativo con resultados numéricos reales) tomamos la métrica
convencionalmente “correcta” de Schwarzschild:
ds² = (1 - 2Gm/rc²)(cdt)² - (1 - 2Gm/rc²) -1(dr)²

- r² (dθ)² - r² sen² θ (dφ)²

haciendo ds = cdτ:

(cdτ)² = (1 - 2Gm/rc²)(dt)² - (1 - 2Gm/rc²) -1(dr)²

- r² (dθ)² - r² sen² θ (dφ)²

y la expresamos en unidades geometrizadas haciendo G = 1 y c = 1:

dτ² = (1 - 2m/r)(dt)² - (1 - 2m/r) -1(dr)²

- r² (dθ)² - r² sen² θ (dφ)²

dividiendo tras esto a la métrica entre dτ², obtenemos entonces lo siguiente:

1 = (1 - 2m/r)(dt/dτ)² - (1 - 2m/r) -1(dr/dτ)²

- r² (dθ/dτ)² - r² sen² θ (dφ/dτ)²

Escogiendo para θ un valor constante θ = π/2, con lo cual dθ/dτ = 0, y con lo cual el último
término se reduce simplemente a r² (dφ/dτ)², tenemos entonces:

1 = (1 - 2m/r)(dt/dτ)² - (1 - 2m/r) -1(dr/dτ)² - r² (dφ/dτ)²

Substituyendo aquí los resultados que obtuvimos de las integraciones de las dos ecuaciones
geodésicas para la métrica de Schwarzschild, llegamos ahora a lo siguiente:

Podemos despejar para (dr/dτ)², obteniendo así:


Diferenciando esto último con respecto a τ y dividiendo entre 2(dr/dτ) obtenemos lo siguiente:

Haciendo dφ/dτ = ω para identificar a la velocidad angular propia (local), podemos identificar
entonces que h = ωr², con lo cual esta última ecuación puede ser escrita de la siguiente manera:

Para el caso en el que la velocidad angular del cuerpo que está sumergido en la métrica es igual a
cero, o sea ω = 0, esto nos dá la forma apropiada de la ley de la atracción universal de Newton en
la cual la aceleración gravitacional varía en razón inversa al cuadrado de la distancia. Para el
caso en el que ω no es igual a cero, el término ω²r corresponde a la aceleración centrípeta
Newtoniana clásica para la cual, si definiéramos a la velocidad tangencial como el producto de la
velocidad angular por el radio (v = ωr), sería igual a la expresión clásica v²/r. Este término sirve
para contrarrestar de alguna manera la atracción causada por la gravedad, pero en la versión
relativista exacta lo que encontramos no es ω²r sino ω²(r - 3m) en el tercer término de la
ecuación de arriba. Para evitar confusiones, vale la pena notar que la cantidad ω²(1 - 3m/r) sería
simplemente ω² si ω fuese definida como la derivada de φ con respecto al tiempo de coordenada
de Schwarzschild (t) en lugar del tiempo propio τ. De este modo, la versión relativista de la
tercera ley de Kepler para órbitas circulares es formalmente idéntica a la versión Newtoniana,
pero solo si identificamos a las coordenadas Newtonianas con las coordenadas de
Schwarzschild. Para valores de r mucho mayores que 3m -en unidades geometrizadas- esta
diferencia puede ser ignorada, pero debe ser claro que conforme el valor de r se va aproximando
cada vez más al valor de 3m podemos esperar encontrarnos con efectos no-clásicos, y
naturalmente si r llega a ser menor que 3m esperamos encontrarnos con efectos de índole
puramente relativista que no tienen absolutamente nada de clásicos. De hecho, esto corresponde
al caso en el cual la partícula en órbita va cayendo en espiral hacia el centro. En la mecánica
clásica Newtoniana, es imposible que una partícula en órbita pueda ir cayendo en espiral hacia
el centro del cuerpo que produce el campo gravitacional porque sólo son posibles las órbitas
elípticas. Aunque se nos vengan a la mente las imágenes de satélites en órbita que van cayendo
en espiral hacia la Tierra (como el Skylab, precursor de la Estación Espacial Internacional, el
cual cayó a la tierra el 11 de julio de 1979 tras ir perdiendo altura por varias semanas), la pérdida
de altura en tales casos se debe a la oposición que va presentando la cada vez más densa
atmósfera terrestre al satélite que está cayendo. La caída en espiral no sólo es posible sino que
incluso es explicada y anticipada dentro de la mecánica relativista.

Puesto que las ecuaciones de arriba involucran únicamente potencias de (1/r), es conveniente
hacer un cambio de variables haciendo u = 1/r. Diferenciando a u con respecto a φ nos dá du/dφ
= -(1/r)²dr/dφ. También, puesto que r² = h/(dφ/dt), tenemos que dr/dτ = -h(du/dφ).
Substituyendo los valores de dr/dτ y 1/r en la ecuación:

obtenemos la siguiente ecuación diferencial que nos relaciona a u con φ:

Diferenciando nuevamente con respecto a φ y dividiendo entre 2h² llegamos a lo siguiente:

en donde con la notación de doble punto estamos representando lo siguiente (no se trata de una
segunda derivada con respecto al tiempo):
Lo que tenemos ahora es una ecuación cuadrática en u. Resolviendo dicha ecuación cuadrática
tenemos entonces:

La cantidad dentro de los paréntesis bajo la raíz cuadrada típicamente es muy pequeña en
comparación con la unidad, de modo tal que podemos aproximar a la raíz cuadrada con los
primeros términos de la expansión en series:

Usando estas aproximaciones para expandir el lado derecho y reacomodando términos


obtenemos entonces:

El valor de d²u/dφ² es numéricamente muy pequeño en problemas astronómicos típicos, varios


órdenes de magnitud menor que la unidad, de modo tal que la cantidad 3m(d²u/dφ²) en el lado
derecho puede ser ignorada en el análisis de los movimientos planetarios. Esto nos deja ya
simplmente con un oscilador harmónico simple de la forma:

en donde M y F son constantes. Para alguna selección inicial de φ la solución general de esta
ecuación puede ser expresada de la manera siguiente:

en donde k es una constante de integración. De este modo, revirtiendo al parámetro original r =


1/u, la relación entre r y φ es:
en donde:

Si la “frecuencia” ω del movimiento planetario fuese igual a la unidad, esto vendría siendo la
ecuación en coordenadas polares de una elipse con el polo ocupando uno de los focos de la elipse
(primera ley de Kepler), y la constante k sería la eccentricidad. Por su parte, el factor principal
vendría siendo la distancia radial del foco a la elipse a un ángulo de π/2 radianes del eje mayor;
o en otras palabras, vendría siendo el semilatus rectum. Sin embargo, el valor de ω es de hecho
ligeramente menor que la unidad, lo que implica que φ debe ir un poco más allá de 2π para
poder completar un ciclo de la distancia radial. Consecuentemente, para valores pequeños de
m/h la trayectoria es aproximadamente Kepleriana, pero el eje está sujeto a una precesión como
lo muestra la siguiente figura:

Esta figura muestra un caso mucho más severo que el que existiría para cualquier planeta en
nuestro sistema solar, porque el perihelio de la órbita de este ejemplo está a únicamente 200m
(en donde m es el radio gravitacional en unidades geometrizadas) del cuerpo central, lo cual
significa que está a únicamente unas 100 veces del “radio del agujero negro correspondiente”
(posteriormente se verá con más detalle el caso de los agujeros negros). La masa de nuestro
propio Sol no está lo suficientemente concentrada para permitir este tipo de órbita con una
precesión tan pronunciada, puesto que el radio gravitacional del Sol es de únicamente m = 1.475
kilómetros, mientras que su masa se extiende a una esfera de 696 mil kilómetros de radio.

Para determinar la predicción relativista para la precesión de las órbitas planetarias, podemos
llevar a cabo la expansión de W del modo siguiente:

Puesto que m/h es tan pequeño, podemos tomar simplemente el término de primer orden, y
observando que un ciclo de la función radial será completado cuando ωφ = 2π, podemos ver que
φ debe incrementar en 2π/ω para cada ciclo radial, de modo que la precesión por revolución
viene siendo:

A diferencia de la aproximación utilizada por Einstein para el cálculo de la precesión de


Mercurio, la solución de Schwarzschild es una solución exacta, lo que significa que puede ser
utilizada en el análisis de los movimientos planetarios en donde el cuerpo central puede ser un
cuerpo masivo compacto produciendo un campo gravitacional mucho más intenso que el del
mismo Sol. Si nos imaginamos tal objeto central extremadamente denso, cuya masa esté
concentrada dentro de su radio gravitaciona, podemos obtener desviaciones mucho mayores de
las órbitas Newtonianas. Si la razón de la precesión es aproximadamente igual a la razón orbital,
entonces tendremos una órbita como la que se muestra a continuación:
Para una órbita con una energía ligeramente menor, la trayectoria tendrá un aspecto como el
siguiente:

en donde el círculo interior punteado representa la órbita “ligera” con el radio r = 3m. Con
suficiente momentum angular es posible hacer que órbitas persistentes tipo-tiempo(timelike)
vayan descendiendo hacia el cuerpo central a cualquier radio provisto que se mayor que 3m, el
cual a su vez es el radio más pequeño posible para una órbita circular (de cualquier modo, una
órbita circular para un radio menor que 6m se vuelve inestable). Si una geodésica tipo-
tiempo llega a pasar dentro de tal radio entonces recorrerá una trayectoria en espiral hacia el
cuerpo central como lo muestra la siguiente figura:
En este ejemplo, el círculo punteado exterior representa el valor 3m (esto tiene que ver con algo
que ha sido definido como la esfera de fotones y lo cual estudiaremos posteriormente con mayor
detalle), mientras que el círculo interior está situado en el valor 2m justo en lo que se conoce
como el horizonte de evento de los agujeros negros (en dimensiones “correctas”, el valor 2m
viene siendo la distancia rs = 2GM/c² conocida como el radio de Schwarzshild y la cual
estudiaremos posteriormente con mayor detalle) dentro del cual no le es posible a nada escapar
ni siquiera a la misma luz. Una vez que una línea del mundo ha caído dentro de 2m, trátese o no
de una geodésica, la coordenada radial de acuerdo con la solución de Schwarzschild debe ir
disminuyendo monotónicamente hacia cero. El asunto de los agujeros negros es de una
importancia tal que su discusión será tratada más a fondo posteriormente.

En relación a la caída en espiral hacia el cuerpo central generador del campo gravitacional, hay
un precedente histórico curioso sobre esto. Algún tiempo antes de escribir su Principiaen donde
las bases de la mecánica Newtoniana gravitacional quedaron establecidas, Newton escribió una
carta a Robert Hooke describiéndole la caída en espiral de un objeto hacia el centro de un
cuerpo ejerciendo una atracción gravitacional. Años después cuando Principia había establecido
la reputación de Newton, ambos se enfrascaron en una discusión acalorada sobre quién tenía el
mérito del descubrimiento de las leyes (clásicas) de la gravitación universal, y Hooke
frecuentemente citaba la carta de Newton como evidencia de que en ese tiempo Newton no
había entendido lo suficientemente bien la naturaleza de la gravedad, en virtud de que la ley de
la inversa del cuadrado de la distancia no permite caídas en espiral, sólo permite órbitas
elípticas. Newton simplemente respondió argumentando que tal idea había sido simplemente un
golpe desafortunado de su pluma. Resulta interesante notar que aunque en ocasiones hay gente
que le atribuye a Newton la idea de los fotones basada en su errónea teoría corpuscular de la luz
(los corpúsculos de Newton requerían estar formados de masa, y hoy se sabe que los fotones
carecen de masa en reposo) jamás se ha sugerido que la “espiral negligente” de Newton haya
sido una premonición de la caída en espiral predicha por la solución de Schwarzschild a las
ecuaciones de campo de la Relatividad General.

En los desarrollos que hemos llevado a cabo, se ha supuesto que el campo gravitacional del
cuerpo central que genera el espacio-tiempo curvo correspondiente a la métrica de
Schwarzschild es de mucho mayor intensidad que la intensidad de los campos que provocan las
curvaturas del espacio-tiempo que acarrean consigo los cuerpos que están orbitando en torno al
cuerpo central o que están en caída libre hacia el mismo, de modo tal que podemos considerar
que la curvatura del espacio-tiempo producida por el cuerpo central no es afectada de manera
significativa por los cuerpos sobre los cuales ejerce su influencia el campo gravitacional del
cuerpo central. De este modo, la masa-energía del cuerpo central (en este caso, el Sol) le dice al
espacio-tiempo cómo se debe “curvear”, mientras que la curvatura de este espacio-tiempo le dice
a los cuerpos sobre los cuales ejerece una influencia gravitatoria cómo se deben mover. Pero
tratándose de dos cuerpos de masas del mismo orden de magnitud, la situación cambia y ya no
es posible utilizar aproximaciones. Inclusive, ya ni siquiera podemos hablar de soluciones
analíticas exactas, y el problema se complica de tal modo que se vuelve irresoluble por
procedimientos manuales de cálculo. Afortunadamente, se pueden llevar a cabo simulaciones
computarizadas para solventar nuestras limitaciones de cálculo manual, lo cual nos lleva al
campo de la relatividad numérica. Pero aún con la ayuda de poderosas super-computadoras, los
cálculos para problemas tan sencillos como el de dos cuerpos de masas iguales aproximándose
(sin encontrarse directamente a lo largo de sus líneas de movimiento) puede terminar
convirtiéndose en una tarea capaz de consumir varios días o inclusive semanas de super-
cómputo continuo. Si en la mecánica Newtoniana el problema de los tres cuerpos es irresoluble
por procedimientos matemáticos analíticos, en la mecánica relativista el problema de los dos
cuerpos se vuelve irresoluble. Un ejemplo de un problema que involucra la interacción de dos
campos gravitacionales que no se presta a un análisis sencillo es el del fenómeno de las mareas
provocado por la atracción que ejerce la Luna sobre los mares de la Tierra:

En este caso, tenemos la interacción entre dos campos gravitacionales, el campo gravitacional de
la Tierra que mantiene a los mares en el planeta, y el campo gravitacional de la Luna que “jala” a
la masa de agua. Aunque estamos acostumbrados a hablar de una “atracción” gravitacional, en
realidad tal atracción no existe porque la fuerza de atracción de la gravedad de Newton nunca
existió. Lo único que existe, en la filosofía relativista, es la curvatura del espacio-tiempo que
provocan la Tierra y la Luna en el 4-espacio intermedio que hay entre ambos cuerpos celestes, y
esta curvatura no es algo que tenga una solución exacta como la que ofrece la métrica de
Schwarzschild para un campo gravitacional simétricamente esférico y estático que no sea
perturbado de modo significativo por los cuerpos a los que “atrae”. De cualquier modo, aún en la
mecánica Newtoniana el análisis cuantitativo del fenómeno de las mareas usando números es
un problema que no tiene solución exacta y tenemos que conformarnos con análisis de índole
cualitativa o con simulaciones numéricas. Y si para llevar a cabo el análisis reemplazamos a la
mecánica Newtoniana por la mecánica relativista, el problema se vuelve prácticamente
irresoluble. Al igual que como ocurre en el estudio de fenómenos en los cuales las velocidades
bajo consideración son considerablemente menores a la velocidad de la luz pudiéndose
prescindir de la Teoría Especial de la Relatividad usando en su lugar la mecánica clásica no
porque sea la correcta sino por su facilidad de uso, del mismo modo en el estudio de fenómenos
en los que el campo gravitacional no es muy intenso se puede seguir utilizando la mecánica
Newtoniana basada en su ley de gravitación universal que, aunque incorrecta, es mucho más
sencilla de utilizar en una gran cantidad de problemas astronómicos, aunque eventualmente
llega un momento en el que a la mecánica Newtoniana “se le acaba la gasolina” y no queda más
opción que recurrir a la Relatividad General.

La solución de Schwarzschild III


La métrica de Schwarzschild, una solución exacta a las ecuaciones de campo de la Relatividad
General, no sólo sirve para analizar el movimiento orbital de los planetas y demás cuerpos
celestes en torno a astros capaces de generar un campo gravitacional intenso. También se puede
utilizar para el análisis, desde la perspectiva relativista, de otros fenómenos tales como la caída
libre de los cuerpos hacia un cuerpo central.

Ya desde tiempos de Galileo se había establecido que sobre la superficie de la Tierra todos los
cuerpos caen con la misma rapidez, trátese de un elefante, de un ratón o de una pluma (en el
caso de la pluma, su caída suave se debe a la resistencia del aire, pero si la pluma se mete dentro
de un tubo al que se le ha extraído todo el aire la pluma al caer en el vacío cae con la misma
rapidez que la rapidez con la cual cae un elefante), y la explicación clásica dada es que siendo la
aceleración gravitacional g igual a la fuerza de atracción gravitatoria Fejercida por la Tierra
sobre la masa (g = F/m, de la fórmula Newtoniana F = ma), a una masa mayor m corresponde
una fuerza de atracción mayor F manteniéndose de este modo la aceleración g constante:
En realidad, es posible deducir por simple lógica que todos los cuerpos dejados caer desde
alturas iguales deben ir cayendo con la misma rapidez sobre la superficie de la Tierra sin
importar sus masas mediante una consideración simple que nos lleva a una paradoja.
Supóngase que tenemos dos masas desiguales, una de 2 kilos y otra de 1 kilo. Si los cuerpos han
de caer con mayor rapidez tanto más masa tengan, entonces la masa de 2 kilos debe caer con
mayor rapidez que la masa de 1 kilo al dejarlos caer por separado. Pongamos ahora la masa de 1
kilo debajo de la masa de 2 kilos dejando caer la combinación. Puesto que la masa de 1 kilo cae
con menor rapidez que la masa de 2 kilos, la primera debe retardar la caída de la masa de 2
kilos, y por lo tanto la combinación debe caer con una rapidez menorque la que correspondería a
la masa de 2 kilos. Sin embargo, si consideramos la combinación total de masas, esta representa
una masa total de 3 kilos, y por lo tanto debería caer con una rapidez mayor que la que
correspondería a una masa de 2 kilos. O sea, que debería caer a dos velocidades distintas, lo cual
no es posible. La única salida de esta paradoja es aceptar que todos los cuerpos caen con la
misma aceleración (la tradición relata que el mismo Galileo se subió hasta lo más alto de la torre
de Pisa dejando caer dos cuerpos de masas diferentes para que un ayudante suyo verificara
abajo que ambos cuerpos llegaban al suelo al mismo tiempo).

Si la Relatividad General está en lo correcto, entonces debemos esperar que también haga una
predicción similar a lo que ya se conoce, o sea que todos los cuerpos deben caer con la misma
aceleración sobre la superficie de la Tierra. Puesto que esta es una caída libre dirigida hacia el
centro de la Tierra a lo largo de una coordenada radial, debemos estudiarla como una
trayectoria geodésica radical. Para estudiar trayectorias radiales bajo la métrica de
Schwarzschild que describe la curvatura del espacio-tiempo generada por un cuerpo central
estático de masa M, tomamos la métrica:

ds² = (1 - 2GM/rc²) c²dt² - [1 - 2GM/rc²] -1 dr² - r² dθ - r² sen² θ dφ²

y puesto que estamos interesados aquí en movimientos puramente radiales, los diferenciales de
las coordenadas angulares dθ y dφ serán iguales a cero. Esto nos deja únicamente con lo
siguiente:

ds² = (1 - 2GM/rc²) c²dt² - [1 - 2GM/rc²] -1 dr²

Matemáticamente hablando, lo que tenemos aquí es una 2-superficie, puesto que dos variables
es justo lo que necesitamos para describir una superficie empotrada en el 4-espacio relativista,
siendo en este caso las variables t y r. Expresada mediante el tiempo propio τ, la fórmula se
convierte en:

(cdτ)² = (1 - 2GM/rc²) c²dt² - [1 - 2GM/rc²] -1 dr²

Esta fórmula nos permite calcular el transcurso total del tiempo propio (tiempo local) a lo largo
de una trayectoria radial que corresponde a incrementos en las coordenadas dt y dr. De la
métrica, haciendo un reacomodo ligero:

(cdτ)² = [(r - 2GM/rc²)/r] c²dt² - [1 - 2GM/rc²] -1 dr²

podemos ver que el la representación matricial del tensor métrico g que corresponde a este
elemento de línea es la siguiente:

Del tensor métrico podemos obtener de inmediato el tensor métrico conjugado g-1 que viene
siendo:
Con el fin de poder utilizar coordenadas generalizadas (notación de índices), haremos x 1 = t y
x2 = r. Ya hemos visto que un sistema de ecuaciones geodésicas se puede expresar de la siguiente
manera (usaremos el parámetro general como se acostumbra en muchos textos, el cual se puede
reemplazar posteriormente por el tiempo propio τ o por un elemento de arco de la trayectoria):

en donde hay una sumación implícita en cada par de índices repetidos en el segundo término de
acuerdo a la convención de sumación. Puesto que estamos trabajando con dos coordenadas,
nuestro sistema de ecuaciones geodésicas consistirá únicamente de dos ecuaciones.

Para el cálculo de los símbolos de Christoffel podemos utiizar la relación general que es
(obsérvese la permutación cíclica de los índices siguiendo el sentido de las manecillas del reloj
de término a término dentro de los paréntesis):

Tomando las derivadas parciales de los componentes de nuestro tensor métrico encontramos
que los únicas derivadas que no son iguales a cero son las siguientes:

A estas alturas resulta obvio que conforme vayamos ampliando nuestro análisis las constantes G
y c que iremos arrastrando nos irán consumiendo tiempo de escritura así como espacio
disponible en nuestro campo de lectura volviendo la notación confusa y engorrosa. Es por ello
que, para hacer un análisis cualitativo, nos conviene recurrir a
unidades geometrizadas haciendo la simplificación G = c = 1, y si por alguna razón tenemos que
llevar a cabo análisis numéricos exactos (o aproximados) para situaciones reales podemos
revertir a las unidades convencionales dándoles a G y a c los valores que les corresponden a
dichas constantes universales en el sistema de unidades que estemos empleando. Con esto, las
derivadas anteriores vienen quedando así:

Utilizando estas derivadas parciales geometrizadas podemos obtener los símbolos de Christoffel
que vienen siendo:

Substituyendo estos símbolos de Christoffel en la relación general geodésica y revirtiendo a la


notación convencional de las coordenadas dejando de lado las coordenadas generalizadas,
obtenemos el siguiente sistema de ecuaciones para las rutas geodésicas sobre la 2-superficie que
estamos analizando:
Aunque estas dos ecuaciones pueden ser integradas en forma cerrada, exacta, los resultados no
se prestan mucho a la manipulación analítica. También pueden ser integradas numéricamente
utilizando pequeños incrementos de longitud para cualquier posición y trayectoria inicial, y esto
es de hecho lo que se lleva a cabo en programas de simulación computarizada como los
programas que se citan en los Apéndices a esta obra. Esto nos permite generar fácilmente rutas
geodésicas en términos de r como función de t. Si hacemos esto, descubriremos que
invariablemente las rutas se van hacia un t infinitamente grande conforme r se va acercando a
2GM/c² (o bien, 2M en unidades geometrizadas). Esto nos lleva naturalmente a preguntarnos si
en dicho punto tenemos una singularidad real o si lo que tenemos es un punto “mal-
comportado” en nuestro sistema de coordenadas (como el Polo Norte en los mapamundis). La
2-superficie bajo consideración tiene una curvatura Gaussiana invariante en cada punto de las
coordenadas (variando de un punto a otro). Para obtener la curvatura Gaussiana intrínseca K
para esta 2-superficie se pueden utilizar los componentes del tensor métrico g y sus primeras y
segundas derivadas. Las primeras derivadas ya fueron obtenidas arriba en el curso de la
obtención de los símbolos de Christoffel. Las únicas derivadas de segundo orden que no son cero
resultan ser las siguientes (en unidades geometrizadas):

Con lo que tenemos aquí, no resulta difícil demostrar que la curvatura Gaussiana intrínseca K
para esta métrica es la siguiente:
Esto significa que en r= 2M la curvatura Gaussiana (que es independiente de las coordenadas
seleccionadas para describir cualquier 2-superficie) es:

K = - 2M/[(2M)3] = - 1/4M²

Puesto que la curvatura Gaussiana tiene un valor finito en r = 2M, la singularidad no es una
singularidad física real, se trata más bien de un fallo de las coordenadas empleadas. La única
singularidad real de la 2-superficie que estamos estudiando ocurre en el punto r = 0 en donde la
curvatura Gaussiana explota volviéndose infinita.

Para poder graficar la distancia radial en función del tiempo propio τ, nos gustaría poder
eliminar a t de nuestro sistema de dos ecuaciones geodésicas. Para poder hacerlo, observamos
que si en la primera ecuación geodésica definimos a la variable T como T = dT/dλ, podemos
escribir a dicha ecuación geodésica del modo siguiente:

Esta es ya una ecuación diferencial ordinaria de primer orden en T con coeficientes variables,
teniendo la forma convencional:

La solución de la ecuación viene siendo la siguiente:

La integral en el exponencial es simplemente:


ln(r) - ln(r - 2M)

con lo cual el resultado viene siendo:

Supóngase ahora que nuestra partícula de prueba está inicialmente estacionaria en r = R y que
la soltamos dejándola caer en caída libre. Podemos considerar en cierta forma al punto r = R
como el “apogeo” de la órbita radial. Nuestro parámetro afín λ es proporcional al tiempo propio
τ a lo largo de la trayectoria, y el valor que le asignemos a k determinará el factor de escala entre
λ y τ. De la ecuación métrica original (en unidades geometrizadas):

(dτ)² = (1 - 2M/r) dt² - (1 - 2/r) -1 dr²

sabemos que en el “apogeo” r = R en donde la velocidad inicial dr/dτ = 0 debemos tener:

(dτ)² = (1 - 2M/R) dt² - (1 - 2/r) -1 dr²

dτ/dt = √1 - 2M/R

Multiplicando esto por la derivada previa dt/dλ tenemos entonces:

Por lo tanto, para poder escalar nuestro parámetro afín λ al tiempo propio τ para esta órbita
radial, necesitamos hacer:

k = √1 - 2M/R

de modo que (representando la distancia inicial R de color azul para distinguirla de la


coordenada variable r):
Esto implica que el valor inicial de dt/dλ en el “apogeo” es 1/√1 - 2M/R, y naturalmente dr/dλ
en dicho punto es igual a cero. Substituyendo este resultado en la segunda ecuación geodésica
nos dá una sola ecuación que nos relaciona al parámetro radial r y al parámetro afín λ que
hemos hecho equivalente al tiempo propio τ, de modo tal que podemos escribir lo siguiente (en
unidades geometrizadas):

En el “apogeo” r = R en donde dr/dτ es igual a cero, podemos borrar este término que aparece
en el numerador dentro del paréntesis del lado derecho, obteniendo de este modo simplemente:

Esta es una medida de la aceleración de la partícula de prueba a lo largo del parámetro radial r.
Aún antes de que resolvamos la penúltima ecuación para cualquier valor de r, resulta claro que
puede ser integrada para darnos la ruta geodésica desde cualquier trayectoria inicial, y podemos
confirmar que atraviesa suavemente a través del valor “mal comportado” (a causa de las
coordenadas utilizadas) r = 2M como una función del tiempo propio τ. Esto al principio puede
parecer sorprendente, puesto que el denominador en el lado derecho de la penúltima ecuación
contiene 1-2M/r (lo cual resulta en una división por cero), así que parecería que la segunda
derivada de r con respecto a τ, d²r/dτ², estalla justo en el punto r = 2M. Sin embargo, un
análisis posterior demuestra que el cuadrado de dr/dτ, o sea el término (dr/dτ)² que habíamos
“borrado” arriba, invariablemente se convierte en (1 - 2M/R) precisamente en r = 2M, con lo
cual el numerador de la antepenúltima ecuación se vuelve cero también, y como bien lo saben
los matemáticos, la división de cero entre cero, o sea 0/0, aún como una operación límite, no es
igual ni al infinito (∞) ni a cero (0).
Para resolver la ecuación analíticamente, observamos que la derivada con respecto a τ de la
cantidad en los paréntesis cuadrados es igual a:

La expresión dentro de los paréntesis cuadrados en el lado derecho se desvanece sí y solo sí la


ecuación:

es satisfecha, de modo tal que podemos concluír que la cantidad entre los paréntesis cuadrados
en el lado izquierdo de la ecuación debe ser constante (haciéndose la observación aquí de que la
singularidad en r = 2M debe poder ser removible mediante un cambio adecuado de
coordenadas, lo cual fue logrado mediante las coordenadas Kruskal-Szkeres), y por lo tanto
podemos considerar a dicha cantidad igual a la unidad (suponiendo que sea la unidad en
cualquier punto de la trayectoria, que es en el apogeo para una trayectoria ligada). Por lo tanto,
la relación de la inversa del cuadrado de la distancia:

es satisfecha en cualquier punto de la trayectoria. Tomando la cantidad entre los paréntesis


cuadrados del lado izquierdo igual a la unidad, tenemos entonces:
Tomando la raíz cuadrada y reacomodando los términos:

Podemos llevar a cabo una integración inmediata sobre esto para obtener ya sea una respuesta
analítica o una aproximación numérica. Si llevamos a cabo la integración desde una distancia
r1 hasta una distancia r2, llegamos a lo siguiente:

Podemos simplificar este resultado mediante un cambio de variables, definiendo al seno inverso
que tenemos en el segundo término como el coseno de algún ángulo α. Una definición de α que
puede funcionar es:

cos(α) = 2r/R - 1

Esto implica que:

Insertando esto en la ecuación precedente nos dá el tiempo propio τ transcurrido entre r1 y r2 de


la siguiente manera:
Esto nos demuestra que la ecuación:

tiene la misma forma cerrada de solución como la que encontramos en la caída libre radial de la
mecánica Newtoniana (si identificamos a τ como el tiempo “absoluto”), o sea las relaciones
paramétricas cicloidales que se estudian en la mecánica Newtoniana. Un graficado de r con
respecto a τ corresponde a la posición de un punto en el “rin” (rim) de una rueda rodante de
radio R/2, en donde α es el ángulo de la rueda. Se deduce de la derivación anterior que esta
ecuación paramétrica también satisface la relación de la inversa del cuadrado de la distancia
d²r/dτ² = - M/r² que es tan familiar a los principiantes en el estudio de la mecánica
Newtoniana.

Podemos expresar también el tiempo correspondiente a la coordenada temporal de


Schwarzschild (t) explícitamente en términos de α multiplicando las siguientes dos relaciones:

para dar:

Substituyendo la expresión paramétrica para r en esta ecuación, multiplicando a través por α e


integrando ambos lados, obtenemos:
Esta integral puede ser evaluada explícitamente para dar:

Haciendo uso de la identidad trigonométrica:

la ecuación puede ser escrita de la siguiente manera:

en donde:

Q = √(R/2M) - 1

Antes de utilizar la fórmula que acabamos de obtener para llevar a cabo el graficado de la órbita
radial, tenemos que tomar una precaución. En este punto, podemos hablar de una “región
interior” para valores de r menores que 2M y de una “región exterior” para valores de r mayores
que 2M. Para valores de α que correspondan a valores de r menores que 2M el argumento del
logaritmo es negativo, y por lo tanto el valor del logaritmo está fuera por π. Esto ocurre porque,
en tales casos, estamos integrando de α = 0 en donde r = R (que es mayor que 2M) a un valor de
α que corresponde a r menor que 2M, y por lo tanto tenemos que efectuar una integración
compleja (recurriendo a la teoría de las variables complejas) alrededor de la singularidad en r =
2M desplazando el resultado por ± π (suponiendo que la trayectoria de la integración compleja
no dé una vuelta completa alrededor de la singularidad). Esto no es sorprendente, porque las
coordenadas t son discontinuas en r = 2M, así que no podemos “transportar” sin ambigüedad el
etiquetado de las coordenadas t de la región en donde r es mayor que 2M a la región en donde r
es menor que 2M. En general, puesto que los coeficientes métricos son independientes de t, las
etiquetas de t para eventos fuera de r = 2M pueden ser desplazadas por un valor constante sin
afectar nuestros resultados, y del mismo modo las etiquetas de t para eventos dentro de r = 2M
pueden ser desplazadas por un valor constante. Más aún, los desplazamientos para los
etiquetados de t para las regiones interior y exterior son independientes el uno del otro debido a
la discontinuidad en r = 2M. No habiendo una condición interior de frontera (boundary),
estamos libres de seleccionar el desplazamiento interior de modo tal que t sea un valor real. La
parte real del logaritmo natural de la variable compleja z -ln(z)- para cualquier valor de z es
ln(|z|), de modo tal que podemos estipular simplemente que tomaremos el valor absoluto del
argumento del logaritmo, o sea que podemos definir las coordenadas temporales mediante la
siguiente relación (obsérvese que la única diferencia entre esta relación y la que tenemos arriba
es que estamos tomando el valor absoluto del argumento del logaritmo natural):

Esto nos dá valores reales (liberándonos de valores complejos o imaginarios) para el etiquetado
de las coordenadas del tiempo que satisface la condición en la derivada en cada punto (excepto,
claro está, en donde las coordenadas del tiempo son singulares en r = 2M). Estrictamente
hablando, podríamos desplazar las coordenadas interiores aún más con cualquier constante
real, de modo tal que la expresión anterior para la coordenada del tiempo de una partícula en
caída libre no es la única, pero ciertamente es la más sencilla que aparea las etiquetas
temporales (tanto la de la coordenada temporal t como la del tiempo propio τ). En base a la
fórmula que hemos obtenido, la gráfica de la coordenada radial r, tanto para el tiempo propio τ
como para el tiempo de coordenada t, con los tres expresados en metros (en unidades
geometrizadas) es la siguiente:
En la gráfica (que en realidad son cuatro gráficas en una) podemos apreciar que el “apogeo” de
la partícula que se ha dejado caer (el “apogeo” es el parámetro que podemos variar libremente)
ha sido seleccionado en una distancia radial r = 10 metros (medida en unidades geometrizadas).
Esta es la mitad del lado derecho de la gráfica, en donde tenemos de hecho dos gráficas, una
para el tiempo de coordenada t medido por un observador situado suficientemente lejos del
alcance del campo gravitacional, y la otra para el tiempo propio (local) τ medido por el reloj de
un observador que viaja junto con la partícula que está en caída libre. Obsérvese que el tiempo
también está especificado en unidades geometrizadas, o sea en metros. Hemos supuesto que al
dejarse caer la partícula los tiempos de ambos observadores están sincronizados en t = τ = 0.
Para un observador que viaja junto con la partícula, conforme la partícula avanza el viajero
atraviesa la barrera r = 2M sin problema alguno mientras que su reloj que mide el tiempo τ
sigue avanzando de modo normal encaminándose hacia la singularidad en r = 0. Sin embargo, lo
que el observador externo ve es algo muy diferente, como lo manifiesta la discontinuidad en la
medición del tiempo encontrada al llegar a r = 2M. Por su parte, la mitad del lado izquierdo de
la gráfica muestra más bien los efectos de una inversión matemática que una situación física
real, porque en este caso tenemos tiempos negativos que van haciéndose cada vez menos
negativos (o más positivos) conforme la partícula va saliendo de la singularidad atravesando la
barrera r = 2M hasta llegar al “apogeo”. Lo que nos muestra el lado izquierdo de la gráfica es el
efecto tanto de la inversión t → - t como de la inversión τ → - τ. Una característica interesante de
las trayectorias en esta gráfica es su simetría temporal. No sólo hay una ruta geodésica continua
desde el “apogeo” hasta la singularidad en r = 0 pasando a través del radio r = 2M (medida en τ),
también hay una ruta geodésica continua desde la singularidad en r = 0 pasando a través del
radio r = 2M hasta llegar al “apogeo”. Esta simetría era de esperarse en virtud de la simetría
temporal que exhiben las ecuaciones de campo en general y en especial la métrica de
Schwarzschild. Sin embargo, y como pronto lo veremos, una vez que una partícula ha entrado al
interior de r = 2M, a la partícula ya no le será posible salir.

Si bien es cierto que la solución de Schwarzschild nos permite llevar a cabo el análisis de
fenómenos tales como el análisis de las órbitas de los planetas en torno al Sol o la caída libre de
los cuerpos sobre la superficie de la Tierra, recuperando como aproximaciones a casos
especiales las mismas fórmulas que las que habían sido obtenidas mediante la “vieja” mecánica
Newtoniana, la solución de Schwarzschild también nos permite predecir otros efectos de índole
puramente relativista cuya posibilidad ni siquiera es contemplada en la mecánica de Newton.
Uno de tales fenómenos es la dilatación gravitacional del tiempo.

PROBLEMA: Un campo gravitacional generado por un cuerpo simétricamente esférico y


estático de masa M produce una dilatación relativista del tiempo a una distancia fija r = R del
centro del cuerpo. Obtener la fórmula para la dilatación del tiempo de índole gravitacional a
partir de la métrica de Schwarzschild.

A una distancia fija r = R del centro del cuerpo, tanto dr como dθ y dφ se desvanecen de la
métrica de Schwarzschild:

ds² = (1 - 2GM/rc²) c²dt² - [1 - 2GM/rc²] -1 dr² - r² dθ - r² sen² θ dφ²

dejándonos únicamente con lo siguiente:

ds² = (1 - 2GM/Rc²) c²dt²

En el lado izquierdo podemos hacer la substitución ds² = c²dτ² con lo cual:

c²dτ² = (1 - 2GM/Rc²) c²dt²

dτ² = (1 - 2GM/Rc²) dt²

Extrayendo la raíz cuadrada en ambos miembros de la igualdad:


dτ = √1 - 2GM/Rc² dt

Despejando para dt e integrando obtenemos la relación deseada:

De acuerdo con la fórmula exacta que hemos obtenido, a una distancia relativamente grande del
cuerpo que está produciendo la curvatura del espacio-tiempo Δt = Δτ, y dos observadores en
reposo el uno frente al otro medirán el mismo paso del tiempo de acuerdo a sus respectivos
relojes que suponemos que están sincronizados. Pero si uno de ellos se acerca a un cuerpo que
está produciendo un campo gravitacional, entonces la marcha del tiempo parecerá dilatada por
el factor √1 - 2GM/Rc². Obsérvese que éste ya no es un factor Lorentziano √1 - V²/c². Lo que
tenemos aquí es un efecto de índole puramente gravitacional que sólo pudo haber sido predicho
por la Relatividad General (estrictamente hablando, la fórmula para la dilatación del tiempo
gravitacional puede ser derivada de un modo más laborioso dentro de la Teoría Especial de la
Relatividad considerando marcos de referencia acelerados, pero eventualmente tendríamos que
invocar el Principio de Equivalencia para poder meter eventualmente la masa M y la constante
de gravitación universal G dentro de nuestra fórmula final, que es a fin de cuentas lo mismo que
hizo Einstein al desarrollar la Relatividad General).

PROBLEMA: Expresar la fórmula para la dilatación gravitacional del tiempo metiendo


dentro de ella el potencial gravitacional Newtoniano clásico.

El potencial Newtoniano clásico φ producido por una masa M a una distancia r del cuerpo está
definido como:

φ = - GM/R

de donde:

R = - GM/φ

con lo cual tenemos:


Es importante notar que Δt siempre será mayor que Δτ, y el tener un signo positivo ahora dentro
del radical en el denominador no significa que esto vaya a cambiar, ya que puesto que por
costumbre el potencial gravitacional siempre es especificado como una cantidad negativa, al
momento de hacer substituciones numéricas ésto debe ser tomado en cuenta produciéndose de
cualquier modo un radical menor a la unidad.

En su primer papel publicado en 1905 en donde Einstein formalizó por vez primera los
principios de la Teoría Especial de la Relatividad sobre dos postulados, mencionó cómo un reloj
puesto en el Ecuador debe correr más lentamente que un reloj puesto en uno de los polos de la
Tierra por un factor γ = 1/√1 - V²/c², haciendo una estimación numérica aproximada del efecto
tomando en cuenta la velocidad tangencial V de la Tierra en su Ecuador. Pero esta estimación no
tomó en cuenta efecto gravitacional alguno al no existir aún en ese entonces la Teoría General de
la Relatividad, lo cual no era de mayor consecuencia porque un reloj colocado en el Ecuador está
situado (aproximadamente) a la misma distancia del centro de la Tierra que un reloj colocado en
uno de los polos. Sin embargo, esta situación cambia al poner ambos relojes a
alturas diferentes sobre la superficie de la Tierra. Si tenemos dos relojes con uno de ellos dando
vueltas rápidamente en torno al otro ocasionando una medición de un tiempo dilatado para el
reloj rotatorio, y si movemos el par de relojes a alturas diferentes situándolos primero lejos de la
Tierra y después cerca de la misma, tendremos entonces una dilatación de tiempo combinada.
Haciendo uso de la aproximación mediante expansión por series:

1/√1 - 2GM/Rc² =

[1 - 2GM/Rc²] -1/2 ≈ 1 - (- 1/2)(2GM/Rc²) + ... ≈ 1+ GM/Rc²

podemos representar el efecto combinado de la siguiente manera:


La fórmula que hemos obtenido para la dilatación gravitacional del tiempo nos plantea un serio
dilema conforme nos vamos aproximando a la distancia radial r = 2GM/c² (en unidades
geometrizadas, r = 2M), porque en este caso el numerador se va aproximando a cero, y para un
observador externo alejado del campo gravitacional el tiempo propio del observador situado en
la cercanía del campo gravitacional se va haciendo extensamente grande. Esto significa que si
los dos observadores están inicialmente juntos, y uno de ellos le enviara al otro con un rayo láser
una señal luminosa monocromática (de una sola frecuencia fija), puesto que la señal es en
esencia una onda electromagnética la distancia entre cada ciclo de la onda (el período T de la
onda) se iría ampliando y corriendo hacia el rojo y hacia el infrarrojo hasta que la frecuencia de
la señal luminosa sería prácticamente cero, y de hecho sería igual a cero en el punto r = 2GM/c².
Esto significa que para una superficie esférica de radio r = 2GM/c² en torno al cuerpo, la luz
emitida desde dicha superficie no llegará jamás al observador externo, lo cual significa que, en
efecto, la luz no podrá escapar. Y si la luz no puede escapar, no le será posible a alguien que
haya entrado en esta barrera el poder enviar señales electromagnéticas de ningún tipo
(luminosas, ondas de radio, rayos láser, rayos X, etc.) al exterior quedando incomunicado
permanentemente del exterior. Esto es precisamente lo que nos lleva de modo ineludible hacia
el estudio de los agujeros negros. Esta posibilidad tan contraria a nuestra experiencia
cotidiana y a nuestra forma intuitiva de pensar fue lo que llevó a muchos científicos de
reconocido prestigio a rechazar de plano la Teoría de la Relatividad por no creer que algo como
esto fuese posible.

PROBLEMA: Obtener la fórmula que proporcione la longitud de onda λ∞ de una señal


luminosa como sería vista por un observador situado en la lejanía cuando la señal luminosa es
emitida con una longitud de onda λ0 desde una linterna por un observador situado en reposo a
una distancia r del centro de un cuerpo de masa M.

Puesto que la frecuencia de la señal luminosa es f = 1/T y c = fλ, entonces T = 1/f = λ/c, con lo
cual tenemos:

Δt = λ∞/c____Δτ = λ0/c

que nos viene dando:

Cuando vemos al Sol todas las mañanas, ciertamente la luz solar nos está llegando a nosotros
pese a que el Sol tiene una masa enorme capaz de mantener a nuestro planeta orbitando en
torno suyo. ¿Por qué no vemos entonces el efecto predicho por la fórmula obtenida con la
solución de Schwarzschild? Por la sencilla razón de que, como nos lo demuestra un cálculo breve
y rápido, el radio r = 2GM/c² para el Sol está situado muy al interior de esta estrella. La mayor
parte del Sol está situada afuera de este radio crítico, de modo tal que la energía luminosa que
puede producir el Sol en su parte exterior a este radio nos puede llegar a nosotros sin problema
alguno. Sin embargo, si fuera posible compactar de alguna manera la masa de un cuerpo celeste
brillante de modo tal que toda ella quedara contenida dentro de su radio “crítico” r = 2GM/c², la
estrella desaparecería de nuestra vista, ya no brillaría. Solo nos enteraríamos de su existencia
al ser “jalados” por ella, y posiblemente ya para entonces sería demasiado tarde para poder
escapar de su tracción gravitacional. Retomaremos este tema posteriormente cuando entremos
en un estudio más detallado de estos cuerpos exóticos que hoy ya son aceptados por la Ciencia
como algo cuya existencia es imposible de negar.

El abandono de la "accion a distancia"


El esquema Newtoniano para la formulación de la ley de la atracción universal, desarrollada
sobre la suposición del espacio absoluto y del tiempo absoluto, estaba basada también en la
suposición de una fuerza de atracción entre dos cuerpos actuando a través del espacio entre
ellos, la cual actuaba de manera instantánea. Pero en base a los resultados obtenidos en la
Teoría de la Relatividad según los cuales ningún tipo de información puede ser transmitida a
una velocidad mayor que la velocidad de la luz, este concepto de “acción a distancia” se volvió
insostenible, y se tuvo que abandonar. Pero no sólo se tuvo que abandonar el concepto de la
“acción a distancia” en el campo de estudio de la mecánica, también se tuvo que abandonar en el
campo de estudio propio de los fenómenos que involucran a la electricidad y el magnetismo,
empezando por la ley de Coulomb, la cual nos dice que dos cargas eléctricas se atraen o se
repelen en razón directa del producto de la magnitud de las cargas y en razón inversa del
cuadrado de la distancia que las separa.

Este abandono del concepto de la “acción a distancia” en todo lo que tenga que ver con el
electromagnetismo, orillado por la Teoría de la Relatividad, es interesante considerando que las
ecuaciones de Einstein son completamente independientes de las cuatro ecuaciones básicas del
electromagnetismo de Maxwell. Ninguna de las ecuaciones del electromagnetismo de Maxwell
puede ser derivada de las ecuaciones de la Teoría de la Relatividad, del mismo modo que
ninguna de las ecuaciones de la Teoría de la Relatividad puede ser derivada de las ecuaciones de
Maxwell, lo cual hizo suponer a Einstein que debía de existir otra teoría más amplia que pudiera
abarcar en un mismo conjunto de fórmulas ambas teorías y que pudiera explicar todos los
fenómenos físicos del Universo. Esta teoría que empezó a ser buscada afanosamente por
Einstein fue llamada la teoría del campo unificado desde antes de que se obtuviera una sola
fórmula uniendo a la teoría del electromagnetismo de Maxwell con la Teoría de la Relatividad de
Einstein. Sin embargo, pese a sus mejores esfuerzos, Einstein jamás pudo formular tal teoría. La
esperanza de Einstein sobre la existencia de dicha teoría sigue viva aún en los corazones de
muchos científicos contemporáneos, los cuales la han rebautizado con el nombre de la teoría
del todo (TOE o Theory of Everything), y al igual que como lo descubrió Einstein, dar con tal
teoría parece ser si no imposible sí algo que requerirá un avance substancial en la maquinaria
filosófica y matemática con la cual contamos en la actualidad.

Regresando a la ley fundamental de la electroestática, la ley de Coulomb, al abandonarse el


concepto de una fuerza actuando instantáneamente entre dos cargas eléctricas, se concibió el
concepto del campo eléctrico, algo así como un campo de fuerza que rodea a una carga
eléctrica, cuya existencia nos es posible mediante una carga de prueba (ya sea del mismo signo o
del signo contrario) que nos indica la presencia de un campo eléctrico en algún lugar. A
continuación tenemos las “líneas de fuerza” que emanan de una carga eléctrica positiva,
precisamente las líneas que representan vectorialmente en cada punto del espacio en torno a la
carga central la dirección de la “fuerza eléctrica” que empujaría a una carga de prueba de igual
signo que fuese puesta dentro del campo eléctrico originado por la carga central:

La representación esquemática de las “líneas de fuerza” frecuentemente va de la mano con lo


que verdaderamente representa al campo de fuerza, una serie de líneas perpendiculares a las
líneas de fuerza que a su vez representan el campo en torno a la carga eléctrica (o a la masa), las
cuales son regiones en el espacio que corresponden a un mismo potencial. Para la carga eléctrica
arriba mostrada, la representación de las líneas de fuerza junto con las líneas de
campo consistiría en la adición a la figura de una serie de circunferencias concéntricas:

En la figura tenemos resaltadas dos líneas de campo, la línea A de color azul y la línea B de color
café. La línea A representa el lugar de los puntos en los cuales el campo eléctrico producido por
la carga eléctrica Q tienen un mismo valor, y es por esto que a esta línea se le conoce como una
línea equipotencial. Lo mismo ocurre con la línea equipotencial B (hay otra línea de campo
equipotencial puesta entre ambas, no resaltada).

Del mismo modo, si hemos de dibujar las líneas equipotenciales que representan a un campo
gravitacional generado en el espacio-tiempo por una masa M (ya sea una esfera de metal o un
planeta) junto con las líneas de fuerza que representan el ya obsoleto concepto de la fuerza de
atracción Newtoniana, tendríamos una figura como la siguiente:

En el caso de la Tierra, podemos hacer un esquema que represente única y exclusivamente


algunas de sus líneas equipotenciales del campo gravitacional prescindiendo de las líneas de
fuerza de la manera siguiente:
Estas líneas equipotenciales son precisamente las que a gran altura recorren los satélites
artificiales lanzados por el hombre al espacio. Los satélites pueden viajar indefinidamente a lo
largo de estas líneas equipotenciales sin consumo alguno de energía puesto que, siendo líneas de
campo que representan un mismo potencial gravitacional, no hay consumo alguno de energía al
moverse de un lado a otro a lo largo de estas líneas. El consumo de energía ocurre en todo caso
cuando el satélite es puesto en órbita moviéndose de una línea equipotencial a otra venciendo a
la gravedad de la Tierra y consumiendo una cantidad apreciable de energía para lograrlo.

Cerca de la superficie de la Tierra, las líneas de fuerza que representan las trayectorias seguidas
por los cuerpos en caída libre de acuerdo a la obsoleta fórmula Newtoniana de gravitación
universal así como las líneas equipotenciales del campo gravitacional cerca de la superficie de la
Tierra tendrán un aspecto como el siguiente:

Las representaciones dadas arriba del campo gravitacional son representaciones planares,
puestas sobre un plano, ofreciendo una perspectiva en dos dimensiones del campo gravitacional.
Pero en realidad, en el Universo tri-dimensional en el que vivimos, lo que tenemos no son líneas
equipotenciales sino superficies equipotenciales. Desafortunadamente, no nos ayuda
mucho a nuestra intuición el estar limitados a representar nuestra realidad de 3 dimensiones
sobre un plano de 2 dimensiones (del mismo modo que no nos ayuda mucho a nuestra intuición
el estar limitados a representar la realidad del espacio-tiempo de 4 dimensiones de la Teoría de
la Relatividad en un espacio pictográfico de 3 dimensiones). De cualquier modo, con un poco de
imaginación, podemos tratar de visualizar unas superficies equipotenciales esféricas generadas
por una masa central con una representación como la siguiente:

De cualquier modo, aunque el trazado de líneas (o superficies) equipotenciales sea algo más
fidedigno a la representación de un campo, el trazado de las “líneas de fuerza” tradicionales
sigue siendo un auxiliar valioso para lograr obtener una perspectiva visual sobre cierto problema
en el cual si intentamos proceder de inmediato al trazado de líneas de campo equipotenciales la
situación parecerá algo confusa desde un principio. Los ejemplos citados arriba son
relativamente fáciles de manejar porque se trata de una sola carga eléctrica o de una sola masa.
Pero, ¿qué ocurre cuando en lugar de una sola masa tenemos dos masas? En este caso, puede ser
útil trazar primero varias líneas de fuerza, y una vez trazadas podemos percatarnos de la forma
que tendrán las líneas equipotenciales del campo producido en cada punto del espacio por las
dos cargas o las dos masas habido el hecho de que las líneas equipotenciales siempre son
perpendiculares a las líneas de fuerza. Es con esto en mente que procederemos a investigar lo
que ocurre cuando tenemos dos cargas eléctricas ya sea del mismo signo o de signo contrario.
Bajo el esquema de las líneas de fuerza, cuando dos cargas eléctricas del mismo signo están en
cercanía la una de la otra, si ambas tienen el mismo signo sus campos se repelerán en forma
similar a la forma en la cual un imán repele a otro imán cuando son acercados con su mismo
polo apuntando el uno al otro, y si ambas cargas tienen signos contrarios sus campos se cerrarán
empezando en una carga que con sus líneas de fuerza actúa como una fuente y terminando en la
otra que con sus líneas de fuerza actúa como un sumidero, como lo muestra el siguiente
diagrama:

Una vez trazadas las líneas de fuerza, si tomamos la segunda de las dos figuras de arriba (situada
a la derecha) que representa a dos cargas eléctricas de signos opuestos y trazamos varias líneas
equipotenciales (con líneas de color rojo), encontraremos que los campos de dichas
cargas parecen repelerse el uno al otro:
En cambio, si tomamos a la primera de las dos figuras de arriba (situada a la derecha) que
representa a dos cargas eléctricas del mismo signo y trazamos varias superficiesequipotenciales,
encontraremos que los campos de dichas cargas parecen atraerse para terminar fusionándose a
grandes distancias:

Bajo el concepto del campo, cuando una carga eléctrica que estaba en reposo es puesta en
movimiento uniforme el campo en torno a ella es alterado como podemos verlo en el caso de la
siguiente partícula que posee una carga eléctrica positiva y la cual se está trasladando de
izquierda a derecha en movimiento uniforme a velocidad constante (usaremos las “líneas de
fuerza” por la simplicidad que estas representan para la representación de un campo en
movimiento):
Y si la carga eléctrica experimenta una aceleración en vez de un movimiento uniforme a
velocidad constante, la distorsión en las “líneas de fuerza” que representan al campo eléctrico en
torno a la carga es tal que si pudiéramos “ver” dichas líneas de fuerza las veríamos tomar un
aspecto curvo, con una curvatura tanto más pronunciada en tanto mayor sea la aceleración. De
hecho, la electrodinámica clásica predice que una carga eléctrica acelerada emitirá una radiación
electromagnética (este es precisamente el principio sobre el cual trabajan los aparatos de rayos
X utilizados en los hospitales, se hace incidir una corriente eléctrica a un voltaje elevado sobre
una superficie que actúa como un freno brusco sobre las cargas eléctricas que forman dicha
corriente, la desaceleración de la carga produce los rayos X que no son más que radiación
electromagnética de alta frecuencia).

La Teoría de la Relatividad, basada en el concepto del campo al igual que la teoría del
electromagnetismo que la inspiró, nos permite imaginar el equivalente gravitacional de un
“campo” en torno a una masa, un campo que en realidad es una curvatura en el espacio-tiempo
producida por dicha masa en su alrededor, sin existir fuerza alguna de atracción hacia la masa
como lo creía Newton. Un observador estacionario situado frente a esa masa, si pudiese “ver” las
líneas de atracción producidas por este campo gravitacional, posiblemente vería algo como lo
siguiente:
En cambio, otro observador moviéndose rápidamente hacia la masa posiblemente vería algo
como lo siguiente:

Un observador situado a un lado de la masa no vería absolutamente cambio alguno, el que “ve”
el cambio es el ciclista que se está moviendo a gran velocidad acercándose a la masa. Sin
embargo, y en conformidad con la filosofía relativista, si el ciclista en la figura de arriba lo
imagináramos en reposo pedaleando rápidamente su bicicleta pero sin moverse hacia ninguna
parte (como si las ruedas estuviesen patinando) y por el contrario nos imagináramos a la masa
moviéndose rápidamente hacia el ciclista, el efecto de abultamiento de las líneas sería
exactamente el mismo, no hay cambio alguno porque no es posible decidir si es el ciclista el que
se está moviendo hacia una masa en reposo o si es la masa la que está moviendose hacia un
ciclista estacionario. Todo sigue siendo relativo en la mecánica Einsteniana.
La distribución de “líneas de fuerza” mostrada arriba en el último diagrama es la que vería un
ciclista moviéndose con respecto a una masa a una velocidad constante. Sin embargo, si el
ciclista se está desplazando con respecto a la masa en un movimiento aceleradocambiando
constantemente su velocidad, entonces dichas “líneas de fuerza” se le mostrarían al ciclista con
una curvatura cuyo aspecto dependerá ya sea que el ciclista se esté acercando a la masa:

o alejándose de la misma:

En este tipo de situaciones en las cuales tenemos una aceleración es en donde aparecen algunas
asimetrías como las que tanto le disgustaban a Einstein, porque aunque la figura será
exactamente la misma ya sea que el ciclista se esté acelerando y la masa esté en reposo o que sea
el ciclista en reposo y la masa la que se está acelerando, uno de los dos ocupará una posición
“privilegiada” por el simple hecho de que la aceleración requiere de un gasto de energía que
uno de los dos tiene que proporcionar. En el caso del ciclista, éste requerirá ir pedaleando cada
vez con mayor velocidad para poder mantener constante su aceleración, mientras que en el caso
de la masa ésta requiere la aplicación de una fuerza sobre ella para ponerla en movimiento
uniformemente acelerado. Si suponemos que el ciclista se mantiene en reposo o en movimiento
a una velocidad constante y que es la masa la que es acelerada, entonces la aceleración de la
masa provocará un pulso en el campo gravitacional que la rodea, un pulso que será radiado
hacia afuera a la velocidad de la luz. Este “pulso” es ni más ni menos una radiación
gravitacional portadora de energía, la misma energía que se tuvo que invertir para acelerar a la
masa.

Aunque la teoría del campo, tras sepultar en definitiva el concepto Newtoniano de la “acción a
distancia”, nos permite contestar muchas interrogantes y resolver muchos problemas, subsisten
otros problemas filosóficos de fondo relacionados con dichos campos que ni siquiera el mismo
Einstein pudo resolver en forma completamente satisfactoria. Uno de estos dilemas radica en lo
que se conoce como el principio de Mach, debido al físico y filósofo austriaco Ernst Mach (el
mismo en cuya memoria cuando un avión supersónico está volando a una velocidad mayor que
la velocidad del sonido, digamos al doble de la velocidad del sonido, se le refiere a dicha
velocidad en términos del número Mach, por ejemplo Mach 2, que es un múltiplo de la
velocidad del sonido). El principio se puede enunciar de manera muy sencilla en la siguiente
forma:
“La inercia de cualquier cuerpo o de cualquier sistema es el resultado de su
interacción con el resto del Universo. En otras palabras, cada partícula del
universo ejerce una influencia sobre todas las demás partículas.”

Aunque esta no es una enunciación matemática precisa como lo es la ecuación tensorial básica
de la Relatividad General, sus implicaciones son mucho más profundas de lo que parecen ser a
primera vista. Si nos limitamos a un solo cuerpo sólido, lo que nos dice el principio de Mach es
que eso que llamamos la inercia del cuerpo, una de las propiedades físicas más esenciales de
todas, no depende de la masa del cuerpo sino de la influencia que tiene la masa restante del
Universo entero sobre dicho cuerpo. Puesto de otra manera, el resto del Universo es el que fija
localmente esa propiedad que llamamos inercia. De acuerdo con el principio de Mach, en un
Universo en donde sólo existiera un cuerpo sólido se le podría empujar sin necesidad de tener
que efectuar gasto alguno de energía porque la inercia de dicho cuerpo sería cero. Del mismo
modo, en un Universo desprovisto por completo de materia sería imposible detectar la
deformación que produce la rotación de la Tierra sobre su ecuador (la Tierra no es una esfera
ideal, ya que está achatada en los polos y su radio ecuatorial es mayor que lo que tendría si no
hubiese tal deformación que la convierte en un elipsoide). La rotación de la Tierra produce
fuerzas centrífugas que le deforman su superficie, y según el principio de Mach una Tierra
rotando en un Universo vacío de materia tendría una configuración esférica. Pero si la Tierra
fuese el único objeto en el Universo, ¿podríamos decir realmente que la Tierra está girando
sobre su eje, si no hay absolutamente nada con respecto a lo cual se pueda decir que está
girando? En un Universo vacío, no es posible distinguir una Tierra que está en reposo de una
Tierra que está girando sobre su propio eje, ya que no hay nada en el exterior con respecto a lo
cual podamos definir su movimiento de rotación. Inclusive tratar de aumentar la rotación de la
Tierra poniendo enormes cohetes anclados a su ecuador sería un ejercicio inútil porque no
habiendo una masa del Universo que determine localmente la inercia del planeta Tierra
porque dicha rotación -que ni siquiera podría ser estimada- se puede obtener sin gasto alguno
de energía, porque siendo el único objeto en el Universo la Tierra carecería de inercia para
resistir su aceleración rotatoria. El principio de Mach es enunciado a veces vagamente diciendo
“la masa que hay afuera es lo que produce la inercia que hay aquí”.

El principio de Mach de hecho fue anticipado por el filósofo irlandés Bishop Berkeley, el cual en
contraposición a Newton que definió a la rotación de un cuerpo como un
movimiento absoluto en base a la fórmula para la fuerza centrípeta, sugirió que era la
rotación relativacon respecto a las estrellas del Universo lo que realmente importaba, y que la
rotación de las estrellas fijas en el firmamento en relación a un objeto debería tener las mismas
consecuencias físicas que la rotación del objeto con respecto a las estrellas. De acuerdo con
Berkeley, si la Tierra fuese el único cuerpo en el Universo, carecería de todo sentido el afirmar
que la Tierra está girando. Puntos de vista similares fueron emitidos poco después por Gottfried
von Leibinz y Chrisitan Huygens. Sin embargo, correspondió a Mach el respaldar estas
concepciones con una teoría científica, e inclusive anticipó mucho del material filosófico que
podemos encontrar dentro de la Teoría de la Relatividad. De acuerdo con Mach, un Universo
desprovisto de estrellas carecería de una estructura espacio-tiempo con respecto a la cual la
Tierra pudiera girar, y para que pueda haber campos gravitacionales o inerciales capaces de
hacer que la Tierra pierda su forma esférica convirtiéndose en un elipsoide a causa de su
rotación o capaces de hacer que el agua en una cubeta que está girando se salga por los lados,
debe de haber estrellas capaces de crear una estructura espacio-tiempo. Sin una estructura tal el
espacio-tiempo carecería de geodésicas. Inclusive no se podría decir que un rayo luminoso
viajando en un Universo vacío sería capaz de recorrer una geodésica, porque en ausencia de una
estructura espacio-tiempo el rayo luminoso no tendría forma de “seleccionar” una ruta sobre la
otra. El rayo luminoso “no sabría a dónde ir”, como lo expresó A. d'Abro en su obra clásica The
Evolution of Scientific Thought. Inclusive la existencia de un cuerpo como la Tierra no sería
posible, porque las partículas que forman a la Tierra están cohesionadas por la gravedad, la cual
mueve a las partículas a lo largo de geodésicas. Sin una estructura espacio-tiempo y sin
geodésicas, la Tierra “no sabría qué forma tomar” como lo dijo el mismo d'Abro.
Vayámonos ahora hacia el espacio exterior en nuestro Universo en donde sí hay materia que
podemos ver por dondequiera que apunten nuestros telescopios. Supongamos que tenemos un
bloque flotando libremente y en reposo en el espacio exterior (1), y que le imprimimos a dicho
bloque una fuerza F de aceleración (2) tras lo cual después de cierto tiempo removemos dicha
fuerza (3) habiendo puesto al bloque en movimiento perpetuo hacia su dirección de
movimiento, (4) y (5):

Podemos ver en (2) cómo al aplicarle una fuerza F al bloque éste se resiste a ser puesto en
movimiento de acuerdo a la tercera ley de Newton (“a toda acción corresponde una reacción de
igual intensidad y dirección contraria”), presentando una fuerza de oposición que está
simbolizada como la flecha gris dentro del bloque. De este modo, al aplicarle al bloque una
“fuerza viviente” se le ha despertado de su estado inerte, “sin vida”, poniéndolo en un estado de
movimiento perpetuo (filosóficamente hablando, esta es precisamente la motivación para el uso
de la palabra inercia). Pero de acuerdo con el principio de Mach, aunque el bloque fuese un
objeto tan grande como un rascacielos de 100 pisos o inclusive tan grande como la Tierra, no
presentaría absolutamente ninguna oposición -o inercia- a un empuje al no tener inercia
alguna dentro de un Universo vacío. El objeto no sólo sería mucho más ligero que una simple
pluma, sería lo más ligero que pudiese haber porque aunque el cuerpo poseyera cierta masa (y
cierto volumen) su masa inercial sería exactamente igual a cero. De hecho, algo así nos pondría
en un severo dilema para tratar de determinar la masa del cuerpo al comportarse como si fuese
un cuerpo sin masa por tener una inercia igual a cero.

La única forma en la cual podemos verificar con certeza absoluta si el principio de Mach es
válido o falso consistiría en vaciar al Universo de todo rastro de materia y llevar a cabo algunos
experimentos en ese Universo vacío, lo cual ciertamente no va a ocurrir ni hoy ni mañana.

Si el Universo entero posee una masa enorme (ya sea finita o infinita) que podemos simbolizar
como MU, entonces de acuerdo con el concepto del campo gravitacional esta masa repartida por
todo el Universo debe estar generando un inmenso campo gravitacional universal o
quizá algún campo de otra índole que admite variaciones locales que forman parte del
campo universal. De acuerdo con el principio de Mach, este campo universal vendría siendo
precisamente lo que genera la inercia de cada cuerpo, sin el cual los cuerpos dejarían de tener
dicha propiedad. Este es precisamente el punto de vista que desarrolla Dennis Sciama en su
libro The Unity of the Universe, y de ser cierto entonces la medición local de la inercia nos
proporcionaría una medida de la cantidad total de materia que hay en el Universo. Las
ecuaciones de Sciama demuestran que la influencia de las estrellas cercanas sobre la inercia de
un cuerpo es increíblemente pequeña. Cuando escribió su libro, él suponía que todas las
estrellas de nuestra galaxia, la Vía Láctea, contribuían tan sólo con una diez-millonésima de la
inercia aquí en la Tierra, concluyendo que el resto de la inercia es generada por estrellas
distantes al grado de que un 80 por ciento de la inercia era el resultado de galaxias tan distantes
que aún no habían sido descubiertas por los telescopios de su época. En la actualidad, con el
desarrollo de nuevos y más potentes telescopios de toda índole aumentando en forma explosiva
la cantidad de estrellas y galaxias detectadas y confirmadas, la estimación a la contribución de
las mismas para la creación local del efecto de inercia ha tenido que ser revisada
substancialmente hacia abajo a grado tal que un amplio segmento de la comunidad científica ha
llegado a la conclusión de que Mach estaba equivocado. La única forma, desde luego, de probar
sin tela de duda que Mach estaba equivocado, sería vaciando al resto del Universo de la materia
que contiene, lo cual no va a suceder. Desde esta perspectiva, cuando Mach formuló su hipótesis
posiblemente lo hizo sabiendo que sería muy difícil si ni imposible el poder desacreditarlo por
completo.

Históricamente, Einstein se inspiró en el principio de Mach para desarrollar la Teoría de la


Relatividad. Él mismo fue quien se refirió al punto de vista de Mach como “el principio de
Mach”. Era la esperanza de Einstein que este principio pudiese ser incorporado dentro de la
Teoría de la Relatividad, al grado de concebir un modelo del Universo en el cual su estructura
espacio-tiempo es creada por las estrellas y otros cuerpos materiales. Cuando publicó su
primera descripción matemática de dicho modelo en 1917, Einstein dijo: “En una teoría
consistente de la relatividad, no puede haber inercia relativa al ‘espacio’, sino tan solo una
inercia de las masas relativas la una a la otra. Por lo tanto, si yo tengo una masa lo
suficientemente alejada de todas las otras masas restantes del Universo, su inercia debe caer a
cero”. Posteriormente, cuando fueron encontradas fallas serias en el modelo cosmológico de
Einstein, éste se vió obligado a abandonar el principio de Mach. De cualquier manera, el
principio de Mach continúa ejerciendo una fascinación casi irresistible sobre muchos
cosmólogos en virtud de que lleva la relatividad del movimiento hasta su grado máximo. El
punto de vista opuesto, el que supone la existencia de una estructura espacio-tiempo inclusive
en la ausencia total de estrellas y cualquier otro tipo de masa en el Universo, no está muy alejado
de la vieja teoría del éter. En lugar de una substancia misteriosa invisible e inmóvil llamada éter,
tenemos ahora una substancia misteriosa e invisible llamada espacio-tiempo. Suponiendo que
esta estructura permanece fija, todas las aceleraciones y rotaciones que ocurren en el Universo
adquieren sospechosamente un carácter absoluto. Pero si los efectos inerciales son relativos no a
la estructura universal del espacio-tiempo sino a las estrellas de Universo, entonces se puede
preservar una forma pura de relatividad. Resulta irónico que, habiendo sido Mach uno de los
mayores inspiradores de Einstein junto con el “padre del electromagnetismo” Maxwell para la
formulación de la Teoría de la Relatividad, Mach siempre haya rechazado a la Teoría de la
Relatividad hasta el final de sus días considerándola una teoría errónea y falsa.

El concepto del campo tiene tanto sus ventajas como sus desventajas, pero siendo sus
desventajas más de índole filosófica que científica y técnica, es un concepto que debe ser
retenido como una de las herramientas más útiles que se hayan desarrollado en la historia del
hombre para su comprensión del Universo que le rodea.

Los agujeros negros: Génesis


Por su naturaleza propia, no resulta nada fácil encontrar soluciones exactas para las ecuaciones
de campo de la Relatividad General, pero cuando se logra tal cosa los resultados pueden resultar
sorprendentes. Cuando al poco tiempo de haberse publicado en 1915 el primer trabajo de
Einstein dándose a conocer la Teoría General de la Relatividad el matemático alemán Karl
Schwarszchild encontró una solución exacta a las ecuaciones de campo de Einstein a través de
lo que hoy se conoce como la métrica de Schwarszchild, basada en el uso de coordenadas
esféricas para un cuerpo estático:
ds² = (1 - 2GM/rc²)(cdt)² - (1 - 2GM/rc²) -1(dr)² - (r²)(dθ)²

- (r² sen² θ)(dφ)²

no transcurrió mucho tiempo para darse cuenta de que esta métrica predecía la existencia de
objetos tales que ni siquiera la luz sería capaz de escapar de los mismos. Esta predicción era una
predicción puramente matemática, sin apoyo alguno en una evidencia astronómica e imposible
de ser verificada experimentalmente en un laboratorio en la Tierra, razón por la cual no fue
tomada muy en serio en aquella época. Otra dificultad en la aceptación de la solución
matemática encontrada por Schwarzschild era que la existencia de estos objetos,
necesariamente super-masivos, era postulada sin darse la menor idea de cómo se pudieran
formar tales objetos en el Universo. Una cosa es hacer una predicción matemática sobre la
posible existencia de algo recurriendo a argumentaciones teóricas, y otra cosa muy diferente es
explicar la manera en la cual tales objetos pueden ser creados. La ausencia de mecanismos que
pudieran dar origen a tales objetos extraños constituyó un impedimento en la aceptación de los
mismos hasta que llegaron teorías dando la ruta sobre una forma natural para la creación de los
mismos.

Pero quizá la objeción más grande de todas a la solución de Schwarzchild era que en el centro de
la misma debía de haber una singularidad, el equivalente de una división por cero tan temida
por los matemáticos ya que está fuera de cualquier tipo de análisis numérico que se quiera llevar
a cabo. Y esta singularidad representaba en las ecuaciones de campo ni más ni menos que una
perforación en el entramado del espacio-tiempo del Universo. Desde un principio, esto rebasó
los límites de la credibilidad de muchos científicos, inclusive aquellos acostumbrados a la
naturaleza probabilística de la materia predicha por la mecánica cuántica. La dificultad de
aceptar la posibilidad de que una singularidad matemática pudiese tener una existencia real en
el campo de la astronomía, en el Universo entero, fue inclusive un argumento utilizado por
amplios sectores de la comunidad científica para poner en duda y desacreditar toda la Teoría de
la Relatividad, afirmándose que cualquier teoría que fuese capaz de postular la existencia de
algo tan extraño tenía que ser una teoría necesariamente incorrecta.

Estos objetos tan masivos que ni siquiera la luz podría escapar de los mismos fueron bautizados
como agujeros negros o hoyos negros por el físico estadounidense John Archibald Wheeler,
un especialista en la Relatividad General.

Todavía hace unas cuantas décadas, se creía que estos objetos, de existir, debían ser una rareza
difícil de encontrar en el Universo. Hoy en día, con instrumentos astronómicos cada vez más
potentes, la existencia de los agujeros negros no sólo ha sido confirmada de varias maneras, sino
que existe la certeza de que inclusive la galaxia en la que vivimos, la Vía Láctea, tiene en su
núcleo central un agujero negro gigantesco, al igual que muchas otras galaxias.

Si repasamos la métrica de Schwarzschild dada arriba, encontraremos que


hay dos singularidades. Una de ellas está relacionada con la coordenada (cdt)² y ocurre para r =
0, o sea en el centro del cuerpo. La otra está relacionada con la coordenada (dr)²:

y ocurre para un radio conocido como el radio de Schwarzschild, el cual está dado por:

rs = 2GM/c²

Este es precisamente el radio que nos define la extensión de la esfera de la cual no le es posible
a la luz escapar del cuerpo que está generando la métrica en cuestión. Dada una masa
M, cualquier masa M, siempre existe un radio rs que podemos determinar para dicha masa. La
Tierra, por ejemplo, tiene cierto radio de Schwarzschild rs, como también lo tiene el Sol. Sin
embargo, no hay problema en que un rayo de luz lanzado desde la superficie de la Tierra
“escape” hacia la Luna, llegue a la Luna, y sea reflejado de la Luna hacia la Tierra (esto ocurrió
de hecho con la ayuda de unos reflectores dejados en la Luna por los astronautas de una de las
misiones Apollo, reflejando posteriormente rayos de luz láser lanzados desde la Tierra hacia
dichos reflectores). ¿Cómo es esto posible, si la Tierra tiene su radio rs del cual no le es posible a
la luz escapar? Esto se debe a que, si calculamos el radio rs para la Tierra, dicho radio
está dentro de la superficie de la Tierra. Para que no le fuese posible a la luz escapar de la
superficie de la Tierra, la masa entera de la Tierra tendría que ser “comprimida” hasta estar
contenida toda dentro de ese radio rs. Sin embargo, si podemos tener un cuerpo lo
suficientemente denso, de modo tal que toda su masa esté contenida dentro de su radio rs, no le
será posible a la luz lanzada hacia afuera desde dicho radio escapar al espacio exterior. Y se
presume que, si toda la masa de un cuerpo es comprimida hasta quedar contenida en un radio
menor que su radio rs, la atracción gravitacional será tan intensa que toda la masa continuará
comprimiéndose aún más. De cualquier manera, el radio rs sigue “afuera”, una vez que ha hecho
su aparición el “boquete” aparente continúa allí inmóvil.
Haremos ahorauna comparación interesante del radio de Schwarzschild rs con la velocidad de
escape clásica (Newtoniana) que debe tener un cuerpo al momento de ser lanzado verticalmente
desde la superficie de la Tierra para no volver a caer jalado por la atracción de la gravedad. Para
beneficio de quienes no han estado expuestos o no recuerdan la derivación de la fórmula de la
velocidad de escapa, a continuación llevaremos a cabo la derivación de la fórmula.

Suponiendo una equivalencia plena clásica (Newtoniana) entre la masa inercial definida con la
fórmula Fi = ma y la masa gravitacional definida mediante la ley de Newton para la atracción
universal que establece una fuerza gravitacional Fg = - GMm/r², un cuerpo lanzado hacia arriba
experimentará una pérdida de velocidad definida mediante la siguiente igualdad:

Fi = Fg

Usando la regla de la cadena, obtenemos lo siguiente:

y puesto que v = dr/dt:

Integrando:
Puesto que para la velocidad de escape estamos buscando las siguientes condiciones (para un
tiempo infinitamente grande a una distancia infinitamente grande la velocidad del cuerpo debe
ser igual a cero):

t → ∞___r(t) → ∞___v(t) → 0

entonces debemos tener:

Esta es la velocidad de escape que debe tener un cuerpo lanzado desde la superficie de la Tierra
para sobreponerse completamente a la atracción gravitacional sin volver a caer. Obsérvese
que esta velocidad de escape no depende en lo absoluto de la masa del cuerpo que está siendo
lanzado verticalmente hacia arriba.

Tomemos ahora la fórmula clásica para la velocidad de escape v0 de un cuerpo poniéndola en


función del radio r0:

Compárese ésta fórmula con la fórmula para el radio de Schwarzschild. Ambas tienen
exactamente la misma forma, pero con una diferencia importante: en la fórmula para el radio
de Schwarzschild lo que aparece específicamente en el denominador es la velocidad de la luz.
Esto fue lo que llevó a sospechar casi de inmediato desde un principio que esta fórmula definía
algo más que la velocidad de escape de un cuerpo, definía una condición para que la misma luz
pudiera escapar de la superficie sobre la cual está definido el radio de Schwarzschild. En la
fórmula clásica para el radio de escape podemos hacer a la velocidad v0 igual a la velocidad de la
luz. Sin embargo, antes del advenimiento de la Teoría de la Relatividad, carecía de sentido
hablar de una velocidad de escape para la luz porque no había razón para suponer que la luz,
siendo una onda electromagnética, pudiese caer bajo la influencia de atracción gravitacional
alguna. Y sin embargo, es el radio de Schwarzschild lo que nos define precisamente el alcance
de un agujero negro.

Como un agujero negro es incapaz de emitir luz alguna o de reflejarla, no es posible ver un
agujero negro directamente. Si pudiésemos estar en la cercanía de una región en donde hay un
agujero negro, tal vez veríamos algo como lo siguiente:

Esta es la simulación de un agujero negro con una masa equivalente a la de diez masas solares,
visto a una distancia de 600 kilómetros. El círculo negro que vemos en la parte central de la
imagen de arriba es lo que se conoce como el horizonte de evento (event horizon), el cual
tiene un radio fijo para una masa M, y fuera del cual aunque hay una atracción gravitacional
intensa aún es posible escapar de la atracción que está siendo ejercida. Este radio fijo que define
a la superficie esférica conocida como el horizonte de evento es precisamente el radio de
Schwarzschild rs. Cualquier objeto material que penetre el horizonte de evento es un objeto que
ya no podrá salir del agujero negro, ya que si ni la luz puede escapar del mismo menos un objeto
material.

A decir verdad, la predicción de objetos con tanta masa que fueran capaces de crear un campo
gravitacional tan intenso que ni siquiera la luz pudiera escapar de los mismos no fue una idea
nueva que llegó con la Teoría General de la Relatividad. Desde 1784, año el el que fue publicada
una carta enviada a Henry Cavendish por el filósofo natural y geólogo inglés John Michell, en
dicha carta “redescubierta” recientemente en la década de los setenta Michell hablaba de un
cuerpo celestial que tuviese tanta masa que a la misma luz le fuese imposible escapara de la
superficie de dicho cuerpo (la ley de la gravitación universal de Newton y la fórmula para
la velocidad de escape de la superficie de un planeta ya eran conocidas en aquél entonces), e
inclusive señaló que aunque un objeto así no fuese directamente visible su existencia se podría
intuír por el efecto gravitacional que ejercería sobre un planeta cercano, llegando al extremo de
sugerir el uso de un prisma para medir el efecto de la gravedad sobre la disminución en la
intensidad de la luz (lo que hoy conocemos como el corrimiento al rojo), ideas demasiado
avanzadas para su tiempo. Por su parte, el matemático francés Pierre-Simon Laplace en su
libro Exposition du Systeme du Mondepublicado en 1796 sugirió también la posibilidad de
objetos tan masivos que fueen capaces de impedirle a la misma luz escapar de ellos. En sus
propias palabras, Laplace dijo lo siguiente: “Una estrella luminosa, de la misma densidad que la
densidad de la Tierra, y cuyo diámetro fuera 250 veces más grande que el del Sol, no permitiría,
como consecuencia de su atracción, que cualquiera de sus rayos nos llegasen; es por lo tanto
posible que los cuerpos luminosos más grandes en el Universo sean, por esta causa, invisibles”.
Sin embargo, estas ideas estaban basadas en el concepto de una fuerza de gravedad, concepto
descartado y reemplazado en la Teoría General de la Relatividad por el concepto de un espacio-
tiempo curvo fijando las órbitas de los planetas.

PROBLEMA: Suponiendo la ley de gravitación universal de Newton como válida, y siendo la


velocidad de escape de un cuerpo de la superficie de la Tierra igual a 11.2 kilómetros/seg, ¿cuál
sería la velocidad de escape si de alguna manera pudiésemos comprimir a la Tierra a la mitad
de su tamaño actual?

Tomaremos como válidos los siguientes datos:

Constante de Gravitación Universal = G = 6.674215·10-11 m3/kg-seg²

Radio medio de la Tierra = R = 6,400 kilómetros

De la fórmula para la velocidad de escape, y suponiendo que el radio promedio de la Tierra ha


sido comprimido de R = 6,400 kilómetros a la mitad, la velocidad de escape sería:

v = √2GM/R = √2GM/(3,200 Km) = 15.8 Km/seg


En la fórmula podemos ver que, manteniendo la masa M constante y comprimiendo de alguna
manera un cuerpo esférico disminuyendo su radio, aumentará entonces la velocidad de escape
requerida para que un objeto se pueda sustraer de la atracción gravitatoria del cuerpo. Nos
preguntamos ahora: ¿cuál tendrá que ser el radio de un cuerpo con una masa igual a la masa de
la Tierra, para que la velocidad de escape de su superficie sea igual a la velocidad de la luz?

PROBLEMA: Suponiendo la ley de gravitación universal de Newton como válida, ¿cuál


tendría que ser el radio de un cuerpo esférico con una masa igual a la masa de la Tierra para
que la velocidad de escape requerida sea igual a la velocidad de la luz?

En este caso:

c = √2GM/R

R = 2GM/c²

R = 0.9 centímetros

De acuerdo con la mecánica Newtoniana, si la Tierra pudiese ser comprimida hasta este tamaño,
ni siquiera la misma luz podría escapar de su superficie. ¡La Tierra se convertiría en un agujero
negro! Sin embargo, este es un resultado que se antoja difícil de lograr, porque no conocemos
una fuerza que sea capaz de comprimir a un planeta como la Tierra hasta tener el tamaño de una
pelota que mida menos de una pulgada. Agregar más masa (en forma de polvo) sobre la
superficie de la Tierra con la esperanza de que a mayor masa obtengamos mayor atracción
gravitacional tampoco ayudará en nada ya que al ir agregando más masa el radio R de la Tierra
irá aumentando también contrarrestando en cierta forma el efecto gravitacional de una masa
mayor (lo cual aumenta la atracción de la gravedad) con una distancia también mayor al centro
geométrico de la Tierra (lo cual disminuye la atracción de la gravedad), no sirviendo de nada
para esto último el que intentemos construír un pozo que vaya hacia el interior de la Tierra (con
el fin de disminuír la distancia R hacia el centro de la Tierra) porque la gravedad de hecho va
disminuyendo en el interior de la Tierra hasta hacerse cero en el centro de la Tierra (en donde R
= 0). No se antoja posible que podamos convertir a un planeta sólido como la Tierra en un
agujero negro.

¿Pero qué tal si en vez de usar un planeta sólido empleamos en su lugar una estrella que está
compuesta de una nube de partículas elementales?

PROBLEMA: De acuerdo con la métrica de Schwarzschild, ¿cuál tendría que ser el radio de
una estrella como el Sol para que la luz pueda escapar de su superficie?

Tomaremos el siguiente dato como válido:

Masa del Sol = 1.99·10 30 Kilogramos

Procederemos como en el problema anterior usando para M la masa del Sol en lugar de la masa
de la Tierra, pero ahora utilizaremos el radio de Schwarzschild que nos define a la superfice
esférica de un horizonte de evento:

rs = 2GM/c²

rs = 2 (6.674215·10-11) (1.99·10 30) /(3·10 8)²

rs = 3 kilómetros

Este radio sigue pareciendo extremadamente pequeño tomando en cuenta que el Sol posee un
radio de centenas de miles de kilómetros. Sin embargo, si calculamos la densidad del Sol,
encontraremos que esta densidad no es mucho mayor que la densidad del núcleo de los átomos.

PROBLEMA: Suponiendo que de alguna manera podamos comprimir al Sol para que tenga
un radio de 3 kilómetros, ¿cuál será su densidad?

Tomaremos el siguiente dato como válido:

Masa del Sol = M = 1.99·10 30 Kilogramos

La densidad ρ es igual a la masa por unidad de volumen, o sea (suponiendo al Sol como una
esfera con un radio -comprimido- de 3 kilómetros):

V = (4/3) π r3

V = (4/3) π (3,000 metros) 3 = 1.13·10 11 m3


ρ = M/V

ρ = (1.99·10 30Kg) / (1.13·10 11 m3)

ρ = 1.76·1019 Kg/m3

Esta densidad no es mucho mayor que la densidad que encontramos en el núcleo de los átomos.
En el caso de una esfera gaseosa compuesta por partículas elementales como el Sol, si las fuerzas
atómicas de alguna manera son capaces de ir comprimiendo la materia hasta estas densidades,
entonces tenemos la posibilidad de que a diferencia de lo que ocurre con un planeta sólido
una estrella sea capaz de terminar convirtiéndose en un agujero negro o por lo menos en un
objeto exótico conocido como una estrella de neutrones. Esto no solo es posible, sino de hecho
es inevitable que ciertas estrellas que posean cierta cantidad mínima de masa puedan detener su
conversión hacia una estrella de neutrones o hacia un agujero negro.

Para poder estar en condiciones de entender lo que ocurre en la formación de un agujero negro,
debemos tomar conocimiento sobre las tres formas en las cuales puede morir una a partir de su
creación.

El proceso de formación de una estrella comienza cuando una nube de gas empieza a contraerse
a causa de su propia atracción gravitacional. Conforme la nube de gas se va compactando, la
energía potencial gravitacional se va convirtiendo en energía térmica y la nube de gas se va
calentando. Al calentarse, la presión ejercida por los átomos y las moléculas del gas aumenta
tendiendo a contrarrestar la atracción gravitacional, y si la nube de gas no perdiese energía esta
presión bastaría para detener el proceso de compactación. Pero esto no sucede en virtud de que
la nube de gas continúa perdiendo energía a causa de la radiación que emite hacia el espacio
exterior. El proceso de compactación ocasionado por la atracción gravitacional prosigue su
marcha y la temperatura de la nube de gas continúa aumentando, hasta que después de algunos
millones de años el centro de la nube de gas está lo suficientemente caliente como para que
empiecen a ocurrir reacciones nucleares capaces de convertir materia en energía de acuerdo con
la fórmula E = mc². El destino final de la nube de gas conforme se va convirtiendo en una
estrella dependerá de la cantidad de gas inicial que había para la formación de la estrella, algo
que pudiéramos llamar su “masa inicial”.

Es un hecho aceptado entre los astrónomos que en cuanto mayor sea la cantidad de masa de la
cual consta una estrella tanto más violenta será su muerte. La primera forma en la cual puede
morir una estrella se aplica a estrellas relativamente pequeñas como la nuestra, el Sol. Estas
estrellas se mantienen “encendidas” mediante un proceso de fusión atómicaconocido
como proceso protón-protón en el cual a causa de la elevada temperatura las fuerzas
repulsivas que tienden a repeler a las partículas con cargas eléctricas del mismo signo son
vencidas y los átomos de hidrógeno son fusionados y convertidos en átomos de helio, lo cual a su
vez libera enormes cantidades de energía a la vez que la estrella va adquieriendo una
configuración que pudiéramos llamar “estable”:

Además de este proceso mediante el cual una estrella puede mantenerse viva existe otro
mecanismo de fusión atómica mejor conocido como el ciclo CNO (carbono-nitrógeno-oxígeno)
o ciclo Bethe, en referencia a Hans Bethe quien lo propuso por vez primera en 1939. Aunque la
cadena protón-protón es más importante en las estrellas con una masa como la de nuestro Sol o
menor, los modelos teóricos muestran que el ciclo CNO es la fuente de energía dominante en las
estrellas con una masa de por lo menos 1.5 veces más grande que la de nuestro Sol, las cuales
son las más susceptibles de terminar convirtiéndose en estrellas de neutrones ó agujeros negros.

Los procesos de fusión atómica que dan vida a las estrellas impiden por sí mismos que una
estrella pueda ser considerada como un objeto de densidad constante, y a partir del momento en
que la densidad de una estrella no es constante el proceso de colapso gravitacional es un hecho
ineludible. De cualquier manera, aunque se tuviese una estrella de densidad constante, para
cierta cantidad de masa el proceso de colapso gravitacional es inevitable de acuerdo con un
resultado clásico conocido como el teorema de Buchdahldado a conocer por Hans Adolph
Buchdahl en 1959, de acuerdo con el cual no puede haber estrellas de densidad uniforme que
tengan un radio menor que (9/4) M (siendo M la masa Schwarzschild en unidades
geometrizadas). Esto significa que si uno construye una estrella de densidad constante con un
radio igual a (9/4) M y le dá un ligero empujón (esféricamente simétrico) hacia adentro,
entonces a la estrella no le queda más alternativa que comenzar a colapsarse hacia adentro, a la
estrella no le es posible ya retomar una condición estática.
En un proceso de fusión como el que mantiene vivo a nuestro Sol, cada mil kilogramos de
hidrógeno son convertidos en 993 kilogramos de helio que van a dar al interior de la estrella que
actúa como una especie de “basurero”:

mientras que los 7 kilogramos restantes son emitidos hacia el exterior como 6.3·10 16 joules de
energía radiante (este es el tipo de energía que recibimos del Sol) al pasar por el proceso de
metamorfosis de masa a energía de acuerdo con la equivalencia relativista E = mc². Estrellas
como nuestro Sol “queman” más de unas quinientas millones de toneladas cada segundo que
son fusionadas de hidrógeno a helio, lo cual continúan haciendo por miles de millones de años
hasta que se les va agotando el hidrógeno. Mientras esto ocurre, el “núcleo de helio” de la
estrella se encuentra en una situación similar a la que se encontraba la nube de gas original que
dió inicio a la creación de la estrella, al empezar a contraerse debido a la acción de la gravedad
calentándose y acelerando el proceso de “incineración” del hidrógeno en la capa exterior. En
este proceso, los átomos de helio en el interior de la estrella empiezan a fusionarse a causa de la
enorme temperatura y presión convertiéndose en carbono y oxígeno, liberando con ello más
energía. A causa de esto, las capas exteriores de la estrella experimentan una expansión además
de un enfriamiento que produce un cambio importante en su aspecto, con lo cual la estrella
termina convirtiéndose en un tipo de estrellas conocidas como gigantes rojas (rojas porque la
temperatura en la superficie de las mismas ha descendido de manera significativa y gigantes por
el aumento en su tamaño disminuyendo enormemente a la vez la densidad de las mismas).
Cuando nuestro propio Sol llegue a esta etapa que le está esperando en unos cinco mil millones
de años, será tan grande que llegará hasta Mercurio, Venus, y a la misma Tierra. Un ejemplo
muy conocido de una gigante roja es la estrella Betelgeuse:

Eventualmente, el proceso de fusión en el interior de la estrella empieza a agotar la fuente de


helio, y la estrella puede pasar por fases en las cuales los átomos de carbono son fusionados para
ser convertidos en átomos de silicio, y a su vez estos átomos de silicio son fusionados para ser
convertidos en átomos de hierro. Eventualmente, a toda estrella se le debe terminar su
fuente de energía obtenida a base de procesos de fusión atómica, puesto que el
hierro es el elemento más estable de todos los átomos en lo que respecta a esta
clase de procesos. Cualquier reacción que convierta al hierro en otro elemento de la tabla
periódica es una reacción que requiere suministrar energía en lugar de liberarla.

En su proceso de desarrollo, una estrella tiene una temperatura lo suficientemente elevada como
para que sus átomos se encuentren ionizados (sin electrones estables en las órbitas que
normalmente les corresponderían alrededor de los átomos). Si la densidad de la estrella no es
muy elevada, cuando es relativamente joven, esta colección de átomos y iones se comporta en
cierta manera como un gas ideal cuya presión P y cuya temperatura T están relacionadas
mediante la ley del gas ideal:

P = nkT

siendo n la densidad del gas y k la constante de Boltzmann (1.381×10 −23 joules/grados Kelvin).
De esta fórmula podemos ver que para una densidad dada se requiere una temperatura elevada
T para poder mantener una presión P que se oponga al colapso gravitacional de la estrella, pero
en virtud de que la estrella está radiando constantemente energía hacia el espacio exterior la
temperatura T no puede ser sostenida indefinidamente al írsele agotando a la estrella su
“combustible”, con lo cual disminuye la presión P y con lo cual el colapso gravitacional continúa.
Sin embargo, al continuar compactándose la estrella aumentando su densidad, se va alejando de
su comportamiento como un gas ideal pero entra en acción otro efecto repulsivo de naturaleza
puramente cuántica (como en Mecánica Cuántica). Los electrones del gas de la estrella
obedecen el principio de exclusión de Paulique nos dice que “dos electrones no pueden ocupar el
mismo estado con todos sus números cuánticos iguales”, y como consecuencia de este efecto
existe una presión-repulsión adicional que se opone al colapso gravitacional de la estrella, una
presión adicional ejercida por los electrones que se vuelve importante al ir aumentando la
densidad de la estrella, a la cual se le conoce como presión de degeneración de los
electrones (electron degeneracy), la cual requiere de una densidad en torno a los 106 g/cm³
(1000 kg/cm³). Si la densidad de la materia en una estrella se vuelve aproximadamente unos
cinco millones de veces más grande que la densidad del agua, los electrones contribuyen con
una presión adicional que es aproximadamente igual a:

P ≈ hcn4/3

siendo h la constante de Planck, c la velocidad de la luz y n el número de electrones por unidad


de volumen (a densidades más bajas la presión se vuelve proporcional a n5/3). Esta presión,
siendo de naturaleza cuántica, no requiere de una temperatura alta, de modo tal que puede ser
sostenida aún cuando la estrella continúa radiando energía.
Para que una estrella pueda sostenerse en un estado de equilibrio resistiéndose a su colapso
gravitacional, el requerimiento esencial de equilibrio hidroestático es que a cada radio r -
medido desde el centro de la estrella- la fuerza de atracción gravitacional Newtoniana que tiende
a compactarla sea contrabalanceada por una presión causada por el gas del que está formada la
estrella, lo cual se puede formular clásicamente de la siguiente manera con la ecuación de
equilibrio hidroestático para estrellas Newtonianas (no-relativistas):

siendo dP/dr la razón del cambio de la presión con respecto al radio de la estrella, ρ la densidad
de la materia, y m(r) la cantidad total de masa encerrada en un “casco” esférico a una distancia r
del centro de la estrella. Es de notarse que m(r) puede ser una función compleja que además de
depender del radio r también dependerá no sólo de la edad de la estrella sino de los elementos
que se estén formando en su interior (ya vimos que en el centro de la estrella se va formando un
núcleo de helio, al cual posteriormente se le irán sumando otros elementos más pesados como el
carbono y el silicio, mientras que en el exterior se tiene una capa de hidrógeno). A partir de esta
ecuación se puede demostrar que para poder sostenerse en contra de un colapso gravitacional,
la presión Pc en el centro de la estrella debe ser aproximadamente:

Pc ≈ GM2/3 ρ4/3

siendo M la masa total de la estrella. Para saber si la presión de degeneración de los


electrones es suficiente para salvar a una estrella de un colapso gravitacional continuado, es
necesario comparar la presión producida por la degeneración de electrones P con la presión
central Pc. Repasando las fórmulas obtenidas, podemos ver que ambas tienen la misma
dependencia (n4/3 y ρ4/3) en la densidad de electrones (la densidad ρ es directamente
proporcional a n). La salvación de la estrella de un colapso gravitacional solo será posible si el
coeficiente numérico del término n4/3 debida a la presión de degeneración de los electrones P es
mayor que el coeficiente numérico del término n4/3 (esencialmente ρ4/3) de la presión
central Pc requerida. En virtud de que el coeficiente numérico de Pc depende directamente de la
masa total M de la estrella, esto implica que las estrellas pequeñas pueden ser sostenidas en
contra de un colapso gravitacional continuado, no siendo así con las estrellas grandes. Si P fuera
proporcional a n4/3, inclusive estrellas con densidades bajas serían inestables. Pero como ya se
mencionó, a densidades más bajas la presión de degeneración de electrones se vuelve
ligeramente mayor, proporcional a n5/3, lo cual permite que haya estrellas estables cuando su
masa total M esté por debajo de la masa crítica. Los cálculos detallados llevados a cabo por vez
primera por SubrahmanyanChandrasekhar a principios de la década de los treinta demostraron
cómo en aquellas estrellas con una masa menor que 1.3 veces la masa de nuestro Sol la presión
de degeneración de los electrones P puede detener el colapso gravitacional, con lo cual las
estrellas pueden “envejecer” hasta convertirse en gigantes rojas.

Sin embargo, para una masa mayor a 1.3 veces la masa de nuestro Sol pero no mayor de cierto
límite, al ser insuficiente la presión de degeneración de los electrones se vuelve cada vez más
probable que las estrellas eventualmente continúen con su proceso de colapso de gravitacional
hasta que la atracción de la gravedad hace que se contraigan a una estrella conocida como enana
blanca del tamaño de la Tierra pero con una masa equivalente a la masa del Sol. Un pedacito de
una enana blanca del tamaño de un guisante tendría (sobre la superficie de la Tierra) un peso
superior al de un hipopótamo. A continuación tenemos a una enana blanca comparada en
tamaño con la Tierra:

En estas estrellas el empuje hacia el interior ocasionado por la gravedad sigue siendo contra-
balanceado por la presión repulsiva producida por la degeneración de los electrones. Conforme
va pasando el tiempo, la enana blanca continúa enfriándose hasta convertirse lo que equivale al
rescoldo de una brasa que se va apagando, conocido como enana negra, explotando su capa
exterior hacia el espacio formando una nebulosa como la Nebulosa del Anillo M57 en la
constelación de Lyra:
Si suponemos que la masa original de la estrella es ligeramente mayor a la de nuestro Sol pero
no dos veces mayor, podría convertirse en una enana blanca e inclusive también podría
convertirse en una gigante roja (aunque esto último no es muy probable). Sin embargo, existe
un límite para una enana blanca, conocido como el límite de Chandrasekhar, el cual
equivale a aproximadamente unas 1.44 masas solares, siendo esta la máxima masa posible de
una estrella fría estable con la cual la degeneración de electronesen su interior (flechas rojas)
apenas es capaz de contrarrestar la atracción de la gravedad (flechas negras):

Si se supera la masa límite de Chandrasekhar, la estrella se empezará a colapsar:


en camino para convertirse en una estrella de neutrones ó en un agujero negro (existe también,
al menos en teoría, un tercer posible resultado de este colapso, que se cree que puede producir
lo que hoy se conoce como una estrella de quarks), ya que al contraerse por efecto de la
atracción de la gravedad, su mayor cantidad de masa hará que se exceda el límite crítico
explotando para convirtirse en una supernova:

Cuando estos eventos ocurren, las explosiones son visibles e inclusive pueden ser vistas en el
cielo sin ayuda de instrumentos ópticos como estrellas con una luminosidad mucho mayor que
la luminosidad de las estrellas circundantes. La Nebulosa del Cangrejo es el residuo de una
explosión de este tipo, la cual tuvo lugar en 1054 y fue tan espectacular que incluso fue
registrada por los astrónomos orientales.
Rebasado el límite de Chandrasekhar, y antes de que la estrella pueda terminar convirtiéndose
en un agujero negro, existe otro límite que determina la suerte que le espera a una estrella con
una masa dos o tres veces mayor que la masa de nuestro Sol. Cuando una estrella explota
convirtiéndose en una supernova arrojando hacia el espacio su capa exterior, esta explosión
también proporciona un empuje esférico hacia el interior concentrando en el núcleo remanente
de la estrella una cantidad de masa mucho mayor que la que había antes allí. Tenemos
nuevamente una situación inicial de equilibrio hidroestático. Sin embargo, la intensidad del
campo gravitacional impide que podamos analizar este tipo de estrella bajo la mecánica clásica
Newtoniana. Es necesario recurrir a las ecuaciones de campo de la Relatividad General para
poder determinar lo que va a ocurrir de aquí en adelante. Esta fue la conclusión a la que se llegó
en 1939 cuando se obtuvo una solución a las ecuaciones de campo de la Relatividad General
también para el caso de una masa esféricamente simétrica, tomando como punto de partida
la ecuación de equilibrio hidroestático para estrellas relativistas:

Esta ecuación exacta que reemplaza a la ecuación Newtoniana, descrita por vez primera por el
físico norteamericano Robert Oppenheimer y su alumno George Volkoff, es mejor conocida
como la ecuación Oppenheimer-Volkoff. Compárese esta ecuación relativista con su
contraparte Newtoniana dada arriba. Podemos ver que en el lado derecho de esta ecuación tanto
por el numerador que es mayor en la expresión relativista como por el denominador que es
menor en la expresión relativista, será más difícil el poder mantener un equilibrio hidroestático
-la presión requerida para mantener a una estrella en pie en contra de su colapso gravitacional-
que como lo era en el caso Newtoniano clásico, debido al mayor gradiente de presión dP/dr. Si la
expresión Newtoniana derivó en un límite, el límite de Chandrasekhar, que es la masa máxima
con la cual una estrella puede sostenerse en equilibrio en contra de su colapso gravitacional,
podemos esperar que en la expresión relativista para el equilibrio hidroestático habrá también
otro límite. Ese límite existe y es conocido como el límite Oppenheimer-Volkoff.

Con el propósito de poder compaginar mejor la teoría con los datos experimentales y las
observaciones astronómicas, la ecuación Oppenheimer-Volkoff fue objeto de una modificación
posterior que produjo lo que hoy se conoce como la ecuación Tolman-Oppenheimer-
Volkoff:
en donde r es la coordenada radial y ρ(r) y P(r) son la densidad y la presión, respectivamente,
del material de la estrella en un punto r = r0, siendo M(r0) la masa total de la estrella dentro del
radio r=r0 como es medido por el campo gravitacional percibido por un observador distante. La
métrica relativista ligada a la ecuación Tolman-Oppenheimer-Volkoff es, desde luego, la métrica
de Schwarzschild, escrita de la siguiente manera:

De acuerdo con las conclusiones que se pueden obtener de las relaciones para el equilibrio
hidroestático de estrellas en vías de su colapso, la mayor parte de la estrella se comprime en
cuestión de unos cuantos segundos hasta convertirse en una estrella más pequeña incluso que la
Tierra, una estrella de no más de unos diez a veinte kilómetros de radio. Siendo tan densa y a
causa de una atracción de la gravedad tan intensa, la densidad en dicha estrella se vuelve un
millón de veces más densa que la densidad de la Tierra, y una porción de dicha estrella del
tamaño de una canica tendría sobre la superficie de la Tierra un peso de millones de toneladas.
Esto es algo demasiado compacto como para permitir la preservación de la identidad de los
átomos de la estrella e inclusive de las partículas elementales que forman a los átomos de la
estrella. Los protones son comprimidos junto con los electrones convirtiéndose en neutrones,
hasta que desaparecen todos los protones y electrones y lo único que queda son partículas sub-
atómicas neutras sin carga eléctrica, los neutrones. En efecto, la estrella se ha convertido en
una estrella de neutrones. Si la masa no excede de cierto límite, estas estrellas son
mantenidas en tal estado, quedando a salvo de una continuación posterior del proceso de
colapso gravitacional gracias a lo que hoy se conoce como presión de degeneración de
neutrones (neutron degeneracy), un mecanismo de presión repulsiva de origen cuántico
similar en cierta forma a la presión de degeneración de los electrones, basado también en el
principio de exclusión de Pauli para fermiones (aunque el principio de exclusión de Pauli,
responsable de la "impenetrabilidad" de la materia ordinaria que hace que esta sea una
substancia extensa, responsable también de la estabilidad de los orbitales atómicos haciendo
que la complejidad química sea posible, y responsable desde luego de la presión ejercida por la
materia degenerada, fue aplicado inicialmente a los electrones situados en los orbitales atómicos
de los átomos, explicando exitosamente la configuración electrónica de los átomos y el por qué
los electrones tienen que ir ocupando capas electrónicas sucesivas a causa de este efecto de
repulsión cuántica, el principio eventualmente fue extendido a los fermiones de todo tipo, o sea
incluyendo a los protones y a los neutrones). En la siguiente figura podemos ver cómo con una
temperatura cercana al cero absoluto mientras que las partículas sub-atómicas conocidas
como bosonespueden ser acomodadas todas juntas en un mismo nivel energético en el pozo
potencial energético de la izquierda, los fermiones tienen que ser puestos en niveles energéticos
diferentes en el pozo potencial energético de la derecha por la repulsión que hay entre todos
ellos a causa del efecto cuántico enunciado por el principio de exclusión de Pauli (el nivel de
energía EFERMI destacado en la figura derecha corresponde a la energía del más elevado estado
cuántico ocupado dentro por un sistema de fermiones):

A diferencia del estado inicial de una estrella en el cual la presión requerida para retrasar el
colapso gravitacional es causado por la enorme temperatura que a su vez se traduce en una
enorme presión la cual se va perdiendo al ir radiando la estrella energía hacia el espacio exterior,
la presión de degeneración de neutrones es una presión que puede ser sostenida conforme va
bajando la temperatura ya que no es de naturaleza térmica sino de naturaleza cuántica. Esto
significa que una estrella de neutrones se puede ir enfriando indefinidamente manteniendo su
equilibrio y su tamaño (su radio) por el resto de la eternidad siempre y cuando su masa no
exceda de cierto límite con el cual la atracción ejercida por el campo gravitacional puede
vencer incluso la repulsión causada por la presión de degeneración de neutrones.

A continuación tenemos una representación del proceso de formación de una estrella de


neutrones ocurrido en diciembre de 2004 a unos 50 mil años-luz de la Tierra, el cual fue tan
violento que temporalmente encegueció todos los satélites de rayos-X que se tienen en órbita
alrededor de la Tierra y además ocasionó que la parte superior de la atmósfera terrestre se
iluminara:

La estrella de neutrones es un cuerpo opaco, y se ha estimado por varios cálculos independientes


que la densidad de la materia en una estrella de neutrones es de aproximadamente 10 17 Kg/m3,
lo cual podemos escribir explícitamente como:

100,000,000,000,000,000 kilogramos... ¡por cada metro cúbico!

El consenso actual entre la comunidad científica es que la explosión de una supernova es lo que
produce estrellas de neutrones en rotación rápida, las cuales son conocidas
como púlsares (pulsars, una contracción de las palabras “pulsating stars”), de las cuales se
conocen en la actualidad más de 600 con periodos de rotación que van desde el milisegundo a
unos pocos segundos, con un promedio de 0.65 segundos (en la ilustración la esfera en el centro
representa la estrella de neutrones, las curvas indican las líneas del campo magnético y los
conos representan los haces de emisión de las señales de radiofrecuencia):
habiéndose detectado la primera púlsar en julio de 1967 mediante un radiotelescopio (los
radiotelescopios siguen siendo la única manera en la cual este tipo de objetos pueden ser
localizados en el espacio). Estos periodos de rotación tan cortos sólo son posibles si este tipo de
estrellas tienen tamaños de unos pocos miles de kilómetros. En la siguiente fotografía tomada
por el telescopio espacial Chandra tenemos a los remanentes de la supernova identificada
como Kes 75, dentro de la cual el púlsar es el objeto brillante en el centro de la fotografía:
De los cientos de púlsares que se han detectado hasta la fecha, quizás el más interesante de
todos ellos es el PSR B1913+16 descubierto en 1974, también conocido como el púlsar
binario Hulse-Taylor, el cual está formado por dos estrellas compactas girando en torno a su
centro de masa común. Este sistema es interesante porque su órbita ha estado decayendo desde
el año en que el sistema fue descubierto en conformidad precisa con la pérdida de energía
causada por la emisión de ondas gravitacionales predicha por la Teoría General de la
Relatividad. En la actualidad se considera que esta es la primera confirmación obtenida sobre la
existencia de ondas gravitacionales, distorsiones en el entramado del espacio-tiempo que viajan
a la velocidad de la luz.

A diferencia de lo que ocurre con estrellas como nuestro Sol cuya gravedad pese a ser lo
suficientemente intensa para mantenernos en órbita en torno suyo no es lo suficientemente
intensa como para sacar a relucir a flote claramente los efectos de la Relatividad General (la
expedición llevada a cabo por Sir Arthur Eddington a la isla de Príncipe cerca de Africa durante
el eclipse solar el 29 de mayo de 1919 para confirmar la desviación de los rayos provenientes de
estrellas lejanas a causa de la gravedad del Sol como lo predice la Relatividad General,
comentada en la entrada “Predicciones, confirmaciones y reflexiones”, dejó en los registros
fotográficos un efecto tan tenue que eventualmente fue puesto en tela de duda por décadas al ser
tomadas en cuenta las incertidumbres experimentales astronómicas capaces de ser confundidas
con efectos relativistas), las estrellas de neutrones (así como los agujeros negros) son el medio
ideal para efectuar cálculos matemáticos propios de la Relatividad General así como para llevar
a cabo confirmaciones astronómicas de dichos cálculos, ya que la gravedad es tan intensa en
estos cuerpos que los efectos no pueden ser explicados mediante simple mecánica Newtoniana.

Una superficie límite interesante que se puede esperar encontrar en torno a una estrella de
neutrones es la que se conoce como una esfera de fotones. En la siguiente figura, si suponemos
que hay una fuente luminosa (una estrella) situada en el punto B, al pasar cerca del Sol un rayo
de luz proveniente de dicha estrella será desviado conforme lo predice la Relatividad General, y
al llegar al observador (situado en un telescopio en la parte superior de la figura) el observador
creerá que la estrella está situada en el punto A:

Para un rayo de luz que pasa muy cerca de la superficie del Sol, el efecto relativista que puede
esperarse es muy pequeño, inferior a unos dos segundos de arco de deflexión de una línea recta.
Pero si se trata de un rayo luminoso que sale de la superficie de una estrella de neutrones a
cierto ángulo (digamos unos 30 grados) con respecto al horizonte, será desviado de tal manera
por la intensidad de la gravedad que no podrá escapar de la superficie y entrará en órbita:
La luz que sea emitida a ángulos menores a dicho ángulo límite no podrá escapar y caerá sobre
la superficie de la estrella de neutrones como si fuese un objeto material. Entre la región crítica
de la cual un fotón aún puede escapar de una estrella de neutrones al no estar lo suficientemente
cerca para ser “jalado” hacia la estrella a causa de la atracción gravitacional y la región crítica en
la cual el fotón será irremediablemente “jalado” hacia la estrella, podemos concebir una
distancia radial crítica hacia el centro de la estrella en la cual ocurriría algo espectacular: los
fotones entrarían en órbita en torno a la estrella de neutrones. Esta superficie sería
precisamente la esfera de fotones. Sin embargo, una esfera de fotones es algo sumamente
hipotético en virtud del alto grado de precisión que se necesitaría para que los fotones puedan
entrar en órbita en torno a una estrella de neutrones. Si la distancia hacia el centro de la estrella
requerida para que un fotón entre en órbita en torno a la estrella es de 25.04 kilómetros,
entonces el fotón debe estar situado justa y exactamente a tal distancia, sin desviación alguna.
Esto significa que si el fotón se encuentra no a una distancia de 25.04 kilómetros sino de:

25.039999999999999999999999000000... kilómetros

entoces ese poquito que le falta al fotón para estar situado exactamente a los 25.04 kilómetros
no será suficiente para impedir que sea “jalado” hacia la estrella de neutrones. Por otro lado, aún
si fuese posible crear artificialmente de alguna manera una esfera de fotones, nosotros no
veríamos nada porque para ver algo los fotones tienen que entrar directamente hacia nuestras
retinas en lugar de estar en órbita en torno a un cuerpo. La esfera de fotones, más que algo que
pueda existir en algún lado del Universo, debe ser vista como un parámetro de interés como lo
es la velocidad del sonido, el cual cuando es rebasado por los aviones supersónicos trae consigo
una cantidad de efectos interesantes. En el caso de una esfera de fotones, es el límite del cual
aún podemos enviar información hacia el exterior desde una estrella que aún no se ha
convertido en un agujero negro.
El proceso de conversión de una estrella ordinaria a una estrella de neutrones que hemos visto
arriba es la segunda forma en la cual puede morir una estrella.

Rebasado el límite de Chandrasekhar, y rebasado el límite Oppenheimer-Volkoff, la tercera


forma en la cual puede morir una estrella es el proceso que la puede llevar a convertirse en
un agujero negro. Todo depende de la masa inicial de la estrella. La cantidad de masa máxima
para una estrella de neutrones es de aproximadamente tres veces la masa de nuestro Sol. Este es
aproximadamente el límite Oppenheimer-Volkoff. Cuando la masa de una estrella es unas diez
veces mayor que la masa de nuestro Sol, al acercarse al final de su ciclo de vida la atracción
gravitacional se vuelve tan intensa que la repulsión interna producida por la presión de
degeneración de neutrones no es suficiente para detener el proceso de compresión y
compactación de protones y electrones que de otro modo la convertiría en una simple estrella de
neutrones. La implosión se convierte en un colapso gravitacional catastrófico que continúa en
forma acelerada hasta que se crea una región esférica en el espacio-tiempo del Universo de cuyo
interior la luz ya no puede escapar a causa de la intensa atracción gravitacional, una región
esférica de radio rs que hoy conocemos como el radio de Schwarzschild, el cual aparece
precisamente como parte de la solución exacta a las ecuaciones de campo de Einstein a través de
la métrica de Schwarszchild especificada al principio:

rs = 2GM/c²

Este es el radio que define al horizonte de evento del agujero negro en su proceso de formación
cuando ocurre el colapso gravitacional:
Pero dentro del horizonte de evento, en el centro del agujero negro encontramos todavía algo
más interesante: una singularidad matemática en la cual muchos científicos suponen que el
espacio-tiempo se comprime hasta el infinito:
Y en esta singularidad no sólo el espacio-tiempo es compactado hasta el infinito. Dondequiera
que haya un agujero negro en el centro de su interior se ha perforado un punto en el Universo en
el cual también toda la materia-energía puede ser compactada hasta el infinito:

De este modo, en la singularidad matemática que se encuentra en el centro del agujero negro se
compacta todo, se compactan el espacio-tiempo y la materia-energía formando “algo” que ni
siquiera nos podemos imaginar, se forma una “substancia” a la cual tal vez ni siquiera se le
pueda llamar substancia, porque las matemáticas humanas carecen de funcionalidad para poder
investigar el infinito.

Si podemos imaginar un punto del tamaño de una cabeza de alfiler capaz de tragarse
completamente a la Tierra, apenas empezaríamos a vislumbrar la magnitud de lo que ocurre en
la singularidad situada en el interior de un agujero negro. Entre la singularidad situada en el
centro del agujero negro y la superficie esférica que representa al horizonte de evento aún es
posible que un objeto pueda continuar existiendo, pero un objeto jalado hacia la singularidad se
comprime hasta desaparecer en la singularidad. La singularidad en el centro de un agujero
negro no es únicamente una singularidad matemática, muchos científicos suponen que se
trata también de una singularidad física con existencia real. Esta singularidad no puede ser
vista o detectada de modo alguno por un observador externo en virtud de que el horizonte de
evento esférico que rodea a la singularidad no permite que pueda escapar del agujero negro
ninguna señal luminosa hacia el exterior.

Un agujero negro, a causa del enorme campo gravitacional que lo rodea, es capaz de devorar no
sólo objetos pequeños sino inclusive estrellas y planetas enteros, como lo muestra la siguiente
imagen que representa a una estrella como la nuestra, un Sol, en el proceso de comenzar a ser
devorada por un agujero negro:
Con cada planeta o estrella que vaya devorando el agujero negro, la masa M del agujero negro va
aumentando a la vez que todo es comprimido en su interior a grado tal que inclusive los átomos
y las moléculas que formaban al planeta o a la estrella son fusionadas una y otra vez hasta que la
identidad de las mismas desaparece por completo. Ni siquiera nos quedan los neutrones, porque
estos son fusionados entre sí y comprimidos hasta el infinito hacia esa substancia extraña que se
supone que existe en la singularidad situada en el centro de todo agujero negro.

Una pregunta que puede surgir a estas alturas es: ¿son los agujeros negros algo hipotético, el
resultado de haber ido demasiado lejos con las matemáticas de una teoría, o contamos con
algunas evidencias que nos puedan decir algo sobre la realidad de los mismos dentro del
Universo en que vivimos? La respuesta a esta pregunta nos lleva invariablemente al primer
agujero negro en haber sido detectado y confirmado, de lo cual hablaremos a continuación.

En astronomía, al hablar acerca de sistemas binarios, no estamos hablando de algo que tenga
que ver con una computadora digital (aunque esta última pueda ser de mucha ayuda). Se trata
de dos cuerpos, generalmente estrellas, que están en órbita la una en torno a la otra bajo la
influencia de sus respectivas atracciones gravitatorias. Nuestra galaxia está repleta de estos
sistemas binarios cuya existencia ha sido confirmada desde hace ya buen tiempo.
Desde 1970, con la puesta en órbita de satélites capaces de detectar fuentes de rayos-X, se ha
encontrado una cantidad creciente de sistemas binarios capaces de generar rayos-X. El común
denominador en estos sistemas es una estrella aparentemente normal, visible, en órbita cercana
con otro cuerpo que no es ópticamente visible. La existencia de esos otros cuerpos que no son
ópticamente visibles se ha podido intuír gracias a los cambios en la frecuencia de las señales
luminosas debido al desplazamiento Doppler. La interrogante con respecto al origen de estos
rayos-X es, desde luego, el mecanismo que los produce, cómo es posible que en esos sistemas
binarios se puedan generar los rayos-X emitidos al resto del Universo que están detectando
nuestros satélites en órbita. La mejor explicación que tenemos a la mano es que si uno tiene una
estrella ordinaria en órbita cercana con respecto a una estrella compacta (ya sea una enana
blanca, una estrella de neutrones o un agujero negro) es lógico esperar que haya un flujo de
materia gaseosa de la estrella ordinaria hacia la estrella compacta. En algunos casos, el flujo
constante del gas desde la estrella va cayendo hacia la estrella compacta siguiendo la ruta de una
espiral, formando lo que se conoce como un disco de acreción (se define como “acreción” la
agregación de materia a un cuerpo). La compresión del gas conforme va cayendo así como la
turbulencia del mismo producen un sobrecalentamiento del gas en el disco de acreción, lo cual
resulta en la emisión de rayos-X. El mecanismo natural de producción de rayos-X debe ser el
mismo que el que utilizamos en los aparatos de rayos-X que tenemos en los hospitales para
tomar radiografías y tomografías: una carga eléctrica (electrones) es acelerada bajo una gran
diferencia de potencial hacia una lámina en donde los electrones que se mueven a gran
velocidad son detenidos abruptamente, y cuando son detenidos emiten una radiación intensa a
causa del fenómeno del bremsstrahlung (la palabra significa “radiación de frenado”).
Clásicamente (y también relativísticamente) toda carga eléctrica que es acelerada o decelerada
emite una radiación electromagnética, y estos son precisamente los rayos-X que emanan de
nuestros aparatos en los hospitales (por radiación de frenado al ser deceleradas las cargas
eléctricas), y por extensión lógica, también de los sistemas binarios (al ser aceleradas las cargas
eléctricas en su camino hacia la estrella compacta). Bajo el modelo teórico señalado, es
necesario que el gas pase por una acreción hacia una estrella compacta en lugar de una estrella
ordinaria para que el calentamiento del gas sea lo suficientemente intenso como para que se
produzcan los rayos-X. Además de esto, se han registrado variaciones rápidas en el tiempo en la
emisión de los rayos-X, lo cual nos dice que la región desde la cual son generados posiblemente
es una región muy pequeña. Es por estas razones que se ha aceptado que todas las fuentes
astronómicas binarias de rayos-X constan de una estrella normal que está en órbita en torno a
una enana blanca, una estrella de neutrones, o un agujero negro.
Tras haber entrado en órbita los primeros satélites de rayos-X, una de las primeras fuentes
binarias de rayos-X en captar la atención inmediata de los astrónomos fue Cygnus X-1,
usualmente abreviada como Cyg X-1. De las mediciones del período orbital y la velocidad
orbital (estos a su vez inferidos de los desplazamientos Doppler) de la estrella así como otros
datos más indirectos, se puede estimar la masa del cuerpo compacto en torno al cual está
orbitando la estrella de Cygnus X-1. Las mejores estimaciones astronómicas nos indican que la
masa del cuerpo compacto invisible del sistema binario Cygnus X-1 es de por lo menos
unas nueve masas solares. Este es un valor significativamente mayor que el tope máximo
posible de masa para una estrella enana blanca o para una estrella de neutrones. Se concluyó,
por lo tanto, que el sistema binario Cygnus X-1 contiene un agujero negro.

Tras la confirmación de la existencia real del primer agujero negro en ser detectado, otros
agujeros negros han ido apareciendo en el panorama, a grado tal que ya no se consideran una
rareza exótica difícil de encontrar.

PROBLEMA: Bosquejar en un diagrama espacio-tiempo el proceso de colapso gravitacional


que conduce a la creación de un agujero negro.

Un diagrama espacio-tiempo apropiado es el siguiente:

En la parte inferior de este diagrama espacio-tiempo, empezamos con una estrella que está
experimentando un colapso gravitacional en virtud de poseer una densidad de masa así como la
masa suficiente para que se lleve a cabo su conversión en un agujero negro. La parte inferior
trata de bosquejar un cuerpo esférico que se está encogiendo rápidamente, hasta llegar a un
radio marcado como Rs, que es precisamente el radio de Schwarzschild para la estrella que se
está colapsando. A partir de este momento, la estrella deja de emitir todo tipo de luz, porque
toda su materia está comprimiéndose dentro del horizonte de evento que permanece por fuera
como una esfera de la cual no puede escapar un rayo de luz. Por dentro el colapso continúa hacia
la singularidad que es representada como una línea ondulada. Se han dibujado varios conos de
luz que corresponden a varios observadores situados en el diagrama espacio-tiempo. Los dos
conos de luz que están situados más hacia la derecha son conos de luz de observadores tan
alejados del agujero negro que siguen siendo los conos de luz ordinarios típicos del diagrama
espacio-tiempo de Minkowski. Pero al ir estando más cerca del agujero negro, los conos de luz se
van inclinando mostrando el efecto de la distorsión provocada en el espacio-tiempo circundante
en el exterior del agujero negro por la enorme masa de la estrella que parece haber
desaparecido. El cono de luz cuyo extremo lateral está situado justo en el borde del horizonte de
evento del agujero negro nos señala la superficie de la cual ni siquiera la misma luz puede
escapar. Si un haz de luz va a entrar en órbita circular en torno a un agujero negro sin caer
dentro del mismo, es justo aquí es donde la línea del mundo que corresponde al cono de luz
debe coincidir tangencialmente con la superficie esférica en la que está situado el horizonte de
evento. Cualquier otra línea del mundo del interior de ese cono de luz situado en el borde
conduce en el “futuro” del cono directamente hacia el interior del agujero negro. Por último, los
otros dos conos de luz que están en el interior del horizonte de evento representan los conos de
luz de observadores que en algún momento de su “pasado” penetraron al interior del agujero
negro, y la inclinación pronunciada a medida que se acercan a la singularidad refleja el hecho de
que la singularidad está compactando la mayor cantidad posible de masa-energía-espacio-
tiempo en ese punto casi imposible de describir.

Los agujeros negros estáticos


Habiendo estudiado las maneras mediante las cuales se puede formar un agujero negro en
alguna parte del Universo, lo cual como hemos visto dependerá substancialmente de la masa
inicial de la estrella así como del hecho de que se forme estáticamente o a partir de una estrella
en rotación, ha llegado el momento adecuado para intentar explicar la naturaleza de dichos
objetos recurriendo a Relatividad General, y el punto de partida usual es la solución esférica
encontrada por Karl Schwarzschild a las ecuaciones de campo de la Relatividad General:
Es común encontrar que en algunos textos los dos últimos términos:

[ r² dθ² + (r² sen²) (dφ)² ]

son simplificados de la manera siguiente:

[ r² dθ² + (r² sen²) (dφ)² ] = r² [dθ² + (sen²) (dφ)²] = r² dΩ²

en donde Ω es lo que se conoce como un ángulo sólido, un término que resultará familiar para
quienes hayan tomado un curso de geometría esférica.

Conforme r se acerca al valor 2GM/c², el coeficiente de dt² (ignoraremos por el momento el


valor de la constante absoluta c que no es indispensable para nuestro análisis) se acerca a cero,
mientras que el coeficiente de dr² se va acercando al infinito. Por un buen tiempo, no se tuvo la
certeza de que la singularidad “infinita” en el punto r = 2GM/c² conocido como el radio de
Schwarzschild rs fuese una singularidad física real, tangible, que no pudiera ser atravesada
por un observador cayendo hacia el agujero negro, o que simplemente fuese lo que suele
llamarse una singularidad en la coordenada. Un ejemplo familiar de una singularidad en la
coordenada es el que ocurre para el valor de r = 0 cuando estamos utilizando coordenadas
polares (r, θ), con lo cual nos encontramos con una indeterminación matemática para la
especificación de dicho punto. En este caso, basta con una transformación de coordenadas
polares a coordenadas Cartesianas (rectangulares) para eliminar la singularidad. Otro ejemplo
parecido lo encontramos cuando queremos llevar a cabo la proyección de la superficie de una
esfera sobre un plano como ocurre con la proyección de Mercator:
Considérese la siguiente tentativa de llevar a cabo la proyección de la superficie de una esfera
sobre un plano:

En este caso, no sólo φ = 0 y φ = son la misma línea (dándole la vuelta a la esfera a través de los
polos), sino que inclusive las líneas θ = 0 y θ = π... ¡representan el mismo punto! En efecto, el
polo norte de la esfera tiene coordenadas:

θ=0

0 ≤ φ ≤ 2π

y aunque φ puede tomar cualquier valor para θ = 0, todos estos valores representan el mismo
punto. Para un caso así, encontrar otro tipo de coordenadas que resuelva el problema no es un
asunto fácil. A manera de ejemplo, si queremos intentar una proyección estereográfica de la
superficie de una esfera sobre un plano de coordenadas polares, el cual tendría la desventaja de
ser infinitamente grande:

nos encontraremos con una nueva singularidad, situada precisamente en el polo en el cual
ambas superficies están en contacto.

El fallo radica, pues, no en las ecuaciones físicas de la teoría sino en el tipo de coordenadas que
se están utilizando. Por lo general, una singularidad en una de las coordenadas indica un
problema matemático, no un problema físico real, y el problema matemático puede ser
eliminado por una transformación de las coordenadas.

La solución original encontrada por Schwarzschild solo describe lo que ocurre en la


región exterior del horizonte de evento. Pero no nos dice nada sobre lo que ocurre en el interior.
Aunque desde un principio se sospechó que la singularidad en el punto 2GM/c² era una
singularidad de la coordenada y no una singularidad física real, esto no se pudo demostrar sino
hasta fines de la década de los cincuentas cuando se encontró un sistema de coordenadas capaz
de remover la singularidad matemática (de lo cual se hablará posteriormente), tras lo cual se
fueron descubriendo otros tipos de coordenadas capaces también de remover la singularidad
matemática.

Si en la métrica de Schwarzschild consideramos a un observador situado en el “infinito”,


podemos ver que conforme r va tomando valores grandes el coeficiente de dt² va tomando el
valor de -1. Por otro lado, las coordenadas espaciales r, θ y φ para un observador en reposo
permanecen constantes con el transcurso del tiempo, de modo tal que los diferenciales dr, dθ y
dφ toman el valor de cero para un observador en reposo situado a una buena distancia del
cuerpo. Con esto, el tiempo propio de un observador en reposo situado en el infinito se puede
considerar aproximadamente igual a la coordenada tiempo de la métrica Schwarzschild, y
cualquier afirmación que se haga concerniente a t o dt también será aplicable para el tiempo que
está midiendo en su reloj el observador situado en reposo en la lejanía.

Haciendo ds² = 0 en la métrica de Schwarzschild, podemos estudiar el comportamiento de un


rayo de luz cerca del horizonte de evento, tal y como será visto por un observador en reposo
viendo lo que sucede desde el “infinito”. Podemos simplificar nuestro análisis si consideramos
que el rayo viaja a lo largo de una geodésica nula (de tipo luminoso) radial, ya sea directamente
hacia el agujero negro y alejándose directamente de él, con lo cual las coordenadas θ y φ del rayo
de luz no cambiarán. Con esto podemos eliminar los últimos dos términos en la métrica de
Schwarzschild quedándonos únicamente con la siguiente expresión:

Tomando el valor de c = 1 para simplificar nuestro análisis, obtenemos lo siguiente tras la


extracción de la raíz cuadrada:

Podemos ver claramente que conforme r se aproxima a 2GM, dt/dr empieza a crecer
aumentando hasta el infinito. Este es un efecto de dilatación del tiempo. Cualquier mensaje
enviado por medio de una señal luminosa desde las afueras del horizonte de evento a un
observador en reposo situado lejos del agujero negro será “estirado”. Entre más cerca se
encuentre el emisor de la señal luminosa al radio que define al horizonte de evento (rs =
2GM/c²) tanto más “estirado” le llegará el mensaje al observador situado en la lejanía. La
frecuencia de una señal luminosa repetitiva experimentará un corrimiento al rojo
gravitacional llevándole una cantidad menor de información por unidad de tiempo (medido por
el reloj del observador-receptor situado en la lejanía). Cuando el emisor se encuentra muy
cercano al horizonte de evento, el corrimiento al rojo gravitacional es tan grande que la señal
luminosa enviada hacia afuera para fines prácticos desaparece. Por esta razón el horizonte de
evento es llamado algunas veces el horizonte de corrimiento al rojo infinito. Este es en esencia el
mismo argumento esgrimido a partir de los tiempos del mismo Karl Schwarzschild para
identificar al horizonte de evento como una superficie de la cual a la luz no le sería posible
escapar.

Como se afirmó al principio de esta entrada, las coordenadas esféricas simples utilizadas por
Schwarzschild para definir la métrica en el exterior del agujero negro resultaron insuficientes
para manejar el interior a causa de la singularidad matemática en el punto r = 2GM/c². Este
problema fue solventado con la invención de un nuevo conjunto de coordenadas,
las coordenadas Kruskal-Szkeres, inventadas por Martin Kruskal y George Szkeres, las
cuales permiten la descripción matemática de lo que ocurre en un agujero negro tanto fuera del
horizonte de evento como dentro del horizonte de evento. Estas coordenadas se obtienen
partiendo de las coordenadas de Schwarzschild (t,r,θ,φ) y la métrica de Schwarzschild:

ds² = (1 - 2GM/rc²)(cdt)² - (1 - 2GM/rc²) -1(dr)² - (r²)(dθ)²

- (r² sen² θ)(dφ)²

reemplazando la variable t y la variable r por las siguientes coordenadas T y R para la


región exterior del agujero negro:

y reemplazando la variable t y la variable r por las siguientes coordenadas T y R para la


región interior del agujero negro:

siendo la métrica Kruskal-Szkeres la siguiente:

Haciendo un ligero cambio de variables, tenemos la representación esquemática usual con la


cual se tiene un diagrama conocido como el diagrama Kruskal-Szkeres:
La diferencia entre las coordenadas que corresponden a la métrica de Schwarzschild y las
coordenadas Kruskal-Szkeres se hace manifiesta al estudiar el comportamiento de los conos de
luz típicos del diagrama espacio-tiempo de Minkowski conforme un observador se va acercando
al horizonte de evento. Mientras que en las coordenadas de Schwarzschild los conos de luz se
van cerrando cerca de la superficie que corresponde al horizonte de evento:

al usar las coordenadas Kruskal-Szkeres los conos de luz se van inclinando pero sin cerrarse,
reflejando un comportamiento más creíble:
Además de las coordenadas Kruskal-Szkeres creadas para investigar lo que ocurre en el interior
de un agujero negro, hay otras coordenadas tales como las coordenadas Eddington-
Finkelstein adaptadas para el estudio de geodésicas radiales del tipo luminoso (tipo nulo), o
sea para el estudio de lo que ocurre con fotones moviéndose directamente hacia o alejándose de
la masa central del agujero negro, para las cuales definimos una nueva coordenada designada
como la coordenada tortuga, definida de la siguiente manera (en los textos que tratan sobre
estas coordenadas se acostumbra igualar la velocidad de la luz a la unidad como es típico cuando
se utilizan unidades geometrizadas):

Obsérvese que esta coordenada va tomando el valor de -∞ conforme la distancia radial se va


acercando al radio de Schwarzschild. Ahora definimos las coordenadas de entrada nula y salida
nula de la siguiente manera:

v = t + r*

u = t - r*

Las coordenadas de entrada nula están especificadas por v = constante mientras que las
coordenadas de salida nula están especificadas por u = constante.

De este modo, las coordenadas de entrada Eddington-Finkelstein se obtienen reemplazando t


con v, y al hacerlo la métrica de entrada Eddington-Finkelstein está dada por:
Del mismo modo, las las coordenadas de salida Eddington-Finkelstein se obtienen
reemplazando t con u, y al hacerlo la métrica de salida Eddington-Finkelstein está dada
por:

Para investigar lo que ocurre sobre un objeto que va encaminado hacia un agujero negro,
además del uso de las coordenadas Eddington-Finkelstein y las coordenadas Kruskal-Szkeres,
Edwin Taylor y John Archibald Wheeler propusieron en su libro Exploring Black Holes:
Introduction to General Relativity publicado en el año 2000 un marco de referencia bautizado
con el nombre de marco lluvia (rain frame), un marco de referencia que está en caída libre
hacia un agujero negro cuya simplicidad lo hace útil para el aprendizaje y para cuya definición se
utilizan por lo menos dos partículas de prueba enviadas desde el infinito con una velocidad
inicial de cero directamente hacia el agujero negro a lo largo de una dirección radial, ambas
partículas situadas a la misma distancia radial del centro del agujero negro y con sus relojes
sincronizados al mismo tiempo, cayendo hacia el agujero negro como si fuesen gotas de lluvia
(de allí el nombre del marco de referencia). Una de las ideas principales detrás de estas
coordenadas es que al utilizar dos “gotas de lluvia” (no necesariamente objetos líquidos) como
partículas de prueba, midiendo separaciones tales como la separación AA’ y la
separación BB’ un observador en caída libre hacia el agujero negro puede deducir dentro de su
marco de referencia (su marco lluvia) la coordenada r. El mismo método puede ser utilizado
inclusive si el observador ha penetrado dentro del horizonte de evento, midiendo la
distancia CC’:
Podemos imaginarnos en las afueras del horizonte de evento y en torno a un agujero negro
varias esferas imaginarias concéntricas que llamaremos “cascos” mantenidos estacionarios de
alguna manera sin caer hacia el agujero negro. Un observador externo se puede imaginar
situado sobre la superficie de uno de estos cascos adyacentes. En una región suficientemente
pequeña de cualquiera de estos cascos podemos considerar al espacio-tiempo como plano,
Lorentziano, en el cual se pueden aplicar los principios de la Teoría Especial de la Relatividad.
Dos o más partículas de prueba situadas en el mismo “casco” estarán ambas a la misma
distancia radial del centro del agujero negro, y tendrán sincronizados sus relojes a la misma
hora, los cuales permanecerán sincronizados todo el tiempo inclusive al atravesar las partículas
el horizonte de evento y al encaminarse hacia la singularidad por estar situadas ambas a la
misma distancia del centro del agujero negro.

Puesto que la coordenada del tiempo es especialmente problemática dentro de las coordenadas
de Schwarzschild para analizar movimientos a través y dentro del horizonte de evento, la
reemplazamos por el tiempo propio de la partícula de prueba, el tiempo que va midiendo un
reloj situado a un lado de la partícula que está en caída libre. Si consideramos el tiempo
registrado por un mismo reloj en el mismo lugar en uno de los cascos en donde tengamos dr =
0, dθ = 0 y dφ = 0, entonces el tiempo que registra el reloj es el tiempo propio Lorentziano.
Reescribiendo la métrica de Schwarzschild utilizando el tiempo propiodτ en lugar de la
distancia del intervalo relativista ds (emplearemos unidades geometrizadas con las cuales la
constante de gravitación universal y la velocidad de la luz c ambas toman el valor de 1):
tenemos entonces para el tiempo propio de este marco derivado de la métrica de Schwarzschild
lo siguiente:

Tomando la raíz cuadrada obtenemos una expresión para dts:

Del mismo modo podemos obtener una expresión para la distancia drs en la coordenada r
considerando dos eventos simultáneos que tienen lugar en la misma dirección radial de dos
cascos esféricos separados una distancia infinitesimal dr, la cual resulta ser:

Localmente, con las coordenadas ts y rs de un punto en un casco, la métrica para un marco de


referencia en un casco se puede expresar como:

dτ² = dts² - drs² - r² dθ² - r² sin² θ dφ²

Si definimos al marco lluvia como un marco de referencia que está en caída libre hacia un
agujero negro, la coordenada tiempo del marco lluvia se puede obtener mediante la aplicación
de las ecuaciones de transformación de Lorentz a las coordenadas del casco en las afueras del
horizonte de evento:

dtr = γ(dts - β drs)

drr = γ(drs - β dts)


en donde γ = 1 / √1 - β² siendo β = - √2M/r la velocidad del marco de lluvia con respecto al
casco. De este modo, podemos obtener las coordenadas lluvia tomando en consideración la
curvatura del espacio-tiempo entre las coordenadas de un casco y las coordenadas
Schwarzschild debido a la cercanía del agujero negro (se han omitido aquí varios pasos
intermedios):

dtr = dt - βγ² dr

drr = γ² dr - β dt

siendo la métrica lluvia la siguiente:

dτ² = dtr² - drr² - r² dθ² - r² sin² θ dφ²

En coordenadas Schwarzschild, la velocidad de una gota de lluvia, definida la gota de lluvia


como un objeto en caída libre cayendo radialmente hacia un agujero negro desde el infinito
partiendo de una velocidad de cero, medida por un observador situado en uno de los cascos
atravesados por la gota de lluvia, y definido el marco lluvia como el marco de referencia en el
cual la gota de lluvia se encuentra en reposo, es la siguiente:

Existen disponibles gratuitamente en Internet programas de simulación que nos permiten


analizar visualmente lo que ocurre en un marco de referencia como el marco lluvia. Uno de ellos
es el programa ejecutable elaborado por el proyecto Open Source Physics, del cual se dan
algunos detalles en uno de los apéndices titulado “Programas de simulación computarizada”, el
cual se recomienda obtener a la mayor brevedad posible para poder experimentar con las
métricas y los marcos de referencia utilizados dentro de la Relatividad General.

Hablaremos ahora de la suerte que encontraría una persona que cayese en un agujero negro
encaminándose directamente hacia la singularidad del agujero negro, la cual sería terrible, en
virtud de lo que se conoce como las fuerzas de marea (tidal forces). Si bien en la Tierra se
requiere escalar a grandes alturas sobre la superficie para poder encontrar disminuciones
apreciables en la aceleración g provocada por la gravedad de la Tierra como las predichas
clásicamente por la mecánica Newtoniana:

al ir en camino hacia un hoyo negro estas diferencias se vuelven perceptibles primero en


cuestión de unos cuantos metros y luego en cuestión de centímetros y milímetros continuando
así el proceso hasta el infinito. A manera de ejemplo, la diferencia gravitacional evaluada sobre
una longitud (medida como una diferencia de alturas) de tan sólo dos metros estando situados a
unos 5 mil kilómetros de un agujero negro que posea una masa-energía equivalente a cincuenta
masas solares es (usando un valor de 1.99·1030kilogramos para la masa del Sol) :

= (6.63·1021) (3.2·10-20) = 212 metros/seg²

Comparada con la gravedad sobre la superficie de la Tierra de g = 9.8 m/seg², ésta sería una
fuerza de estiramiento más de veinte veces mayor que la fuerza de la gravedad en la superficie
de la Tierra. Y conforme un viajero se va aproximando más y más al centro del agujero negro,
esta fuerza va aumentando considerablemente. Como consecuencia de que una persona entre de
pies a un agujero negro en camino hacia la singularidad matemática que está en el centro del
mismo, será estirada de pies a cabeza, transformada en un hilo delgado hasta convertirse en la
línea ideal de Euclides con un grosor de cero y estirada hasta volverse infinitamente larga:
Cuando el agujero negro no es eléctricamente neutro, cuando tiene una carga eléctrica, la
solución de Schwarzschild deja de ser válida. En este caso, en la solución a las ecuaciones de
campo encontramos que tenemos no uno sino dos horizontes separados. Uno de ellos es el
horizonte de evento usual, y el otro es un horizonte interno al horizonte de evento,
llamado horizonte de Cauchy. Definiendo al radio de Schwarzschild de la manera usual
como rs = 2GM/c², la métrica que corresponde al campo gravitacional de un cuerpo
simétricamente esférico de masa M con una carga eléctrica neta Q (positiva ó negativa),
descubierta por Hans Reissner y Gunnar Nordström entre 1916 y 1918, es la siguiente:

siendo Ω el ángulo sólido y siendo rQ una escala de longitud que corresponde a la carga eléctrica
del cuerpo, la cual está dada por la relación:
PROBLEMA: ¿A qué se reduce la métrica Reissner-Nordström para el caso en el cual el
agujero negro está desprovisto de carga eléctrica?

En una situación así, tenemos Q = 0 con lo cual rQ = 0, y la métrica Reissner-Nordström se


reduce a la métrica de Schwarzschild.

En el límite cuando la carga eléctrica del agujero negro tiende a cero, podemos recuperar
también la teoría clásica Newtoniana de la gravedad conforme el cociente rs/r se aproxima a
cero, ya que en tal caso la métrica ds² se convierte en la métrica de Lorentz usual para la Teoría
Especial de la Relatividad.

En la práctica el cociente rs/r es casi siempre muy pequeño. Para la Tierra su radio
Schwarzschild es de aproximadamente nueve milímetros (o tres octavos de pulgada), lo cual es
insignificante en comparación con el radio de la Tierra, de modo tal que las correcciones
relativistas a la gravedad Newtoniana son de únicamente una parte en mil millones. El único
lugar en donde el cociente rs/r adquiere valores significativos es en las estrellas de neutrones y
en los agujeros negros.

Como ya se mencionó, cuando el agujero negro adquiere una carga eléctrica el horizonte de
evento del agujero negro Schwarzschild se contrae y aparece afuera del mismo otro horizonte, lo
cual, lo cual tenemos ilustrado en el siguiente dibujo:
Una consecuencia de la existencia de dos horizontes es que después del cambio en el espacio-
tiempo que se experimenta al atravesar el primer horizonte se vuelve a experimentar otro
cambio en el espacio-tiempo al cruzar el segundo horizonte con lo cual el espacio-tiempo vuelve
a tomar sus características originales (exceptuando a la singularidad), de modo tal que al entrar
en un agujero negro estático cargado eléctricamente es posible evadir la singularidad.

Los dos horizontes del agujero negro Reissner-Nordström pueden ser obtenidos igualando a
cero la parte temporal de la métrica, o sea analizando la ecuación:

De aquí podemos obtener la siguiente ecuación cuadrática:

La condición rs = 2rQ es un caso en el cual los dos horizontes se confunden, produciéndose


un estado degenerado, resultando en lo que se conoce como un agujero negro extremo. Por
otro lado, si la carga eléctrica del agujero negro es lo suficientemente elevada, esto conduciría a
la preocupante condición matemática en la cual rs se vuelve menor que 2rQ, produciéndonos un
término imaginario a causa del valor negativo dentro del radical. Si a esto pudiera dársele una
interpretación física, esto nos describiría una situación en la cual los dos
horizontes desaparecen, dejando abierta (aparentemente) la posibilidad de que la singularidad
en el centro del agujero negro quede expuesta a la vista de un observador externo, lo cual sería
un acontecimiento significativo para el Universo entero porque el espacio-tiempo del Universo
entraría en contacto directo con un punto en el cual el mismo espacio-tiempo ha dejado de
existir, un suceso equiparable tan sólo con la unión de materia con antimateria. Sin embargo, en
la opinión de muchos astrofísicos tal cosa no puede ocurrir en virtud de un principio conocido
como la hipótesis del censor cósmicoconjeturada y propuesta de manera informal por vez
primera por Roger Penrose en 1969, una especie de “censura” con la cual el Universo
“púdicamente” -como si se tratase de un padre ocultando la desnudez de su hija ante los ojos del
mundo- impide que la singularidad del agujero negro pueda quedar expuesta de alguna manera,
y en base a lo cual se supone que al crearse un agujero negro tras un colapso gravitacional se
crea primero el horizonte de evento -que nos impide ver todo lo que se forme dentro del mismo
al no poder escapar la luz del interior- y tras esto -después- se crea la singularidad. Más que un
asunto de moralismo cósmico, esta censura vendría siendo una forma en la cual el Universo nos
protege de lo que pueda ocurrir con la inherente impredictibilidad de las singularidades al
ponerse en contacto con el Universo en virtud de que el comportamiento físico de las
singularidades nos es desconocido por completo, y si las singularidades pudiesen ser observadas
directamente desde el resto del espacio-tiempo, si hubiese singularidades desnudas, esto
posiblemente nos conduciría a una pérdida del determinismo científico porque es imposible
predecir el comportamiento del espacio-tiempo en el futuro causal de una singularidad, con lo
cual la física perdería su capacidad predictiva al no poder basarse ya en el principio de causa y
efecto.

De cualquier manera, es poco probable (aunque ciertamente posible) que un agujero negro del
tipo Reissner-Nordstrøm pueda existir, en virtud de que para producir un agujero que posea una
carga eléctrica el agujer negro se tiene que formar a partir de una estrella que también posea
una carga eléctrica neta (positiva o negativa), lo cual no es muy probable que suceda ya que por
lo general tras todos los procesos atómicos y sub-atómicos de compactación que están
ocurriendo en el interior de las estrellas, con los cuales las cargas eléctricas positivas y negativas
terminan siendo neutralizadas al irse fusionando las unas con las otras, consideradas las
estrellas como un todo terminarían siendo eléctricamente neutras. Sin embargo, esto no excluye
la posibilidad de que un cuerpo con una carga eléctrica neta (positiva ó negativa), sea devorado
por el agujero negro, con lo cual la carga eléctrica pase a formar parte directamente del agujero
negro.

Los agujeros negros dinámicos


La solución matemática encontrada por Karl Schwarszchild así como la solución matemática
encontrada por Hans Reissner y Gunnar Nordström son soluciones estáticas, para agujeros
negros que se mantienen inmóviles y que no están girando en torno a un eje propio. Pero estas
no son las únicas soluciones exactas posibles a las ecuaciones de campo de Einstein. Hay otras
soluciones, también exactas, que predicen la existencia de agujeros negros dinámicos, los
cuales están en rotación continua. A continuación tenemos un agujero negro de este tipo en un
sistema binario que muestra a una estrella a la derecha que está alimentando el disco de
acreción que rodea al agujero negro:

Obsérvense los dos chorros emitidos en direcciones opuestas por el agujero negro. En la esquina
superior derecha de la imagen tenemos una fotografía real tomada por el telescopio espacial
Hubble de un agujero negro enorme que está situado en el centro de la galaxia NGC4261.

Existe la creencia generalizada de que el agujero negro estático, en caso de existir, no se produce
tan fácilmente porque es el resultado del colapso de una estrella que se puede presumir que
tenía algún movimiento de rotación similar al movimiento de rotación de la Tierra antes de
colapsarse. Esta rotación implica la existencia de un movimiento angular J, mejor conocido
como momento angular, el cual por el principio de la conservación de la cantidad de
movimiento angular no se puede desvanecer hacia la nada sin dejar rastro, lo cual nos lleva a
sospechar en la posibilidad de que el agujero negro creado por tal colapso gravitacional retiene
dicha rotación, e inclusive en la posibilidad de que la solución matemática a tal agujero negro en
rotación sea una solución exacta y no una aproximación. Este sería el agujero negro más realista
de todos, este sería el que tendríamos mayores posibilidades de encontrar en el Universo. En
1963, el matemático neo-zelandés Roy Kerr logró resolver las ecuaciones de campo partiendo de
la solución de Schwarzschild introduciendo el siguiente parámetro adicional de rotación:

a = J/M

que describe la rotación del agujero negro, el cual cuando toma el valor de cero se reduce a la
descripción de un agujero negro estático sin rotación, siendo J la cantidad de movimiento
angular del agujero negro en rotación y M el contenido total de masa-energía del mismo. La
resolución del problema requirió recurrir a las coordenadas Boyer-Lindquist, las cuales son
una generalización de las coordenadas usadas para la métrica del agujero negro de
Schwarzschild.

La métrica Kerr que describe a un agujero negro en rotación es la siguiente:

en donde

ρ² = r² + a² cos θ

Δ = r² - 2Mr + a²

y (r, θ, φ) son las coordenadas polares usuales.

Obsérvese que si llevamos a cabo la expansión del quinto término (cuadrático) en la métrica de
Kerr, obtenemos lo que se conoce como un término óblico, el término dtdφ. La aparición de
este término en la métrica es responsable por lo que hoy se conoce como el efecto Lense-
Thirring, con el cual los marcos de referencia cercanos al agujero negro en rotación son
arrastrados junto con el mismo.

Esta característica interesante de que los agujeros negros en rotación sean capaces en la
proximidad de su horizonte de evento de ir arrastando al espacio-tiempo la tenemos ilustrada en
el siguiente graficado:

El “arrastre” producido por un agujero negro en rotación sobre el espacio-tiempo se puede


visualizar mejor con el hundimiento del espacio-tiempo hacia la singularidad en el siguiente
bosquejo:

El arrastre del espacio-tiempo en torno a la superficie de un agujero negro, similar al remolino


que producen sobre el agua las aspas de una licuadora al ponerse en movimiento, es un efecto
puramente relativista. Es imposible que esto pueda ocurrir en la mecánica clásica en donde el
espacio absoluto, el tiempo absoluto y la atracción de la gravedad son cosas completamente
independientes la una de la otra. Podemos definir una región afuera del horizonte de evento de
los agujeros negros rotacionales conocida como la ergósfera o ergoesfera, una estructura de
forma de forma elipsoidal coincidiendo su semieje menor con el eje de rotación de esta,
achatándose en la dirección del eje de giro de manera similar a como lo hace la Tierra a causa de
su rotación:

En la región de la ergósfera, el campo de gravedad del agujero negro rota junto con él
arrastrando al espacio-tiempo. Dentro de la ergóesfera no existe el reposo, es imposible que un
cuerpo no se mueva, pues el propio espacio gira en torno a la singularidad por lo que la materia
que se encuentre en esa región rotará junto a ella. Dentro de la ergósfera, el espacio-tiempo es
arrastrado en la dirección de la rotación del agujero negro a una velocidad mayor que la
velocidad de la luz en relación con el resto del Universo. A causa de esto, los objetos dentro de
la ergósfera no pueden permanecer estacionarios con respecto al resto del Universo a menos de
que se estén moviendo a velocidades superiores a la velocidad de la luz, lo cual es imposible. Lo
que sucede es que no son las partículas las que se estén moviendo con tal velocidad, es el
espacio-tiempo de la ergósfera el que se mueve a velocidades superiores a la velocidad de la luz.
Otra consecuencia del arrastre de los marcos de referencia es la existencia de energías
negativas dentro de la ergósfera.

El límite exterior de la ergósfera es una superficie conocida como el límite estacionario. En


este límite estacionario, los objetos que se estén moviendo a la velocidad de la luz permanecen
estacionarios con respecto al resto del Universo, en virtud de que el espacio-tiempo justo en esta
superficie límite está siendo arrastrado exactamente a la velocidad de la luz. Un poco fuera ya de
este límite, el espacio-tiempo sigue siendo arrastrado, pero a una velocidad menor que la
velocidad de la luz.

Puesto que la ergósfera está situada afuera del horizonte de evento, aún es posible que los
objetos puedan escapar de la atracción gravitacional del agujero negro. De este modo, un objeto
puede adquirir energía entrando en la ergósfera y tras esto escapar de la misma llevándose algo
de la energía del agujero negro. En pocas palabras, el objeto puede salir con una mayor energía
que la que tenía al entrar en la ergósfera. Esta posibilidad de extraer energía de un agujero negro
en rotación fue propuesto por vez primera por el matemático Roger Penrose, y es conocido como
el proceso Penrose. Teóricamente, la extracción máxima posible de energía de un agujero
negro a través de su ergósfera es igual al 29% del total de la energía del agujero negro. Esta
posibilidad de irle extrayendo a un agujero negro su energía a través de su ergósfera con la mira
de aprovecharla para hacer un trabajo útil es precisamente lo que motivó el nombre de dicha
región, derivado del griego ergon que significa “trabajo”. Sin embargo, no es posible estar
extrayendo energía del agujero negro sin que ello tenga consecuencia alguna sobre el agujero
negro. Al serle removida energía a través de su ergósfera, el agujero negro va disminuyendo su
rotación, hasta que en un momento dado la ergósfera deja de existir habiendo dado el agujero
negro todo lo que podía dar.

Un resultado interesante para el agujero negro tipo Kerr está dado por la fórmula que nos
proporciona el área para el horizonte de evento de este tipo de agujero:

PROBLEMA: Si un agujero negro va perdiendo su rotación hasta detenerse por completo,


¿cuál será el área de su horizonte de evento de acuerdo con la ecuación de Kerr? ¿Está
justificada esta conclusión?
Al perder un agujero negro su rotación, entonces J = 0 y el radical toma el valor de 1, con lo cual
el área del horizonte de evento del agujero negro vendría siendo:

A = 16πG²M²/c4

Un agujero negro estático es esencialmente un agujero negro Schwarzschild con un horizonte de


evento de radio rs = 2GM/c². La superficie esférica de su horizonte de evento será:

A = 4πrs² = 4π(2GM/c²)² = 16πG²M²/c4

Puesto que este resultado concuerda con el que obtuvimos a partir de la fórmula para el agujero
negro de Kerr, entonces la conclusión dada por la fórmula de Kerr está justificada.

El interés que podamos tener en el área de la superficie de un agujero negro es propiciado por el
siguiente esultado fundamental que es válido para cualquier tipo de agujero negro de la clase
que sea:

Teorema del área: El área de la superficie del horizonte de evento de un agujero negro
nunca puede disminuír. Después de cualquier proceso, el área sólo puede aumentar (o
permanecer igual) con respecto al área inicial.

El teorema, expresado en terminología matemática, se puede escribir de la manera siguiente:

De acuerdo con el teorema, si dos agujeros negros se acercan y se fusionan bajo la influencia de
su atracción gravitacional mutua, el área A del agujero negro resultante deberá ser mayor que
las áreas A1 y A2 que tenían los dos agujeros negros antes de encontrarse:

A ≥ A 1 + A2

El teorema del área será de enorme importancia cuando veamos la conexión que existe entre los
agujeros negros y la segunda ley de la termodinámica.

Dos años después de conocerse la solución de Roy Kerr a las ecuaciones de campo, el
matemático norteamericano Ezra Newman extendió la solución exacta encontrada por Roy Kerr
para incluír agujeros negros en rotación que poseen una carga eléctrica denotada como Q.

Para que un agujero negro del tipo Kerr-Newman pueda ocurrir, debe cumplirse la siguiente
condición esencial:

en donde M es la masa, Q es la carga y J es la cantidad del momento angular del agujero negro
en rotación. Si se viola la desigualdad, aún es posible encontrar soluciones a las ecuaciones de
campo para la familia de agujeros negros Kerr-Newman, pero estas soluciones nos describen
singularidades “desnudas” en lugar de agujeros negros.

Habíamos visto anteriormente que cuando un agujero negro no es eléctricamente neutro,


cuando tiene una carga eléctrica, encontramos que tenemos no uno sino dos horizontes
separados, siendo uno de ellos el horizonte de evento usual y el otro un horizonte interno al
horizonte de evento conocido como el horizonte de Cauchy. Tomando esto en cuenta, para el
agujero negro más general de todos podemos definir tres superficies en torno a la singularidad
situada en el centro, las cuales vistas “desde arriba” (la llamaremos una vista polar) son las
siguientes.

y las cuales desde una perspectiva “ecuatorial” son las siguientes:


Resumiendo lo que hemos visto hasta ahora, existen cuatro soluciones matemáticas exactas a las
ecuaciones de campo de la Teoría General de la Relatividad que permiten clasificar a los
agujeros negros dentro de cuatro tipos posibles (posibles matemáticamente, físicamente la
abundancia relativa que pueda haber de cada uno de ellos en el Universo es un tema propio de la
filosofía de la astrofísica), dependiendo de que el agujero negro no tenga rotación alguna (J = 0)
ó de que exhiba alguna rotación (J ≠ 0) y de que sea eléctricamente neutro (Q = 0) ó que posea
alguna carga eléctrica (Q ≠ 0):

Los agujeros negros: Evaporación


Caer en un agujero negro tal vez no signifique el fin de todo. Una vez formado un agujero negro,
la Relatividad General nos indica que el agujero negro jalará y devorará todo lo que pase lo
suficientemente cerca de su influencia gravitacional como para ser engullido. Como un glotón
que solo puede crecer y crecer y del cual nada puede escapar, ni siquiera la misma luz, el agujero
negro parecería tener garantizada una existencia casi eterna tras la creación del Universo. Esto
si nos atenemos únicamente a las ecuaciones de la Relatividad General.

Pero en el Universo no sólo rige la Relatividad General. También rige la Mecánica Cuántica. Y
uno de los descubrimientos teóricos más espectaculares en tiempos recientes ha sido el que nos
indica que los agujeros negros, lejos de ser eternos, se van evaporando poco a poco:

El tiempo de “evaporación”, se admite de inicio, puede ser extremadamente largo. Pero el


sepulturero más grande que hay en el Universo, el agujero negro, tiene a fin de cuentas su
propia sepultura esperándolo, su propio fin. Ni siquiera el poderoso agujero negro puede evadir
su propia muerte.

Esta historia tiene un principio en el año de 1973, con la visita hecha a Moscú (en los tiempos de
la Unión Soviética) por el afamado científico inglés Stephen Hawking, en la cual tuvo un
encuentro con los físicos soviéticos Yacob Zeldovich y Alexander Starobinsky, los cuales le
hicieron ver que, de acuerdo con el principio de incertidumbre de Heisenberg, los agujeros
negros en rotación deberían ser capaces de producir y emitir una radiación de partículas, la cual
debería ir disminuyendo la masa del agujero negro con el paso del tiempo hasta que en un
momento dado el horizonte de evento dejaría de existir, el momento en el cual a un rayo de luz
le sería posible escapar del agujero negro.

De regreso a Inglaterra, Stephen Hawking trabajó sobre los argumentos que le fueron
proporcionados por los físicos soviéticos, y al año siguiente, en un trabajo que le fue publicado
en la revista Nature titulado “Black hole explosions?”, proporcionó por vez primera los
argumentos teóricos que sustentaban las conjeturas que le habían sido proporcionadas por los
físicos soviéticos, fundamentando el fenómeno que hoy se conoce como la “evaporación de
agujeros negros”. El proceso de emisión de partículas por el cual un agujero negro va perdiendo
masa con el paso del tiempo es conocido hoy como la radiación de Hawking.

Quienes no están familiarizados con los temas de los que se está hablando aquí naturalmente se
preguntarán: ¿cómo es posible que algo pueda escapar de la atracción gravitacional de un
agujero negro? ¿Cómo es posible que un agujero negro pueda emitir una radiación si ni siquiera
le permite a la luz escapar del mismo?

Nada puede escapar de un agujero negro dentro del horizonte de evento. Pero fuera del
horizonte de evento, cuando no se ha caído al interior, el escape es posible. Y es aquí en donde
enfocamos nuestra atención hacia lo que puede ocurrir en la cercanía del horizonte de
evento por fuera.

Tal vez una de las aserciones más espectaculares que se puedan escuchar de la Mecánica
Cuántica (o mejor dicho, de la Teoría del Campo Cuántico) tiene que ver con la creación de
partículas de la nada, salidas del vacío. Por definición, el vacío tiene una energía de cero. La
creación de partículas salidas de la nada aparentemente violaría el principio de la conservación
de la energía. Sin embargo, esto no ocurriría si estamos dispuestos a admitir algo que de inicio
puede parecer sacado de una novela de ciencia ficción, la posibilidad de la existencia de
partículas con energía negativa, o lo que es lo mismo, partículas con masa negativa.
Supongamos por un momento que tenemos una región pequeña en el espacio-tiempo vacía, en
la cual la energía es cero:

Supongamos ahora que de repente aparecen dos partículas en esa región, una con una masa
positiva m+ y otra con una masa negativa m-. La partícula con masa positiva tiene una energía
de reposo convencional igual a E+ mientras que la partícula con masa negativatiene una
energía negativa igual a E- de la misma magnitud. Podemos ver a la partícula m-como una
especie de antipartícula de la partícula m+. Al aparecer ambas partículas salidas al mismo
tiempo, no se viola el principio de la consevación de la masa-energía porque:

E+ + E - = 0

de modo tal que la masa-energía del Universo entero sigue siendo exactamente la misma que la
que había antes de la aparición de estas dos partículas. De acuerdo con cálculos llevados a cabo
con la Teoría del Campo Cuántico, estas partículas desaparecen casi tan rápidamente como
aparecen en virtud de que se vuelven a juntar aniquilándose mutuamente. Estamos
acostumbrados a pensar en que si se junta materia con antimateria se libera cierta cantidad de
energía, como cuando juntamos un electrón con un positrón o como cuando juntamos un protón
como un antiprotón. Pero tanto el positrón como el antiprotón tienen energías positivas, de
modo que al aniquilarse con sus pares toda la energía en reposo de cada par se convierte en
energía radiante. En cambio para las partículas creadas espontáneamente salidas de la nada,
una de ellas debe tener una energía negativa, lo cual la convierte en una nueva especie de
antipartícula, quizá lo que podríamos llamar la verdadera antimateria. Al juntar energía
positiva con negativa, se aniquilan dando un balance energético igual a cero, de modo tal que no
hay radiación luminosa posible al llevarse a cabo la aniquilación entre ambas.

Por otra parte, tenemos también dentro del panorama una incertidumbre física propia de la
Naturaleza, expuesta por vez primera en 1927 por Werner Heisenberg, el principio de
incertidumbre de Heisenberg , de lo cual tenemos que hacer un repaso.

El principio de incertidumbre de Heisenberg data de los tiempos en que se aceptó, en base a los
resultados obtenidos en numerosos experimentos de laboratorio, la dualidad onda-partícula. Se
hace indispensable establecer una distinción clara entre ondas y partículas, por ser estos los
únicos dos modos posibles de transmisión de energía. Clásicamente, una partícula material es
algo que ocupa una posición bien definida en el espacio, tiene momentum, energía cinética,
masa y carga eléctrica, mientras que una onda clásica tiene características tales como longitud
de onda, frecuencia, velocidad, amplitud de la perturbación, intensidad, energía y momentum.
La diferencia más sobresaliente entre ambas es que la partícula puede ser localizada mientras
que la onda se esparce y ocupa una posición relativamente amplia en el espacio. Todas las
partículas, incluyendo los fotones, se comportan en ciertas circunstancias como ondas y en otras
como partículas. Precisamente en virtud a este comportamiento, hay experimentos en los cuales
si intentamos medir cierto parámetro de una partícula habrá otro parámetro que se volverá
tanto más incierto conforme midamos uno de ellos con mayor exactitud. De este modo, si
queremos medir la posición y la cantidad de movimiento de una partícula atómica, para medir
su posición con grados mayores de exactitud tenemos que interactuar con ella alterando
irremisiblemente su cantidad de movimiento. No podemos determinar al mismo tiempo la
posición de una partícula y su cantidad de movimiento con grados ilimitados de exactitud, el
medir uno de ellos introduce una incertidumbre en la medición del otro. Y esto no es algo que
tenga que ver con la precisión de los instrumentos utilizados, es algo que tiene que ver con la
naturaleza de lo mismo que está siendo medido, es un límite absoluto impuesto por la
Naturaleza al que no podemos darle vuelta, el cual tiene una enunciación matemática precisa. El
principio de incertidumbre de Heisenberg nos dice que es imposible medir en un solo y mismo
experimento variables conjugadas (como la posición y el momentum) con precisión absoluta, y
como consecuencia no es posible medir en el mismo experimento los aspectos ondulatorio y
corpuscular de la materia. Supongamos que se diseña un experimento para medir las
propiedades de partícula de un cuerpo. Entonces necesariamente en este
experimento Δx y Δt deben ser cero puesto que una partícula, por definición, puede ubicarse
con precisión absoluta en cualquier momento. Pero entonces el momentum y la energía y con
ello los aspectos ondulatorios de la partícula (λ = h/p, f = E/h) nos serán completamente
desconocidos de acuerdo al principio de incertidumbre. De este modo, cuando se muestran los
aspectos de partícula de la materia, la naturaleza ondulatoria necesariamente se suprime. De
igual manera, si los aspectos ondulatorios son medidos con exactitud, es decir si
hacemos Δλ y Δf igual a cero, Δp y ΔE también lo serán y los aspectos de partícula no serán
observados.

Tratándose de la incertidumbre en la posición Δx y de la incertidumbre en la cantidad de


movimiento Δp de lo que estamos midiendo, ambas incertidumbres están fijadas por la
siguiente relación:

Δp · Δx ≥ h/4π

en donde h es la constante de Planck:

h = 6.626·10-34 Joule·segundo

h = 4.136·10-15 eV·segundo

El principio de incertidumbre de Heisenberg también puede formularse para otras variables


conjugadas. Supóngase un experimento en el cual se trata de determinar la energía E en un
tiempo t. Un análisis nos demuestra que la incertidumbre ΔE en la medición de la energía está
relacionada de la siguiente manera con el intervalo de tiempo Δt en el cual se lleva a cabo la
medición:

ΔE · Δt ≥ h/4π

De este modo, la energía de un cuerpo puede conocerse con toda exactitud (ΔE = 0) solamente
si la medición se efectúa en un intervalo de tiempo infinito (Δt = ∞). El concepto del vacío
absoluto desprovisto de todo rastro de materia y energía entra en conflicto directo con el
principio de incertidumbre en virtud de que el vacío total requiere de un valor de energía E = 0,
el cual siendo un valor exacto sin incertidumbre alguna no es realizable si se va a llevar a cabo
una medición en el vacío en un tiempo finito. Bajo el principio de incertidumbre de Heisenberg,
pares de partículas pueden aparecer y desaparecer tan rápidamente como aparecieron sin dejar
rastro directo de su existencia, razón por la cual se les conoce como pares virtuales. Y el hecho
de que en el vacío que creíamos absoluto se puedan producir estas partículas virtuales es
conocido como las fluctuaciones del vacío. A continuación tenemos una “instantánea
fotográfica” de lo que supuestamente está ocurriendo a niveles sub-atómicos pequeñísimos
debajo de nuestra capacidad experimental actual para poder detectarlo:

En el primer instante de tiempo, de la nada que teníamos en la placa 1 se crean dos partículas
sub-atómicas, una con energía positiva y la otra con energía negativa (un segmento
considerable de la comunidad científica aún tiene problemas con esto último por ser algo que no
puede ser entendido y mucho menos explicado fácilmente), las cuales aparecen en la placa 2.
Pero siendo opuestas en todo, inclusive teniendo cargas eléctricas opuestas, dichas partículas se
atraen en la placa 3. Y se aniquilan desapareciendo al vacío de donde llegaron, como podemos
verlo en la placa 4. Sin embargo, en el proceso del “aniquilamiento” del par, no hay liberación
alguna de energía, no hay producción alguna de fotones, porque como una de las partículas
tenía energía positiva y la otra tenía energía negativa, al juntarse las energías de ambas la
energía total es cero. De cualquier modo, como hasta la fecha no tenemos instrumento científico
alguno que nos pueda medir algo con contenido energético combinado total de cero exponiendo
del mismo algo que posea energía negativa, estas partículas nos parecen tan fantasmagóricas
como el resto del Universo que no alcanzamos a ver con nuestros telescopios pero que
sospechamos que está allí. Esta producción de pares de partículas no debe ser confundida con la
creación de pares estudiada en la entrada titulada “Física atómica relativista” en la cual se crean
dos partículas, un electrón y un positrón, a partir de un proceso de conversión relativista de
energía en materia que requiere de un fotón de alta energía para llevarse a cabo. En aquél caso,
el proceso de creación de pares no puede llevarse a cabo sin el fotón. Pero en este caso que nos
ocupa, no se requiere de fotón alguno. En aquél caso, las partículas creadas eran totalmente
reales y detectables en experimentos de laboratorio. Pero en este caso, las partículas virtuales
teniendo una de ellas una energía negativa parecen ser más bien conclusiones (o ilusiones)
creadas a partir de las herramientas matemáticas utilizadas en la Teoría del Campo Cuántico. Si
hemos de creerle a las matemáticas empleadas en nuestros razonamientos, vivimos en un
verdadero “mar” de partículas virtuales apareciendo y desapareciendo por debajo de nuestro
nivel de consciencia como lo muestra el siguiente diagrama espacio-tiempo (en el cual cada
partícula creada de la nada es mostrada de color azul mientras que su
respectiva antipartícula es mostrada de color rojo):

PROBLEMA: Demostrar, a partir del principio de incertidumbre de Heisenberg, que la vida


Δt de un par de partículas virtuales creadas a partir de las fluctuaciones del vacío, suponiendo
que cada una de ellas está actuando como un fotón, está dada por:

Δt = 1/8πf
siendo f la frecuencia característica de cada fotón.

Utilizaremos el principio de incertidumbre de Heisenberg en su condición de igualdad:

ΔE Δt = h/4π

Δt = h/4πΔE

La energía de un fotón de luz, de acuerdo a la Mecánica Cuántica, está dada por E = hf,
mientras que la energía de un par de fotones será el doble, con lo cual ΔE = 2hf. Substituyendo
esto en la condición de Heisenberg:

Δt = h/4π(2hf)

Δt = 1/8πf

PROBLEMA: Un fotón que produzca en la retina luz de color naranja tiene una longitud de
onda de 600 nanometros. Estimar la duración de un par de partículas virtuales que sean
fotones de color naranja.

Para un fotón c = fλ, de donde obtenemos la frecuencia correspondiente como:

f = c/λ = (300,000,000 metros/seg)/(600·10-9 metro)

f = 5·1014 Hertz = 500 Terahertz

De la fórmula obtenida tenemos:

Δt = 1/8πf = 1/(8π·5·1014) ≈ 8·10-18 segundo

Δt ≈ 8·10-17 segundo ≈ 80·10-18 segundo ≈ 80 attosegundos

Como puede verse, el tiempo de vida para un par de partículas virtuales es extremadamente
breve.

Aunque las partículas virtuales parecen ser indectectables y parecen ser meras explicaciones o
justificaciones teóricas dadas a varias técnicas matemáticas utilizadas tanto en la Teoría del
Campo Cuántico como en la Electrodinámica Cuántica, durante el brevísimo tiempo en el que
aparecen estas partículas virtuales se vuelven partículas reales y dejan huella. La existencia
de las partículas virtuales fue confirmada por vez primera en 1947 a través de un efecto conocido
como el desplazamiento Lamb (Lamb shift). En el átomo de hidrógeno, de acuerdo con la
Electrodinámica Cuántica, el protón en el núcleo así como el electrón que lo circunda están
ligados juntos por fotones (el quantum del campo electromagnético). Cada fotón vivirá cierto
tiempo como un electrón virtual junto con su antipartícula, un positrón virtual. De acuerdo con
la Mecánica Cuántica clásica, el átomo de hidrógeno tiene dos niveles de energía (conocidos
comúnmente como orbitales atómicos), el nivel 2S1/2 y el nivel 2P1/2, los cuales deben tener
exactamente la misma energía (en este caso estamos citando a Dirac). Sin embargo, cuando el
átomo está en uno de esos dos niveles interactúa de modo diferente que cuando se encuentra en
el otro nivel, de modo tal que la interacción del electrón con el vacío produce un ligerísimo
desplazamiento en el nivel de energía del orbital atómico 2S1/2. Este desplazamiento fue
detectado experimentalmente por Willis Lamb y Robert Retherford, los cuales midieron un
ligero aumento de 1060 Megahertz (aproximadamente 1 Gigahertz, una frecuencia fácilmente
realizable en nuestros días como lo comprueba el uso extendido de los teléfonos celulares que
trabajan en esos rangos de frecuencias) del nivel 2S1/2 sobre el nivel 2P1/2:

coincidiendo con el valor predicho teóricamente:

lo cual a su vez proporcionó el ímpetu necesario para la fundación de la Electrodinámica


Cuántica emprendida por Julian Schwinger, Freeman Dyson y Richard Feynman (este último
famoso por la creación de los diagramas de Feynman que han contribuído a la visualización de
la renormalización matemática que permite manejar los términos infinitos que aparecen en las
series de perturbación empleadas en la Teoría del Campo Cuántico). Además el desplazamiento
Lamb, se ha medido también otro efecto de laboratorio conocido como el efecto Casimir,
propuesto por vez primera por el científico holandés Hendrick Casimir en 1948, el cual consiste
en lo que parece ser una “fuerza de atracción” entre dos placas metálicas debido no a la
atracción gravitacional de las masas de las placas o a la atracción electrostática que pueda haber
entre ellas sino al empuje dado a las mismas por las partículas virtuales creadas en el exterior de
las placas. Casimir teorizó que si dos placas perfectamente paralelas podían ser aproximadas lo
suficiente la una a la otra, el espacio pequeño entre dichas placas estaría libre de todas las
partículas con una longitud de onda larga. Esas partículas, sin embargo, podían seguir
creándose espontáneamente en el exterior de las placas, creándose una presión detectable
contra el exterior de las placas:

demostrándose con ello la existencia de partículas creadas espontáneamente del “espacio libre”:
A continuación tenemos la fotografía de una esferita metálica microscópica en el momento en
que está siendo objeto de un desplazamiento hacia el hueco inferior que hay por debajo de ella,
ocasionado por el empuje del efecto Casimir:
Así pues, la existencia de las partículas virtuales, aunque no observables directamente, está
fuera ya de toda duda por los efectos que su efímera existencia son capaces de producir. Y si las
partículas virtuales están creándose continuamente en todas partes en donde suponemos que
hay un vacío, también deben estarse creando en las afueras del horizonte de evento de un
agujero negro.

Siguiendo el espíritu del diagrama espacio-tiempo de Minkowski, a continuación tenemos una


ilustración de lo que ocurre en el proceso de “evaporación” del agujero negro (el radio del
cilindro representa el radio del horizonte de evento):

En esta figura tenemos muchos pares de partículas virtuales que se crean espontáneamente
fuera del horizonte de evento del agujero negro y se aniquilan mutuamente al poco tiempo de
haberse creado, de las cuales nunca llegaremos a saber nada. Dentro del horizonte de evento,
tenemos también otro par que se crea y desaparece espontáneamente del cual tampoco
llegaremos a saber nada. Pero en la figura podemos ver que hay tres pares de partículas que se
crearon espontáneamente cerca (y fuera) del horizonte de evento. En cada uno de estos tres
pares una de las partículas con energía negativa E- traspasa el horizonte de evento yéndose al
interior del agujero negro, mientras que la otra con energía positivaE+ empieza un viaje solitario
alejándose del horizonte de evento:

La partícula que cae dentro del horizonte de evento tiene el equivalente de un déficit de energía
por el simple hecho de ser una partícula con energía negativa E-, lo cual el agujero negro tiene
que compensar disminuyendo su propia masa-energía. Esto, efectivamente, es una evaporación
paulatina del agujero negro conforme el proceso se va repitiendo en grandes cantidades.

A continuación veremos cuánta energía puede extraer un par de partículas virtuales de un


agujero negro. Puesto que la única cosa que puede salir hacia fuera del radio de Schwarzschild
desde el interior de un agujero negro es la gravedad, la radiación de Hawking debe depender de
alguna manera de la gravedad.

Clásicamente, cuando algo es acelerado por efectos de la gravedad, gana energía de movimiento,
energía cinética, la cual es proporcional a la masa del objeto y la distancia a lo largo de la cual es
acelerado. Tratándose de un fotón que de acuerdo a la Teoría de la Relatividad sólo puede
desplazarse a la velocidad de la luz, no puede acelerarse pero su frecuencia sí puede cambiar
dándole con ello una mayor energía.

Si una masa m cae una altura d al estar bajo la acción de un campo gravitacional, la energía que
adquiere será igual a la diferencia que hay en la energía potencial a través de esa distancia d:
E = mgd

En realidad esta no es una relación exacta porque la gravedad varía de acuerdo con la distancia
radial hacia el centro de la atracción. De cualquier modo, puesto que los fotones virtuales tienen
un tiempo de vida muy corto (de acuerdo con el cálculo aproximado que hicimos arriba), no
llegarán muy lejos y podemos considerar a la gravedad aproximadamente constante,
permitiéndonos el uso de esta fórmula. Puesto que los fotones se mueven siempre a la velocidad
de la luz, la distancia recorrida por un fotón virtual en el transcurso de su corta vida será d =
cΔt. Ya vimos arriba que el tiempo aproximado de vida de un fotón virtual será Δt = 1/8πf.
Entonces:

d = c/8πf

Poniendo esto en la fórmula de arriba obtenemos:

E = mg(c/8πf) = mgc/8πf

Clásicamente también, de la fórmula Newtoniana F = GmM/r² para la atracción gravitacional


entre dos cuerpos de masa m y M obtenemos lo siguiente con la ayuda de la definición
Newtoniana de la fuerza como F = ma con una aceleración a = g:

a = g = GM/r²

Uno de los fotones virtuales tiene que caer dentro del agujero negro a fin de que se produzca la
radiación de Hawking, de modo tal que ambos se tienen que originar cerca del radio de
Schwarzschild, el cual es rs = 2GM/c². Como una aproximación podemos tomar el radio de
Schwarzschild como la distancia r entre el par de fotones virtuales y el agujero negro. Entonces:

g = GM/r² = GM/(rs)² = GM/(2GM/c²) = c4/4GM

Poniendo esto en la fórmula anterior:

E = mgc/8πf = [m(c4/4GM) c]/8πf

E = mc5/32πGMf

Ahora intentaremos substituír el valor de la masa m recurriendo a la fórmula clásica de la Teoría


Especial de la Relatividad E = mc², de la cual obtenemos m = E/c². La energía para un solo
fotón está dada por E1 = hf, mientras que para dos fotones está dada por E2 = 2hf, con lo cual
obtenemos m = 2hf/c². Poniendo esto en la fórmula de arriba obtenemos:

E = m (c5/32πGMf) = (2hf/c²) (c5/32πGMf)

E = hc3/16πGM

Esta es nuestra fórmula para la energía de un fotón que resulta de la radiación de Hawking.
Puesto que esta relación nos dice que la energía es inversamente proporcional a la masa M del
agujero negro, entonces una partícula emitida por un agujero negro tiene tanto más energía
cuanto mas pequeño sea el agujero negro, lo cual podrá parecer sorprendente a muchos.

Los cálculos iniciales llevados a cabo a principio de los setentas para la creación de partículas
virtuales justo en el exterior del horizonte de evento de un agujero negro consideraron que para
que este fenómeno ocurriera el agujero negro tenía que ser un agujero negro dinámico, tenía que
estar en rotación, pero la mayor sorpresa estaba aún por venir.

En 1974, Stephen Hawking efectuó cálculos meticulosos del proceso de creación de partículas
que ocurre durante el proceso del colapso gravitacional que transforma a una estrella en un
agujero negro. Aún en el caso de un agujero negro sin rotación colapsándose hacia un agujero
negro Schwarzschild, estático, nosotros esperaríamos que ocurriese alguna creación de
partículas durante la fase dinámica del colapso en virtud del intenso y variante campo
gravitacional. Y en el caso de una estrella en rotación colapsándose para formar un agujero
negro en rotación, también esperaríamos que se llevase a cabo en forma constante la creación de
partículas de la manera en que se ha señalado arriba. Pero en el caso del colapso hacia un
agujero negro estático, sin rotación, no se esperaba creación alguna de partículas después de
haber ocurrido el proceso del colapso. Sin embargo, esto no es lo que Hawking encontró al llevar
a cabo sus cálculos detallados. Encontró que para tiempos posteriores al colapso gravitacional
propio de un agujero negro estático, la razón de emisión de partículas hacia el espacio exterior
no caía a cero sino que se estabilizaba en cierto valor. Y la sorpresa mayúscula resultó ser que
esta razón de emisión de partículas se correspondía exactamente con el proceso de radiación de
lo que clásicamente se conoce en termodinámica como la radiación del cuerpo negro (el
término no tiene nada que ver aquí con los agujeros negros). Todos estamos familiarizados de
alguna manera con este tipo de radiación térmica. La hemos visto cuando vemos los videos de la
lava de un volcán cayendo por sus laderas, cuando vemos las brasas de carbón al hacer una
carne asada a la parrilla, o cuando vemos un metal calentado “al rojo vivo”:

Esta radiación térmica no es precisamente una radiación que ocurra a una sola frecuencia del
espectro visible. Es una radiación que contiene toda una gama de frecuencias que van inclusive
más allá del infrarrojo y del ultravioleta, y lo que ven nuestros ojos es un “compuesto” del
espectro de radiación interpretándola (erróneamente) como si fuese luz de un solo color. A
continuación tenemos el espectro de radiación emitido por un cuerpo que se encuentra a una
temperatura de 6000 grados Kelvin:
Lo interesante de esta radiación térmica es que todos los cuerpos emiten exactamente la
misma radiación a la misma temperatura independientemente del material del
que están hechos, ya sea carbón, níquel, cobre, cobalto, oro o uranio. Con el objeto de que en
la determinación experimental en el laboratorio de este espectro característico de radiación
térmica no haya distorsión alguna ocasionada por la luz incidente del exterior (la cual posee
también su propio espectro característico), se acostumbra preparar un bloque hueco con una
cavidad en su interior haciendo un pequeño agujerito para permitirle a la radiación que se
genere dentro de dicha cavidad el poder escapar hacia el exterior en estado “puro” en donde
puede ser medida con la ayuda de espectrómetros. El hecho de que la cavidad interior no reciba
luz alguna del exterior siendo por lo tanto “negra” es lo que ha hecho que a la radiación
generada dentro de dicha cavidad que escapa hacia el exterior por el agujerito se le denomine
“radiación del cuerpo negro”.

En principio, no solo fotones luminosos sino toda clase de partículas pueden ser emitidas de la
cavidad interior de un “cuerpo negro”, pero a menos de que la temperatura sea extremadamente
elevada (alrededor de mil millones de grados centígrados) la emisión de partículas con masa que
será observada será prácticamente nula y lo único que observaremos serán fotones.

La radiación térmica del cuerpo negro es el resultado de las interacciones de los átomos al
interior de un cuerpo que producen una distribución característica de fotones a cierta
temperatura que no depende de la naturaleza detallada de las interacciones, y por lo tanto este
proceso es de una naturaleza completamente al proceso de emisión de partículas de un agujero
negro. Sin embargo, la emisión de partículas de un agujero negro estático de masa M es idéntica
en todos sentidos a la radiación de un cuerpo negro puesto a una temperatura T.
A continuación se llevará a cabo una derivación tentativa de una expresión que corresponda a la
temperatura T de un agujero negro que está en proceso de evaporación.

Tomaremos como base el hecho de que la energía térmica promedio E para un fotón (y en
general para cualquier partícula) producido por la radiación de un cuerpo negro, expresada en
función de la constante de Boltzmann k, está dada por:

E ≈ 2.821439372 kT

siendo la constante numérica 2.821439372 el resultado a la ecuación trascendente:

3 (1 - e-x ) = x

Suponiendo que esta energía es igual a la magnitud de la energía puesta para la creación de un
par de partículas, podemos igualar E con la energía E que obtuvimos arriba:

E=E

2.821439372 kT = hc3/16πGM

Despejando y poniendo lo anterior en función de la temperatura, tenemos entonces:

T = hc3/16(2.821439372)(π)GM

Esta fórmula no está muy alejada de la fórmula obtenida por Hawking recurriendo a
argumentos mucho más elaborados que caen dentro del ámbito de la Teoría del Campo
Cuántico, ya que en la fórmula exacta para la temperatura de un agujero negro de masa M
considerado como un radiador térmico por la emisión de partículas resulta ser la siguiente
(reemplazándose el factor numérico 2.821439372 por π):

siendo por lo tanto el margen de error con la aproximación que obtuvimos relativamente
moderado.
El hecho de que todo agujero negro debe poseer cierta temperatura fue demostrado por Jacob
Bekenstein en 1972, dos años antes de que Hawking demostrase la existencia de la radiación de
partículas que lleva su nombre a través del mecanismo de creación de partículas virtuales justo
afuera del horizonte de evento de un agujero negro.

La pregunta ahora es: ¿la extraordinaria coincidencia entre el espectro de emisión de partículas
de un agujero negro y el espectro de radiación electromagnética de un cuerpo negro es
simplemente una increíble coincidencia, o hay detrás de esto alguna importante razón de fondo
que se nos está escapando y que aún no alcanzamos a comprender? Recuérdese que antes de
que hicieran su aparición los reactores nucleares y las bombas atómicas Einstein ya había
anticipado una equivalencia entre la materia y la energía a causa de la Teoría Especial de la
Relatividad, y si esto no hubiera ocurrido entonces de cualquier manera habríamos obtenido
empíricamente la fórmula E = mc², y sin poder darle una explicación teórica a dicha fórmula
nos encontraríamos en la misma situación que en la que hoy nos encontramos al sospechar que
detrás del extraordinario parecido entre el espectro de emisión de partículas de un agujero
negro y el espectro de radiación electromagnética de un cuerpo negro hay toda una teoría
novedosa y radical que está en espera de ser desarrollada por otro Einstein, quizá por alguien
que esté leyendo esto.

PROBLEMA: Utilizando los valores experimentales de las constantes físicas fundamentales,


simplificar la fórmula que dá la temperatura de un agujero negro de masa M.

Manteniéndonos dentro de un sistema consistente de unidades, el sistema MKS, las constantes


físicas que debemos utilizar son las siguientes:

h = 6.626·10-34 metro² · kilogramo/seg

c = 299, 792, 458 metros/seg

k = 1.38065·10-23 metro² · kilogramo/seg² · °K

G = 6.674215·10-11 m3/kg-seg²

Entonces:

T =_______________________
[(6.626·10-34)(299, 792, 458)3]/[16π²(1.38065·10-23)( 6.674215·10-11)M]
T ≈ (1.227·1023 /M) °K

Frecuentemente esta fórmula es expresada dando la masa en función de masas solares, usando
la masa del Sol como múltiplo. Puesto que la masa del Sol M☉ es:

M☉ = 1.98892·1030 kilogramos

entonces podemos escribir la fórmula expresada en masas solares como:

T ≈ (6·10-8 /M☉) °K

PROBLEMA: Sabiendo que la luminosidad de un cuerpo negro está dada por la fórmula
Stefan-Boltzmann:

L = σAT4

en donde σ es la constante de Stefan-Boltzmann:

σ = 2 π5 k4 /15 h3 c²

σ = 5.6704·10-8 watts / metro² · °K4

y que A es la superficie del cuerpo radiante, derivar una fórmula apropiada para la
luminosidad de un cuerpo negro.

La superficie relevante para la radiación de Hawking es el área superficial de una esfera con un
radio igual al radio de Schwarzschild rs, porque allí es donde se origina la radiación. Entonces:

A = 4 π r² = 4 π (rs)² = 4 π (2GM/c²)² = 16πG²M²/c4

Podemos poner esto en la relación para la luminosidad:

L = σAT4 = (2 π5 k4 /15 h3 c²)(16πG²M²/c4 ) T4

L = (32 π6 k4 G² M²/15 15 h3 c6) T4


Pero la fórmula para la temperatura T es la que tenemos arriba, lo cual nos conduce a lo
siguiente:

L = (32 π6 k4 G² M²/15 15 h3 c6) (hc3 /16 π² kGM)4

L = (32 π6 k4 G² M²/15 15 h3 c6)(h4 c12/256 π8 k4 G4 M4)

L = h c6/30720 π² G²M²

Manteniéndonos dentro de un sistema consistente de unidades, el sistema MKS, la fórmula


obtenida se puede escribir de la manera siguiente:

L ≈ (3.568·1032/M²) watts · Kg²

PROBLEMA: ¿Cuál será la luminosidad para un agujero negro que tenga el tamaño de la
Tierra?

Tomando para la Tierra una masa de M = 5.9742·10 24 Kilogramos, la luminosidad será:

L ≈ (3.568·1032)/(5.9742·1024 Kg)²) watts · Kg²

L ≈ 10·10-18 watts

PROBLEMA: ¿Qué tan masivo será un agujero negro que posea la misma luminosidad que
nuestro Sol?

La luminosidad de nuestro Sol no es la de un cuerpo negro clásico que siga las normas de la
termodinámica convencional, ya que su energía radiante depende de procesos de fusión nuclear
que liberan una cantidad de energía mucho mayor que la que sería liberada sin esos procesos de
fusión nuclear. Consultando Internet, encontramos que la luminosidad de nuestro Sol es:

L☉ ≈ 3.839 · 1026 watts

Ya vimos que la luminosidad que corresponde a un agujero negro es:

L ≈ (3.568·1032/M²) watts · Kg²


de donde, haciendo L = L☉:

M ≈ √3.568·1032/L

M ≈ √3.568·1032/L☉

M ≈ √[3.568·1032/3.839·1026]

M ≈ 964 kilogramos

Un agujero negro de tan solo 964 kilogramos tendría la misma luminosidad que la de nuestro
Sol, pese a tener un diámetro de tan solo 2.85·10 -24 metros (estamos hablando de un diámetro
que corresponde a un radio de Schwarzschild). Sin embargo, no sería visible, en virtud de que la
radiación de un agujero negro con estas características sería una radiación de rayos gamma
letales.

Estamos ahora en condiciones de llevar a cabo la derivación de una fórmula que nos pueda dar
el tiempo de vida de un agujero negro. Podemos empezar considerando que la potencia de la
radiación de Hawking es esencialmente igual a la luminosidad del agujero negro:

P = L = hc6/30720 π² G²M²

Por otro lado, la energía que está siendo perdida por el agujero negro es la misma que la energía
que está siendo transportada por la radiación de Hawking a una razón dada por:

P = - dE/dt

en donde el signo menos se ha introducido para indicar que la energía radiada hacia afuera es
una energía que está siendo perdida, que está disminuyendo en lugar de aumentar. Usando
ahora la equivalencia relativista entre la masa y la energía vemos que:

E = Mc²

dE = c² dM

Por lo tanto:
P = - dE/dt = - d(c² dM)/dt = -c² dM/dt

Igualando esto a la expresión para la potencia de la luminosidad:

hc6/30720 π² G²M² = -c² dM/dt

- (hc4/30720 π² G²) dt = M² dM

Para fines de simplicidad, agruparemos el factor que está en el lado izquierdo dentro de una
gran constante que llamaremos K, con lo cual tenemos lo siguiente:

- K dt = M² dM

Ahora vamos a llevar a cabo una integración elemental. Conforme el agujero negro se va
evaporando lentamente, su masa cae desde una masa inicial M0 hasta una masa igual a cero
cuando el agujero negro se ha “evaporado” totalmente y no queda ya nada de él. El tiempo
requerido para la evaporación empieza desde un tiempo igual a cero hasta llegar a un tiempo
t1 que es el tiempo límite de vida requerido para la evaporación. Integrando ambos lados de la
ecuación:

Por lo tanto, el tiempo de vida “útil” de un agujero negro será no mayor de:

t = M03/3K

en donde la “gran constante” K al ser evaluada tiene un valor igual a 3.98·10 15kg3/segundo.

PROBLEMA: ¿Cuál sería la vida máxima de un agujero negro que tuviese la misma masa
que la de nuestro Sol?

Usando la fórmula obtenida:


t = M☉3/3K = (1.98892·1030 kg)3/(3)·(3.98·1015 kg3/segundo)

t = 6.60·1074 segundos ≈ 2·1067 años

Considerando que el Universo en el que vivimos es relativamente joven, con una edad de tan
solo entre 13 y 14 mil millones de años, podemos ver que un agujero negro que tenga la misma
masa que nuestro Sol tendrá una vida mucho mayor que la lleva acumulada nuestro Universo.

La fórmula obtenida nos dice que el tiempo de vida de un agujero negro es proporcional al cubo
de su masa M. Esto nos dice que un agujero negro grande toma un tiempo considerablemente
mayor para evaporarse que un agujero negro de menor tamaño, y a causa de la misma fórmula
el proceso de evaporación se acelerará conforme el agujero negro vaya perdiendo masa
disminuyendo aún más su tiempo de vida, cayendo por lo tanto el proceso en una espiral viciosa
que va acelerando el fin del agujero negro. Por otro lado, repasando la fórmula para la
temperatura de un agujero negro, podemos ver que conforme el agujero negro va perdiendo
masa su temperatura irá aumentando en forma inversamente proporcional, de modo tal que
cuando sea muy pequeño lo más probable es que el agujero negro se “quemará” explotando en
un estallido estruendoso y gigantesco que sin lugar a dudas será notado de alguna manera por
los vecinos del moribundo cósmico.

Apelando al principio de equivalencia de la Relatividad General que nos dice que estar en reposo
en un campo gravitacional es equivalente a estar en un marco de referencia acelerado,
concluímos que debe existir un efecto análogo a la radiación de Hawking para un observador
que experimenta una aceleración comparable a la que experimentaría en la cercanía del
horizonte de evento de un agujero negro, máxime que el proceso cuántico de creación de
partículas virtuales es algo que ocurre en todos los confines del Universo y no sólo en el borde de
un agujero negro. La posibilidad de este efecto fue propuesta por William Unruh en 1976, razón
por la cual se le conoce como el efecto Unruh. Este efecto, para el cual no necesitamos de la
cercanía de un agujero negro, es la predicción de que un observador que se está acelerando
observará una radiación térmica (de cuerpo negro) en donde un observador en reposo no la
detectará:
De este modo, el trasfondo parecerá “caliente” desde el punto de vista del marco de referencia de
un observador que se está acelerando, o puesto de otra manera, un termómetro que esté siendo
agitado rápidamente (sometido a aceleraciones intensas) medirá, en el vacío absoluto de un
marco de laboratorio puesto a una temperatura de cero grados, una temperatura diferente de
cero. En una forma similar a como ocurre con la radiación de Hawking, el efecto Unruh es
causado por las fluctuaciones del vacío cuando el observador se encuentra en un marco de
referencia acelerado.

Para aceleraciones muy bajas, la longitud de onda emitida por la radiación de Unruh sería tan
larga que una longitud de onda completa sería mayor que la extensión del Universo conocido.
Las bajas aceleraciones generarían, por lo tanto, ondas que no tienen efecto alguno sobre el
cuerpo de un observador acelerado. Sin embargo, un cuerpo con aceleración moderadamante
elevada lentamente puede ir superando un umbral de aceleración en el cual la radiación Unruh
decrementa su longitud de onda a una menor que la extensión del Universo conocido,
provocando esta aceleración un “impulso” diminuto pero medible. De este modo, si un cuerpo es
acelerado, éste observará radiación de un cuerpo negro en una zona en la que un observador
inercial no lo observará. Se debe recalcar que se trata de un efecto cuántico de principio a fin.

A partir de las coordenadas Rindler se puede derivar sin mucha dificultad la expresión para la
temperatura T debida a la radiación Unruh, que para un observador que se está desplazando
localmente con una aceleración a resulta ser:
En base a esta relación, la temperatura Unruh del vacío vista por un observador que está sujeto
a una aceleración igual a la de la superficie de la Tierra (9.8 m/seg²) es igual a 4·10 −20 °K, un
valor demasiado cercano al cero absoluto. De ser posible obtener en un laboratorio
aceleraciones de hasta 1026 m/seg², esto nos produciría un efecto Unruh considerablemente
mayor, igual a 400,000 °K. Desafortunadamente el obtener aceleraciones de esta magnitud
inclusive por un período de tiempo brevísimo sobre una partícula pequeñísima es algo que está
fuera del alcance de nuestras posibilidades actuales.

Se puede obtener más información en la Wikipedia acerca de las partículas virtuales, el


desplazamiento Lamb, el efecto Casimir, la evaporación de los agujeros negros y el efecto Unruh
en los enlaces indicados dentro de la Bibliografía puesta al final de esta obra.

Los agujeros negros: Entropía generalizada


Posiblemente la mayoría de los lectores de esta obra están familiarizados con el concepto de
la entropía, la medida del orden (o más bien, el desorden) de un sistema, y con el enunciado de
que la entropía del Universo jamás puede disminuír con el tiempo, sólo puede aumentar. Este es
precisamente el enunciado de la segunda ley de la termodinámica. Y es la ley física que nos
fija de modo claro e inequívoco lo que llamamos la flecha del tiempo, la dirección en la cual
avanza el tiempo, precisamente porque la entropía solo puede aumentar con el paso del tiempo,
nunca disminuír; para que la entropía en alguna parte del Universo disminuyese en forma
espontánea el tiempo tendría que avanzar hacia atrás. De cualquier manera, para el beneficio
de quienes no tienen claro en sus mentes el concepto de la entropía, haremos aquí un repaso
breve de dicho concepto.

La entropía, como se dijo, es una medida del desorden de un sistema. Intuitivamente, podemos
entender que hay sistemas que indudablemente están más y mejor ordenados que otros, como lo
es el caso de una taza de café y una cucharada de leche, los cuales consideraremos
individualmente como estados puros. Al vaciar la leche de la cuchara dentro del café, aunque no
agitemos la taza con la cuchara la leche se irá mezclando con el café hasta que los dos
componentes originales serán irreconocibles. En vez de los dos estados puros originales
tenemos un estado mezclado. Hemos perdido la separación que había entre los dos
componentes originales al quedar revueltos de forma espontánea. Y hemos perdido cierto grado
de orden. Aunque nos quedemos sentados esperando millones de años a que la leche y el café se
separen espontáneamente así como se revolvieron, esto no sucederá, la probabilidad de que ello
ocurra es astronómicamente insignificante. Podemos, si así lo deseamos, separar la combinación
en sus partes constituyentes, café y leche. Pero ello requerirá un gasto de energía que no se
había requerido para que ambos componentes se mezclasen totalmente. Al mezclarse el café y la
leche, ha aumentado la entropía del sistema café-leche. La primera ley de la termodinámica
sigue siendo plenamente válida, no se ha perdido energía alguna al llevarse a cabo la mezcla.
¿Entonces por qué requerimos de cierta cantidad de energía mínima para separar ambas partes?
Precisamente porque la energía inicial que había en el sistema se ha vuelto menos útil por
tratarse de un sistema más desordenado. ¿Y si separamos el café y la leche en sus componentes
fundamentales acaso no disminuímos la entropía del sistema? No, el gasto de energía que
requerimos para llevar a cabo la separación aumentará la entropía total del sistema que ahora
incluye no solo el cafe y la leche sino el laboratorio en donde se lleva a cabo la separación.

El primero en darse cuenta de que la entropía solo puede aumentar, nunca disminuír, fue el
ingeniero francés Sadi Carnot. Tras su descubrimiento, esta segunda ley de la termodinámica
que se suma a la primera ley (que nos enuncia la conservación de la energía, hoy expresada
relativísticamente como la conservación de la masa-energía) ha sido corroborada en infinidad
de análisis teóricos y experimentos de laboratorio. No hay forma alguna de escapar a dicha ley.

Podemos representar lo que ocurre en la taza con el café y la leche, separados inicialmente
mediante una barrera puesta entre ambos en la misma taza, representando sus moléculas del
modo siguiente antes y después de la remoción de la barrera con las moléculas del café de color
azul y las moléculas de la leche de color rojo:

Tras la remoción de la barrera, podemos ver que las moléculas de ambos líquidos están
totalmente mezcladas gracias a la agitación térmica de las moléculas (conocida técnicamente
como el movimiento Browniano).
Hemos visto lo que ocurre en el caso de dos líquidos. En el caso de dos gases como el oxígeno y
el metano ocurre exactamente lo mismo, excepto que a una rapidez mucho mayor:

Puesto que la tendencia natural de todo sistema físico es avanzar de un grado de orden mayor de
orden hacia el desorden, si nos presentan dos fotografías y nos piden que digamos cuál de las
dos fue tomada antes y cuál de las dos fue tomada después, no tendremos problema alguno en
dar una respuesta, como lo ilustran los siguientes dos ejemplos:
En las dos figuras de arriba que nos representan unos átomos dentro de un recipiente, sin lugar
a dudas la figura en el lado derecho representa un grado mayor de orden que la figura del lado
izquierdo. En tal caso, la fotografía de la figura derecha tuvo que haber sido tomada antes que la
figura del lado izquierdo, lo cual significa que la flecha del tiempo avanza de derecha a
izquierda. Por otro lado, en las dos figuras de abajo que representan unos ladrillos sin lugar a
dudas la figura del lado izquierdo representa un grado mayor de orden que la figura del lado
derecho. En este caso, la fotografía del lado derecho tuvo que haber sido tomada después que la
fotografía del lado izquierdo, lo cual significa que la flecha del tiempo avanza de izquierda a
derecha.

De este modo, además de la concepción relativista que tenemos del tiempo, tenemos una
concepción termodinámica que nos fija el criterio para determinar el sentido en el cual está
avanzando el tiempo, lo cual nos hace sospechar que de alguna manera la Relatividad General y
la Termodinámica están conectadas.

La entropía, como la hemos descrito, ha sido enunciada en términos puramente cualitativos,


subjetivos, sin ponerle números al asunto. Sin embargo, a la entropía se le puede dar una
definición de origen matemático basada en la teoría de las probabilidades. Esto fue
precisamente lo que hizo por vez primera el físico austriaco Ludwig Boltzmann en su teoría
cinética de los gases. La famosa constante que lleva su nombre, la constante de
Boltzmann k, es en esencia una constante estadística derivada de una aplicación rigurosa (con
algunas aproximaciones de simplificación) de las reglas de la probabilidad. Su igualmente
famosa fórmula para la entropía a la cual hoy en día simbolizamos como S es:
S = k ln W

en donde la constante k es igual a:

k = 1.38065 · 10−23 joule/°K = = 8.61734 · 10−5 eV/°K

El modelo de Boltzmann fue un gas ideal de N partículas idénticas, de las cuales Ni son las i-
ésimas condiciones microscópicas de posición y cantidad de movimiento. La cantidad
adimensional W puede ser obtenida recurriendo a las permutaciones posibles de partículas que
encontramos en la estadística de Maxwell-Boltzmann:

donde i varía dentro de todos las condiciones moleculares posibles (el símbolo π representa el
producto de las i-ésimas condiciones microscópicas de posición y cantidad de movimiento). La
corrección en el denominador es debido al hecho de que partículas idénticas en la misma
condición son indistinguibles. La cantidad W es conocida como la probabilidad
termodinámica. Muy justamente, la fórmula está inscrita en la cabecera de la lápida que
indica el lugar en donde descansan los restos de Ludwig Boltzmann en el cementerio
Zentralfriedhof de Viena:
Para ilustrar el significado matemático de la entropía de acuerdo a la definición de la misma
dada por Boltzmann (considerado como el “padre” de la mecánica estadística), considérese
primero el caso de una partícula (un átomo, por ejemplo) confinada a un microestado sin
posibilidad alguna para pasar de dicho microestado a otro:

En este caso, puesto que la partícula no tiene opción de movimiento, sólo hay un estado posible.
La entropía S es cero; nos lo dice la misma fórmula de Boltzmann:

S = k ln (1) = 0

Veamos ahora el caso de nueve partículas confinadas a nueve microestados, sin capacidad para
moverse a otro microestado adicional porque no hay lugar para ello:
En este caso, la entropía también será cero, porque hay tantas partículas “empaquetadas” como
hay lugares disponibles. El sistema no puede desordenarse. Si en lugar de una configuración
planar de nueve partículas tenemos un cubo de 27 átomos en el cual sólo hay 27 microestados
disponibles, y si ninguno de los átomos tiene energía suficiente como para salir fuera del cubo,
entonces podemos visualizar esto como un cristal “perfecto” con entropía cero. De hecho, esta es
precisamente la formulación de la tercera ley de la termodinámica que nos dice que la
entropía de una sustancia pura a la temperatura del cero absoluto es cero. Por consiguiente, la
tercera ley provee de un punto de referencia absoluto para la determinación de la entropía
absoluta, ya que la entropía relativa a este punto es la entropía absoluta.

Veamos ahora un caso en el cual tenemos dos partículas, las cuales pueden ocupar tres
microestados. En este caso, si las partículas son iguales, existen tres formas distintas en las
cuales las dos partículas pueden ser acomodadas en los tres microestados:

Tenemos entonces una situación en la cual definitivamente se le puede asignar al sistema una
entropía diferente de cero con la fórmula de Boltzmann. La entropía en este caso tendrá un valor
bajo, porque no es mucho lo que se pueda desordenar un sistema de dos partículas habiendo
tres microestados para ello.

La situación empieza a cambiar de modo radical en una situación como la siguiente:


En este caso tenemos nueve partículas, pero hay 8² = 64 microestados disponibles. Y hay
muchisímas más maneras en las cuales las nueve partículas pueden ser acomodadas en esos 64
microestados. A continuación se muestra una de ellas:

Si recurrimos a un tablero de ajedrez para reproducir la situación mostrada arriba y empezamos


a contar las distintas maneras en las cuales podemos poner las nueve partículas en los 64
microestados disponibles, podemos darnos una idea de los números grandes con los cuales nos
tenemos que enfrentar al tratar de medir la entropía. En la fórmula de Boltzmann, estos
números grandes se ven reflejados en el factorial N!; esta es precisamente una de las
principales razones para la inclusión de la función del logaritmo natural en la fórmula de
Boltzmann, sirve para “amortiguar” los efectos del aumento exponencial de la cantidad W a
partir de la cual calculamos la entropía.
PROBLEMA: (a) ¿De cuantas maneras distintas se pueden colocar en dos cajas distintas dos
pelotas, una de color rojo y una de color azul? (b) ¿De cuantas maneras distintas se pueden
colocar en tres cajas dos pelotas, una de color rojo y una de color azul? (c) ¿Cuáles serán las
respuestas para (a) y (b) en caso de que todas las pelotas sean del mismo color?

(a) El número de maneras distintas en las que se pueden colocar dos pelotas diferentes en la
primera caja y ninguna en la otra es 1:

W1 = N! /(N1! · N2!) = 2! / (2! · 0!) = 1

Por otro lado, el número de maneras distintas en las que se pueden colocar dos pelotas
diferentes, una en la primera caja y la otra en la segunda caja, es:

W2 = N! /(N1! · N2!) = 2! / (1! · 1!) = 2

Y el número de maneras distintas en las que se pueden colocar dos pelotas diferentes en la
segunda caja y ninguna en la primera es 1:

W3 = N! /(N1! · N2!) = 2! / (0! · 2!) = 1

Entonces el número total de maneras distintas en las que se pueden colocar dos pelotas
diferentes en las dos cajas es:

W = Σ W i = W 1 + W2 + W 3 = 1 + 2 + 1 = 4

(b) Procediendo en una forma parecida a la anterior:

W = Σ W i = Σ N! /(N1! · N2! · N3!)

W = 2! /(1! · 1! · 0!) + 2! /(0! · 1! · 1!) + 2! /(1! · 0! · 1!)

+ 2! /(2! · 0! · 0!) + 2! /(0! · 2! · 0!) + 2! /(0! · 0! · 2!)

W = 2 + 2 + 2 + 1 + 1 +1

W=9
(c) 3 (una pelota en cada caja, las dos pelotas en la primera caja, y las dos pelotas en la segunda
caja) y 6 (las dos pelotas en la primera caja, las dos pelotas en la segunda caja, las dos pelotas en
la tercera caja, una pelota en la primera caja y la otra en la segunda, una pelota en la segunda
caja y la otra en la tercera, una pelota en la primera caja y una pelota en la tercera caja).

PROBLEMA: (a) ¿De cuantas maneras distintas se pueden colocar en dos cajas distintas
cuatro pelotas, de color rojo, de color verde, de color azul y de color blanco? (c) ¿Cuál será la
respuesta en caso de que todas las pelotas sean del mismo color?

(a) Procedemos del mismo modo que en el problema anterior:

W1 = 4! /(2! · 2!) = 6

W2 = 4! /(1! · 3!) = 4

W3 = 4! /(3! · 1!) = 4

W4 = 4! /(0! · 4!) = 1

W5 = 4! /(4! · 0!) = 1

W = Σ Wi = 6 + 4 + 4 + 1 + 1

W = 16

(b) 5 maneras distintas (las cuatro pelotas en la primera caja, las cuatro pelotas en la segunda
caja, una pelota en la primera caja y tres pelotas en la segunda caja, tres pelotas en la primera
caja y una pelota en la segunda caja, dos pelotas en la primera caja y dos pelotas en la segunda
caja).

PROBLEMA: ¿De cuántas maneras diferentes se pueden repartir tres niveles de energía
entre tres partículas a, b y c, sujeto a la restricción de que la suma total de la energía de las
tres partículas sea igual a tres unidades de energía?
El acomodo de las tres partículas en los tres niveles de energía se puede llevar a cabo de las
siguientes maneras posibles:

En el primer recuadro superior, tenemos las partículas (identificadas de color rojo, verde y
ciano) repartidas de modo tal que todas las partículas poseen distintos niveles de energía, no
hay dos partículas con el mismo nivel de energía, y para este caso:

W1 = 3! /(1! · 1! · 1!) = 6

En el recuadro intermedio, tenemos las partículas repartidas de modo tal que dos de ellas
ocupan el mismo nivel de energía:

W2 = 3! /(2! · 0! · 1!) = 3

Y en el tercer recuadro, tenemos las partículas repartidas de modo tal que todas ellas ocupan el
mismo nivel de energía, y como puede verse, sólo existe una posibilidad:

W3 = 3! /(0! · 3! · 0!) = 1

En todas las combinaciones mostradas, la suma de los niveles energéticos de las tres partículas
es igual a tres unidades de energía.

De este modo:
W = Σ W i = W 1 + W2 + W 3 = 6 + 3 + 1

W = 10

De este modo, tenemos diez microestados porque hay diez maneras distintas de repartir las
partículas entre los tres niveles energéticos posibles.

Antes de dejar este problema, vale la pena observar que si en las diez figuras contamos primero
todas las partículas que están en el nivel cero (12 en total), y tras esto contamos todas las
partículas que están en el nivel uno (9 en total), y tras esto contamos todas las partículas que
están en el nivel 2 (6 en total) y tras esto contamos todas las partículas que están en el nivel 3 (3
en total), podemos definir algo que se llama el número de ocupación promedio Ni para cada
nivel, obtenido de dividir el número de partículas en cierto nivel entre la cantidad total de
microestados (que es 10 en este caso). Para este problema tenemos cuatro números de
ocupación promedio:

N0 = 12/10 = 1.2

N1 = 9/10 = 0.9

N2 = 6/10 = 0.6

N3 = 3/10 = 0.3

Obsérvese que si sumamos los números de ocupación promedio, obtenemos el número total de
partículas del sistema:

N = 1.2 + 0.9 + 0.6 + 0.3

N=3

Obsérvese también algo importante: la distribución de números de ocupación va cayendo


exponencialmente. La probabilidad de encontrar partículas con cierto nivel de energía se va
desplomando rápidamente conforme aumenta el nivel de la energía, y se puede demostrar con
argumentos puramente combinatóricos (matemáticos) que para sistemas con un gran número
de partículas esta probabilidad va disminuyendo exponencialmente siguiendo una caída del tipo
e-n. Esta es precisamente la distribución de Boltzmann, porque Boltzmann fue el primero
en descubrir este hecho. Para casos sencillos como este, la distribución de Boltzmann para los
números de ocupación está dada por la fórmula:

En el problema que estamos manejando con tres partículas repartidas en tres niveles de energía,
la evaluación del denominador usando números nos dá:

Q = 1.00000 + 0.36788 + 0.13534 + 0.04979

Q = 1.553

con lo cual:

N0 = (e0/Q) N = (1/1.553) 3 = 1.932

N1 = (e-1/Q) N = (0.36788/1.553) 3 = 0.711

N2 = (e-2/Q) N = (0.13534/1.553) 3 = 0.261

N3 = (e-3/Q) N = (0.04979/1.553) 3 = 0.96

En prácticamente todas las sumatorias manejadas previamente en otras entradas, se ha usado


indistintamente para el número inicial de la sumatoria ya sea cero (i = 0) o uno (i = 1), por
ejemplo en la representación de los sub-índices de las coordenadas, porque el uso es meramente
simbólico. Sin embargo, y en este caso muy especial y muy peculiar tratándose de la distribución
de Boltzmann, la sumatoria tiene que partir forzosamente con un número inicial de cero, ya que
su uso no es meramente simbólico sino que interviene en la exactitud de los resultados
numéricos obtenidos.

Comparando los resultados (estadísticamente aproximados) obtenidos para los números de


ocupación promedio con la distribución de Boltzmann y los resultados exactos obtenidos arriba,
podemos quedarnos con la impresión de que la aproximación dada por la distribución de
Boltzmann no es muy buena. Pero conforme aumenta el número de átomos (y con ello la
cantidad de microestados posibles) la distribución de Boltzmann se va asentando firmemente
por la acción estadística de la ley de los grandes números (la misma que nos dice que tras
arrojar una moneda al aire varias miles de veces, la mitad de las veces en promedio la moneda
habrá caído cara y la otra mitad habrá caído cruz, a menos de que la moneda esté cargada). A la
cantidad Q que tenemos arriba se le ha dado en llamar función de partición, un nombre
intimidante que desafortunadamente esconde la sencillez de la idea detrás de dicha cantidad.

PROBLEMA: De acuerdo con la distribución de Boltzmann, ¿cuáles son los números de


ocupación Ni para un sistema con cinco partículas y cinco niveles posibles de energía?

Calculamos primero el denominador para la distribución de Boltzmann, o sea la función de


partición Q:

Q = e0 + e-1 + e-2 + e-3 + e-4 + e-5

Q = 1.00000 + 0.36788 + 0.13534 + 0.04979 + 0.018316 + 0.00674

Q = 1.578

Los números de ocupación para este sistema, según la distribución de Boltzmann, son:

N0 = (e0/Q) N = (1/1.578) 5 = 1.932

N1 = (e-1/Q) N = (0.36788/1.578) 5 = 0.711


N2 = (e-2/Q) N = (0.13534/1.578) 5 = 0.261

N3 = (e-3/Q) N = (0.04979/1.578) 5 = 0.96

N4 = (e-4/Q) N = (0.018316/1.578) 5 = 0.96

N5 = (e-5/Q) N = (0.00674/1.578) 5 = 0.96

La caída exponencial en los números de ocupación promedio es la razón por la cual al ir


escalando una montaña el aire se va enrareciendo rápidamente hasta llegar a la atmósfera
superior en donde casi no hay moléculas de aire, una consecuencia de la distribución de
Boltzmann.

Dicho sea de paso, aunque hemos estado manejando aquí niveles discretos de energía, esto fue
por mera conveniencia matemática en el manejo de funciones de probabilidad discretas que no
involucra suposición alguna de que la energía esté discretizada, y la sub-división que hay entre
la separación de los niveles de energía se puede ir disminuyendo hasta hacerla prácticamente
cero formando así un espectro casi continuo de niveles de energía. El descubrimiento teórico de
que la energía está discretizada correspondió poco después no a Boltzmann, sino a Max Planck.
La constante de Boltzmann k introduce la estadística en el estudio del comportamiento de
sistemas con un gran número de partículas sin que ello implique la discretización de la energía,
mientras que la constante de Planck h introduce la discretización en los niveles de energía que
puede tomar cualquier tipo de partícula.

Con la definición matemática de la entropía S de un sistema en nuestras manos, podemos


definir cuantitativamente a la segunda ley de la termodinámica del modo siguiente: “Con el
paso del tiempo, la entropía de un sistema cerrado sólo puede aumentar, nunca
disminuír”:

Esta afirmación, llevada al extremo, puede ser enunciada de la siguiente manera: “Con el paso
del tiempo, la entropía del Universo sólo puede aumentar, nunca disminuír”.

¿Y qué tiene que ver la termodinámica con los agujeros negros?, se podrían preguntar muchos a
estas alturas. Resulta que en la física de los agujeros negros también tenemos un enunciado muy
parecido a la definición que se ha dado arriba de la segunda ley de la termodinámica, como
resultado del teorema del área que nos dice que el área de la superficie del horizonte de
evento de un agujero negro sólo puede aumentar, nunca disminuír:

Pero para poder reforzar nuestras sospechas sobre el enorme parecido que hay entre ambos
enunciados, es necesario generalizar el teorema del área de la siguiente manera: “El área de la
superficie de todos los horizontes de evento de todos los agujeros negros que hay
en el Universo sólo puede aumentar, nunca disminuír”.

Filosóficamente, no debe haber problema alguno en llevar a cabo esta generalización que hemos
llevado a cabo, ya que si es cierta individualmente para cada agujero negro que hay en el
Universo, entonces debe ser cierta para todos los agujeros negros que hay en el Universo. Puesto
que la naturaleza de las leyes que rigen a la física de los agujeros negros (leyes capaces de ser
demostradas como teoremas dentro del marco de la Relatividad General) es fundamentalmente
diferente de la naturaleza de las leyes que rigen a la termodinámica (leyes basadas en la
posibilidad de poder tomar un promedio estadístico sobre un gran número de partículas), se
creía que esta coincidencia entre ambas era el resultado de alguna coincidencia o el producto de
alguna curiosidad matemática común a ambas.

El teorema del área es un resultado obtenido estrictamente dentro del marco de la Relatividad
General, y es un resultado perfectamente válido dentro de la misma. Sin embargo, cuando
metemos a la Mecánica Cuántica dentro del panorama, se nos viene un problema encima con el
teorema del área, porque de acuerdo a la Mecánica Cuántica los agujeros negros no son eternos
sino que se van evaporando, muy lentamente pero de cualquier forma se van desgastando con
una emisión de partículas que tiene todas las características de una radiación térmica clásica, lo
cual llega a costa de irle disminuyendo al agujero negro su masa (por cada partícula del par
virtual que escapa hacia el Universo con una energía positiva, cae al interior del agujero negro
una partícula con energía negativaque disminuye el contenido masa-energía del agujero negro)
y con ello el área de la superficie de su horizonte de evento. La Mecánica Cuántica,
esencialmente, destruye el teorema del área que es un resultado perfectamente válido dentro de
la Relatividad General. Lo irónico es que el descubrimiento del teorema del área dentro del
ámbito de la Relatividad General fue obra de Stephen Hawking, el mismo que arrojó a dicho
teorema en serios aprietos al descubrir el efecto de la evaporación de los agujeros negros.

Sin embargo, y a la postre, la entrada en el escenario de la Mecánica Cuántica y la demostración


de la evaporación “térmica” de los agujeros negros a causa de la creación de pares de partículas
virtuales permitió la materialización de una nueva segunda ley de la termodinámica que
reemplaza a la definición “clásica”, una segunda ley generalizada de la termodinámica de la
cual trataremos en esta entrada.

Ya vimos con anterioridad en otra entrada que la temperatura de un agujero negro está dada por
la relación:

El que un agujero negro radiante tenga un espectro térmico y una temperatura diferente de cero
sugiere una conexión con la termodinámica que incluye la cuestión de la entropía. Considérese
el área superficial esférica de un agujero negro con radio de Schwarzschild r s = 2GM/c². En el
límite r → rs y estando dada el área de una esfera por la fórmula A = 4πr², tenemos entonces lo
siguiente para un agujero negro:

A = 4πrs²

A = 4π(2GM/c²)²

A = 16πG²M²/c4

Tomando infinitesimales:

dA = (32πG²/c4) M dM
o bien:

dM = (c4/32πG²M) dA

De la equivalencia relativista entre la masa y la energía tenemos lo siguiente:


E = Mc²

dE = c² dM

dE = c² [(c4/32πG²M) dA] = (c6/32πG²M) dA

Recurrimos ahora a un resultado clásico de la termodinámica que conecta a la energía E de un


sistema con su entropía S, válido cuando no hay términos que expresen un trabajo físico que se
esté llevando a cabo (la derivación no es difícil, pero no se repetirá aquí porque se puede
encontrar en cualquier texto de termodinámica):

dE = T dS

Reemplazando en esta relación las igualdades para dE y la temperatura dadas arriba:

(c6/32πG²M) dA = [hc3/16π²kGM] dS

(c3/2G) dA = [h/πk] dS

[h/πk] dS= (c3/2G) dA

dS = (πkc3/2Gh) dA

Integrando esta expresión, es así como llegamos a la fórmula para la entropía S de un agujero
negro:

En algunos textos se acostumbra utilizar la constante reducida de Planck para escribir la misma
fórmula del modo siguiente:

Si hay agujeros negros en el Universo, entonces la ley de la entropía no puede ser sostenida en la
forma en la cual ha sido dada, porque la materia puede caer en un agujero negro desapareciendo
toda la información que llevaba consigo en una singularidad en el espacio-tiempo, y cuando ello
ocurre la entropía total de la materia en el Universo disminuye, contraviniendo la segunda ley de
la termodinámica. De esto no hay duda alguna, ya que Brandon Carter, junto con Werner Israel
y Stephen Hawking, demostró que según la Relatividad General toda la información dentro de
los agujeros negros, excepto la masa M, la carga eléctrica Q y el momento angular J, se pierde y
desaparece; de aquí la frase “los agujeros negros no tienen pelo” (en alusión a los calvos). Por
otro lado, a causa de la evaporación cuántica de los agujeros negros, a causa de la emisión
térmica de partículas, se viola el teorema del área en virtud de que tanto la masa como el área
superficial del horizonte de evento disminuyen durante el proceso de evaporación en lugar de
aumentar. Esto se puede solventar definiendo una entropía generalizada S' de la siguiente
manera:

en donde S representa la entropía total de toda la materia-energía que hay en el Universo


entero afuera de los agujeros negros y A es el área total de todos los horizontes de evento
de todos los agujeros negros que hay en el Universo. De este modo, aunque S y A puedan
disminuír individualmente, esta última definición nos indica que S' nunca disminuye, ya que si
disminuímos S arrojando materia hacia un agujero negro, al hacer tal cosa aumentamos tanto el
área como la masa del agujero negro, de modo tal que S' no disminuye. Por otro lado, la
creación cuántica de partículas disminuye el área A, pero a costa de la emisión de un espectro
térmico de partículas, lo cual aumenta S, y nuevamente S' no disminuye. De este modo, ni la
segunda ley de la termodinámica ni el teorema del área para un agujero negro son
satisfechos individualmente, pero todo nos parece indicar que tenemos aquí una nueva ley de
física formulada por vez primera por Jacob Bekenstein en 1972, la segunda ley generalizada
de la termodinámica que nos dice que la entropía generalizada S' del Universo nunca
disminuye con el tiempo. Esta segunda ley generalizada es sorprendente en el hecho de que
logra juntar tres campos diferentes de la física, la termodinámica, la Relatividad General, y la
Mecánica Cuántica. De nueva cuenta, tenemos aquí lo que parece ser una extraordinaria
coincidencia. Pero, ¿se trata realmente de una coincidencia? ¿O existe alguna razón filosófica de
fondo detrás de todo esto cuyo significado aún no alcanzamos a comprender?

Jacob Bekenstein, el físico teórico que formuló la segunda ley generalizada de la termodinámica,
también ha estudiado a fondo la relación que tienen los agujeros negros y la entropía con
la teoría de la información. Basado en su trabajo previo sobre la termodinámica de los
agujeros negros, Bekenstein también demostró lo que hoy se conoce como el acotamiento
Bekenstein (Bekenstein bound), de acuerdo con el cual existe un límite máximo a la cantidad de
información que puede ser potencialmente almacenada en cierto volumen, y que este límite
máximo es proporcional al área que acota a este volumen y no al volumen en sí. En la teoría de
la información, la base de todo tipo de información se sustenta a su nivel más elemental en el
sistema binario de unos y ceros, el mismo sistema en el cual se basa en funcionamiento de todas
las computadoras digitales de la Tierra. No es inusual que para transmitir la idea de lo que es el
acotamiento Bekenstein se nos presente una superficie teselada con “bits” digitales de ceros y
unos tal y como lo sugirió Bekenstein:

Imaginemos por un momento que la superficie sobre la cual grabamos nuestra información es el
horizonte de evento de un agujero negro. Ciertamente la cantidad máxima de información que
podamos poner sobre dicho cuerpo no podrá ir más adentro de la superficie (en lo que es el
volumen de la esfera en sí), porque cualquier información que vaya adentro del horizonte de
evento es una información esencialmente perdida para siempre que no podremos recuperar. Lo
único que podemos hacer es reducir el tamaño de los “cuadritos” en donde escribimos nuestros
“bits”, para así poder aumentar la cantidad de información que podemos apilar sobre la
superficie de la esfera. Pero resulta que también hay un límite a qué tan pequeña podamos hacer
el área para cada “bit”. Aún suponiendo que de alguna manera podamos irnos hasta niveles sub-
atómicos, existe una distancia conocida como la longitud de Planck, igual a 1.616·10−35 metros,
por debajo de la cual se espera que el espacio deja de tener una geometría clásica, siendo una
medida que no puede ser tratada adecuadamente en los modelos de física actuales debido a la
aparición de efectos de gravedad cuántica.

El límite descubierto por Bekenstein es un descubrimiento fundamental, porque se trata de un


límite natural para el almacenamiento de información que no puede ser rebasado.

¿Y qué de la información que va al interior de un agujero negro?

Supongamos que tenemos un dispositivo de memoria masivo como el disco duro de una
computadora repleto de información o inclusive una enciclopedia impresa como aquellas que
hoy sólo se pueden encontrar en los anaqueles de las bibliotecas que aún conservan estas
reliquias. Si arrojamos el disco duro o la enciclopedia hacia un agujero negro, una vez que dicha
información ha cruzado hacia el interior del horizonte de evento la información ya no puede ser
recuperada porque ni siquiera la luz, la portadora primaria de información, puede escapar del
horizonte de evento. Sin embargo, la información sigue allí mientras va cayendo en camino
hacia la singularidad situada en el centro del agujero negro, y en principio si damos marcha
atrás a la flecha del tiempo podemos ir reconstruyendo los eventos previos al ingreso de dicha
información al horizonte de evento. Puesto de otra manera, todo presente tuvo que haber tenido
un pasado. No hay nada que esté ocurriendo hoy que no haya existido “ayer”. En la Mecánica
Cuántica, esto es lo que se conoce como el principio de reversibilidad: la física debe ser
capaz de rastrear el resultado final de cualquier proceso, incluído el proceso que condujo a la
formación de un agujero negro, a las condiciones que condujeron a dicho proceso.

Sin embargo, hay una situación preocupante que se nos viene encima cuando la información
termina cayendo directamente en la singularidad de un agujero negro. La información se
destruye totalmente a grado tal que no queda absolutamente nada que podamos
rastrear a las condiciones que condujeron a la pérdida de dicha información. El
dilema del asunto radica en la aserción que se ha venido haciendo de que la singularidad de un
agujero negro es un punto en el cual todo es compactado hasta el infinito, incluído el espacio-
tiempo. ¿Cómo vamos a poder rastrear hacia atrás en el tiempo algo de un punto en el que cual
el mismo tiempo como nosotros lo concebimos ha dejado de existir? Al esfumarse la masa-
energía y el espacio-tiempo en un coctel en el que se compacta todo junto hasta el infinito, no es
posible intentar recorrer la ruta inversa dándole marcha atrás al reloj como podríamos hacerlo
con una película grabada en un videodisco, porque no hay reloj que funcione en un lugar en
donde el tiempo ha dejado de existir como tal. No podemos regresar una película a una escena
previa cuando no sólo ya no existe la película sino inclusive ya ni siquiera existe el equipo para
reproducirla. El problema con la aplicación de la teoría clásica es que podemos utilizar cualquier
combinación de partículas para “construír” un agujero negro (protones, electrones, estrellas,
planetas, lo que sea) sin que ello ocasione diferencia alguna en el resultado final. Hay billones y
billones de maneras distintas con las cuales se puede hacer un agujero negro, pero bajo el
modelo clásico el resultado final es siempre el mismo. Y si todos los agujeros negros son iguales
(en el sentido de que al desaparecer totalmente todo rastro de información dentro de ellos
entonces no es posible diferenciar cada uno de ellos rastreándolo hacia un origen único e
individual), cualquier información acerca de las partículas atómicas y sub-atómicas que los
formaron está irremediablemente perdida para siempre una vez que se forma el agujero negro.
Este tipo de uniformidad es precisamente lo que viola la ley mecánico-cuántica de
reversibilidad, ya que debería ser posible rastrear el producto final de cualquier proceso,
incluyendo el proceso que dá origen a la formación de un agujero negro, a las condiciones que lo
crearon.

Esta situación preocupante fue reconocida de inmediato por los teóricos que enfocaron sus
investigaciones hacia la pérdida de información que tiene lugar en la singularidad de un agujero
negro, los cuales no tardaron mucho tiempo en calificarla con un nombre: la paradoja de la
información del agujero negro (black hole information paradox). La paradoja radica en el
hecho de que la Mecánica Cuántica, por sí sola, nos garantiza la recuperación de la información
a partir de un estado inicial que ha ido evolucionando, mientras que la Relatividad General, por
sí sola, nos garantiza que en la singularidad de un agujero negro la información se ha perdido
irremediablemente en forma tal que ni siquiera la Mecánica Cuántica puede obrar algún milagro
para poder recuperar aunque sea una minúscula parte de la información. Puesto de otra
manera, la desaparición de información física en la singularidad de un agujero negro permite
que varios estados físicos evolucionen hacia un mismo estado único, lo cual viola la suposición
más básica de la ciencia de que en principio la información completa acerca de un sistema físico
en un momento dado de tiempo determina por completo su estado en cualquier otro tiempo
posterior.

La paradoja de la información de los agujeros negros fue una de las cosas que dieron pie para
que a finales de la década de los noventas Abhas Mitra, un astrofísico hindú asociado a la
División de Física Teórica del Bhabha Atomic Research Centre en Bombay (hoy Mumbai),
desafiara la creencia convencional aceptada acerca de la existencia de los agujeros negros con
una singularidad física en su interior, afirmando con un papel que fue publicado en diciembre
de 2000 en la revista Foundation of Physics Letters que un agujero absoluto no podía existir si
nos adheríamos rigurosamente a la Teoría General de la Relatividad, llegando a la conclusión de
que las estrellas candidatas a terminar convirtiéndose en agujeros negros debían tener campos
magnéticos intensos y por lo tanto no podían terminar como agujeros negros incapaces de
poseer campo magnético alguno. Para describir mejor la idea que estaba tratando de comunicar,
Mitra acuñó en 1998 la frase Magnetospheric Eternally Collapsing Object (MECO), que
podemos traducir como simplemente como “objeto eternamente colapsante”. Esta es otra
proposición revolucionaria, porque de ser cierta ello implicaría que no existe singularidad
alguna en el interior de los agujeros negros que están en proceso de formación. Y de hecho, ni
siquiera existe físicamente el horizonte de evento, ello sería tan sólo la consecuencia de una
curiosidad matemática que resulta de la solución de Schwarzschild. En vez de tener una estrella
que bajo la acción de una gravedad intensa implota formando primero un horizonte de evento e
inmediatamente tras esto una singularidad en su interior, lo que tendríamos sería una estrella
en camino perpetuo de convertirse en un agujero negro sin llegar a serlo jamás. El proceso
del colapso gravitacional de una estrella en lugar de ser un evento que concluye en una
cantidad finita de tiempo sería un proceso que nunca terminaría de concluír; la estrella se
estaría colapasando hacia su interior a perpetuidad arrastrando en su camino todo el espacio-
tiempo con el que se está colapsando sin que este se llegue a “comprimir” junto con la masa-
energía de la estrella hacia un punto singular. El núcleo de la demostración presentada por
Abhas Mitra radica en el argumento de que para que un agujero negro se pueda formar, la
materia colapsante debe viajar a una velocidad mayor que la velocidad de la luz con respecto a
un observador fijo, lo cual no es posible. Aunque la tesis propuesta por Abhas Mitra no tardó en
ser cuestionada y calificada como errónea por teóricos relativistas de prestigio como Chris
Hillmann quien ha caracterizado el trabajo de Abhas Mitra como “totalmente errado” a causa de
malentendidos de la Relatividad General, además de ir en contra de la visión convencional de
los agujeros negros defendida por científicos de enorme talla como Stephen Hawking, cuatro
años después de que Abhas Mitra diera a conocer sus conclusiones y 30 años después de haber
formalizado la existencia de los agujeros negros, el mismo Stephen Hawking dió un vuelco
considerado tan espectacular como sus descubrimientos acerca de la evaporación de los
agujeros negros, afirmando en julio de 2004 (aunque utilizando argumentos teóricos diferentes
a los de Mitra) que los agujeros negros no existen en un sentido factual sino que las estrellas en
vías del colapso gravitacional hacia un agujero negro continúan emitiendo radiación térmica y
“evaporándose” por un largo período de tiempo.

El objeto eternamente colapsante de Abhas Mitra es uno que en realidad no difiere del concepto
tradicional de un agujero negro en el hecho de haber sido una estrella que continuamente se
encoge en un espacio cada vez más pequeño, pero que en el caso del objeto descrito por Abhas
Mitra nunca llega a ser un agujero negro, y eventualmente el encogimiento de la estrella se frena
hasta ser casi imperceptible para nosotros aunque continúa encogiéndose tan lentamente que
podría sostenerse a lo largo de varias veces la vida del universo, encerrándose a sí misma en un
espacio cada vez menor por toda la eternidad sin alcanzar jamás el tamaño infinitamente
pequeño de la singularidad de un agujero negro. A diferencia de un agujero negro, un MECO
tiene un tamaño definido. El MECO esencialmente es una densa bola de plasma que genera
continuamente campos magnéticos por medio de corrientes superficiales, lo que explica su
magnetismo. Más aún, los objetos “chupados” pueden, teóricamente, salir nuevamente, aunque
con extrema dificultad. Y esto es importante porque esencialmente proporciona una ruta para
comenzar a resolver la paradoja de la información de los agujeros negros.

La comprobación de la hipótesis de Abhas Mitra, aunque aún no es aceptada por la mayoría de


la comunidad científica, ha ganado la aceptación de investigadores de la talla del Doctor Darryl
J. Leiter y el Doctor Stanley L. Robertson, y continúa ganando simpatizantes que están
buscando ya la manera de poner a prueba dicha hipótesis. Uno de ellos es Rudy Schild del
Centro Harvard-Smithsoniano de Astrofísica en Cambridge, Massachusetts, trabajando
conjuntamente con sus colegas el Doctor Leiter y el Doctor Robertson, los cuales han estado
escudriñando un objeto de un tipo extremadamente luminoso conocido como cuásar. Los
cuásares, según concuerda la mayoría de los astrónomos, son los centros de galaxias muy
lejanas. Tradicionalmente, los astrónomos describen al corazón de un cuásar como un disco de
gas que cae en espiral hacia un agujero negro súper-masivo, que se alimenta de él. La
luminosidad proviene del gas, que se calienta a medida que corre hacia dentro. Una parte de él
sale disparada en dos chorros que se dirigen en direcciones opuestas conocidas como jetso
“chorros”. Los cuásares aparecen únicamente en los más lejanos confines del universo conocido.
Los astrónomos razonan que esto es así porque existieron solamente en el más lejano pasado.
Las áreas más lejanas son aquellas en que vemos al cosmos tal como era hace mucho tiempo,
porque la luz se tarda mucho en llegar desde esos lugares hasta nosotros. El grupo de Schild ha
enfocado sus esfuerzos en el estudio de un cuásar designado como Q0957+561, que se encuentra
a unos 9 mil millones de años luz de distancia en la constelación de la Osa Mayor. El cuásar
contiene un objeto central compacto con una masa equivalente a unos 3 o 4 mil millones de
Soles. La mayoría de los científicos cree que es un agujero negro, pero Schild dice que sus
hallazgos sugieren otra cosa: sorprendentemente, es magnético, a diferencia de un agujero
negro, tal y como lo predicen las conclusiones teóricas de Abhas Mitra. Los investigadores
escogieron a Q0957+561 porque está asociado con una lente gravitacional (ó lente cósmica). Las
estrellas y los planetas que están dentro de la galaxia también afectan la luz del cuásar, un
fenómeno relacionado al que se conoce como “micro-lente gravitatoria”, con lo cual es posible
discernir más detalles de este así llamado “agujero negro” que se encuentra a dos tercios de
distancia del borde del universo observable, que del agujero negro que se encuentra en el centro
de la Vía Láctea", nuestra galaxia. El equipo ha estado monitoreando la luminosidad del cuásar a
lo largo de 20 años, junto a un consorcio internacional de observadores en 14 telescopios, y ha
estudiado el núcleo del cuásar, definiendo un lugar propuesto donde se forman los chorros, algo
que 60 años de investigación pasada no han podido explicar. El equipo calculó que los chorros
provienen de dos regiones que son ambas unas 25 veces más grandes que la distancia entre el
Sol y Plutón, las cuales se ubican directamente sobre los polos del objeto central compacto, a
unas 200 veces la distancia Sol-Plutón. Únicamente se cuenta con un escenario propuesto capaz
de explicar fácilmente estas ubicaciones, de acuerdo a las conclusiones a las que ha llegado el
grupo de investigadores encabezado por Schild: el objeto central es magnético, e interactúa con
el disco a través del campo magnético que lo rodea. A medida que gira, el campo se enrolla.
Eventualmente, se arrolla tanto que se "rompe" explosivamente antes de re-formarse a sí mismo
en una configuración más relajada. Estas roturas liberan energía que impulsa a los chorros. Pero
un agujero negro en un disco de acreción no puede tener su propio campo magnético, agregan
los investigadores. Normalmente, esto es así porque un objeto en rotación puede ser magnético
únicamente si lleva una carga eléctrica, de acuerdo con la teoría Maxwelliana del
electromagnetismo. Un agujero negro no puede sostener una carga así, porque cualquier agujero
negro con carga eléctrica absorbería inmediatamente suficiente material cargado opuestamente
como para cancelar su propia carga. El problema desaparece, sostienen Schild y sus colegas, con
el nuevo tipo de objeto compacto propuesto por Abhas Mitra, el “Magnetospheric Eternally
Collapsing Object”. Estas conclusiones basadas en los estudios llevados a cabo por Schild y sus
colegas aparecen publicadas en arXiv en el documento “Observations Supporting the Existence
of an Intrinsic Magnetic Moment Inside the Central Compact Object Within the Quasar
Q0957+561”, publicado también en el número de julio de 2006 de la revista The Astronomical
Journal.

No será fácil que la teoría MECO gane una amplia aceptación entre los científicos, según dicen
los astrónomos, dado que los agujeros negros han sido el escenario aceptado desde Einstein.
Pero la propuesta hecha por Abhas Mitra proporciona una ruta de escape de la paradoja de la
información de los agujeros negros, a grado tal que el mismo Stephen Hawking ha puesto en
duda ya la visión convencional que había sostenido a lo largo de toda su vida acerca de los
agujeros negros. (El nuevo tipo de agujero negro propuesto por Hawking ya no es algo capaz de
engullir totalmente cualquier cosa; en lugar de esto se mantiene emitiendo radiación durante un
periodo prolongado de tiempo para finalmente descubrirse y revelar información
interior. Irónicamente los resultados obtenidos por el mismo Hawking le hicieron perder una
apuesta sobre un par de enciclopedias que él mismo hizo en 1997 junto al físico teórico Kip
Thorne, del California Institute of Technology en Pasadena, contra John Preskill, tambien del
Caltech. Ambos defendían que la información que absorbe un agujero negro desaparece para
nunca jamás ser revelada, un punto de vista sobre el cual Hawking terminó dando un giro
espectacular de 180 grados. Sin embargo, dada la complejidad de las matemáticas involucradas
para llegar a tales conclusiones, no falta quienes sospechen que las nuevas conclusiones de
Hawking son más bien el resultado de una manipulación matemática magistral de argumentos
sofisticados consecuencia del deseo de resolver una de las paradojas más duras de la Relatividad
General de la cual entre otras cosas depende la existencia o inexistencia factual de los mismos
agujeros negros.)

Además de las rutas de escape proporcionadas por Abhas Mitra y Stephen Hawking para la
resolución de la paradoja de la información del agujero negro a costa de destronar al mismo
agujero negro como materia prima para las novelas de ciencia-ficción, han ido surgiendo con el
paso del tiempo otras teorías alternas que también proponen una resolución a dicha paradoja.
Una de ellas está basada en la “teoría de las supercuerdas” (string theory) que propone que
todas las partículas del Universo están formadas por pequeñas cuerdas vibrantes. En el año
2000, los teóricos de las supercuerdas identificaron a la paradoja de la información de los
agujeros negros como la octava prioridad en su lista de los diez problemas físicos más
importantes a ser resueltos en el tercer milenio (esa lista incluye preguntas tales como “¿cuál es
la vida de un protón?” y “¿cómo puede la gravedad cuántica explicar el origen del Universo?”).
Físicos de la Ohio State University encabezados por Samir Mathur han derivado un conjunto
extenso de ecuaciones que sugiere que la información aparentemente perdida en el interior de
un agujero negro continúa existiendo, apilada en un enorme montón de cuerditas que llena a un
agujero negro desde su núcleo hasta su horizonte de evento. Los resultados obtenidos por ellos
sugieren que los agujeros negros no son entidades suaves sin rasgos prominentes sino bolas
borrosas bautizadas como fuzzballs. Mathur comenzó trabajando sobre la paradoja de la
información con el investigador post-doctoral Oleg Lunin calculando la estructura de objetos
situados entre estados simples de supercuerdas y agujeros negros clásicos grandes. En lugar de
ser objetos pequeños, resultaron ser objetos grandes, y trabajando tiempo después con los
estudiantes de Doctorado Ashish Saxena y Yogesh Srivastava, encontraron que emergía la
misma imagen de un “fuzzball” para objetos que se asemejan más cercanamente a un agujero
negro clásico. Como resultado de estas investigaciones, Mathur propuso a través de dos papeles
publicados en el añ0 2000 que los agujeros negros son en realidad esferas de supercuerdas con
un volumen definido en lugar de ser el punto de dimensión cero y volumen cero en el cual está
concentrada toda la masa del agujero negro. La teoría de los “fuzzballs” avanzada por Mathur y
Lunin satisfacen la ley de reversibilidad (y con ello resolviendo la paradoja de la información de
los agujeros negros) porque la naturaleza cuántica de todas las cuerdas que caen dentro un
fuzzball-agujero negro es preservada conforme van cayendo cuerdas contribuyendo al
crecimiento del objeto; no hay información cuántica que sea compactada hasta el infinito
saliendo fuera de nuestro Universo. Más aún, este aspecto de la teoría es verificable puesto que
la tesis central afirma los datos cuánticos del fuzzball-agujero negro no permanecen atrapados
para siempre en el centro del mismo sino que eventualmente encuentran su camino hacia la
superficie borrosa del objeto en donde eventualmente la radiación de Hawking se convierte en
portadora de esta información codificada en las correlaciones delicadas que existen entre las
partículas virtuales que están escapando hacia el exterior.

Tan pequeñas como son las supercuerdas, Mathur cree que de cualquier modo estas pueden
formar agujeros negros grandes a través de un fenómeno llamado tensión fraccional. Las
cuerdas son estirables, aunque el estiramiento necesariamente lleva cierta cantidad de tensión
del mismo modo que como ocurre con la cuerda de una guitarra. Con la tensión fraccional, la
tensión va aumentando conforme va aumentando la longitud de la cuerda al ser estirada. Así
como resulta más fácil estirar una cuerda larga de guitarra que una cuerda corta, es más fácil
estirar una larga trenza de supercuerdas mecánico-cuánticas que una supercuerda individual.
De este modo, cuando se juntan muchas supercuerdas del modo en que ocurriría cuando se
juntan las muchas partículas necesarias para formar un agujero negro muy masivo, la bola
combinada de cuerda se vuelve muy flexible y se expande a un diámetro grande. Cuando los
físicos de la Ohio State University obtuvieron su fórmula para el diámetro de un agujero negro
borroso formado por supercuerdas, encontraron que el diámetro coincidía con el diámetro del
horizonte de evento sugerido por el modelo clásico (la solución de Schwarzschild). Puesto que
Mathur conjetura que las supercuerdas pueden continuar existiendo en el interior de un agujero
negro sin ser compactadas, y la naturaleza de estas supercuerdas depende a su vez de las
partículas que conformaban la materia prima inicial con la que fue hecho el agujero negro,
entonces cada agujero negro es individual y único como lo son las estrellas, planetas, o galaxia
que lo formaron. Y del mismo modo, las supercuerdas que vayan entrando en el interior de un
agujero negro una vez que éste se ha formado también serían rastreables.

Como puede verse, no hay una sola manera posible con la cual se pueda resolver la paradoja de
la información de los agujeros negros. En lo que respecta a cuál de todas ellas será la explicación
correcta, esta tendrá que esperar a un tiempo posterior en el futuro, si es que la respuesta no
está más allá de los recursos experimentales que podamos desarrollar en el futuro.

Radiación gravitacional
De acuerdo con la teoría electromagnética clásica basada en las ecuaciones del campo
electromagnético de Maxwell, la aceleración de cualquier partícula que posea una carga eléctrica
producirá una radiación, ya sea que la aceleración se lleve a cabo con la partícula moviéndose en
línea recta aumentando su velocidad o que la aceleración se lleve a cabo con la partícula
manteniendo la magnitud de su velocidad constante pero cambiando continuamente la
dirección de su movimiento (lo cual equivale también a una aceleración, en este caso de carácter
vectorial). Podemos darnos una idea sobre cómo se produce esta radiación tomando una carga
eléctrica e impartiéndole una aceleración brusca a partir de un momento t = 0, quitándole poco
tiempo después la aceleración a la carga eléctrica.

Antes de imprimirle una aceleración a una carga eléctrica, podemos imaginarnos a las “líneas de
fuerza” que usualmente asociamos con el campo eléctrico de la carga como emanando
radialmente en forma simétrica del centro de la carga. Pero al imprimirle una aceleración brusca
a la carga, estas “líneas de fuerza” que se extienden geométricamente hasta el infinito no pueden
moverse a la par con la carga en virtud de que el “golpe aceleratorio” no puede ser transmitido
sobre dichas líneas a una velocidad mayor que la velocidad de la luz de acuerdo con la Teoría
Especial de la Relatividad. Tenemos entonces una “zona” en la cual la continuidad radial de las
“líneas de fuerza ” parece haber sido distorsionada:
Al habérsele quitado la aceleración a la carga, y cerca de la misma, las “líneas de fuerza” retoman
su aspecto simétrico radial dentro de lo que podríamos llamar una “zona de post-aceleración”, el
mismo aspecto que tenían antes de que la carga fuese acelerada, fijando la “radialidad” que será
emanada hacia afuera desde la carga en líneas rectas. Pero lejos de la carga, las líneas rectas del
campo eléctrico corresponden a las que emanaban de la carga antes de ser acelerada. Tenemos
entonces una zona que equivale a un “casco esférico” que irá creciendo radialmente hacia afuera
alejándose de la carga:

La zona que va creciendo, la “zona de radiación”, es precisamente la portadora de la radiación


electromagnética producida por la carga. Una carga eléctrica en reposo, e inclusive una carga
eléctrica moviéndose a velocidad constante, no produce radiación electromagnética alguna. Se
requiere impartirle una aceleración a la carga para que se pueda producir la radiación
electromagnética. Esta radiación electromagnética, de acuerdo con las ecuaciones de Maxwell,
es portadora de cierta cantidad de energía, la cual no sale de la nada sino que tiene que ser
suministrada en el proceso de aceleración de la carga, venciendo lo que pudiéramos llamar una
especie de “inercia eléctrica”, esto es, la oposición de la carga a ser acelerada. Y esta energía de
carácter electromagnético radiada hacia el exterior puede ser vista como una onda
electromagnética, o puede ser vista como un espectro continuo de paquetes de energía,
los fotones. Al acelerar una carga eléctrica, en efecto, se crean fotones.

Como ya se señaló, la radiación electromagnética emanada por una carga eléctrica acelerada se
puede obtener manteniendo a una carga a la misma velocidad pero cambiándole su dirección
continuamente. Este es precisamente el mecanismo mediante el cual se produce la radiación del
tipo conocida como Bremsstrahlung que significa “radiación de frenado”, producida cuando un
electrón (una carga eléctrica elemental negativa) pasa lo suficientemente cerca de un núcleo
atómico (el cual contiene protones, cargas eléctricas elementales positivas) que por el efecto de
la atracción eléctrica de cargas opuestas es desviado de su curso, emitiendo radiación
electromagnética:

El tercer tipo de radiación electromagnética a causa de una aceleración ocurre cuando una carga
eléctrica es frenada totalmente en su movimiento, lo cual equivale a una aceleración negativa,
pero aceleración al fin y al cabo. Este es precisamente el mecanismo que utilizamos para
producir los rayos-X en los hospitales, impactando electrones de alta energía (acelerados con
una fuente de alto voltaje) en contra de una superficie sólida:

Un aspecto interesante en la radiación electromagnética obtenida a partir de una carga eléctrica


acelerada es que no es posible determinar a partir de la misma si la carga eléctrica era una carga
positiva o negativa. Esta información se pierde por completo al emanarse la energía en forma de
fotones.

Podemos derivar a partir de las ecuaciones de Maxwell fórmulas específicas para la radiación
electromagnética obtenida a partir de un mecanismo de aceleración, esto se puede consultar en
cualquier buen texto de Electrodinámica Clásica (o inclusive en Internet).

La Relatividad General, estando basada e inspirada en la teoría del campo electromagnético de


Maxwell, postulando también un campo gravitacional, nos lleva a sospechar de inmediato en la
posibilidad de que una masa que sea acelerada pueda ser capaz de producir un efecto similar al
que produce una carga eléctrica. Y así es, en efecto. A partir de sus ecuaciones para el campo
gravitacional, en un trabajo publicado en 1918 en el cual utilizó lo que podemos
llama relatividad general linearizada, Einstein demostró que cuando una masa es acelerada
dicha masa tiene que dar origen a campos de gravedad que varían con el tiempo, alejándose de
la masa a la velocidad de la luz como ondulaciones en el espacio-tiempo. Así como un objeto
cargado eléctricamente genera ondas electromagnéticas en proporción a su carga y aceleración,
del mismo modo se puede esperar que una masa en movimiento genere rizos
gravitacionales (distorsiones geométricas en el entramado espacio-tiempo del Universo) en
proporción a su masa y aceleración como lo muestra la siguiente figura en la cual tenemos a una
masa acelerada que está atravesando una región de espacio-tiempo plano (Lorentziana):
Si una masa experimenta un cambio súbito, el rizo gravitacional resultante tomará la forma de
un pulso breve, como el que se produce cuando arrojamos una piedra a un estanque de agua
tranquilo. Pero si la masa está sujeta a un cambio periódico, repetitivo, los rizos gravitacionales
se sostendrán como la onda continua portadora de una señal de televisión. Tendremos entonces
lo que se conoce como ondas gravitacionales, o lo que es lo mismo, una radiación
gravitacional. De cualquier manera, la amplitud (o altura) de la onda gravitacional irá
disminuyendo conforme aumenta la distancia de la fuente. Un ejemplo de un caso en el cual
podríamos tener una onda gravitacional repetitiva sería el siguiente en el cual tenemos a un
planeta masivo en órbita en torno a otro planeta masivo:

En este caso, no se requiere llevar a cabo un análisis matemático detallado a partir de las
ecuaciones de campo de la Relatividad General para darse cuenta de que la frecuencia de la onda
gravitacional que está siendo emanada del sistema será la misma que la frecuencia de la órbita
del planeta en torno al cuerpo central. Aquí podemos hacer una observación importante. Si toda
onda de cualquier índole es portadora de información, portadora de energía, entonces esa
energía tiene que salir necesariamente de algún lado. En este caso, la onda gravitacional sólo
puede ser sostenida a expensas de una variación en la órbita del planeta que está
girando, cayendo poco a poco en espiral hacia el astro central. En pocas palabras, las órbitas
de los planetas en torno a una estrella no pueden ser eternas como lo supuso Newton. La
Luna está cayendo hacia la Tierra así como todos los planetas están cayendo hacia
el Sol. Afortunadamente, para nosotros, la cantidad de energía emanada a consecuencia de la
radiación gravitacional es astronómicamente insignificante. Mucho antes de que se pueda
detectar cambio alguno en las órbitas de los planetas del sistema solar, el Sol habrá dejado de
brillar por completo. Podemos obtener una estimación muy cruda del tiempo que le toma a un
sistema el perder su energía a causa de la radiación gravitacional con la siguiente fórmula
(consúltese la página 981 del libro Gravitation de Misner, Thorne y Wheeler):

en donde Torbita es el período orbital y Rs es el radio de Schwarzschild de la masa central.


Tomando para el Sol un radio de Schwarzschild R s igual a 3 kilómetros, en el caso de la Tierra
tenemos un cociente R/Rs aproximadamente 5·107, y obtenemos un tiempo t igual a 1020 años, o
sea:

100,000,000,000,000,000,000 años

por lo que la caída en espiral de la Tierra hacia el Sol o de la Luna hacia la Tierra a causa de la
radiación gravitacional no son cosas que nos deban causar mucha preocupación. Para que la
caída en espiral pueda ser detectable, se requiere de un sistema con un cuerpo o con un par de
cuerpos extraordinariamente masivos, como lo es el caso del sistema binario púlsar Hulse-
Taylor:
en donde se han detectado diferencias medibles que han confirmado la pérdida de energía
gravitacional a causa de la radiación hacia el espacio exterior de ondas gravitacionales. De
hecho, esta es considerada como la primera confirmación experimental, en base a mediciones
astronómicas, del fenómeno relativista de radiación gravitacional.

El punto usual de partida para el estudio teórico de la radiación gravitacional, la Relatividad


General linearizada, radica en un esquema de aproximación en el cual las contribuciones no-
lineares a la métrica del espacio-tiempo son ignoradas, lo cual simplifica el estudio de muchos
problemas. Esto se lleva a cabo considerando al tensor métrico gcomo la suma de una solución a
las ecuaciones de Einstein, casi por lo general la métrica del espacio-tiempo plano de Lorentz (o
de Minkowski, que es lo mismo) usualmente denotada como η, sumada a una perturbación al
campo usualmente denotada como h:

g=η+h

La perturbación h es manejada con los métodos usuales de la teoría de la perturbación, que


comprende métodos matemáticos que son utilizados para encontrar una solución aproximada a
un problema que no puede ser resuelto exactamente, comenzando con la solución exacta a un
problema parecido. En notación de componentes:

gμν = ημν + hμν


siendo hμν la desviación de la métrica g de la métrica del espacio-tiempo plano h. Puesto que
tanto la métrica g como la métrica η del espacio-tiempo plano son simétricas, la relación
anterior nos indica que la perturbación h también debe serlo.

Aunque el efecto es minúsculo, si la Relatividad General está en lo correcto entonces el Universo


entero debería estar bañado en ondas gravitacionales. Sin embargo, el mismo Einstein jamás las
tomó muy en serio, mirándolas como meros artefactos matemáticos, posibles en teoría pero
nunca lo suficientemente intensas como para poder tener consecuencias medibles, un punto de
vista compartido por muchos de sus contemporáneos como Sir Arthur Eddington que comentó
en términos derogatorios: “Las ondas gravitacionales se propagan a la velocidad del
pensamiento”.

Además de la confirmación que se pueda obtener por medios astronómicos acerca de la


existencia de radiación gravitacional, se han llevado y se siguen llevando a cabo experimentos en
laboratorios en la misma Tierra para poder detectar ondas gravitacionales que puedan ser
emanadas de eventos cósmicos catastróficos tales como la colisión de dos agujeros negros, de lo
cual tenemos como ejemplo la siguiente composición generada por una simulación de
computadora que nos muestra la colisión de dos agujeros negros así como las ondas de
choque que se espera que una colisión así produzca en la fábrica del espacio-tiempo del
Universo:

Uno de tales laboratorios en Tierra, el más relevante, consta de dos estaciones situadas en
ciudades diferentes de Estados Unidos, el LIGO (Laser Interferometer Gravitational-Wave
Observatory) que tiene relativamente poco tiempo de haber sido puesto en operación:

No se pueden soslayar las enormes dificultades técnicas que se han tenido que enfrentar para
poder construír laboratorios en la Tierra con instrumental que sea lo suficientemente preciso
para poder detectar ondas gravitacionales generadas en el espacio exterior. Imaginemos que a
varios miles de años-luz de la Tierra ocurre el equivalente de un tsunamicósmico. Al recorrer la
onda de choque gravitacional generada por el cataclismo la enorme distancia que nos separa del
evento hasta nosotros, su influencia sobre nuestro espacio-tiempo habrá disminuído a tal grado
que conforme pase por la Tierra su influencia será tanta como ocasionar que una distancia entre
la Tierra y su estrella más cercana, nuestro Sol, se altere momentáneamente por el grosor de un
pelo humano. Un instrumento lo suficientemente sensible como para detectar tal cambio tiene
que ser lo suficientemente sensible como para detectar un cambio en la distancia entre la Tierra
y el Sol de la anchura de un átomo, aproximadamente la millonésima de un protón por metro.
Estos son los obstáculos que tuvo que enfrentar el pionero en la detección de ondas
gravitacionales en Tierra, Joseph Weber, cuyos instrumentos hoy en día asemejan crudos
prototipos que jamás podrían haber logrado su objetivo. De su primer dispositivo terminado en
1965, un detector cilíndrico de aluminio de un metro de diámetro y 3.5 toneladas de peso
alrededor del cual se hallaban una serie de cristales piezoeléctricos los cuales generaban un
voltaje cuando la barra oscilaba de tamaño:

el propio Weber sostenía que el aparato era capaz de detectar deformaciones de tan sólo una
parte de 1016, lo que supone la cienava parte del diámetro de un núcleo atómico, lo cual parece
dudoso en nuestros tiempos. Aunque el consenso de la comunidad científica es que Joseph
Weber parece haber fracasado en sus esfuerzos por detectar radiación gravitacional, no se le
puede negar el mérito de haber sido el primero en intentarlo. Hoy en día, siguiendo en cierta
forma el ejemplo de Albert Michelson que en sus esfuerzos por detectar el movimiento de la
Tierra a través del hipotético éter se vió obligado a recurrir al fenómeno óptico de la
interferometría porque sólo de esa manera podía obtener la precisión necesaria para llegar a una
evaluación conclusiva, del mismo modo se está recurriendo en la actualidad a la interferometría
apoyada con rayos láser y mediciones de tiempos llevadas a cabo con relojes atómicos.

Pese a las enormes dificultades técnicas que parece haber para poder detectar radiación
gravitacional, debemos tomar en cuenta que existe un fenómeno físico de sobra conocido por los
ingenieros en electrónica que se dedican al diseño, la construcción y el mantenimiento de
equipos transmisores y receptores de radio y televisión: la resonancia. Es un hecho ineludible el
que una gran variedad de sistemas físicos tienen lo que se llama una frecuencia natural de
resonancia, y si se les hace “vibrar” a dicha frecuencia el comportamiento oscilatorio del sistema
puede aumentar a tal grado que la cosa se puede salir fuera de control. Un ejemplo dramático de
un sistema mecánico que empezó a vibrar a su frecuencia natural de resonancia hasta que el
sistema terminó autodestruyéndose es el puente de Tacoma Narrows en los Estados Unidos:

Otro ejemplo más mundano de un objeto que tiene su propia frecuencia natural de vibración es
la horquilla metálica que utilizan los médicos, la cual cuando es golpeada produce un sonido
característico (un “tono” musical) propio de la frecuencia natural de vibración de la horquilla (el
tono de la horquilla que se muestra a continuación es ajustable mediante los contrapesos
montados sobre los ejes cuya posición se puede ajustar):
En el caso de las transmisoras de señales de radio y televisión, en su quintaesencia todas ellas
operan sobre un mismo principio, un circuito tanque formado por un inductor eléctrico L y un
capacitor eléctrico C, cuyos valores determinan automáticamente la frecuencia de transmisión
de una señal que conocemos como canal (la cual es invariable y es asignada individualemente
por cada gobierno a cada empresa) que a su vez es radiada a través de una antena para ser
recibida por un receptor el cual debe ser sintonizado con un circuito tanque similar a la misma
frecuencia de la señal que se quiere recibir:
En la figura de arriba, en donde se le ha agregado al circuito tanque del receptor una resistencia
eléctrica R que representa las pérdidas de energía por disipación en el sistema además de un
medidor de voltaje e para medir la amplitud del voltaje de la señal recibida, podemos ver que la
frecuencia del circuito tanque del receptor puede ser variada mediante un capacitor (o
condensador) eléctrico variable destacado por la flechita en el diagrama que nos indica que se
trata de un componente eléctrico ajustable o sintonizable. Como ya se dijo, la frecuencia natural
de resonancia f0 del circuito tanque depende única y exclusivamente de los valores de L y C, y
está dada por la fórmula:

f0 = 1/2π√LC

Si a un circuito tanque que tiene conectados en serie un inductor L, un capacitor C y una


resistencia R le aplicamos un voltaje alterno de frecuencia variable, al variar la frecuencia no
tardaremos en toparnos con cierta frecuencia en la cual la corriente eléctrica media cuadrática
Irms (root mean square o rms, una especie de promedio matemático para una corriente eléctrica
alterna senoidal) del circuito adquiere un valor máximo precisamente en la frecuencia natural
de resonancia del circuito ω0 = 1/√LC:
De las gráficas de las curvas de resonancia podemos ver que la amplitud de la corriente I rms(en
este caso medida en milliamperes o mA) en el punto de resonancia ω0 depende única y
exclusivamente del valor de la resistencia R, a menores valores de R tanto mayor será la
amplitud. Y de hecho, teóricamente, si no hubiese resistencia eléctrica alguna en el circuito, la
amplitud de la corriente Irms sería infinita en el punto de resonancia.

Veamos ahora el caso de dos masas M conectadas mediante un resorte, las cuales también
podrían ser cargas eléctricas (en cuyo caso las representamos con la letra Q, siendo una de ellas
positiva y la otra negativa):

Si se trata de dos cargas eléctricas Q y -Q, entonces al estar “vibrando” dichas cargas y puesto
que se trata de un movimiento oscilatorio se generará una onda senoidal electromagnética que
será radiada fuera del sistema, la cual tendrá la misma frecuencia que la frecuencia
característica a la cual están oscilando las cargas acercándose y alejándose la una de la otra. Pero
si se trata de dos masas M, entonces lo que será radiado será una onda gravitacional de una
frecuencia muy específica.

Supóngase ahora que tenemos dos masas iguales M conectadas mediante un resorte y situadas a
cierta distancia del par de masas oscilante. Entonces, en principio, este par de masas puede
actuar como un receptor y amplificador de la onda gravitacional que está emanando del par de
masas oscilante si la frecuencia natural del sistema receptor es la misma que la frecuencia de
la onda gravitacional que está siendo recibida (en pocas palabras, si ambos sistemas
están sintonizados a la misma frecuencia):

Si podemos hacer variar de alguna manera la frecuencia natural de resonancia del sistema
receptor, entonces podemos tener una especie de “radio” con el que podemos “sintonizar” una
una señal gravitacional de frecuencia muy específica descartando todas las demás frecuencias,
al igual que como ocurre cuando sintonizamos un canal de televisión en donde todos los demás
canales excepto el canal seleccionado son eliminados al caer fuera de la frecuencia a la cual
tenemos sintonizado el televisor. De este modo, podemos “sintonizar” directamente hacia los
efectos de una sola señal gravitacional descartando a todas las demás. Si a esto añadimos que en
el espacio exterior tenemos en las estrellas púlsares fuentes de ondas gravitacionales de
frecuencias repetitivas muy específicas como ocurre en el caso de los sistemas binarios en donde
una de las estrellas generalmente posee una masa enorme (por ser una estrella de neutrones o
un agujero negro):
entonces se nos abre un nuevo horizonte de posibilidades. A modo de ejemplo, la púlsar PSR
J0437-4715 tiene un período preciso de rotación cada 5.75 milisegundos. Una vez detectada una
púlsar y habiéndose medido su radiofrecuencia a través de un radiotelescopio, cabe esperar que
la púlsar también esté emitiendo ondas gravitacionales de la misma frecuencia, capaces de ser
detectadas y medidas por un “resonador” construído para tal efecto. Pero no sólo las púlsares
emiten una señal de radiofrecuencia con una frecuencia natural de sistema muy específica.
También se distinguen por ser los relojes más estables de todo el Universo, incluyendo los
relojes atómicos de alta precisión hechos por el hombre, con una estabilidad de una parte en
1014 ó 1015. Esto nos permite intentar construír “resonadores” mecánicos o electromecánicos que
sean susceptibles de ser sintonizados a la misma frecuencia a la que está “vibrando” el púlsar. Y
al igual que una antena de radio, es susceptible orientar estos resonadores apuntándolos hacia la
fuente a ser investigada, como si fuesen pequeñas antenas gravitacionales. No es necesario
tomar muy en serio las ilustraciones dadas arriba mostrando un tranmisor gravitacional y un
receptor gravitacional construídos con dos masas M conectadas con un resorte, porque aquí lo
que importa no es tanto la forma en la que esté construído el sistema mecánico (o
electromecánico) sino su frecuencia natural de resonancia o la capacidad de poder variar
dicha frecuencia. Esto nos dá un amplio espectro de diseños posibles, cada uno con sus ventajas
y con sus desventajas. Sin embargo, un detector-receptor gravitacional ubicado sobre la
superficie de la Tierra debe contender con el problema de tener que evitar que una señal
causada por radiación gravitacional pueda ser confundida con el ruido causado por las
numerosas vibraciones de origen mecánico que se dan en la Tierra, desde las vibraciones
causadas por el tráfico vehicular sobre el pavimento de las calles hasta las vibraciones de mayor
envergadura de las cuales los detectores sísmicos pueden dar fé, lo cual requiere necesariamente
de programas computacionales basados en matemáticas sofisticadas como la Transformada
Rápida de Fourier basada en el algoritmo Cooley-Tukey FFT para extraer señales del ruido
aleatorio, aunque un problema técnico de esta índole también se puede solventar colocando el
detector-receptor en órbita en el espacio en donde no hay vibraciones mecánicas más que las
que pueda producir el propio satélite.

Aunque, en principio, es posible construír un sistema de intercomunicación utilizando ondas de


gravedad en lugar de ondas electromagnéticas, las dificultades técnicas involucradas en una
empresa de esta naturaleza son de tal magnitud que casi estamos obligados a conformarnos con
lo que ya tenemos basado en la radiación electromagnética. Además, puesto que tanto las ondas
gravitacionales como las ondas electromagnéticas se propagan con la misma velocidad, la
velocidad de la luz, no hay nada que justifique dejar algo que ya tenemos y que nos funciona
muy bien desde frecuencias de radio de amplitud modulada (AM) que empiezan desde los 100
Kilohertz llegando hasta las frecuencias superaltas en el orden de los Gigahertz, reemplazándolo
por una quimera cuyas únicas ventajas tal vez sean que no es afectada por interferencias
eléctricas además de que pueda abrir una nueva banda de radiocomunicación (o mejor
dicho, gravitocomunicación).

Las ondas gravitacionales son transversales, como lo son las ondas luminosas y las ondas
sonoras; “vibran” en ángulos rectos a la dirección hacia la cual se están desplazando. Para poder
apreciar cómo esto afecta su interacción con la materia, supóngase que tenemos cuatro masas
acomodadas en un plano horizontal en los cuatro extremos de un compás, y que una onda
gravitacional atraviesa el plano desde arriba. En cierto momento, la distancia entre las masas
Norte-Sur disminuye y la distancia entre las masas Este-Oeste. Media longitud de “onda
gravitacional” después, ocurre precisamente lo contrario. Y si la onda gravitacional atraviesa las
masas no perpendicularmente al plano sino en una dirección a lo largo del plano, por ejemplo en
la dirección Este-Oeste, entonces no tiene efecto alguno sobre las masas en la dirección de su
movimiento; las masas Este-Oeste permanecen fijas en su posición mientras que la distancia
entre las masas Norte-Sur aumenta y disminuye periódicamente conforme la onda gravitacional
atraviesa por el plano. Esto tiene una implicación directa para nosotros. Podemos decir que las
ondas gravitacionales están polarizadas. En las siguientes dos ilustraciones tenemos en el
primer renglón un círculo conformado por masas de prueba situados en un plano de modo tal
que es atravesado perpendicularmente, con lo cual las masas se acercan y se alejan en la forma
oscilatoria mostrada, mientras que en el segundo renglón tenemos a la onda gravitacional
atravesando al plano de modo tal que la polarización de la misma se hace evidente:

Como ya se mencionó, así como un objeto cargado eléctricamente genera ondas


electromagnéticas en proporción a su carga y aceleración, del mismo modo se puede esperar que
una masa en movimiento genere rizos gravitacionales en proporción a su masa y aceleración.
Sin embargo, hay una diferencia importante entre ambos fenómenos. La tercera ley de Newton,
conocida como la ley de la inercia nos dice a toda acción corresponde una reacción de igual
intensidad y dirección contraria, la aceleración de una masa en cierta dirección debe ser
acompañada por la aceleración de otra masa en la dirección contraria, con el momentum (la
masa por la velocidad) en ambas direcciones siendo iguales. Esto significa que en un sistema
binario si una masa genera ondas gravitacionales la otra masa del sistema también debe generar
las suyas propias, de modo tal que las ondas gravitacionales de ambas masas tienden a
cancelarse. En cierta forma, esto es una consecuencia del principio de la conservación de la
energía expresado tensorialmente por la ecuación:

Tμν,ν = ∂Tμν/∂xν = 0

la cual elimina la posibilidad de que pueda haber radiación de monopolo en una teoría
linearizada de radiación gravitacional del mismo modo que la conservación de la carga elimina
la posibilidad de que pueda haber radiación de monopolo en la teoría del electromagnetismo.
Sin embargo, puesto que las masas no están en el mismo lugar, la cancelación nunca es perfecta.
La cantidad de radiación gravitacional que logra escapar del sistema depende ya sea del arreglo
geométrico de las masas discretas o de la forma geométrica del cuerpo emisor, medido por lo
que se ha designado como el momento de cuadrupolo (en similitud al concepto del mismo
nombre cuando se trata de cargas eléctricas). Un objeto totalmente simétrico, como una pelota
de futbol sóccer, tiene un momento de cuadrupolo igual a cero, mientras que una pelota de
futbol Americano tiene un momento de cuadrupolo grande, al menos para la rotación en torno a
su eje de simetría corto. Para fines de cálculo cuando tenemos que trabajar con cuadrupolos
eléctricos o gravitacionales, el concepto fundamental que manejamos es el del tensor de
cuadrupoloQij:

el cual representa las nueve cantidades especificadas para un sistema de cargas o


masas discretas:

Qij = Σ n qn (3xi xj - r² δij)

mientras que para un sistema continuo con una densidad de carga o de masa ρ(x) la expresión
equivalente para cada uno de los nueve componentes del tensor de cuadrupolo se obtiene
reemplazando la sumatoria por una integral:

Qij = ∫ ρ(x) (3xi xj - r² δij) d3x

El momento de cuadrupolo Qij tiene nueve componentes, pero debido a la relación de simetría:

Qij = Qji

únicamente seis de estas componentes son independientes. Más aún, por la propiedad de la
traza de la diagonal principal de la matriz que representa al tensor, de acuerdo con la cual la
suma de los elementos diagonales es igual a cero:

Q11 + Q22 + Q33 = 0

únicamente cinco de estas componentes son independientes.

PROBLEMA: Para un sistema de particulas discretas, demostrar que la traza del tensor de
cuadrupolo es igual a cero.

Empezamos con la relación:


Qij = Σ n qn (3xi xj - r² δij)

Para resolver el problema, igualamos los dos sub-índices del tensor Qij:

i=j=k

con lo cual de hecho inicializamos una operación de contracción del tensor activando la
convención de sumación, lo cual nos resultará en un escalar. Sumando sobre k como nos lo pide
la convención de sumación al llevarse a cabo la contracción:

Σ k Qkk = Σ k [ Σ n qn (3xk xk - r² δkk) ]

Puesto que en una doble sumatoria podemos intercambiar el orden de las sumatorias sin que se
nos altere el doble sumando final, podemos reescribir lo anterior de la manera siguiente:

Σ k Qkk = Σ n qn [3 Σ k (xk)² - r² Σ k (δkk) ]

Pero:

r² = x1² + x2² + x3²

Σ k (δkk) = δ11 + δ22 + δ33 = 1 + 1+ 1 = 3

Entonces:

Σ k Qkk = Σ n qn [3 r² - 3 r²] = 0

Q11 + Q22 + Q33 = 0

Los multipolos eléctricos tienen su origen en la definición básica del potencial Φ producido por
una carga eléctrica q a una distancia R de dicha carga:

siendo ε la permitividad eléctrica del espacio en el cual está situada la carga (ε 0 en el caso del
espacio vacío). En el caso de dos cargas eléctricas:
el potencial total Φ en un punto dado es simplemente la suma de los
potenciales Φ1 y Φ2producidos por cada carga en dicho punto (esta es una de las grandes
ventajas del uso del concepto del potencial sobre el concepto de la fuerza eléctrica):

Φ(r1,r2) = Φ1(r1) + Φ2 (r2)

Sin embargo, hay razones de peso por las cuales resulta conveniente obtener una fórmula para el
potencial efectivo no en función de las distancias radiales r1 y r2 sino en función de una sola
distancia R hacia un centro de origen de un sistema de coordenadas como se muestra en la
figura de arriba. Pero como al calcular la distancia R en función de las distancias
radiales r1 y r2 la expresión obtenida va en un denominador, al llevar a cabo la expansión por
series de Taylor de la fórmula para Φ van apareciendo uno a uno los términos del monopolo, del
dipolo, del cuadrupolo, y otros multipolos sucesivos.

Como ocurre con cualquier momento multipolo, si un momento de orden menor (monopolo o
dipolo en este caso) no es igual a cero, entonces el valor del momento de cuadrupolo dependerá
de la selección del origen del sistema de coordenadas. Un dipolo formado por dos cargas
eléctricas de signos opuestos (que carece por lo tanto de monopolo), por ejemplo, puede tener
un momento de cuadrupolo diferente de cero si el origen del sistema de coordenadas empleado
es recorrido fuera del centro de la configuración (que en el caso de un dipolo se encuentra justo
a la mitad de la distancia entre las dos cargas), o el momento de cuadrupolo puede ser reducido
a cero colocando el origen del sistema de coordenadas en el centro de la configuración. En
contraste, si los momentos de monopolo y de dipolo se desvanecen pero no así el momento del
cuadrupolo (esto ocurre en el caso de cargas eléctricas de la misma magnitud pero con signos
alternantes colocadas en las esquinas de un cuadrado), el momento de cuadrupolo es
independiente de la selección del origen para el sistema de coordenadas.
Puesto que el cuadrupolo relativista es muy análogo al cuadrupolo eléctrico, no debe
sorprendernos el hecho de que mientras que el potencial de un cuadrupolo eléctrico esté dado
por la siguiente relación (Classical Electrodynamics, John David Jackson):

en el caso del cuadrupolo relativista la densidad de carga simplemente se reemplace con la


densidad de masa para darnos el potencial gravitacional del cuadrupolo relativista que tras los
cálculos tensoriales resulta ser:

Es importante tener presente que estas últimas dos relaciones representan potenciales estáticos,
invariantes, para sistemas de cargas o masas fijas sin movimiento alguno, lo cual no puede
producir radiación gravitacional alguna. Para que se nos produzca alguna radiación, es
necesario poner lo anterior en movimiento, lo cual requiere que tanto la primera como la
segunda derivadas de los potenciales con respecto al tiempo pueda estar definida y no sea igual
a cero, y es aquí precisamente en donde el momento de cuadrupolo entra en acción.

Para un sistema continuo (en lugar de un sistema de partículas discretas), o sea un cuerpo como
la Tierra, puesto que la Tierra está girando sobre su eje ésta tiene una forma oblatada (achatada
en los polos), lo cual dá origen a un momento de cuadrupolo gravitacional, y aunque la
contribución de este momento de cuadrupolo es extremadamente importante para satélites
artificiales que están orbitando cerca de la Tierra, es menos importante para la Luna porque
como podemos verlo en la relación de arriba, el término 1/r cúbico hace que el cuadrupolo
relativista caiga rápidamente de valor. De cualquier modo, el momento de cuadrupolo de masas
es importante en la Relatividad General porque si éste varía con el tiempo entonces puede
producir radiación gravitacional semejante a la radiación electromagnética que se produce con
los cambios de momentos de cuadrupolo eléctrico o magnético (específicamente, se requiere que
la derivada de segundo orden con respecto al tiempo sea diferente de cero). El monopolo de
masa representa la cantidad total de masa-energía en un sistema, la cual no puede variar con el
tiempo, y por lo tanto es incapaz de poder producir radiación gravitacional alguna. De modo
semejante, el dipolo de masarepresenta el centro de masa de un sistema, el cual tampoco varía
con el tiempo y por lo tanto tampoco es capaz de poder producir radiación gravitacional alguna.
Sin embargo, el cuadrupolo de masa sí puede variar con el tiempo, y es la contribución del
menor orden posible a la radiación gravitacional.

El ejemplo más sencillo e importante de un sistema radiante de ondas gravitacionales es un par


de agujeros negros con masas iguales compartiendo una órbita común el uno en torno al otro. Si
colocamos el origen de nuestro sistema de coordenadas justo a la mitad de la distancia que hay
entre los dos agujeros negros, y colocamos uno de los agujeros negros a una distancia unitaria a
lo largo del eje-x, el sistema no tendrá momento dipolar, y el momento de cuadrupolo será
simplemente:

Qij = M (3xi xj - 1² δij) = M (3xi xj - δij)

en donde M es la masa de cada agujero negro y xi es el vector unitario en la dirección-x.


Conforme el sistema gira en su órbita común, el vector-x también estará en rotación, lo cual
significa que tendrá una derivada de segundo orden con respecto al tiempo que no será igual a
cero, y por lo tanto el sistema radiará ondas gravitacionales.

Así como los multipolos de carga y corriente eléctricas contribuyen al campo electromagnético,
los multipolos de masa y corrientes-de-masa contribuyen al campo gravitacional de la
Relatividad General, puesto que la Relatividad General también incluye efectos
gravitomagnéticos. Los multipolos producidos por corrientes-de-masa variables también
pueden producir radiación gravitacional. Sin embargo, las contribuciones de los multipolos de
corrientes-de-masa serán típicamente mucho menores que las contribuciones del cuadrupolo de
masa.

Es posible que pronto haya un evento cósmico capaz de generar ondas gravitacionales que sean
lo suficientemente grandes como para poder dar hoy mismo una confirmación inequívoca del
fenómeno, el cual radica en lo que ha sido bautizado como una hipernova, un tipo de
supernova que teóricamente se debe producir cuando estrellas muy masivas (con masas
superiores a las 100 masas solares) colapsan al final de sus vidas. El candidato a una explosión
tal lo es la estrella Eta Carinae:
Esta estrella es increíblemente, casi imposiblemente, brillante, con un brillo unas 4 millones de
veces mayor que el de nuestro Sol, y con una masa por lo menos 100 veces mayor. Y es también
extremadamente inestable, dando variaciones súbitas en luminosidad y cambios súbitos de
aspecto que han causado en los astrónomos la impresión de que se trata del equivalente de un
volcán que está listo para explotar. Algunos la han llamado “la estrella más peligrosa en el cielo”.
Y aunque está situada a unos 7,500 años-luz de la Tierra, aún a esa distancia podría ocasionar
un daño severo a los satélites que tenemos en órbita.

Si la detección de radiación gravitacional es tan sólo una cuestión de tiempo conforme


refinamos y mejoramos el alcance de nuestros instrumentos, la superexplosión de una
hipernova como Eta Carinae podría radiar una onda de choque gravitacional lo suficientemente
grande como para ser detectada con lo que ya tenemos. Sin embargo, considerando que una
hipernova ocurre en nuestra galaxia una vez cada 200 millones de años, se vuelve más atractivo
ir refinando aún más la potencia de nuestros instrumentos para poder detectar radiación
gravitacional generada por eventos de menor envergadura que esperar pacientemente a que
alguna generación futura tenga la suerte de poder presenciar tales acontecimientos cuando
llegan a ocurrir.

Aunque la radiación gravitacional sólo ha podido ser confirmada indirectamente a través de


observaciones astronómicas, específicamente el sistema binario púlsar Hulse-Taylor, sería una
verdadera sorpresa que no fuese detectada tarde o temprano ya que en realidad el único
argumento que ha sido avanzado en contra de la posible existencia de ondas gravitacionales
proviene del principio de Mach (basado a su vez en la filosofía de Leibniz), que en una de sus
variantes afirma que el espacio vacío realmente debe ser vacío y que lo único de lo que tiene
sentido hablar es de las posiciones relativas de los objetos que haya en dicho espacio; sin los
cuales no es posible hacer afirmación alguna, y si en el espacio vacío no puede haber nada
entonces tampoco debe haber ondas gravitacionales. Este argumento, desde luego, ha sido
desacreditado por la Teoría del Campo Cuántico y la Electrodinámica Cuántica, los cuales nos
afirman que el espacio “vacío” está siendo ocupado constantemente por partículas virtuales que
aparecen de la nada y desaparecen tan pronto como llegaron, las mismas partículas que dan
origen a la “evaporación” de los agujeros negros. Por otro lado, el espacio vacío sí está “lleno” de
algo, está lleno de espacio-tiempo, aunque esto tiene la desventaja de sonar como un intento por
regresar al viejo concepto del éter aunque reemplazando el concepto inicial con algo parecido
pero más refinado. Puesto de otra manera, el movimiento absoluto no puede ser detectado ni
siquiera por medios ópticos o electromagnéticos porque el “éter” no existe, esta es la base de la
Teoría de la Relatividad; pero si el Universo está montado en un entramado gigantesco de
espacio-tiempo, ¿acaso el movimiento absoluto (o mejor dicho, la aceleración absoluta) de un
objeto no puede ser detectado relativo a este entramado? Sobre todo si el espacio-tiempo del
Universo es el “medio de transmisión” sin el cual la propagación de los rizos gravitacionales
sería imposible. Le dejaremos esta última pregunta a los filósofos de la ciencia.

Cosmología relativista I
Las ecuaciones de campo de la Relatividad General no sólo sirven para predecir y explicar las
trayectorias de los planetas alrededor del Sol y la existencia de los agujeros negros, sirven
también para intentar abarcar algo mucho más ambicioso: el origen y el destino final del
Universo.

Las ecuaciones de campo originales atribuían una curvatura en el espacio-tiempo a la presencia


cercana de masa-energía, y en notación tensorial simplificada esto se escribe simplemente
como G = T. Si partimos de dichas ecuaciones, no tardamos en encontrar que si tales ecuaciones
son ciertas entonces describen un Universo dinámico.

Einstein no era partidario de la idea de un Universo dinámico, él suponía la existencia de un


Universo estático. Y puesto que sus ecuaciones de campo no acomodaban tal posibilidad, para
adaptar sus ecuaciones de campo al concepto de un Universo estático introdujo en las mismas
una constante, la constante cosmológica, denotada como Λ. De este modo, las ecuaciones
originales
G=T

se convertían en

G+Λ=T

Pero la suposición de un Universo estático fue desmoronada tras años de investigación por el
astrónomo norteamericano Edwin Hubble, el cual publicó en 1929 un análisis de la velocidad
radial de las nebulosas cuya distancia a la Tierra había calculado, análisis en el que hablaba
acerca de las velocidades de las nebulosas con respecto a la tierra. Aunque encontró que algunas
nebulosas extragalácticas tenían espectros que indicaban que se estaban moviendo hacia la
Tierra, la gran mayoría de las nebulosas estudiadas por él mostraba corrimientos hacia el rojo
(ocasionadas por el efecto Doppler) que solo podían explicarse asumiendo que dichas nebulosas
se estaban alejando. Más sorprendente aún fue su descubrimiento de que existía una relación
directa entre la distancia de una nebulosa hacia la Tierra y su velocidad de retroceso con la cual
se estaba alejando de la Tierra. Esto lo conocemos en la actualidad como la ley de Hubble, una
ley de cosmología física que establece que el corrimiento hacia el rojo de una galaxia es
proporcional a la distancia a la que ésta se encuentra de la Tierra. Hubble concluyó que la única
explicación consistente con los corrimientos hacia el rojo registrados era que, dejando aparte a
un “grupo local” de galaxias cercanas, todas las nebulosas extragalácticas se estaban alejando de
la Tierra y que, cuanto más lejos se encontraban, más rápidamente se alejaban. Esto sólo tenía
sentido si el propio Universo, incluido el espacio entre galaxias, se estaba expandiendo. La ley
de Hubble es considerada como la primera evidencia observacional que apoya uno de los
descubrimientos más sorprendentes de nuestra era: la expansión del Universo. Al
enterarse de los resultados publicados por Hubble, Einstein se retractó arrepentido de haber
introducido artificialmente en sus ecuaciones de campo la constante cosmológica Λ, llamándola
“el mayor error de mi carrera”, tras lo cual hizo un famoso viaje a Monte Wilson, en donde
trabajaba Edwin Hubble en su observatorio astronómico, para agradecerle a Hubble que le
proporcionara las bases observacionales de la cosmología moderna.

Sin embargo, siete años antes de que Hubble anunciara la relación velocidad-distancia, en 1922-
1924 un meteorólogo soviético que se convirtió en Profesor de Matemáticas en la Universidad de
Leningrado, Alexander Friedman, encontró las primeras soluciones dinámicas a las ecuaciones
originales de Einstein sin incluír la constante cosmológica Λ. Desafortunadamente sus trabajos
permanecieron ignorados en aquél entonces pese a que fueron publicados en un medio de
comunicación de amplio prestigio y pese a que el mismo Einstein estaba al tanto de los trabajos
de Friedman. Unicamente hasta que Georges Lemaître, conocido como el “padre de la gran
explosión” (big-bang) redescubrió independientemente por cuenta propia las ecuaciones de
Friedman la cosmología moderna logró establecer firmemente sus raíces sobre un andamiaje
matemático. Desafortunadamente (por segunda ocasión) los trabajos de Lemaître también
permanecieron ampliamente ignorados hasta que el prestigioso astrónomo Arthur Eddington
señaló la importancia de los mismos en 1930. (Esto nos debe poner a meditar en la posibilidad
de que en estos precisos momentos hay trabajos científicos ya publicados cuya importancia
desconocemos por no haber alguien importante que los saque de la obscuridad.) Las
contribuciones posteriores a estos trabajos que fundaron la cosmología moderna fueron
también de naturaleza matemática. Los matemáticos Howard P. Robertson y Arthur Walker
demostraron que las soluciones encontradas por Friedman eran de hecho las soluciones más
generales posibles que se podían encontrar a las ecuaciones de campo de Einstein, siempre y
cuando se partiera del supuesto de que el Universo es
espacialmente homogéneo e isotrópico. La suposición de un Universo homogéneo debe ser
tomada con un poco de fé, ya que supone que podemos ir subdividiendo el Universo en regiones
suficientemente grandes y del mismo tamaño encontrando para cada región más o menos
(aproximadamente) la misma cantidad de estrellas y galaxias y agujeros negros y todo lo demás
que pueda estar repartido en el Universo, o sea, una densidad de cuerpos celestes que no varía
mucho de una región a otra:

Y en lo que respecta a la isotropía, esto supone que el espacio-tiempo del Universo tiene el
mismo comportamiento hacia cualquier dirección a donde apuntemos con nuestros telescopios,
ya que de no ser así ello tendría que verse reflejado necesariamente en la métrica.

Robertson y Walker demostraron además que el espacio-tiempo cuatri-dimensional podía ser


descompuesto en un espacio tri-dimensional y un mismo tiempo común a todos los
observadores que se hallasen en movimiento conjunto. El fruto final de estos trabajos
combinados derivó en lo que hoy se considera el punto de partida convencional para el estudio
de la cosmología relativista, la métrica de Friedman-Lemaître-Robertson-
Walker o modelo FLRW, la cual es una solución exacta a las ecuaciones de campo de
Einstein y partiendo de una suposición de homogeneidad e isotropía del Universo es capaz de
describir un universo en expansión o en contracción:

En esta métrica, k es un parámetro que mide la curvatura, y a(t) es un factor de escala que es
explícitamente dependiente del tiempo.

Si el Universo está en expansión constante, como parecen indicarlo las mediciones astronómicas
que se han estado llevando a cabo desde los tiempos de Edwin Hubble, si el Universo empezó
con una explosión estruendosa a partir de un punto infinitesimalmente pequeño dentro del cual
había una cantidad infinitamente grande de masa-energía así como de espacio-tiempo, una
duda natural que puede surgir en una mente inquisitiva es la siguiente: ¿Cuál es el centro de la
explosión?

Puesto que nosotros, desde la Tierra, vemos a través de nuestros telescopios que en su conjunto
todas las estrellas parecen estarse alejando de nosotros por donde quiera que miremos, y
considerándonos además no por cuestiones de carácter científico sino por cuestiones de carácter
religioso como el centro del Universo, resulta tentador suponer que nosotros ocupamos
actualmente el centro de la explosión inicial, y si no estamos en el centro de la explosión
entonces debemos estar muy cerca de él. Pero estas son ilusiones que se van cayendo al
examinar el asunto más a fondo. En primer lugar, el concepto de que la Tierra (y con ella el
hombre) es el centro del Universo, la teoría geocéntrica, se vino abajo desde los tiempos de
Copérnico y de Galileo cuando se dedujo que no es el Sol el que está girando alrededor de
nosotros sino que somos nosotros los que estamos girando alrededor de él. Este concepto
sumado al hecho de que nosotros no somos el único sistema planetario del Universo así como
nuestra galaxia tampoco es la única galaxia del Universo deben ser razón más que suficiente
para quitarnos de encima la ilusión vanidosa y egoísta de que toda la Creación gira alrededor de
nosotros.

Sin embargo, queda el asunto indiscutible de que todas las demás estrellas y galaxias parecen
estarse alejando de nosotros como si estuviéramos precisamente en el centro de los “cascos de
expansión”. El principal obstáculo en tratar de aferrarnos a tal suposición es que está basada en
un concepto tri-dimensional del Universo cuando el Universo en que vivimos es un
Universo cuatri-dimensional. Y en un Universo cuatri-dimensional, relativista,
cualquier planeta, cualquier sistema solar, cualquier estrella, cualquier galaxia, se
puede considerar como el centro de la explosión, no hay observadores privilegiados ni
siquiera en éste asunto. Esto lo podemos visualizar mejor considerando a todos los astros del
cosmos colocados sobre la superficie de una 2-esfera que se ha ido inflando con el paso del
tiempo:

del mismo modo en que pudiéramos pintar sobre la superficie de un globo de hule varios
puntitos viendo lo que sucede al ir inflando el globo:
Si en cada uno de los puntos que hemos “pintado” sobre la superficie del globo inflable ponemos
una hormiga, o mejor aún, un conglomerado de pequeños seres inteligentes que viven
confinados por siempre a las dos dimensiones que ellos pueden trazar sobre la superficie del
globo con las cuales efectúan sus mediciones, entonces cualquiera de ellos al ver a los demás
puntos alejarse a la misma velocidad concluirá erróneamente ser el centro privilegiado de la
explosión, cuando en realidad nosotros que somos capaces de ver “por fuera” lo que está
sucediendo nos damos cuenta de que no existe sobre la superficie del globo ningún “centro
privilegiado” de la explosión. Del mismo modo, nosotros mismos no podemos apuntar hacia
alguna parte del Universo diciendo “allí es donde comenzó todo” porque no existe un lugar
específico al cual se le pueda señalar como el “centro de la explosión”. En todo caso, todo lo que
hay en este Universo puede ser considerado como el centro de la explosión del universo
inflacionario.

Utilizando una proyección de superficie rectangular plana en lugar de una 2-superficieesférica,


podemos visualizar la evolución del Universo entero de la siguiente manera:
La solución ampliada encontrada por los matemáticos Robertson y Walker a las ecuaciones de
campo de Einstein aplicadas al Universo a gran escala condujo a la consideración del tipo de
geometría espacial (hablando en cuatro dimensiones) que pueda tener el Universo, según la
cantidad de materia o energía que contenga así como la distribución de la misma. Lo curioso es
que la Relatividad General permite como posibilidad cualquiera de las tres geometrías que son
posibles de según las matemáticas (la geometría Euclideana convencional, la geometría no-
Euclideana elíptica y la geometría no-Euclideana hiperbólica), de acuerdo con el valor que posea
un parámetro crucial conocido como Ω0Las dos soluciones encontradas por Friedman permiten
un espacio esférico de curvatura positiva constante y un espacio hiperbólico de
curvatura negativa constante. A estas dos soluciones se añadió una tercera solución encontrada
por Robertson y Walker, que corresponde a la de un espacio plano de curvatura cero. En un
espacio esférico de curvatura positiva dos rayos paralelos de luz láser lanzados sobre un mismo
plano van a terminar encontrándose tarde o temprano sin importar la dirección en la cual esté
situado el plano; este es el caso para el cual el parámetro Ω0 toma un valor mayor que la unidad.
En un espacio hiperbólico de curvatura negativa dos rayos paralelos de luz láser no sólo no se
van a encontrar, ni siquiera permanecerán paralelos; este es el caso para el cual el
parámetro Ω0 toma un valor menor que la unidad. Y en un espacio plano de curvatura cero, dos
rayos paralelos de luz láser permanecerán paralelos por toda la Eternidad sin separarse ni
acercarse jamás; este es el caso para el cual el parámetro Ω0 toma el valor mayor de la unidad
( Ω0 = 1). La siguiente figura ilustra las tres posibilidades:

De nuestras suposiciones de la homogeneidad e isotropía del Universo, deducimos que la


estructura espacial del Universo debe ser la de una esfera 3-dimensional, la de un hiperboloide
3-dimensional, o la de un 3-espacio Euclideano plano. Para completar la especificación de la
geometría espacio-tiempo del Universo, tenemos que determinar el factor de
escala a (posiblemente dependiente del tiempo, como lo propone la métrica Friedman-
Lemaître-Robertson-Walker al escribir dicho factor de escala como a(t) en la expresión de la
métrica) que fija la escala de distancia en cada una de las “superficies” espaciales de
homogeneidad e isotropía. En el caso de la esfera y del hiperboloide, el factor de
escala a también determina la magnitud de la curvatura espacial. En cada superficie espacial de
homogeneidad, la distancia entre cada par de galaxias es proporcional al factor de escala a.
Si a tomara el mismo valor en cada superficie, las distancias entre las galaxias no cambiarían
con el tiempo. Por otro lado, si a fuera aumentando de valor con el tiempo, las distancias entre
las galaxias aumentarían y las galaxias retrocederían una con respecto a la otra a una velocidad
proporcional a la distancia entre ellas. Y si a disminuyera con el tiempo, las galaxias se estarían
acercando la una a la otra de modo similar. Es extraordinario el hecho de que este movimiento
de acercamiento o alejamiento entre las galaxias es atribuíble a la expansión o a la contracción
del espacio que hay entre ellas.

Si metemos en el panorama a las ecuaciones de campo de Einstein, la curvatura del espacio-


tiempo del Universo depende únicamente del factor de escala a y de la naturaleza de las
superficies de homogeneidad e isotropía, cantidades que a su vez dependen de la densidad ρ y
de la presión P de la materia-energía que hay en el Universo. Para escribir explícitamente las
ecuaciones que describen al Universo, tenemos que identificar cada superficie de homogeneidad
e isotropía en el Universo mediante el tiempo t medido con un reloj en nuestra galaxia (o
cualquier otra galaxia); esto es, identificamos cada superficie de acuerdo con la lectura en
nuestro reloj cuando la línea del mundo de nuestra galaxia (como se le representaría en un
diagrama espacio-tiempo de Minkowski) atraviesa dicha superficie. Si se hace esto, las
ecuaciones de campo de la Relatividad General nos producen el siguiente par de ecuaciones:

En estas ecuaciones, da/dt representa la razón del cambio del factor de escala a con respecto al
tiempo, o sea la razón a la cual se está llevando a cabo la expansión o la contracción de las
secciones espaciales del Universo, d²a/dt² representa la rapidez a la cual se está llevando a cabo
la razón del cambio del factor de escala con respecto al tiempo, o sea la aceleración de la
expansión, con G y c denotando a la constante de gravitación universal G y la velocidad de la luz.
Por último, k es un número que toma el valor de cero para el 3-espacio Euclideano plano (Ω0 = 1
en el diagrama de arriba)), el valor de +1 para la 3-esfera (Ω0 mayor que 1 en el diagrama de
arriba), y el valor de -1 para el hiperboloide 3-dimensional (Ω0 menor que 1 en el diagrama de
arriba).

Las dos ecuaciones puestas arriba nos deparan una sorpresa. En las representaciones gráficas
dadas a los tres tipos de Universo, sería natural suponer que cada una de ellas representa a un
Universo que permanece constante manteniendo el mismo aspecto con el correr del tiempo, de
modo tal que la estructura a gran escala del Universo siempre ha sido en el ayer lo que es hoy y
lo que será mañana. ¡Pero estas ecuaciones nos dicen que tal cosa es imposible! Si hay materia-
energía presente en el Universo, entonces el lado derecho de la primera ecuación
necesariamente debe ser positivo, puesto que la densidad ρ de la materia-energía siempre es
positiva y la presión P no puede tomar valores negativos. Entonces la aceleración de la
expansión ( d²a/dt² en el lado izquierdo de la primera ecuación) no puede ser cero (y de hecho
debe tomar un valor negativo). Esto quiere decir que, exceptuando el breve instante de tiempo
en el que la expansión se detiene y se convierte en una contracción, el Universo siempre debe
estarse expandiendo o contrayendo. La noción de un Universo estático es incompatible
con las ecuaciones de campo de la Relatividad General, el Universo
necesariamente tiene que ser un Universo dinámico. Esto fue precisamente lo que llevó
a Einstein, quien se sentía incómodo con la posibilidad de un Universo dinámico, a injertar en
sus ecuaciones de campo la famosa constante cosmológica Λ que tiempo después llamó “el
mayor error de mi carrera” al confirmarle Edwin Hubble mediante las observaciones
astronómicas recabadas por él que efectivamente el Universo era un Universo dinámico que se
estaba expandiendo. Si Einstein hubiese hecho lo mismo que lo que hizo desde un principio
cuando presentó al mundo su Teoría Especial de la Relatividad, aferrándose a la validez total de
los dos postulados básicos de dicha teoría pese a que de inmediato condujeron a aparentes
paradojas y efectos tan bizarros como la dilatación del tiempo y la contracción de longitud,
Einstein habría hecho lo que indudablemente podría haber sido el mayor descubrimiento
teórico de su vida, el anuncio de que el Universo es dinámico y no estático. Al ser confrontado
por los datos experimentales, Einstein no tardó en darse cuenta de la magnitud de su yerro. Pero
el error cometido por Einstein fue de hecho más lamentable porque al aferrarse a su noción de
un Universo estático él mismo pasó por alto otro argumento formulado antes del advenimiento
de la Relatividad General que por sí solo hubiera bastado para buscar otros argumentos de
índole teórica -como la Relatividad General- para desechar la creencia en un Universo estático:
la paradoja de Olbers, enunciada por el astrónomo Heinrich Olbers que publicó un artículo
en 1823 planteando el problema enunciado de una manera muy sencilla:

¿Por qué es obscuro el cielo en la noche?

La paradoja de Olbers (el término “paradoja de Olbers” fue popularizado por el cosmólogo
Hermann Bondi en los años cincuenta en honor de Olbers) sólo constituye un verdadero
problema en un Universo que es eterno tanto en el futuro como en el pasado, estático,
infinitamente grande y que no cambia con el tiempo, porque en un Universo así uno debe
encontrar una estrella en cualquier dirección del cielo hacia donde uno apunte su vista, de la
misma manera que en un bosque suficientemente grande uno debe encontrar el tronco de un
árbol en la línea de visión en cualquier dirección en que se le ocurra mirar:
El problema se puede plantear de una manera un poco más formal suponiendo un Universo
eterno e infinitamente grande y estático que contenga una densidad de estrellas más o menos
constante (un Universo homogéneo). Aplicando una ley del inverso del cuadrado de la distancia,
en una superficie esférica centrada en un observador a una distancia 2r del observador dicho
observador debe poder encontrar exactamente cuatro veces más estrellas que en una distancia
situada a una distancia r del mismo:

Pero a la vez el flujo de luz recibido de una estrella situada a una distancia 2r debe ser
exactamente cuatro veces menor, por lo que la cantidad de luz recibida tanto de la esfera situada
a una distancia r como de la esfera situada a una distancia 2r debe ser exactamente la misma. Si
vamos sumando las contribuciones de todas las esferas situadas a cualquier distancia del
observador, obtenemos una cantidad infinita de luz recibida por el observador, puesto que la
cantidad de esferas posibles es infinita en un Universo infinito. Esto, desde luego, no concuerda
con la realidad. Para reducir la cantidad de luz que recibe el observador, se puede intentar
eliminar la luz interceptada por los discos estelares que se encuentran más cerca del observador.
Pero aún habiendo hecho esto, el cielo debería ser al menos tan brillante como la superficie
solar. El cielo no debería ser obscuro de noche. Y en esto radica precisamente la paradoja.

Aunque la paradoja es atribuída al astrónomo Olbers, la interrogante se remonta a filósofos y


pensadores anteriores a Olbers (1758 - 1840). Rompiendo con el esquema de Aristóteles y
Ptolomeo bajo el cual el Universo era finito y todas las estrellas estaban situadas en una misma
esfera, en 1576 el inglés Thomas Digges introdujo el concepto del infinito en nuestra concepción
moderna del Universo, y al hacerlo el problema de explicar la obscuridad del cielo cayó
directamente en sus manos. Para darle una salida al problema, Digges argumentó que la
obscuridad del cielo era debida a una disminución de la cantidad de luz recibida desde las
estrellas más alejadas, argumento que se desecha como erróneo en base a lo que se acaba de
explicar arriba. Posteriormente, la paradoja fue estudiada por Kepler en 1610, quien parece
haber sido el primero en darse cuenta del conflicto que hay al plantear la infinitud del Universo
contrastando dicha infinitud con la obscuridad observada del cielo. La solución dada por Kepler
era que la obscuridad que hay entre las estrellas se debía a la existencia de un “borde” del
Universo, en pocas palabras, un Universo finito. Un siglo más tarde el astrónomo Edmund
Halley volvió a investigar la paradoja retomando la explicación errónea de Digges como solución
de la misma, leyendo dos artículos referentes a la paradoja ante la Royal Society en 1721 en la
presencia del mismo Newton. Pero ni siquiera al mismo Newton se le ocurrió que la solución de
la paradoja podría estar ubicada en otra posibilidad, la de un Universo con una edad finita.
Considerando que la Iglesia tenía ubicada la fecha de la creación en el año 4004 A.C., este dato
implicaba que el tamaño del Universo visible, tomando en cuenta la velocidad finita de la luz,
tenía que ser menos que unos 6000 años-luz, lo suficientemente pequeño para eliminar la
paradoja. El que Newton y sus contemporáneos no dieran importancia alguna a tal posibilidad
nos confirma la poca fe que tenían en la “fecha oficial” de la Creación dada por la Iglesia.

La primera persona en plantear la paradoja en una forma en la que Olbers lo haría


posteriormente fue el astrónomo Jean-Philippe Loys de Chésaux, quien la solucionó
introduciendo la hipótesis de que la luz era absorbida por el espacio vacío, explicación que fue
considerada también por el mismo Olbers que supuso la existencia de algún tipo de materia
situada entre las estrellas capaz de absorber la luz. Sin embargo Olbers, quien obviamente no
era un experto en el área de la termodinámica, no se dió cuenta de que la materia interestelar
propuesta por él se calentaría a causa de la luz absorbida y terminaría radiando tanta energía
como la que estaba recibiendo, con lo cual el problema seguía igual que antes.

La primera explicación en acercarse a la realidad provino no de algún astrónomo profesional


sino de un escritor norteamericano, Edgar Allan Poe, el cual era también un científico amateur,
y el cual publicó en febrero de 1848 un ensayo titulado Eureka en el que dió la siguiente
explicación a los vacíos obscuros entre las estrellas:
“Podríamos comprender los vacíos que nuestros telescopios encuentran en innumerables
direcciones suponiendo que la distancia hasta el fondo invisible es tan inmensa que ningún rayo
de luz procedente de allí ha sido todavía capaz de alcanzarnos.”

Esta propuesta en realidad equivalía a dar al traste con la suposición de que el Universo ha
existido eternamente en el pasado, lo cual a su vez equivalía a dar al traste con la noción de un
Universo estático e inmutable, y lo cual equivalía a dar credibilidad a la propuesta de la misma
Biblia de que el Universo no ha existido por siempre en el pasado sino que fue de hecho el
resultado de un acto de proporciones colosales.

Como suele ocurrir en muchos casos, la enorme trascendencia de la propuesta hecha por Edgar
Allan Poe en su calidad de científico amateur, el cual murió antes de que se divulgara su
argumento, pasó desapercibida, pese a que la misma encerraba la clave para la resolución total
de la paradoja de Olbers, como tampoco hubo alguien que se percató de la trascendencia de la
idea cuando en 1907 el científico irlandés Fournier d’Albe escribió en un artículo:
“Si el mundo fue creado 100 mil años atrás, entonces la luz de los cuerpos que estuvieran
situados a más de 100 mil años luz no podría habernos alcanzado en el tiempo presente.”

Fournier d’Albe había tomado la idea de Lord Kelvin, quien publicó dicha idea en un volumen
de conferencias en 1904, siendo también ignorado hasta que Eduard Harrison, Profesor Emérito
de Física y Astronomía en la Universidad de Massachusetts nacido en Inglaterra, rescatara estos
antecedentes publicándolos en su libro Darkness at Nightpublicado en 1987. Resulta casi
increíble el comprobar que desde Newton hasta el mismo Einstein, pasando por los numerosos
hombres de ciencia que estuvieron al tanto de la paradoja de Olbers, ninguno de ellos se diera
cuenta cabal del hecho de que el cielo fuese tan obscuro se debía a que el Universo no era
infinitamente viejo. Hoy en día, aunque la paradoja de Olbers ya no es ninguna paradoja, el
hecho de contemplar un cielo nocturno en lugar de un cielo iluminado es una de las grandes
evidencias a favor de que tiempo atrás hubo un Big Bang que dió origen a la creación del
Universo en que vivimos.
Si en la métrica Friedman-Lemaître-Robertson-Walker el parámetro a va incrementando su
valor con el tiempo, como corresponde a un Universo en expansión, entonces la distancia entre
las galaxias va aumentando a la vez que se va creando espacio entre ellas, y en tal caso las
galaxias del Universo se estarán alejando de nosotros a una velocidad v dada por la siguiente
fórmula conocida como la ley de Hubble:

v = HR

en donde R es la distancia que nos separa de dicha galaxia y H es un parámetro definido por la
fórmula:

conocido como la constante de Hubble, aunque aquí la palabra “constante” es engañosa porque
de hecho H es algo que varía con el tiempo, aunque lo hace a una razón tal que en la escala del
tiempo humano la variación es insignificante.

En la creencia de que, haciendo la analogía que corresponde al hecho de que el efecto de toda
explosión va disminuyendo con la distancia y con el paso del tiempo, la expansión del Universo
se está decelerando, todavía hasta mediados de la década de los noventas se definía
un parámetro de deceleración de la siguiente manera:

que nos dice qué tanto se está decelerando la expansión del Universo (estrictamente hablando,
la fórmula también nos define qué tanto se está acelerando la expansión del Universo, aunque
todavía a fines del milenio anterior tal cosa no se consideraba posible). En términos de los
parámetros H y q, el par de ecuaciones dadas arriba toman la siguiente forma:
Gracias a los datos recabados por el telescopio espacial Hubble, hoy sabemos que la expansión
del Universo no solo no está “perdiendo vigor”, sino que por el contrario, la expansión del
Universo se está acelerando. Y para poder “ajustar” y explicar este descubrimiento dentro la
Relatividad General, hay prominentes investigadores que han estado proponiendo agregar a las
ecuaciones de campo de Einstein ¡una constante cosmológica Λ!, la misma constante
cosmológica que en su tiempo Einstein se vió orillado a abandonar llamándola “el mayor error
de mi carrera”. Lo cual nos puede servir como moraleja para demostrar que en la Ciencia no hay
“verdades” que se puedan considerar intocables, sólo hay teorías que en su momento pueden ser
muy populares como en su momento lo fue la teoría Newtoniana de la gravitación universal, y
que tiempo después pueden terminar en un aparador exhibidas como piezas de museo.

La noción de un Universo cerrado, finito, definido por el 3-espacio de una esfera (Ω0 mayor que
1 en el diagrama de arriba), es lo que conlleva la posibilidad de que si empezamos a viajar
estrictamente en línea recta hacia cualquier dirección partiendo desde cualquier punto del
Universo, después de cierto tiempo eventualmente regresaremos “por detrás” al mismo punto
desde donde partimos, el mismo punto desde el cual comenzó nuestra travesía. Esto puede dar
lugar a la especulación clásica de que si el Universo es finito, entonces tenemos una paradoja
porque un Universo que ocupa el volumen finito de una 3-esfera supuestamente debería tener
algo “afuera”:

Sin embargo, esta concepción es errada, porque la curvatura sobre la cual se puede encerrar el
espacio-tiempo del Universo sobre sí mismo corresponde a un espacio cuatri-dimensional,
no es un espacio-tiempo tri-dimensional. Y nosotros estamos confinados a vivir dentro de este
espacio cuatri-dimensional porque no contamos con los medios (ni con la teoría física o
matemática) para poder salir “fuera” de este espacio cuatri-dimensional.

Para quienes estén interesados en obtener información adicional sobre “las otras geometrías” de
las cuales casi nunca enseñan nada en las escuelas, las geometrías no-Euclideanas, está
colocado un trabajo en Español accesible bajo el siguiente enlace:

http://www.geometrias-no-euclideanas.blogspot.com

Cosmología relativista II
A continuación se llevará a cabo la derivación de la ecuación de Friedmann a partir de la métrica
para Friedmann un Universo homogéneo e isotrópico.

PROBLEMA: Derivar la ecuación de Friedmann a partir de la métrica para Friedmann un


Universo homogéneo e isotrópico.

De la métrica de Friedmann, podemos escribir los componentes del tensor


métrico gacomodados dentro de su matriz respectiva G:

De esta matriz diagonal, invirtiéndola, podemos obtener los componentes del tensor métrico
conjugado g-1 = (gαβ) que requerimos para poder subirle el índice a los símbolos de Christoffel de
primer género:

Si utilizamos la notación del punto puesto encima de una variable para denotar a la derivada
con respecto al tiempo de dicha variable, y si utilizamos una comilla para denotar a la derivada
de la variable con respecto a ρ, podemos obtener las derivadas parciales del tensor métrico que
son diferentes de cero, las cuales son:

Con las derivadas parciales ya obtenidas podemos proceder al cálculo de los símbolos de
Christoffel de primer género para la métrica de Friedmann:

A continuación convertimos los símbolos de Christoffel de primer género en símbolos de


Christoffel de segundo género utilizando para ello los componentes del tensor métrico
conjugado obtenidos arriba:
Con los símbolos de Christoffel en nuestras manos, el siguiente paso consistirá en evaluar los
componentes del tensor de Ricci R = (Rab) = (Rcacb):

Rab = Rcacb = Γcab,c - Γcac,b + Γeab Γcec - Γeac Γceb

con la finalidad de poder evaluar el tensor de curvatura de Einstein G y poder usar en ello las
ecuaciones de campo de la Relatividad General. Hay cuatro componentes del tensor de Ricci que
tienen que ser evaluado:

1) El componente tiempo, R00

2) El componente radial, R11

3) El componente θ, R22

4) El componente φ, R33

Evaluación de la componente del tiempo

La componente del tiempo se obtiene fijando a = b = o:

R00 = = Γc00,c - Γc0c,0 + Γe00 Γcec - Γe0c Γce0

El cálculo de los términos individuales es el siguiente:


Entonces la componente del tiempo para el tensor de Ricci será:

Evaluación de la componente radial

La componente del tiempo se obtiene fijando a = b = 1:

R11 = = Γc11,c - Γc1c,1 + Γe11 Γcec - Γe1c Γce1

El cálculo de los términos individuales es el siguiente:


Entonces la componente radial para el tensor de Ricci será:

Aquí es posible hacer una simplificación posterior notando que f-1f ” = -k:

Evaluación de la componente θ

La componente θ se obtiene fijando a = b = 2:

R22 = = Γc22,c - Γc2c,2 + Γe22 Γcec - Γe2c Γce2

El cálculo de los términos individuales es el siguiente:

Entonces la componente θ para el tensor de Ricci será:


Aquí es posible hacer una simplificación posterior notando que 1- (f ’ )² = kf² y que f ” = -kf:

Evaluación de la componente φ

La componente φ se obtiene fijando a = b = 3:

R33 = = Γc33,c - Γc3c,3 + Γe33 Γcec - Γe3c Γce3

El cálculo de los términos individuales es el siguiente:

Entonces la componente φ para el tensor de Ricci será:

Aquí es posible hacer una simplificación posterior notando que (f ’ )² = 1 - kf² y que f ” = -kf:
El escalar de Ricci se obtiene mediante la contracción del tensor de Ricci con el tensor métrico, o
sea:

R = gab Rab

Aplicando la convención de sumación sobre los índices repetidos (una doble sumación en este
caso) y formando la suma de los cuatro términos resultantes tenemos entonces que el escalar de
curvatura de Ricci es:

Con el escalar de Ricci R y el tensor de Ricci Rab podemos calcular el componente 00 del tensor
de curvatura de Einstein G00:

G00 = g0ag0bRab - g00R/2

G00 = R11 - R/2

Introduciendo los resultados previos:

Ahora utilizamos un postulado propuesto por Weyl que nos dice que el comportamiento
promedio neto para las galaxias es el de un fluido perfecto, con lo cual podemos tomar el tensor
energía-impulso como:
De este modo, la ecuación de campo de Einstein:

G = 8GπT

Gab - Λgab = 8GπTab

evaluada para el componente ab = 00:

G00 - Λg00 = 8GπT00

nos produce lo siguiente:

Esto último es precisamente la ecuación de Friedmann.

Las escalas de Planck


Aunque una suposición matemática esencial grabada en las ecuaciones de campo de la
Relatividad General es que el espacio y el tiempo pueden ser subdivididos hasta el infinito, la
naturaleza cuántica de la materia nos impone otra realidad de la cual posiblemente ya desde
1899 se había percatado el científico alemán Max Planck cuando introdujo su propuesta para el
uso de un nuevo sistema de unidades conocidas como unidades naturales, unidades de
medición diseñadas de modo tal que ciertas constantes físicas fundamentales sean utilizadas
como unidades fundamentales en lugar de las unidades convencionales para longitud, masa y
tiempo creadas arbitrariamente por el hombre. Hablaremos primero un poco acerca de estas
unidades.

Para fines de simplificacion de calculos en los trabajos cientificos relacionados con la fisica y la
quimica, Planck propuso un nuevo sistema de unidades basado no en el sistema convencional
del metro-kilogramo-segundo (MKS) o del centímetro-gramo-segundo (CGS) del sistema
internacional SI de unidades, sino en un nuevo sistema de unidades basado las tres principales
constantes físicas, creando así lo que llamó un sistema de unidades naturales (por estar basado
en constantes físicas de la naturaleza y no en estándares arbitrarios sin base física como el
metro, el kilogramo y el segundo). Planck argumentó que este sistema de unidades naturales
permanecería igual siempre y cuando la ley de la gravedad (dependiente de la constante de
gravitación universal G), la velocidad de la luz en el vacío c, y los principios de la
termodinámica, permanecieran invariables. Las unidades naturales de Planck suelen ser
llamadas (en broma) entre los físicos como “las unidades de Dios” porque al depender de
constantes físicas su uso elimina las arbitrariedades antropocéntricas en el sistema de unidades.

Planck enlistó su sistema de unidades “naturales” dándoles valores curiosamente cercanos a los
que utilizamos hoy en la actualidad, en un trabajo presentado en mayo de 1899 a la Academia
Prusiana de Ciencias bajo el título “Über irreversible Strahlungsvorgänge” aparecido en el
volumen 5 de la publicación periódica Sitzungsberichte der Preußischen Akademie der
Wissenschaften. Es importante señalar que al momento de presentar Planck su propuesta la
Mecánica Cuántica aún no se había inventado, y el mismo aún no había descubierto, la teoría de
la radiación térmica del cuerpo negro (esta sería publicada hasta diciembre de 1900) en donde la
constante h hizo su aparición por vez primera y por la cual Planck fue galardonado con el
premio Nobel. Tampoco había hecho su aparición la Teoría General de la Relatividad, ni
siquiera la Teoría Especial de la Relatividad, y mucho menos se sabía de lo que pudiera ser un
agujero negro.

La parte relevante del trabajo (en lo que concierne a las unidades naturales propuestas por
Planck) presentado por Planck en 1899 nos dejan alguna confusión sobre cómo pudo concebir
sus unidades de longitud, masa, tiempo, temperatura, etc., que el día de hoy definimos
utilizando la constante h-barra (la constante de Planck dividida entre 2π conocida también
como la constante reducida de Planck) y que son motivadas hoy recurriendo a referencias en la
Física Cuántica, en una época en la que no se conocían ni la constante h-barra ni la Física
Cuántica. Es interesante notar también que en su trabajo Planck hace referencia a la posibilidad
de civilizaciones extraterrestres al asentar en el mismo lo siguiente acerca de sus unidades
naturales:
“Bedeutung für alle Zeiten und für alle, auch ausserirdische und ausser menschliche
Culturen nothwendig behalten und welche daher als ‘natürliche Maasseinheiten’
bezeichnet werden können.”
“...Estas necesariamente retienen su significado para todos los tiempos y para todas las
civilizaciones, inclusive extraterrestres y no-humanoides, y por lo tanto pueden ser
designadas como ‘unidades naturales’...”
De hecho Planck propuso no tres sino cinco unidades naturales, agregando la carga eléctrica y la
temperatura (esta última a través de la constante de Boltzmann) a las unidades de longitud,
masa y tiempo.

En lugar de seguir la línea de argumentación original dada por Planck para justificar su sistema
de unidades naturales (cargado de razonamientos que muestran su dominio del
electromagnetismo y la termodinámica), seguiremos aquí un enfoque más moderno que
ciertamente nos resultará más claro.

Para que la gravedad pueda estar acoplada con la materia se requiere una constante de
acoplamiento G, la constante de gravitación universal, la cual tiene unidades de longitud sobre
masa. Al considerar la atracción gravitatoria entre dos cuerpos, si uno permite que la Mecánica
Cuántica entre en el panorama uno eventualmente se topará con lo que llamamos escala de
Planck. Para ello, considérese primero una partícula cuántica que posee cierta masa en
reposo m0 y que posee otra propiedad física que llamamos la longitud de onda Compton λ,
estando dada la relación entre ambas por la constante de Planck h:

PROBLEMA: Hallar la longitud de onda Compton para un electrón (cuya masa en reposo es
0.511 Mev).

Teniendo la masa en reposo como dato dado, para fines de cálculo resulta conveniente reescribir
la relación de la longitud de onda Compton de la manera siguiente:
La cantidad hc que aparece en el numerador es una cantidad tan utilizada que vale la pena
asignarle de antemano su valor numérico:

hc = (4.136·10-15 eV·segundo)(3·108 metros/segundo)

hc = 1.24·10-6 eV·metro

hc = 1.24·104 eV·Å

Para el electrón su longitud de onda Compton será:

λ = hc/m0c² = (1.24·104 eV·Å)/(0.511 MeV)

λ = 0.0243 Å

PROBLEMA: Hallar la longitud de onda Compton para un protón (cuya masa en reposo es
938.3 Mev).

Procedemos de manera idéntica a como lo hicimos en el problema anterior:

λ = hc/m0c² = (1.24·104 eV·Å)/(938.3 MeV)

λ = 1.32·10-5 Å

Dando por hecho que cada partícula atómica sea capaz de ejercer una atracción gravitacional
sobre otra, debemos contender con el hecho de que nuestros conocimientos actuales del mundo
sub-atómico nos indican que es imposible fijar con absoluta certeza a cualquier partícula
atómica si se considera a dicha partícula como formada por un paquete de onda. Esto es lo que
nos dice la Mecánica Cuántica Ondulatoria, a esto es a lo que nos lleva el aspecto ondulatorio de
la materia confirmado por numerosos experimentos. Podemos medir la probabilidad de que la
partícula atómica se encuentre dentro de cierta región, pero su localización exacta nos será
incierta, y esa probabilidad podrá tener una distribución estadística Gaussiana para una sola
partícula. Supondremos que la mayor parte de la onda está confinada precisamente dentro de lo
que viene siendo la longitud de onda Compton de la partícula.
A continuación considérese que una partícula pueda ser localizada en el espacio tanto como sea
posible tomando en cuenta su naturaleza ondulatoria, quedando definido su “alcance” por su
longitud de onda Compton (para el paquete de onda mostrado, podemos suponer que la
partícula está localizada entre -5 y +5 unidades en el diagrama, con lo cual su longitud de onda
Compton sería igual a 10 unidades, siendo esta una onda que se propaga de izquierda a
derecha):

En otras palabras, estamos considerando a una partícula con masa m0 localizada dentro de
cierta región del espacio-tiempo con una “longitud de alcance” dada por la longitud de onda
Compton de la partícula. Podemos ver de la fórmula que entre mayor sea la masa en
reposo m0 de la partícula, tanto menor será su longitud de onda λ. La longitud de onda Compton
(y por ende la incertidumbre de la posición que ocupa una partícula en el espacio-tiempo) se va
haciendo más y más pequeña conforme va aumentando la cantidad de masa.

Teniendo lo anterior en mente, si tenemos a dos electrones situados a cierta distancia el uno del

otro, los podemos representar como dos “paquetes de onda” que ejercen entre sí una
atracción gravitacional:

Hasta aquí podemos reconciliar a la Relatividad General con la naturaleza cuántica de la


materia, mientras los electrones no estén “lo suficientemente juntos”. El problema se nos viene
encima cuando intentamos juntar a las dos “ondas de materia” dentro de su longitud de onda
Compton de modo tal que las regiones de probabilidad que representan la posicion de cada
partícula se van traslapando una con otra:

porque en este caso, ¿qué exactamente es lo que está ejerciendo una atracción gravitacional
sobre qué? ¿Se trata acaso de una probabilidad ejerciendo una atracción sobre otra? ¿Y qué
gravedad puede haber entre dos partículas cuando ambas están completamente traslapadas?
¿Pierden acaso su identidad? Esta situación hipotética de tratar de juntar dos electrones dentro
de una región de extensión igual a la de su longitud de Compton se antoja inverosímil porque
para poder lograr tal cosa ambos tendría que ocupar, considerados como partículas puntuales,
el mismo lugar en el espacio. La única forma de “casi” lograrlo sería revocando la hipótesis de
que cada electrón se extiende hasta una distancia igual a su longitud de Compton, suponiendo
ahora que cada electrón puede ser confinado a distancias mucho menores que su longitud de
Compton. Sin embargo, esto tiene un límite. Sabemos de la Relatividad General que si
empujamos a cualquier cantidad fija de materia hacia una región más y más pequeña,
eventualmente esta se convertirá en un agujero negro, para lo cual debemos tomar en cuenta el
radio de Schwarzschild para el horizonte de evento de un agujero negro que es rs = 2GM/c².

En el ejemplo mostrado, afortunadamente entra en acción la fuerza repulsiva eléctrica entre los
dos electrones sobreponiéndose por vasto margen a la influencia gravitacional que pueda ejercer
el uno sobre el otro. Pero tratándose de dos partículas como lo son los neutrones, sin carga
eléctrica que los haga repelerse mutuamente, la interrogante se nos viene nuevamente encima.

Aunque alguna vez se propuso la posibilidad de que las partículas sub-atómicas como el
electrón, siendo singularidades en la métrica del espacio tiempo g, pudiesen ser agujeros negros,
unos cálculos elementales descartan tal posibilidad. De acuerdo con la métrica de
Schwarzschild, para el Sol obtenemos un radio de Schwarzschild r s = 2GM/c² de
aproximadamente unos 3 kilómetros, bastante al interior del Sol, razón por la cual al Sol no se le
considera un agujero negro ya que para ser un agujero negro tendría que tener toda su masa
situada dentro de este radio. Para el Sol, su tamaño mecánico-cuántico, su longitud de onda
Compton, es esencialmente cero (no hay mucha incertidumbre sobre la posición en la cual el sol
está localizado dentro del sistema solar), pero para el electrón ya vimos arriba que su longitud
de onda Compton es de λ ≈ 2.43·10−12 metros. Por otro lado, poniendo números, para un
electrón su radio de Schwarzschild rs resulta ser igual a 1.35·10−51metros, una distancia
ciertamente mucho menor que su longitud de onda Compton de 2.43·10−12 metros. Aunque para
un electrón su longitud de onda Compton es una distancia muy pequeña, ciertamente es mucho
mayor que su radio de Schwarzschild, de modo tal que desde la perspectiva de la Mecánica
Cuántica la mayor parte del electrón está situada fuera de su horizonte de evento. Esta es la
razón del por qué a las partículas sub-atómicas, aunque se les considere singularidades en el
entramado de espacio-tiempo del Universo, no se les considera que sean agujeros negros.

De los límites que tenemos para el posible “tamaño” del electrón, por el lado máximo
2.43·10−12 metros y por el lado mínimo 1.35·10−51 metros, es natural que despierte en nosotros la
sospecha de que pueda haber un tamaño “intermedio” entre estos dos valores, no solo para el
electrón sino para cualquier otra partícula, en el cual la Relatividad General y la Mecánica
Cuántica se confronten cara a cara. Puesto que el límite máximo representa una condición de la
Mecánica Cuántica y el límite mínimo representa una condición de la Relatividad General, esto
supondría que la Relatividad General sigue siendo válida a escalas de distancia mucho menores
que las distancias en las cuales la Mecánica Cuántica ya está firmemente en control, lo cual no es
creíble. La búsqueda de una longitud intermedia en la cual la Relatividad General empieza a
verse en aprietos al mostrar la Mecánica Cuántica sus efectos nos lleva a la búsqueda de
una longitud crítica que posiblemente pueda ser derivada a partir de constantes físicas
fundamentales, tales como la constante de la gravitación universal representando a la
Relatividad General, y la constante de Planck representando a la Mecánica Cuántica. Y resulta
que las unidades naturales propuestas por Planck, aunque creadas no quizá con esta intención
en mente, son precisamente las que cumplen con este objetivo. Para poder seguir adelante,
necesitamos fijarnos un criterio que nos sirva de guía. Tal vez el criterio más obvio sea aquél
bajo el cual queremos determinar una masa crítica que corresponda a la longitud crítica que
estamos buscando, definiéndola como aquella masa para la cual su radio de de Schwarzschild
sea del mismo tamaño que su longitud de onda Compton. Este criterio ciertamente pone cara a
cara a la Relatividad General con la Mecánica Cuántica. Usando este criterio como guía,
podemos definir lo que hoy se conoce como la masa de Planck dada por la fórmula:
y cuyos valores calculados, tanto en unidades de masa convencionales en el sistema de unidades
MKS como en su equivalente energético de acuerdo con la relación E = mc² para masa-energía,
usando las mediciones que hoy se tienen para las constantes físicas, resultan ser (en la página
480 de su trabajo, Planck obtiene 5.56·10-5 gramos):

mp = 2.17644·10-8 Kilogramos

mp = 1.220862·1019GeV/c²

Es importante notar que Planck lo que buscaba era definir una longitud universal a partir de
constantes físicas universales, mientras que lo que nosotros buscamos es definir una masa tal
que esta masa sea la masa que una partícula debe tener para que su radio de Schwarzschild sea
del mismo tamaño que su longitud de onda Compton. Y resulta que ambos criterios
conducen a la misma conclusión para el mismo orden de magnitud.

PROBLEMA: Usando la aproximación de la fórmula para el radio de Schwarzschild


(prescindiendo de la constante numérica 2) y la longitud de onda Compton, obtener la fórmula
para la masa de Planck.

La extensión del radio de Schwarzschild es aproximadamente (prescindiendo de la constante


numérica 2, lo cual es una práctica usual cuando lo que se busca son estimaciones del orden de
magnitud y no los valores precisos de una cantidad) del orden de :

GM/c²

Igualando esta cantidad con la longitud de onda Compton mp, obtenemos la relación
aproximada para la masa de Planck que se dá en los textos:

Gmp/c² ≈ h/mpc

mp² ≈ hc/G

mp ≈ √hc/G

Planck obtuvo su fórmula por una cadena de razonamientos diferentes a los que hemos utilizado
(en su tiempo no existía la Relatividad General, no había definición alguna del radio de
Schwarzschild, y mucho menos se concebía la posibilidad de que pudiese haber agujeros
negros), y pese a ello el haber obtenido la misma fórmula obtenida por Planck nos hace
sospechar que no se trata de una mera casualidad.

Una vez que tenemos una fórmula para la masa de Planck, podemos intentar obtener una
expresión correspondiente para la longitud de Planck, definiéndola como aquella longitud
que para cierta masa su radio de Schwarzschild y su longitud de onda Compton tendrán los
mismos valores. Esto nos conduce a la siguiente fórmula:

y cuyo valor usando las mediciones que hoy se tienen para las constantes físicas resulta ser (en
la página 480 de su trabajo, Planck obtiene 4.13·10-33 centímetros):

lp = 1.616252·10-35 metros ≈ 1.6·10-35 metros

Obsérvese que, por la forma en la que está definida la longitud de Planck, no aparecen
constantes de proporcionalidad, ya que las constantes físicas forma una parte integral de la
definición.

PROBLEMA: A partir de la relación para la masa de Planck, obténgase la relación respectiva


para la longitud de Planck.

La longitud de onda de Compton está dada por la relación:

λ = h/m0c = hc/m0c²

Por otro lado, la masa de Planck está dada por la relación:

mp = √hc/G

Haciendo mp = m0 y definiendo lp = λ, obtenemos de las dos relaciones anteriores:

lp = hc/[(√hc/G) c²]

que una vez simplificado nos conduce a la longitud de Planck.


Lo primero que destaca de la longitud de Planck, 1.6·10-35 metros, es que esta longitud está
situada precisamente entre lo que vimos que era la longitud de onda Compton y el radio de
Schwarzschild para un electrón. Pero esta longitud fue obtenida sin hacer referencia a ninguna
partícula en especial. Es una longitud universal del orden sub-atómico. Esta distancia es
de una importancia tal que se tendrá que decir algo más sobre ella antes de dar por concluída
esta entrada.

Teniendo ya una unidad natural para la masa y otra unidad natural para la longitud en la escala
de Planck, solo nos falta determinar una unidad natural para el tiempo, siendo esta unidad un
tiempo que se conoce como el tiempo de Planck, el cual se define universalmente como igual
a la longitud de Planck dividida entre la velocidad de la luz, lo cual nos conduce a la fórmula:

cuyo valor calculado resulta ser (en la página 480 de su trabajo, Planck obtiene 1.38·10 -
43segundos):

tp = 5.39124·10-44 segundos

Hoy se cree que el tiempo de Planck es el momento más temprano en la historia del Universo
en el cual aún trabaja nuestra física teórica. También es el intervalo de tiempo más corto de
tiempo que nos será posible medir en el laboratorio con nuestros conocimientos actuales de
física, y aquí nos estamos refiriendo al aspecto teórico ya que en el aspecto práctico se antoja
casi imposible el poder llegar a tanta precisión).

De este modo, las tres unidades fundamentales en la escala de Planck, la longitud Planck,
la masa Planck y el tiempo Planck, son el símil de las unidades de metro-kilogramo-segundo en
el sistema internacional SI de unidades MKS.

Además de las unidades naturales ya mencionadas, tenemos la unidad fundamental para


la carga eléctrica de Planck que hoy en día evaluamos como:

y cuyo valor calculado resulta ser:


qp = 1.875545·10-18 coulombs

Por último, la quinta unidad natural propuesta por Planck, la unidad fundamental para
la temperatura de Planck que hoy en día evaluamos como:

y cuyo valor calculado resulta ser (en la página 480 de su trabajo, Planck obtiene 3.5·1032grados
Celsius):

Tp = 1.4167·1032 °K

A partir de las unidades naturales de Planck, podemos recuperar las tres principales constantes
fisicas fundamentales en el sistema MKS del modo siguiente:

Velocidad de la luz = c = lp /tp

c = 1.616252·10-35 metros / 5.39124·10-44 segundos

c = 299,758,857.4

Constante de gravitación universal = G = (lp)3/[mp (tp)²]

G = (1.616252·10-35)3 /[(2.17644·10-8) (5.39124·10-44)²]

G = 0.06673·10-9

G = 6.673·10-11 m3 / kg· seg²

Constante de Planck/2π = hbarra = h = (lp)²mp /tp

h = (1.616252·10-35)² (2.17644·10-8 ) /5.39124·10-44

h = 1.054571628·10-34 joule·segundo
Se añade aquí como tema de interés que a partir de las unidades de Planck arriba citadas se
pueden obtener unidades derivadas de Planck, tales como el área de Planck:

cuyo valor resulta ser:

l²p = 2.61223·10−70 metros²

o como el volumen de Planck:

cuyo valor resulta ser:

l3p = 4.22419·10−105 metros3

Del mismo modo obtenemos el momentum de Planck:

con un valor de:

mpc = 6.52485 Kg·metro /seg

y la energía de Planck:

con un valor de:

Ep = 1.9561·109 joules
Planck no sólo propuso que se adoptasen tres constantes físicas fundamentales (la constante de
la gravitación universal G, la velocidad de la luz y la constante de Boltzmann) como base de un
nuevo sistema de unidades naturales. También propuso que, para fines de simplificación en los
desarrollos demostrativos, se les diese a todas estas constantes físicas fundamentales el valor
arbitrario de 1 eliminando con ello las constantes de proporcionalidad, anticipando de este
modo las unidades geometrizadas que se utilizan en la Relatividad General al darle a la
velocidad de la luz el valor de 1 metro por segundo. Dándoles a la constante de gravitación
universal G, a la velocidad de la luz c, a la constante de Planck y a la constante de Boltzmann k el
valor adimensional de 1:

G=c=h=k=1

entonces de inmediato tenemos que tanto la longitud de Planck, la masa de Planck, el tiempo de
Planck, y la temperatura de Planck son todas iguales a la unidad:

lp = mp = tp = Tp = 1

Sobre este asunto, se puede decir que aunque se trate de un truco matemáticamente aceptable
que puede que ahorre algo de trabajo y esfuerzos, a la postre se puede traducir en una pérdida
de información conviritiéndose en la causa de una enorme confusión, sobre todo para aquellos
que están disciplinados a trabajar desde el principo hasta el final en la resolución de problemas
siguiendo dimensionalmente el orden de todas las unidades y las constantes de
proporcionalidad.

Desde el aspecto positivo, el uso de las unidades naturales tal y como fueron propuestas por
Planck trae consigo varias ventajas. La primera y más obvia es que simplifica mucho la
estructura de las ecuaciones físicas porque elimina las constantes de proporcionalidad y hace
que los resultados de las ecuaciones no dependan del valor de las constantes. También permite
evitar bastantes problemas de redondeo, sobre todo en computación. Por otra parte, se pueden
comparar mucho más fácilmente las magnitudes de distintas unidades. Por ejemplo, dos
protones se rechazan porque la repulsión electromagnética es mucho más fuerte que la atracción
gravitatoria entre ellos. Esto se puede comprobar al ver que los protones tienen una carga
aproximadamente igual a una unidad natural de carga, pero su masa es mucho menor que la
unidad natural de masa. Desafortunadamente, las unidades naturales tienen el inconveniente de
que al usarlas es más difícil percatarse de los errores dimensionales.
Retomaremos ahora la longitud de Planck que como vimos arriba es igual a:

lp ≈ 1.6·10-35 metros

Aún suponiendo que sea posible comprimir dimensionalmente un electrón por debajo de su
longitud de onda Compton de 2.43·10−12 metros, no será posible comprimirlo debajo de la
longitud de Planck lp porque terminaría convirtiéndose en un agujero negro dejando de existir
como electrón. Del mismo modo, regresando al caso de las dos partículas que están siendo
aproximadas la una a la otra, si la longitud de Compton no fuese un obstáculo la longitud de
Planck sí lo sería, y en este caso estamos hablando de un obstáculo insalvable:

A distancias comparables con la longitud de Planck, se cree que están sucediendo cosas muy
curiosas que rebasan ampliamente los límites de nuestra imaginación. A diferencia de la
filosofía reduccionista que propone que lo más complejo está elaborado -axiomáticamente- a
partir de lo más elemental, lo que está sucediendo en la escala de Planck no parece tener nada
de elemental o sencillo. Se cree que a esta escala la continuidad del espacio-tiempo en vez de ir
marchando sincronizadamente al parejo con lo que vemos en el macrocosmos de hecho stá
variando a grado tal que a nivel ultra-microscópico el tiempo no sólo avanza o se detiene
aleatoriamente sino inclusive marcha hacia atrás, una especie de verdadera máquina del
tiempo. Las limitaciones de nuestros conocimientos sobre las rarezas que puedan estar
ocurriendo en esta escala en el orden de los 10-35 metros, la longitud de Planck, ha llevado a la
proposición de modelos tan imaginativos y tan exóticos como la teoría de la espuma
cuántica que supuestamente veríamos aún en la ausencia de materia-energía si fuésemos
ampliando sucesivamente una porción del espacio-tiempo plano:
Naturalmente, a niveles ultramicroscópicos no podemos hablar de la ausencia total de materia-
energía debido a las fluctuaciones del vacío predichas por la Mecánica Cuántica que permiten
que en todos los ámbitos del Universo estén apareciendo partículas virtuales salidas de la nada
que van desapareciendo tan rápidamente como se van creando. La imagen de una “espuma
cuántica”, propuesta inicialmente en 1955 por John Archibald Wheeler para describir
cualitativamente las turbulencias que se supone ocurren en el espacio-tiempo sub-atómico a
distancias pequeñas del orden de la longitud de Planck, han sido avaladas por físicos de la talla
de Roger Penrose en su libro The Road to Reality:
Estas turbulencias que en realidad son turbulencias en la fábrica del Universo, turbulencias en
el espacio-tiempo y en la materia-energía que llegan a confundirse en los niveles ultra-
microscópicos, supuestamente pueden aflorar y se pueden conectar y desconectar entre sí
superando incluso lo que ocurre con la espuma de las olas del mar:

aunque todas estas descripciones reflejan más una abundante imaginación que un hecho
existencial apoyado teóricamente con alguna hipótesis que pueda ser comprobada en el
laboratorio sobre hechos que están más allá de poder ser medidos jamás en algún laboratorio
construído por humanos. La única forma de confrontar la factibilidad o la posibilidad del
modelo de la espuma cuántica nos lleva necesariamente a confrontar la carencia de un modelo
que logre unificar exitosamente al macrocosmos con el microcosmos, a la Relatividad General
con la Mecánica Cuántica, la Gravedad Cuántica. Si la energía y la materia (o mejor dicho la
masa-energía) están discretizadas, se supone que también deben de estarlo el espacio y el
tiempo (o mejor dicho, el espacio-tiempo), y la “partícula fundamental” del espacio-tiempo debe
de serlo el gravitón, aunque de momento todo esto son especulaciones que seguirán siéndolo
mientras no tengamos a la mano algo que pueda confirmar la existencia de tan exótica partícula,
quizá la más exótica de cuantas hayan sido concebidas por la imaginación del hombre.

La longitud de onda del gravitón (si es que existe) estaría dada esencialmente por la misma
fórmula para la longitud de onda Compton que ya vimos anteriormente:
y el radio del gravitón bosón a su vez estaría dado por la relación:

Pero estas dimensiones hasta la fecha siguen siendo conjeturas, ya que no hay laboratorio en el
mundo que sea capaz de poder medirlas.

Las escalas de Planck nos indican el límite en el cual las propiedades cuánticas de cualquier
partícula producirán una perturbación significativa en la métrica del espacio-tiempo,
precisamente el límite en el cual nos tenemos que preocupar por reconciliar la Relatividad
General con la Mecánica Cuántica. En comparación con las elevadas energías que pueden ser
alcanzadas con el Gran Colisionador de Hadrones (Large Hadron Collider ó LHC), la masa
de Planck de

mp = 1.220862·1019GeV/c²

es enorme, reflejando el hecho de que la fuerza gravitatoria entre las partículas elementales es
muy débil en comparación con las otras fuerzas del orden atómico que conocemos, y esto es lo
que hace improbable que alguna vez podamos observar experimentalmente los efectos de la
gravedad cuántica, máxime que la única ocasión en la que se han de haber producido tales
energías en el Universo fue cuando el mismo Universo nació en medio de una gran explosión.

El papel original de Planck

El documento con el cual Max Planck introdujo sus escalas (él no las llamó “escalas de Planck”)
que proféticamente anticiparon varias de las limitaciones en las cuales actualmente se encuentra
atorado el alcance de nuestros conocimientos se encuentra disponible, en alemán, en el
siguiente enlace:

http://bibliothek.bbaw.de/bibliothek-
digital/digitalequellen/schriften/anzeige/index_html?band=10-sitz/1899-1&seite:int=454

Axiomatización de la Teoría Relativista


Toda ciencia que se digne de serlo está fundamentada sobre una serie
de axiomas o postulados que se admiten como verdades incuestionables, puntos de partida
que no pueden ser obtenidos de otros axiomas o postulados más sencillos. Así, la Mecánica
Cuántica Ondulatoria está basada en la ecuación de onda de Schrödinger que no puede ser
derivada de otros principios más elementales, y la validez de la misma depende del éxito que
tenga para poder predecir cuantitativamente (poniendo números) resultados experimentales
obtenidos en el laboratorio. Einstein era partidario de la idea de que todos los principios de la
física, al igual que los axiomas de la geometría de Euclides, debían poder ser deducidos con el
solo recurso del pensamiento sin necesidad de tener que recurrir a experimento alguno en un
laboratorio, sin lugar a dudas alentado por su éxito en haber derivado toda la Teoría Especial de
la Relatividad partiendo de dos postulados salidos de su propia mente años antes de que se
obtuvieran las primeras confirmaciones experimentales de dicha teoría, éxito repetido con la
formulación matemática de la Teoría General de la Relatividad sin contar con instrumento
alguno de laboratorio para guiarle en la formulación de la teoría. Cuando en alguna ocasión se le
preguntó a Einstein en dónde tenía ubicado su laboratorio, sacó su bolígrafo y apuntando hacia
dicho bolígrafo dijo simplemente “Aquí”. Con tal manera de pensar, era de esperarse que desde
los inicios de la Teoría de la Relatividad una de las primeras preocupaciones de Einstein fuese el
fundamentar la nueva teoría sobre una estructura sólida que semejase lo más posible la
estructura de una teoría matemática convencional, axiomatizando a la Teoría de la Relatividad
al igual que como lo hiciera Euclides con su geometría, y el punto de lógico de partida para tal
programa era la misma base sobre la cual está fundamentada la mecánica clásica, sobre
principios variacionales. Ya vimos algo sobre una aplicación de los principios variacionales en
la entrada titulada “La ruta geodésica”. En el estudio de las geodésicas, para la obtención de la
curva extrema situada entre dos puntos en un espacio multi-dimensional Euclideano,
Lorentziano o curvo, se recurre a los métodos variacionales con los cuales se busca extremizar el
valor de una integral, buscando aquella integral que nos produzca un valor mínimo de la
variación δy con respecto a la ruta óptima. Aquí volveremos a retomar el mismo tema, pero con
un fin más ambicioso que encontrar la ruta extrema que recorrerá un cuerpo en un espacio-
tiempo curvo, y ese fin será precisamente intentar llevar a cabo la axiomatización de la Teoría de
la Relatividad.

El cálculo de variaciones aplicado a la física es usualmente justificado sobre la base de que la


Naturaleza actúa de modo tal que ciertas cantidades importantes parecen ser minimizadas
cuando tiene lugar un proceso físico. Esto lo tomamos como un postulado básico. De este modo,
un rayo de luz reflejado de una superficie siempre recorre el camino más corto, de lo cual con la
ayuda del cálculo infinitesimal se puede demostrar que el ángulo de reflexión debe ser igual al
ángulo de incidencia. En 1657 Pierre de Fermat reformuló y amplió este principio postulando
que un rayo luminoso siempre viaja de un punto a otro en un medio de modo tal que el camino
recorrido es el que le toma la menor cantidad posible de tiempo, lo cual podemos tomar
también como un postulado básico más amplio que el anterior. De este modo, Fermat pudo
obtener no sólo la ley de reflexión sino también la ley de refracción descubierta
experimentalmente por Willebrord Snell. La primera aplicación de un principio mínimo a la
mecánica se remonta a 1747 cuando Pierre-Louise-Moreau de Maupertuis afirmó que el
movimiento dinámico se lleva a cabo mediante un mínimo de acción o una acción mínima,
término que subsiste hasta nuestros días sin cambio alguno. El principio de acción
mínima de Maupertuis estaba basado no en argumentos matemáticos sino en argumentos
teológicos, habiendo asentado que la acción es minimizada “a través de la sabiduría de Dios”.
Fue hasta 1760 cuando dicho principio fue asentado sobre bases matemáticas firmes por
Lagrange, utilizando para ello las principales variables físicas de un sistema (la posición y la
velocidad) definiendo lo que vienen siendo los contenidos energéticos del sistema (la energía
potencial y la energía cinética).

El basar los fundamentos que estamos buscando para la Teoría de la Relatividad en la Mecánica
Lagrangiana tiene la enorme ventaja de que en la formulación de los principios básicos para
obtener las ecuaciones del movimiento de un sistema no aparece explícitamente fuerza alguna.
Esto es de importancia crucial para la Relatividad General porque dentro de la misma el
concepto Newtoniano de la fuerza de atracción universal entre dos cuerpos ha sido eliminado
por completo, y la única opción que nos queda es recurrir a eso que aún se sigue conservando
invariante dentro de la Teoría de la Relatividad, la energía. Así, para derivar expresiones dentro
de la dinámica relativista, la forma más “axiomática” de lograrlo es recurriendo a la mecánica
Lagrangiana y al Principio de la Acción Mínima que en realidad no es más que una forma
disfrazada de la aplicación del cálculo de variaciones a la física. Desde un principio, mucho antes
que se formulara la Teoría Especial de la Relatividad, la Mecánica Lagrangiana recurriendo a las
definiciones de la energía de un sistema (energía potencial, energía cinética, etc.) ya era superior
a la mecánica Newtoniana basada en la definición de fuerzas y aceleraciones cuando lo que se
trataba de lograr era la obtención de los sistemas de ecuaciones diferenciales que describen el
comportamiento físico de un sistema. El mismo sistema de ecuaciones diferenciales que se
obtienen para un sistema físico (por ejemplo tres masas pendulares conectadas con dos
resortes) se puede obtener de una manera mucho más rápida recurriendo a la mecánica
Lagrangiana que recurriendo a la mecánica Newtoniana ya que se prescinde por completo de la
necesidad de tener que andar estimando las fuerzas que hay dentro del sistema.

Correspondió a Sir William Rowan Hamilton darle su definición final a los postulados de
Lagrange formulando en dos papeles publicados en 1834 y 1835 lo que en la actualidad se
conoce como el principio de Hamilton que puede ser enunciado de la manera siguiente:
“De todos los caminos posibles a lo largo de los cuales se puede mover un sistema
físico de un punto a otro dentro de un intervalo especificado de tiempo, el camino
que será recorrido es aquél que minimiza la integral de tiempo de la diferencia
entre las energías cinética y potencial del sistema.”

Es importante no perder de vista aquí el hecho de que al hablar de los caminos posibles no
estamos hablando simplemente acerca de una distancia (medida en metros o centímetros) como
la trayectoria seguida de un punto a otro sobre la superficie de una esfera. Estamos hablando de
caminos en un sentido mucho más general, caminos en los que intervienen variables de
velocidad o inclusive de aceleración que nos vienen produciendo las ecuaciones de movimiento
de un sistema físico.

De este modo, cuando no basta la simple aplicación del cálculo infinitesimal para determinar un
mínimo o un máximo que corresponderá a la solución de cierto problema físico de dinámica
(como cuando se trata de obtener la ley de la reflexión de un haz luminoso o la ley de la
refracción), es aquí cuando entra en el panorama el cálculo de variaciones mediante el cual una
cantidad que se define como la integral de acción, o simplemente la acción, la cual es
simplemente la integral del Lagrangiano L que clásicamente podemos identificar de inicio
como la suma total de las expresiones de la energía cinética (K) de un sistema menos la suma
total de las expresiones de la energía potencial del sistema (U), tomada dentro de cierto
intervalo de tiempo:

∫ L dt

es sometida a una variación δ, proceso usualmente simbolizado de la siguiente manera:

δ ∫ L dt

y buscando la condición extrema en la cual obtengamos una solución estacionaria(principio


de la acción mínima):

δ ∫ L dt = 0

debemos poder obtener, en principio, toda la información fundamental que nos permita
describir el comportamiento del sistema.

De acuerdo con la definición dada arriba del principio de Hamilton, si tenemos a la mano el
Lagrangiano para un sistema entonces la expresión variacional del principio de Hamilton
usando coordenadas generalizadas qi es la siguiente:

en donde el punto arriba de la coordenada generalizada indica una derivada con respecto al
tiempo (en cooordenadas Cartesianas, esto viene siendo simplemente la velocidad). Una vez que
se ha logrado definir el Lagrangiano para un sistema físico, es un asunto directo encontrar con la
ayuda del cálculo de variaciones las ecuaciones del movimiento que corresponden al sistema
mediante las ecuaciones de Euler-Lagrange:

Compárese este sistema de ecuaciones con la ecuación de Euler obtenida en la entrada “La ruta
geodésica” para calcular la ecuación de la distancia más corta entre dos puntos (geodésica) sobre
una superficie:

Es así como las ecuaciones clásicas (diferenciales) del movimiento de un sistema pueden ser
derivadas del principio de la acción mínima con la ayuda de las ecuaciones de Euler-Lagrange.
Es así como toda la teoría del electromagnetismo de Maxwell puede ser derivada
axiomáticamente a partir de la siguiente acción:

en donde la integral es en realidad una integral cuádruple llevándose a cabo la integración sobre
cierto volumen de espacio tri-dimensional y el tiempo, y en donde F es el tensor
electromagnético ó tensor de Faraday. Del mismo modo, uno de mayores esfuerzos requeridos
para justificar los orígenes de la teorías modernas del campo cuántico se remiten a la búsqueda
del Lagrangiano con el cual se pueda derivar tal o cual serie de fórmulas. Es así como la teoría de
la Electrodinámica Cuántica (Quantum Electrodynamics o QED) tiene como punto de partida el
siguiente Lagrangiano ó densidad Lagrangiana (la “densidad” Lagrangiana viene siendo a fin
de cuentas lo mismo que un Lagrangiano ordinario, la única diferencia estriba en que el empleo
casi fanfarrón de la palabra “densidad” denota que la integración para la evaluación de la acción
se debe llevar a cabo sobre un espacio-tiempo cuatri-dimensional):

Y es así como la teoría de la Cromodinámica Cuántica (Quantum Chromodynamics o QCD)


tiene como punto de partida la siguiente densidad Lagrangiana:

La acción proporciona inclusive el punto de partida para el desarrollo de la moderna teoría de


las supercuerdas. Aunque no siempre es cosa fácil el lograr dar con el Lagrangiano que
requerimos para fundamentar una nueva teoría sobre el cálculo variacional, hoy en día este paso
es considerado como un paso indispensable para poder darle credibilidad y aceptación a toda
nueva teoría.

PROBLEMA: Se deja caer un cuerpo desde una altura de 64 pies, y dos segundos después
golpea contra el suelo. La distancia h recorrida por el cuerpo tras un tiempo t concebiblemente
podría tomar cualquiera de las siguientes tres formas:

h = gt_____h = gt²/2_____h = gt3/4

siendo g la aceleración de la gravedad sobre la superficie de la tierra (igual a 32 pies/seg² en


unidades del sistema inglés). Cualquiera de estas tres formas conduce a la misma respuesta de
h = 64 pies para t = 2 segundos. Demostrar que la forma correcta es la que corresponde a la
integral que dá un mínimo para la integral de acción de acuerdo con el principio de Hamilton.

Para resolver este problema, debemos calcular el valor de la integral I = ∫Ldt en cada uno de los
tres casos, y determinar cuál de dichas integrales es la que produce el valor mínimo.
El Lagrangiano clásico L es igual a la energía cinética K menos la energía potencial U (puesto
que al caer el cuerpo éste pierde energía potencial, el signo de la energía potencial será negativo
al momento de introducir las expresiones cinéticas y potencial en el Lagrangiano):

L=K-U

L = (½) mV² + mgh = (½) m(dh/dt)² + mgh

Para el primer caso, h = gt, el Lagrangiano es:

L = (½) m(g)² + mg(gt)

L = (½) mg² + mg²t

La integral de acción correspondiente es:

Para el segundo caso, h = gt²/2, el Lagrangiano es:

L = (½) m(gt)² + mg(gt²/2)

L = mg²t²

La integral de acción correspondiente es:

Por último, para el tercer caso, h = gt3/4, el Lagrangiano es:

L = (½) m(3gt²/4)² + mg(gt3/4)

L = 9mg²t4/32 + mg²t3/4

La integral de acción correspondiente es:


Podemos ver que de las tres integrales de acción la que tiene el valor mínimo es precisamente la
que corresponde a la respuesta clásica de la distancia h recorrida por un cuerpo en un tiempo t
cuando dicho cuerpo está en movimiento uniformemente acelerado, o sea la fórmula:

h = gt²/2

Esta misma fórmula se puede obtener de una manera más sencilla, sin recurrir al cálculo de
variaciones, haciendo consideraciones elementales sobre un movimiento uniformemente
acelerado a partir de la definición de la aceleración:

a = dv/dt

dv = adt

v = ∫a dt

dh/dt = ∫a dt

h = ∫ [ ∫a dt ] dt = ∫ [ ∫g dt ] dt = g ∫ [ ∫ dt ] dt

h = g ∫ [ t ] dt = g ∫ t dt

h = gt²/2

¿Entonces por qué razón habríamos de recurrir a algo más complejo y elaborado para obtener
un resultado al que se puede llegar de una manera mucho más sencilla? Una respuesta que se
puede dar aquí es que la forma “fácil” de obtener esta fórmula no está basada en un principio de
acción mínima y por lo tanto no es derivable como parte de un programa axiomático. Otra razón
que se puede dar es que, si bien en este caso ya se conoce de antemano la fórmula correcta de la
cual esperamos que se produzca la integral de acción mínima, en otros casos no sólo no
conocemos la fórmula sino que no hay más remedio que montar la integral y proceder a derivar
la ecuación del movimiento a partir del principio de Hamilton (uno de tales problemas es el
del braquistócrono que consiste en encontrar la ecuación de la curva a lo largo de la cual una
esferita que se mueve a lo largo de dicha curva sin fricción bajo la influencia de la gravedad
llegará de un punto a otro de la curva en el menor tiempo posible; y con la ayuda del cálculo de
variaciones encontramos sin mayores problemas que la curva resulta ser una cicloide).

Aunque la Teoría Especial de la Relatividad cuando se dió a conocer al mundo por vez primera
en 1905 fue fundamentada no sobre un principio variacional de acción mínima sino sobre dos
postulados (el abandono del concepto del movimiento absoluto y la adopción de la velocidad de
la luz como una constante universal que no depende del movimiento relativo de quien la mida),
la Teoría Especial de la Relatividad puede ser derivada axiomáticamente del principio de la
acción mínima usando para ello lo que se conoce como el Lagrangiano Relativista, lo cual
veremos a continuación.

Puesto que en la axiomatización de una gran cantidad de áreas de la física, sobre todo las áreas
nuevas, el Lagrangiano que se debe de utilizar como punto de partida es algo que se desconoce y
la mayor parte del esfuerzo de los investigadores será consumido en tratar de “adivinar” la
forma del Lagrangiano que se está buscando, en vez de empezar aquí de buenas a primeras con
la postulación del Lagrangiano Relativista derivando resultados del mismo lo que haremos será
analizar la manera en la cual podemos obtener el Lagrangiano Relativista, lo cual deberá servir
como guía para la obtención de otros Lagrangianos que se desconocen al tratar problemas de
naturaleza nueva.

Habiendo visto que el Principio de la Acción Mínima enuncia que para todo sistema mecánico
debe de haber una cantidad llamada la acción S, y que la variación δS de dicha cantidad debe
ser un mínimo para el comportamiento típico de un sistema, lo cual expresado en
términos variacionales implica buscar el cumplimiento de la condición:

δS = 0

entonces para ser de utilidad en el fin que estamos buscando la acción S de un sistema
relativista dentro del marco de la Teoría Especial de la Relatividad debe ser tal que esta sea una
magnitud escalar que como tal permanezca invariante bajo transformaciones de Lorentz, y debe
ser formulada como una integral que contenga como integrando un diferencial no mayor de
primer orden. La única invariante que cumple con estos dos requisitos es el intervalo relativista
espacio-tiempo ds entre dos eventos o un múltiplo escalar (multiplicado por una constante κ,
letra griega kappa) de dicha integral. La acción S debe tener por lo tanto el siguiente aspecto:

S = κ∫ds

El intervalo relativista espacio-tiempo infinitesimal ds podemos expresarlo como:

ds = √ c²dt² - dx² - dy² - dz²

Sacando fuera cdt de la raíz cuadrada, y haciendo uso del hecho de que la magnitud instantánea
de la velocidad v expresada en tres dimensiones en el espacio Cartesiano es:

tenemos entonces lo siguiente:

ds = (cdt) √1 - v²/c²

con lo cual:

S = cκ∫ √1 - v²/c² dt

La integral de acción puede ser expresada como una integral de tiempo del Lagrangiano Lentre
dos tiempos fijos t1 y t2:

S = ∫ Ldt

De aquí podemos leer el Lagrangiano relativista simplemente como:

L = cκ √1 - v²/c²

Para bajas velocidades, el Lagrangiano relativista L de un cuerpo moviéndose a una velocidad v


debe reducirse al Lagrangiano clásico que no es más que la expresión para la energía cinética del
cuerpo:

L = ½ mv²
Para comparar el Lagrangiano clásico L con el Lagrangiano relativista L, podemos llevar a cabo
una expansión binomial del término bajo la raíz cuadrada mediante una serie de Taylor:

en donde o(v²) representa “los otros términos” residuales de la expansión binomial que pueden
considerarse despreciables para los cálculos numéricos a bajas velocidades.

El primer término en esta expansión, cκ, es una constante, y por lo tanto no tendrá efecto alguno
en las ecuaciones del movimiento. El segundo término, después de llevar a cabo la
multiplicación y la simplificación, es:

(cκ) (- v²/2c²) = - kv²/2c

Comparando ambas L y L, la única manera en la cual el Lagrangiano relativista se pueda reducir


al Lagrangiano clásico para bajas velocidades es haciendo κ = -m0c.

Se deduce, por lo tanto, que el Lagrangiano relativista dentro del marco de la Teoría
Especial de la Relatividad debe ser:

L = - m0c²√1 - v²/c²

Cuando hay una energía potencial U de por medio además de la energía relativista identificada
por el Lagrangiano, entonces acorde con la definición clásica del Lagrangiano la definición que
acabamos de obtener se modifica de la manera siguiente:

L = - m0c²√1 - v²/c² - U

Obsérvese cuidadosamente que este Lagrangiano no está dado por L = K - U, puesto que la
expresión relativista para la energía cinética K está dada por:

K = γm0c² - m0c²

Una vez que se tiene la expresión del Lagrangiano de algo, se puede obtener del mismo la
expresión correspondiente de la cantidad de movimiento mediante la relación que interconecta
al momentum canónico (formal) con el Lagrangiano:

pi = ∂L / ∂vi

Tomando la derivada parcial del Lagrangiano relativista L con respecto a la velocidad v,


obtenemos para la cantidad de movimiento:

p = ½ (2m0v√1 - v²/c²)

p = m0v√1 - v²/c²

p = γm0v

Esta es precisamente la misma expresión para el momentum relativista obtenida con mayores
dificultades (sin la comodidad del método de Lagrange) en una entrada anterior.

PROBLEMA: Dado el siguiente Lagrangiano para un oscilador harmónico simple relativista:

L = m0c² (1 - √1 - β²) - (½) kx²

en donde β = V/c, (1) encontrar la ecuación del movimiento que corresponde a dicho
Lagrangiano, y (2) demostrar tras esto que la expresión puede ser integrada para dar como
energía del sistema:

E = m0c² + (½) ka²

en donde a es la excursión máxima de la partícula oscilante desde el punto de equilibrio.

Del Lagrangiano relativista, para poder recurrir a la ecuación de Euler-Lagrange llevamos a cabo
primero los siguientes cálculos:
Entonces con q = x, la aplicación de la ecuación de Euler-Lagrange (en este caso n = 1 y sólo
tenemos una ecuación) nos produce lo siguiente:

Tomando la derivada con respecto al tiempo del primer término, obtenemos finalmente la
ecuación del movimiento del oscilador harmónico simple relativista (usamos el punto encima
para denotar derivación con respecto al tiempo de la variable):

Regresamos a la penúltima ecuación para llevar a cabo la integración de la misma, para lo cual
la reescribimos el primer término del modo siguiente:

Pero dx/dt es simplemente la velocidad V que podemos modificar como:

dx/dt = V = c (V/c) = cβ

Entonces el primer término se nos convierte en:

Recurrimos ahora a la relación del diferencial del producto de dos variables:

d(uv) = udv + vdu

udv = d(uv) - vdu


y haciendo la diferenciación de esto con respecto a x:

junto con la siguiente identificación de variables:

tenemos entoncoes la siguiente expansión que será utilizada para facilitar la integración :

La segunda cantidad dentro del paréntesis a su vez puede ser reescrita dejando todo como sigue:

Con esto último la integración que queremos llevar a cabo se convierte en un asunto trivial con
lo cual lo que vamos a integrar:

se nos converte ya integrado en lo siguiente:

siendo E la constante de integración. Podemos simplificar los dos primeros términos en uno
solo llegando a:
E = m0c²/√1 - β² + (½) ka²

La constante de integración E puede ser evaluada en el punto de amplitud máxima x = a, cuando


el resorte oscilante está totalmente estirado con una velocidad V = 0 lo cual a su vez dá β = 0.
Llevando a cabo esto, obtenemos la expresión para la energía del sistema que es simplemente:

E = m0c² + (½) ka²

De este modo, la energía del oscilador harmónico simple relativista es igual a la energía
potencial del resorte en su amplitud máxima sumada a la energía en reposo m0c² de la masa
oscilante, algo que quizá podíamos haber anticipado intuitivamente.

Quienes hayan tomado un curso de mecánica a nivel de licenciatura sabrán que además de la
formulación de la Mecánica Lagrangiana, basada en la definición del Lagrangiano, existe otra
formulación clásica de la mecánica, la Mecánica Hamiltoniana, basada en la definición
del Hamiltoniano. Y la pregunta que se harán es: ¿podemos hablar de un
Hamiltoniano relativista? La respuesta es afirmativa, y en este caso todo lo que tenemos que
hacer es tomar la definición del Hamiltoniano clásico (para una partícula):

H = pv - L

y en la misma meter reemplazar el Lagrangiano “clásico” con un Lagrangiano relativista como


los que hemos manejado arriba, reemplazando también el momentum “clásico” p = mv con el
momentum relativista p = γm0v.

PROBLEMA: Obtener el Hamiltoniano relativista para una partícula.

El Hamiltoniano relativista estará dado por:

H = pv - L = (γm0v) v - L

H = γm0v² - L

Metemos aquí la expresión obtenida arriba para el Lagrangiano relativista:


H = γm0v² + m0c²√1 - v²/c² + U

H = m0v²/√1 - v²/c² + m0c²√1 - v²/c² + U

La simplificación inmediata de los dos primeros términos nos produce la siguiente expresión:

H = m0c²/√1 - v²/c² + U

La cantidad en el primer término la identificamos de inmediato con la energía total E de la


partícula (véase la entrada “La ecuación más famosa de Einstein”) cuando no se ha incluído
energía potencial alguna bajo consideración:

E = γm0c²

Entonces:

H=E+U

De este modo, el Hamiltoniano relativista resulta ser igual a la energía total total del sistema,
incluídas la energía cinética, la energía en reposo, y la energía potencial.

Hemos visto cómo se puede fundamentar a la Teoría Especial de la Relatividad sobre el cálculo
de variaciones, y cómo para poder avanzar necesitamos primero definir un Lagrangiano para el
sistema que está bajo estudio, con lo cual podemos obtener la ecuación del movimiento del
sistema. La formulación de la Teoría Especial de la Relatividad sobre principios variacionales
partiendo del principio de la acción mínima nos lleva naturalmente a considerar la posibilidad
de que se pueda hacer lo mismo para poder derivar matemáticamente del cálculo de variaciones
las ecuaciones de campo de la Relatividad General. Esto es algo que desde un principio ocupó la
atención de Einstein que estaba interesado en darle una justificación a sus ecuaciones de campo
mostrándolas como algo susceptible de ser obtenido de principios más fundamentales. El
recurso del Lagrangiano relativista que se ha postulado arriba a partir del principio de la acción
mínima recurriendo al cálculo variacional es algo de lo cual se pueden derivar conceptos
fundamentales en la Teoría Especial de la Relatividad tales como la definición del momentum
relativista. Y resulta que la metodología usada arriba también puede ser aplicada a la
Relatividad General, aunque las suposiciones iniciales requeridas para lograr obtener el
resultado final no sean tan sólidas y convincentes desde el punto de vista filosófico como
pudiera esperarse, siendo una de las inconveniencias el hecho de que la acción Einstein-
Hilbert propuesta por Einstein en competencia intelectual con David Hilbert es indefinida en el
caso de una hoja (manifold) no-compacta, e inclusive esta acción se vuelve infinita aún en el
caso de un espacio-tiempo plano. De cualquier manera, a través de la acción Einstein-Hilbert
ambos demostraron la posibilidad de poder derivar las ecuaciones de campo de la Relatividad
General a partir de una integral de acción. La derivación de las ecuaciones de la Relatividad
General mediante una acción tiene varias ventajas, siendo la principal que nos permite una
unificación relativamente sencilla con otras teorías clásicas de campos (tales como la teoría del
electromagnetismo de Maxwell) que también puedan ser formuladas sobre el principio de una
acción. La acción tiene una ventaja adicional, ya que permite la fácil identificación de cantidades
físicas conservadas en el curso de un proceso físico gracias a un conocido teorema, el teorema de
Noether, para lo cual solo se requiere identificar las simetrías que existan en la acción de un
sistema.

Para la Relatividad General, la acción utilizando a una cantidad g como variable resulta ser
(obsérvese que la integración de la acción se lleva a cabo aquí en un 4-volumen):

en donde:

es el determinante de la metrica del espacio-tiempo plano (Lorentziano), R es el escalar de Ricci,


y κ es una constante universal:

κ = 8πG/c4

Como puede verse, el Lagrangiano (o mejor dicho, la densidad Lagrangiana) aquí es:

Para tomar en cuenta la presencia de masa-energía (o mejor dicho, campos de materia-energía)


es común añadir al Lagrangiano de la Relatividad General un término adicional L, teniendo con
esto la siguiente accion para la Relatividad General:
Con esto tenemos todo lo que necesitamos para poder derivar, a partir de esta última accion, las
ecuaciones de campo de la Relatividad General. Esto, filosóficamente hablando, asienta a la
Relatividad General sobre principios variacionales, y le dá una justificación más formal a la
teoría haciéndola más axiomática y menos intuitiva.

Aunque la fundamentación de la Relatividad General, si es que ha de fundamentarse sobre algo


a partir de lo cual sus primeros principios puedan ser derivados, tiene como punto de partida
predilecto el principio de la acción mediante un Lagrangiano adecuado, también es posible
intentar llevar a cabo una formulación de la misma mediante un Hamitoniano con el cual sea
posible escribir las ecuaciones del movimiento de la Relatividad General en la forma típica de las
ecuaciones de Hamilton. Tal metodología fue desarrollada por Richard Arnowitt, Stanley Deser
y Charles Misner, hoy conocida con el nombre formalismo ADM. Sin embargo, y a fin de
cuentas, la formulación ADM termina basándose en el siguiente Lagrangiano:

Justo cuando todo parece haberse dicho sobre la fundamentación formalizada de la Relatividad
General sobre principios variacionales, debemos contender ahora con otra ruta alterna que nos
permite derivar las mismas ecuaciones de campo no sobre principios variacionales, sino ¡a partir
de la termodinámica!

Al estudiar el tema de la relación que hay entre los agujeros negros y la entropía a través de
la segunda ley generalizada de la termodinámica propuesta por Jacob Bekenstein partiendo a
su vez de la similitud que hay entre el teorema del área para los agujeros negros y la segunda ley
de la termodinámica en su enunciación clásica (estadística) sumado al descubrimiento teórico
hecho por Hawking de que los agujeros negros se comportan como radiadores térmicos
emitiendo partículas constantemente, ya se habían mencionado las enormes dudas y sospechas
de que detrás de todas estas similitudes haya no meras coincidencias sino un mar de fondo que
se nos está escapando y que no alcanzamos a ver en estos momentos.
La posibilidad de la derivación de las ecuaciones de campo de la Relatividad General a partir de
argumentaciones basadas en la termodinámica fue demostrada en 1995 por Theodore (Ted)
Jacobson, quien probó es posible que las ecuaciones de campo de Einstein puedan ser derivadas
como una ecuación de estado a partir de argumentos termodinámicos. Para lograr su
demostración, Jacobson utilizó la ecuación de Raychaudhuri y la relación de
proporcionalidad que hay entre el área A y la entropía S para todos los horizontes locales de
aceleración (y al decir horizontes locales de aceleración no estamos haciendo referencia
específica y exclusiva al horizonte de evento de un agujero negro, estamos hablando del entorno
de un observador que se está acelerando en el espacio-tiempo con una rapidez extraordinaria
siendo por lo tanto capaz de percibir la radiación predicha por el efecto Unruh). La ecuación
de Raychaudhuri es considerada como un resultado fundamental que describe el movimiento de
pedacitos de materia cercanos el uno al otro, y es considerada un lema matemático importante
requerido para poder llevar a cabo la demostración de los teoremas de singularidad Penrose-
Hawking así como para el estudio de soluciones exactas a las ecuaciones de campo de la
Relatividad General, aunque también es de interés por cuenta propia ya que ofrece una
validación general y sencilla de nuestra creencia intuitiva de que la gravedad debe manifestarse
dentro de la Relatividad General como una fuerza de atracción entre dos pedacitos de masa-
energía del mismo modo que ocurre dentro del esquema Newtoniano. La ecuación de
Raychaudhuri suele aparecer escrita en los textos en la siguiente forma (los puntos sobre las
variables indican una derivada con respecto al tiempo propio; obsérvese que en el último
término estamos tomando la derivada covariante del tensor mixto X llevando a cabo tras esto
una operación de contracción con la igualación de los índices que activa a la convención de
sumación culminándolo con la toma de la derivada convencional con respecto al tiempo propio):

en donde

σ² = σmn σmn

ω² = ωmn ωmn

son invariantes cuadráticos (positivos) del tensor de esfuerzo cortante (en inglés, shear) σab:
y ωab es el tensor de vorticidad:

en donde:

es el tensor de expansión, θ es la traza del tensor conocida como el escalar de expansión, y:

hab = gab -XaXb

es el tensor de proyección hacia los planos ortogonales a X. Finalmente, tenemos la traza


del tensor de marea o tensor electrogravítico (conocido también como el escalar de
Raychaudhuri) definido como (obsérvense en ambos lados de esta ecuación tensorial los índices
repetidos que activan la convención de sumación):

En la esencia de la demostración dada por Jacobson, se utiliza como punto de partida una
fórmula termodinámica fundamental conocida como la ecuación de Clausius que nos
relaciona la transferencia de un cantidad infinitesimal de energía (o mejor dicho, masa-energía)
dQ a cierta temperatura T con el correspondiente aumento infinitesimal en entropía dS que se
produce a causa de dicha transferencia:

dS = dQ/T

y la cual tiene que ser reinterpretada definiendo a dS como el cambio ocurrido a través de un
cuarto del área del horizonte local de aceleración (en unidades de Planck), definiendo a dQ
como el flujo de energía a través de ese horizonte local de aceleración, y definiendo a T como
la temperatura Unruh medida por un observador acelerándose dentro del horizonte local de
aceleración (la temperatura Unruh producida por el efecto del mismo nombre es tratada al final
de la entrada “Los agujeros negros IV: Evaporación”). Jacobson demostró que el requerimiento
esencial para que las ecuaciones de campo de la Relatividad General puedan ser derivadas a
partir de la ecuación (redefinida) de Clausius es que dicha ecuación tiene que ser válida para
todos los horizontes locales de aceleración a través de cada punto en el espacio-tiempo.
La demostración obtenida por Jacobson de que las ecuaciones de campo de Einstein pueden ser
derivables termodinámicamente como una ecuación de estado implica como consecuencia la
existencia de algunos grados de libertad cuánticos fundamentales de donde debe ser posible
obtener las ecuaciones de campo mediante una manipulación adecuada de la función de
partición correspondiente, una conexión que hasta la fecha no se ha podido lograr.

Tiempo después del descubrimiento hecho por Jacobson, en el 2006 se publicó en el Physical
Review Letters un documento breve titulado “Non-equilibrium Thermodynamics of Spacetime”
(disponible gratuitamente en arXiv) en donde Jacobson junto con los investigadores Christoper
Eling, Christoper y Raf Guedens cubren la termodinámica del espacio-tiempo en situaciones
fuera del equilibrio termodinámico, mostrando con ello la forma en la cual se ha ido avanzando
en la fusión entre la Relatividad General y la termodinámica. Una propuesta todavía más
interesante es la que fue publicada también enarXiv el 4 marzo de 2009 bajo el título “The
Einstein equations for generalized theories of gravity and the thermodynamic relation dQ = T dS
are equivalent”, con la cual sus autores Ram Brustein y Merav Hadad intentan demostrar que
las ecuaciones del movimiento de la Relatividad General son equivalentes a la relación de
Clausius dQ = T dS, utilizando para ello una definición más extendida de la entropía de carga
de Noether, agregando haber encontrado que esta entropía de carga de Noether obedece
también la segunda ley de la termodinámica si el tensor energía-momentum obedece una
condición de energía nula. El corolario de este trabajo, según afirman sus autores, es que la
gravedad que vemos manifestada a una escala macroscópica no es más que una manifestación
de la termodinámica del vacío, con lo cual consideran concluída la propuesta de Jacobson de
que las ecuaciones de campo de la Relatividad General pueden ser expresadas como una
ecuación termodinámica de estado. Obviamente, para que este trabajo sea válido se requiere que
el fenómeno mecánico-cuántico de creación de partículas virtuales en el vacío a causa de las
fluctuaciones del vacío sea también un hecho incontestable.

Si bien las ecuaciones de campo de la Relatividad General pueden ser derivadas a partir de la
termodinámica, no es posible derivar la termodinámica a partir de la Relatividad General.
¿Significa esto que la Termodinámica deba ser considerada como algo más fundamental que la
Relatividad General? Esto es material de reflexión filosófica que nos demuestra que aún nos
queda un buen trecho por recorrer antes de que podamos proclamar que se ha agotado todo lo
que la física nos permite descubrir.

La Relatividad General no sólo puede ser derivada a partir de principios termodinámicos. Los
investigadores de la teoría de las supercuerdas han estado trabajando afanosamente para
demostrar la factibilidad de que se pueda formular una “Teoría del Todo” que lo explique
precisamente todo, a partir, claro está, de la teoría que ellos mismos han estado desarrollando y
que suponen que es la tan ansiada y elusiva “Teoría del Todo” que se le escapó de las manos al
mismo Einstein. Y hay todavía otras rutas de interés. Aquí se mencionará una de ellas propuesta
por Christoph Schiller en su trabajo titulado “General Relativity and Cosmology Derived From
Principle of Maximum Power or Force” publicado en el International Journal of Theoretical
Physics en septiembre de 2005, de acuerdo con el cual se demuestra que las ecuaciones de
campo de la Relatividad General se pueden derivar poniendo un límite a la fuerza F o a la
potencia P que se pueden dar en la Naturaleza, teniendo dichos límites los valores de c4/4G y
c5/4G. Específicamente, Schiller propone los siguientes valores para una fuerza máxima F y una
potencia máxima P que puedan ocurrir en la Naturaleza que están dadas por las siguientes
relaciones:

señalando que cualquiera de estas dos relaciones puede ser tomada como el postulado básico. La
prueba a la que recurre Schiller utiliza un resultado previo obtenido por Theodore Jacobson, y
argumenta que todos los datos experimentales son consistentes con los límites propuestos por
él. Aplicando los límites propuestos por él, estos predicen la obscuridad de la noche del Universo
(resolviendo con ello la famosa paradoja de Olberssegún la cual el cielo nocturno se debería de
ver iluminado y no oscuro dada la cantidad de estrellas en el firmamento así como las distancias
de las mismas hacia la Tierra) y el factor observado de escala, proponiendo otras pruebas
experimentales para la verificación de su hipótesis. En su trabajo examina los principales
contra-argumentos y paradojas tales como las transformaciones bajo empujes, la fuerza que se
debe sentir en el horizonte de evento de un agujero negro y el “problema de la montaña” así
como el contraste de su teoría contra otras teorías escalar-tensor de la gravitación, indicando
que la resolución de las paradojas clarifica el por qué la máxima fuerza y la máxima potencia
permanecieron ocultas por tanto tiempo. Argumenta también que la derivación de las
ecuaciones de campo de la Relatividad General como él lo propone desempeñan el mismo papel
en la Relatividad General como la máxima velocidad lo hace en la Teoría Especial de la
Relatividad. Este trabajo de Christoph Schiller se puede obtener del siguiente enlace:
http://www.springerlink.com/content/p68p73jru7084772/

Sobre el trabajo inicial emprendido para asentar la Relatividad General sobre principios
variacionales llevado a cabo por Einstein conjuntamente (o mejor dicho, independientemente,
en sana competencia para reclamar los méritos del logro) con el matemático David Hilbert
mediante una acción conocida como la acción Einstein-Hilbert, la cual es una expresión
matemática que representa una generalización hacia el espacio-tiempo cuatri-dimensional del
principio clásico de la acción mínima, y la cual al ser extremizada produce las ecuaciones de
campo de Einstein, se puede obtener más información sobre este tema en los siguientes enlaces:

http://en.wikipedia.org/wiki/Einstein%E2%80%93Hilbert_action

http://www.physics.thetangentbundle.net/wiki
/General_relativity/Einstein-Hilbert_action

Otra fuente de consulta útil es el libro “The Mathematical Theory of Relativity” del Professor
Arthur Stanley Eddington, uno de los pioneros en el campo de la Relatividad General, el cual dá
un tratamiento completo sobre la acción Einstein-Hilbert a partir de la sección 60 del libro
titulada precisamente “Acción”, la cual empieza con una acción cuatri-dimensional basada en la
acción clásica y en donde se demuestra cómo dicha acción es convertida a una integral sobre un
escalar G.

Además de la acción Einstein-Hilbert, en la literatura podemos encontrar mención a otro tipo de


variación conocida como la variación de Palatini, de la cual podemos encontrar mayores
referencias en el siguiente enlace:

http://en.wikipedia.org/wiki/Palatini_variation

El puente Einstein-Rosen
En un trabajo publicado en 1935, después de estar trabajando sobre las ecuaciones de campo de
la Relatividad General, el mismo Einstein en colaboración con su amigo Nathan Rosen sacó a la
luz en el ejemplar 73 correspondiente al volumen 48 del Physical Reviewalgo interesante cuya
importancia teórica pasó desapercibida para muchos en aquél entonces. Se trataba de una
solución que permitía, al menos teóricamente, conectar dos regiones diferentes del espacio-
tiempo a través de un tunel que podía servir como atajo.

Antes de proseguir, formularemos una pregunta al lector que tal vez le parezca sin sentido:
¿Es posible construír un círculo que carezca de centro?

No estamos hablando de algo trivial como el dibujar sobre una hoja de papel un círculo y cortar
con unas tijeras una porción del interior en la cual está situado el centro del círculo. Estamos
hablando de una situación en la que, genuinamente, sin cortar nada y sin haber borrado
nada, no existe el centro de un círculo.

Esto, aunque parezca algo demasiado extravagante y exótico, ya era conocido por los estudiosos
de la topología inclusive desde antes de la llegada de Einstein.

Considérese el siguiente diagrama que representa un objeto que podemos construír en este
mismo momento con un poco de arcilla a nuestra disposición:

Veamos con detenimiento el círculo superior. Visto desde arriba, con su imagen proyectada
hacia una pantalla plana, el círculo definitivamente parece tener un radio que podemos medir
en metros; esto nadie lo va a poner en tela de duda. Pero si miramos más de cerca hacia el
interior de la imagen del círculo, en donde esperamos “ver” al centro, posiblemente
encontraremos algo curioso. Posiblemente encontraremos algo cuyo aspecto no coincide con la
textura del resto del círculo. Y si en vez de estar utilizando la proyección de la imagen hacia
arriba de la superficie decidimos salir hacia afuera mirando al objeto en tres dimensiones,
descubriremos que el círculo cuya imagen habíamos estado viendo proyectada sobre una
pantalla plana carece de centro. Esto nunca lo podríamos haber deducido limitados a un plano
bi-dimensional; teníamos que salir fuera hacia una dimensión “superior”, hacia un espacio de
tres dimensiones, para darnos cuenta de que el círculo superior en realidad es un círculo sin
centro, al igual que el círculo inferior.

Esto por sí solo nos conduce a sospechar sobre la posibilidad de que, si fuésemos capaces de
poder “ver” no en tres dimensiones sino en cuatro dimensiones, algo que de hecho existe de
acuerdo con la Relatividad General, lo más seguro es que veríamos cosas que nos dejarían
estupefactos, con la boca abierta.

Lo que describieron Einstein y Rosen en su papel publicado en 1935 fue ni más ni menos una
solución matemática que describe algo que posteriormente sería bautizado con el nombre
de agujero de gusano (wormhole), aunque en la literatura técnica es conocido como
el puente Einstein-Rosen. La palabra “agujero de gusano” fue acuñada en 1957 por el físico
relativista norteamericano John Archibald Wheeler.

El puente Einstein-Rosen describe esencialmente una “conexión”, por así llamarla, entre dos
regiones separadas de espacio-tiempo, las cuales pueden estar separadas a distancias
astronómicamente enormes. Este puente es una solución puramente matemática, pero muchas
soluciones puramente matemáticas a algún conjunto de ecuaciones han resultado ser más reales
que lo que se creía en un principio, y un ejemplo de ello lo constituyen los mismos agujeros
negros, los cuales existían como una solución matemática a las ecuaciones de campo de la
Relatividad General, pero todavía hasta hace apenas unas dos décadas eran pocos los
astrónomos y científicos que creían que los agujeros negros pudiesen existir. Hoy se ha llegado a
la conclusión de que los agujeros negros no sólo existen, sino que son incluso abundantes en el
Universo. Nuestra propia galaxia en la que habitamos, la Vía Láctea, muy posiblemente contiene
en su interior un enorme agujero negro que está actuando como centro motor de la galaxia.

Puesto que el “atajo” relativista es un verdadero atajo en el más pleno sentido de la palabra, de
existir o de ser posible construír construír uno con alguna tecnología actualmente fuera de
nuestro alcance esto abriría la posibilidad de realizar cosas con las que sólo sueñan en estos
momentos los escritores de ciencia-ficción. Una de ellas sería la posibilidad de poder viajar de
un punto a otro a velocidades mucho mayores que la velocidad de la luz (aunque en realidad no
estaríamos viajando a la velocidad de la luz, sino que estaríamos tomando un atajo que nos
permite acortar la distancia en el espacio-tiempo permitiéndonos llegar en poco tiempo a otro
punto para el cual viajando directamente sin la ayuda de un agujero de gusano necesitaríamos
de millones de años consumidos en el viaje.

En la siguiente ilustración podemos ver cómo, en vez de tomar una ruta siguiendo una “línea
recta” de un punto a otro (o usando la terminología relativista más elegante, siguiendo
la geodésica que hay entre dos puntos) sobre la superficie del plano de color verde, podemos
llegar más rápidamente a través del atajo que une a las dos porciones de la hoja mostrada:

Con varios agujeros de gusano colocados estratégicamente en varios puntos del Universo, estos
podrían servir como portales inclusive para poder llevarnos a otros Universos diferentes al
nuestro:
Pero la factibilidad de poder trasladarse de un punto a otro del Universo recurriendo a la ayuda
de un agujero de gusano es tan sólo el principio de las posibilidades. Otra posibilidad sería la
de poder viajar al pasado o de poder viajar al futuro. Con un túnel conectando dos regiones
diferentes del espacio-tiempo, conectando el “pasado” con el “futuro”, un habitante del “futuro”
podría trasladarse sin problema alguno hacia el “pasado” para poder estar físicamente presente
en dicho pasado con la capacidad de alterar lo que está ocurriendo en el “ahora”. Y un habitante
del “pasado” podría trasladarse hacia el “futuro” para conocer a su descendencia mil
generaciones después, si la hubo. Estamos hablando de una verdadera máquina del
tiempo como la descrita por el escritor H. G. Wells.

La posibilidad de poder viajar al pasado frecuentemente ha sido desmentida recurriendo a una


famosa paradoja según la cual si tal cosa fuese posible entonces un habitante del “hoy” podría
trasladarse con una pistola hacia su pasado para matar a su abuelo, y al haber matado a su
abuelo entonces no debería haber descendido de él, no debería de haber existido, y por lo tanto
no lo podría haber matado. Esta paradoja devuelve algo de la tranquilidad que podríamos haber
perdido ante la posibilidad de poder construír una máquina del tiempo, excepto que si metemos
en el panorama a la mecánica cuántica, con su descripción matemática sobre la creación de una
cantidad infinita de universos alternos cada vez que se toma una decisión o que se lleva a cabo
una medición, es posible dispensar de la paradoja en virtud de que al ir hacia un pasado
estaríamos bifurcando ese pasado en dos rutas diferentes: la ruta en la cual el nieto asesino
decide no viajar al pasado y la ruta en la cual decide viajar al pasado para matar a su abuelo. En
la ruta en la cual el nieto asesino decide no viajar al pasado, el nieto seguiría viviendo en el
Universo en que actualmente habita. Y si decide ir al pasado para matar a su abuelo, al hacer tal
cosa crearía un Universo alterno que ya no es el Universo en el cual nació, de modo tal que
dejaría de haber paradoja. Nuevamente, esta posibilidad debe ser moderada tomando en cuenta
que en la hipótesis de la creación de universos alternos múltiples no es posible al habitante de
éste Universo el poder comunicarse o conectarse con los habitantes de otros Universos alternos;
al menos no con la tecnología y con el instrumental teórico con el que contamos en la actualidad.

En la Relatividad General todas las posibilidades que sean posibles deben ser descritas con una
métrica, y una métrica que nos describe un agujero de gusano atravesable es la siguiente:

Inclusive es posible postular teóricamente agujeros de gusano tomando como base la bien
probada métrica de Schwarzschild. Esto fue lo que hicieron Einstein y Rosen en su papel
original. Sin embargo, en 1962 John Archibal Wheeler y Robert W. Fuller publicaron un trabajo
en el que se llegaba la conclusión de que un agujero de gusano basado en la métrica de
Schwarzschild es sumamente inestable, y se “desinflará” instantáneamente en cuanto se forme
como si fuera un globo inflado picado por un alfiler, impidiendo que inclusive la luz pueda
recorrerlo.

Sin embargo, en un trabajo publicado en 1988, la posibilidad de agujeros negros atravesables


fue demostrada por vez primera por el físico norteamericano Kip Thorne y su alumno Mike
Morris, hoy designado como el agujero de gusano Morris-Thorne. Posteriormente se han
ido descubriendo otras posibilidades que también son soluciones a las ecuaciones de campo de
la Relatividad General, como una variedad estudiada en un trabajo de Matt Visser (autor del
popular libro titulado Lorentzian Wormholes) publicado en 1989 en la cual el atajo a través del
agujero de gusano se puede hacer en sin necesidad de tener que atravesar una región de materia
exótica como lo requiere el agujero de gusano Morris-Thorne. De cualquier manera, en la teoría
de Gauss-Bonnet no se requiere de la ayuda de materia exótica para que un agujero de gusano
pueda existir; puede existir incluso sin requerir materia alguna para ello.

Aunque posibles matemáticamente de acuerdo a la Relatividad General, los agujeros de gusano


siguen siendo inaccesibles para nuestros limitados recursos tecnológicos. Es posible que en
estos momentos ya haya agujeros de gusano que se estén formando espontáneamente en el
Universo de cuya existencia no estamos enterados, como también es posible que pueda haber
agujeros de gusano construídos por otras civilizaciones que sean tecnológicamente mucho más
avanzadas que la nuestra. Y esto último es posible porque con la labor empezada por Copérnico
y Galileo y culminada con Einstein el hombre ha dejado de ser el centro del Universo, ha sido
destronado de la posición privilegiada que creía poseer. Y habiendo ocurrido esto, todo lo demás
se vuelve posible.

Cosmología Cuántica
Aceptada la teoría de la expansión del Universo y la edad limitada del mismo en base a
evidencias científicas tales como la confirmación de que las galaxias se están alejando la una de
la otra así como el descubrimiento de la radiación cósmica de fondo que quedó como resultado
de la gran explosión original Big Bang que dió origen al Universo, predicha teóricamente en
1948 por George Gamow y confirmada experimentalmente en 1964 primero por Arno Penzias y
Robert Woodrow Wilson y más recientemente por la sonda Wilkinson Microwave Anisotropy
Probe (WMAP):

todo parecería suponer que, a gran escala, la explicación de la evolución del Universo desde sus
inicios radica por completo en una aplicación inteligente de las ecuaciones de campo de la
Relatividad General. El problema es que, de acuerdo con lo que se conoce como el teorema de
la singularidad, si las ecuaciones de campo de la Relatividad General son válidas, entonces
debe de haber una singularidad ya sea en el pasado o en el futuro del Universo, y en esa
singularidad las ecuaciones de campo ya no pueden ser utilizadas. De este modo, la Relatividad
General provoca su propio colapso, porque predice que no puede predecir la evolución del
Universo de principio a fin.

Ha habido un esfuerzo intenso por tratar de explicar lo que ocurre a escala macrocósmica no en
base a lo que se aplica a lo extremadamente grande, la Relatividad General, sino en base a lo que
rige a lo extremadamente pequeño a niveles atómicos y sub-atómicos, la Mecánica Cuántica.

¿Cómo es posible que se trate de explicar matemáticamente lo que ocurre a escalas


astronómicas usando para ello las reglas que rigen a lo que ocurre a escalas sub-atómicas,
proyectando matemáticamente lo casi infinitamente pequeño con lo casi infinitamente grande?,
dirán algunos. Esto parecería en primera instancia una exageración de los teóricos, porque las
leyes que rigen al cosmos a gran escala parecen tener muy poco o nada que ver con las leyes que
rigen al mundo sub-atómico. Las ecuaciones y los conceptos son totalmente diferentes. Sin
embargo, si hemos de aceptar en su totalidad los modelos cosmológicos que nos proporcionan
las ecuaciones de campo de la Relatividad General, necesariamente tenemos que aceptar la
existencia de un Universo dinámico que se está expandiendo o contrayendo, no habiendo duda
alguna ya de que se ha estado contrayendo, y extrapolando los datos hacia atrás llegamos a la
conclusión inevitable de que al momento de su nacimiento el Universo no era el gran cosmos
que vemos hoy sino algo inmensurablemente pequeño, algo en lo que aplican las leyes que
rigen a las partículas sub-atómicas. Entonces, a un infinitésimo de su nacimiento, el Universo
estaba regido en su totalidad por las reglas que rigen hoy a la Mecánica Cuántica, en una época
en la cual la Relatividad General y la Mecánica Cuántica estaban completamente unificadas, y
conforme fue evolucionando el Universo necesariamente tendrían que haber estado en acción
las leyes para la evolución de un sistema físico que rigen en la Mecánica Cuántica. Siendo así, no
suena tan disparatada la idea de intentar encontrar una explicación a todo lo que hoy vemos
tomando como base lo que se ha comprobado que funciona para predecir correctamente desde
la Tabla Periódica de los Elementos hasta el electromagnetismo de las partículas sub-atómicas.
Esto es lo que nos lleva a una área de estudio contemporánea conocida como la Cosmología
Cuántica.

Puesto que en la Mecánica Cuántica basada en las “ondas de materia” el punto de partida
tradicional ha sido la ecuación de onda de Schrödinger, describiéndose el comportamiento de
una partícula sub-atómica en base a su función de onda ψ (la gran mayoría de los científicos han
dejado ya de tratar de averiguar qué es exactamente lo que está “ondulando”, aceptando
la interpretación de Copenhague que impone límites a lo que podemos saber acerca de lo que
está ocurriendo en el mundo sub-atómico, y aceptando a ψ como un mero artificio matemático
útil que nos sirve para obtener fórmulas, explicaciones y resultados que concuerdan con las
evidencias experimentales recabadas), no nos debe asombrar el que uno de los primeros
intentos de extender a la Mecánica Cuántica hacia el Universo entero haya consistido en la
búsqueda de una función de onda para el Universo. Esto ocurrió con la publicación en 1967 de lo
que hoy conocemos como la ecuación Wheeler-De Witt, previamente llamada ecuación
Einstein-Schrodinger. La ecuación Wheeler-De Witt es lo que obtenemos cuando llevamos a
cabo lo que se conoce como Mecánica Hamiltoniana en el espacio-tiempo de la Relatividad
General. El Hamiltoniano en sí que corresponde a esta ecuación termina convirtiéndose en una
expresión que debe ser igual a cero, conocida como la constricción de Hamilton. Fue hasta el
año 1983 cuando se publicó en el Physical Review una solución a la ecuación Wheeler-De Witt
en un trabajo titulado “Wave function of the universe”, elaborada por James Hartle y Stephen
Hawking, solución hoy conocida como el estado Hartle-Hawking, la cual tenia como intención
original ser una propuesta para la función de onda del Universo. Estos primeros intentos
sentaron las bases para llevar a la Cosmología Relativista clásica hacia un nuevo terreno al
haberse agotado las posibilidades ofrecidas por la Relatividad General actuando por sí sola sin
ninguna ayuda de parte de la Mecánica Cuántica.

Ya hemos visto cómo la Relatividad General nos describe al campo gravitatorio como
deformaciones del espacio-tiempo, concretamente, como una modificación de la métrica, y
cómo al que una partícula el campo gravitatorio también puede evolucionar desde una
configuración hasta otra, como en el caso de una estrella que explota en supernova, en donde el
campo gravitatorio está evolucionando. El espacio de configuraciones de la Relatividad General
es el espacio de todas las métricas posibles. A este espacio se lo denomina superespacio. En
vez de considerar todas las métricas posibles que son muchas, podemos centrarnos sólo en unas
pocas dependiendo del problema que queramos resolver, y hemos visto cómo en cosmología es
usual centrarse en las métricas que corresponden con espacios homogeneos e isótropos, es
decir, métricas en las que el espacio dentro del espacio-tiempo tiene características iguales en
todos los puntos. Estos espacios pueden evolucionar con el tiempo, por ejemplo expandiéndose
de acuerdo con la ley de Hubble. Al espacio de configuraciones de estas métricas se lo
denomina minisuperespacio. Esto es lo que ha tenido que decirnos la teoría “clásica” basada
estrictamente en las ecuaciones de campo de la Relatividad General. En la Mecánica Cuántica el
espacio de configuraciones adquiere un papel algo diferente. La partícula ya no se mueve a lo
largo de una trayectoria rectilínea, sino que para cada instante de tiempo existe una distribución
de probabilidad en el espacio que nos dice dónde encontrar a la partícula con cierta
probabilidad. A este distribución de probabilidad se la conoce con el nombre de función de
onda. Si encontramos a la partícula en un tiempo determinado en un lugar, luego, en otro
tiempo posterior, podemos encontrarla en otro lugar que no corresponde con el que estaría si
hubiese seguido una trayectoria clásica. Incluso, la Mecánica Cuántica predice situaciones en las
que una partícula que se encuentra frente a una barrera potencial (por ejemplo una fuerza
repulsiva que actúa sobre ella, una pared, etc.) puede traspasarla pese a que clásicamente
chocaría contra dicha barrera sin poder pasar. Esto es conocido como el efecto túnel:
En la Cosmología Cuántica Canónica, la situación es similar y el efecto túnel adquiere un
papel importante. Para entenderlo, se trabaja inicialmente sobre un modelo simplificado en
donde aparece este fenómeno de tunelaje, conocido como el espacio-tiempo de de-Sitter. El
modelo de de-Sitter resulta cuando se considera un espacio completamente vacío pero con una
constante cosmológica. Este modelo es homogeneo e isótropo no solo en el espacio, sino
también en el tiempo. Se trata de un modelo en el cual cualquier punto del espacio-tiempo es
igual a todos los demás. En otras soluciones cosmológicas con singularidad inicial sólo los
puntos de una sección espacial son todos iguales, mientras que los puntos en secciones
espaciales diferentes no tienen por qué ser iguales, es decir, no tienen por qué tener
características iguales de densidad, curvatura, etc. En el modelo de-Sitter, sin embargo, todos
los puntos son iguales. Esto significa que el modelo no presenta una singularidad inicial.
Este modelo es de especial interés porque describe una expansión exponencialmente acelerada,
tal y como se asume que se dió en lo que se conoce como el periodo inflacionario del Universo, y
proporciona, por lo tanto, un modelo descriptivo de esa fase. En la teoría clásica de cosmología
el Universo o bien fue de-Sitter siempre, y fue por lo tanto infinito en el pasado (sin
singularidad inicial, cosa que no concuerda con nuestra idea actual de universo y mucho menos
con las evidencias experimentales recabadas) o bien fue de otro tipo, pero entonces tuvo una
singularidad inicial en un tiempo t = 0. Lo que no puede ocurrir en la teoría clásica es que un
Universo empiece con una singularidad inicial y luego se convierta en un Universo de-Sitter. Lo
sorprendente es que la Cosmología Cuántica Canónica en el minisuperespacio hace posible un
modelo del Universo que tiene una singularidad inicial en t = 0, pero que se comporta como de-
Sitter un instante después en un tiempo t mayor que 0. El mecanismo involucrado es
precisamente el efecto mecánico-cuántico de túnel. La situación aquí es básicamente análoga a
la de la partícula que se encuentra frente a un potencial, aunque aquí la noción de potencial es la
de un potencial efectivo (una correspondencia matemática) con el que se encuentra el universo
en un tiempo t = 0 para “tunelar” hacia el modelo de-Sitter. Esta evolución temporal es una
legítima solución a las ecuaciones de la Cosmología Cuántica Canónica.

Para determinar la solución de forma única hay que imponer condiciones iniciales, como es
usual en los problemas de la física. Existen dos propuestas se pueden considerar como las más
importantes: la propuesta de Hartle y Hawking de la cual ya se ha dado un anticipo arriba, y la
propuesta de Vilenkin. De ambas propuestas resultan dos soluciones para la función de onda del
Universo que se conocen respectivamente con los nombres de función de onda de Hartle-
Hawking y función de onda de Vilekin. Hemos visto que en la Mecánica Cuántica una partícula
libre ya no se mueve a lo largo de una trayectoria rectilínea, sino que para cada instante de
tiempo la función de onda nos dice dónde encontrar a la partícula con cierta probabilidad. Pues
bien, esta idea se puede reformular diciendo que la partícula toma realmente todos los caminos
posibles a la vez, cada uno de ellos con cierta probabilidad. Este metodología es lo que se conoce
como la formulación de la Mecánica Cuántica basada en la integral de caminos de Feynman:

Bajo este esquema, en la Mecánica Cuántica tradicional calculamos la función de onda para una
partícula que comenzó en un estado inicial φ0 y que ha llegado al estado φ integrando sobre
todos los caminos posibles que conectan ambos estados:

aen donde S[ρ] es la acción para la trayectoria. Igual que en la Mecánica Cuántica, la
Cosmología Cuántica Canónica se puede reformular en términos de la integral de caminos. Ésta
formulación permite calcular probabilidades de la transición entre dos configuraciones
espaciales determinadas, sumando las probabilidades sobre todas las geometrías del espacio-
tiempo intermedias posibles. En la Cosmología Cuántica, un “estado” es una “rebanada” (slice) σ
tri-dimensional de un espacio-tiempo cuatri-dimensional, y la función de onda de una partícula
es reemplazada por la “función de onda del Universo” φ(σ) que es la amplitud de la probabilidad
de que el Universo contenga a σ. La integral dada arriba para una partícula es una integral
oscilante que por lo mismo es incapaz de convergir, y es por ello que dentro de la Cosmología
Cuántica las integrales de caminos son formuladas sobre un trasfondo de cuatro dimensiones en
donde la dimensión temporal es asociada con el número imaginario i = √-1, la cual es a veces
referida como un tiempo imaginario precisamente porque involucra el uso de números
imaginarios, lo cual permite aplicar el procedimiento matemático conocido como continuación
analítica que puede ser utilizado para convertir los resultados expresados en cuatro
dimensiones a resultados expresados en tres dimensiones espaciales y una dimensión temporal,
en este caso continuando analíticamente el parámetro del tiempo hacia valores imaginarios: t →
iτ. Esta transformación cambia la firma de la métrica de (- + + +) a (+ + + +), de modo tal que
los caminos resultantes se llevan a cabo sobre un espacio Euclideano en lugar de llevarse a cabo
sobre un espacio Lorentziano. Al mismo tiempo, la acción se vuelve imaginaria, lo que nos
permite escribir S -> i SE en donde SE es la acción Euclideana.

Antes de proseguir, y para el beneficio de aquellos que no han estado expuestos al concepto de la
continuación analítica o que si lo vieron lo han olvidado, aquí se hará un breve resumen de
dicho concepto tal y como se enseña en los cursos introductorios de la variable “compleja”.
Definimos primero un número complejo como aquél que está formado por la suma dos
números, un número real a y un número imaginario b:

a + ib = a + b√-1

Los números imaginarios se pueden representar en un plano bi-dimensional conocido como


el diagrama de Argand usando la escala horizontal para representar la parte real y la escala
vertical para representar la parte imaginaria, como podemos verlo en el siguiente diagrama en
donde se ha representado el número complejo 1+2i:
PROBLEMA: Representar en un diagrama de Argand los siguientes números complejos:

2 + 2i
5 + 3i
3 - 2i
-4
2i
-2 - i
-2 + 4i
-5 + 3i
-4 - 4i

La representación de los números complejos sobre el diagrama de Argand es la siguiente:


La variable compleja no es más que una generalización del concepto del número complejo y que
por lo mismo no tiene nada de complejo:

z = x + iy

En el diagrama de Argand, la variable compleja se puede representar de la siguiente manera:

Una vez definida la variable compleja, podemos usarla para definir una función de variable
compleja como la siguiente:

f(z) = 3 z² - 4 z + 5

Asentados los conceptos anteriores, estamos en condiciones de ver la idea que está detrás del
procedimiento de continuación analítica.
Tal y como se discute en el famoso libro de Euclides titulado Los Elementos, una serie de
números que va aumentando geométricamente como la siguiente:

Sn = 1 + x + x² + x3 + ... + xn

puede ser expresada también de la siguiente manera:

1 + xSn = 1 + x + x² + x3 + ... + xn + xn+1

1 + xSn = Sn + xn+1

Despejando para x obtenemos lo siguiente:

Ahora bien, si la magnitud de x es menor que la unidad, la cantidad x n+1 se va volviendo cero
(xn+1 → 0) conforme x va aumentando, de modo tal que tenemos así la suma de la siguiente serie
infinita:

Fue precisamente utilizando la suma de una serie como esta la forma en la cual Arquímedes
evaluó el área encerrada entre una parábola y una línea recta. Posiblemente este sea el primer
ejemplo de una función que está asociada a la suma de una cantidad infinita de términos. A
modo de ejemplo, si hacemos x igual a 1/2, la anterior ecuación nos dá:

Existe, desde luego, una diferencia significativa entre la ecuación original y la ecuación
simplificada, porque la ecuación original es válida para cualquier valor de x mientras que la
ecuación simplificada no lo es. Por ejemplo, si hacemos x = 2 en la ecuación simplificada,
obtenemos lo siguiente:

- 1 = 1 + 2 + 4 + 8 + ...
lo cual no es una igualdad aritmética válida porque el lado derecho no converge hacia ningún
valor, mucho menos a una cantidad negativa como -1. Esto nos demuestra que una
correspondencia entre una función y una serie infinita como la ecuación simplificada de arriba
sólo se sostendrá dentro de cierto rango limitado de la variable. Generalmente hablando, una
función analítica f(z) definida en términos de una variable compleja z puede ser expandida
mediante una serie de potencias en torno a cualquier valor complejo de la variable z recurriendo
a una expansión de series de Taylor, lo cual puede ser escrito como:

pero la serie convergirá en la función sólo sobre una región circular del plano complejo centrada
en el punto z0 y extendiéndose hacia el polo más cercano de la función (definimos al polo como
un punto en el cual la función se nos hace infinitamente grande en virtud de un término que
aparece en un denominador que al tener un valor de cero nos dispara el valor de la fracción
hasta el infinito). La función f(z) = 1/(1z) discutida previamente (con la pequeña variante de
que hemos convertido a la variable real x en una variable compleja z) tiene un polo en z = 1, de
modo tal que el “disco de convergencia” de la serie de potencias en torno al origen (z = 0) tendrá
un radio de 1. Esto está representado en el siguiente diagrama de Argand:

La función analítica f(z) = 1/(1z) puede ser expandida en una serie de potencias en torno a
cualquier otro punto en donde la función y sus derivadas sean “bien comportadas”. Las
derivadas de f(z) son:
y así sucesivamente. Injertando estos términos en la expresión para la serie de Taylor,
obtenemos:

De este modo, la expansión en serie de potencias llevada a cabo con respecto al punto z = 2 viene
siendo:

f(2 + z) = -1 + z - z² + z3 - z4 + ...

Cada serie de potencias obtenida de esta manera sigue siendo convergente solo dentro de la
región circular del plano de Argand centrada en z0 y extendiéndose hacia el polo más cercano de
la función. En el ejemplo que hemos estado viendo, puesto que la función f(z) = 1/(1z) tiene un
polo en z = 1, la serie de potencias con z0 = 2 es convergente únicamente en la región sombreada
de la siguiente figura:
Hasta aquí hemos estado hablando únicamente acerca de la función particular f(z) = 1/(1-z) y
simplemente hemos demostrado cómo esta función analítica conocida es igual a cierta serie de
potencias dentro de ciertas regiones del plano complejo. Sin embargo, en algunas circunstancias
nos puede ser dada una serie de potencias que no tiene una forma explícitamente cerrada para
la función analítica que representa (en su región de convergencia). En tales casos
frecuentemente podemos determinar los valores para la función analítica subyacente para
argumentos que están fuera de la región de convergencia de la serie de potencias dada
precisamente mediante la técnica de continuación analítica. Para ilustrar esto, supóngase que se
nos da la siguiente serie de potencias:

f(z) = = 1 + z + z² + z3 + z4 + ...

y supóngase que no conocemos la expresión en forma cerrada para la función analítica


representada por esta serie. Como se observó arriba, la serie converge para valores de z con
magnitudes menores que 1. De cualquier manera, mediante el proceso de continuación analítica
podemos determinar el valor de esta función en cualquier valor complejo de z siempre y cuando
la función en sí sea bien comportada en dicho punto. Para ello, considérese nuevamente la
siguiente región de convergencia para la serie de potencias dada:
Puesto que la serie de potencias conocida es igual a la función dentro de su radio de
convergencia, podemos evaluar f(z) y sus derivadas en cualquier punto en dicha región.
Podemos, por lo tanto, escoger un punto como el punto z 0 mostrado en azul en la figura de
arriba, y determinar la expresión en serie de potencias para f(z0+ z) que será convergente dentro
de la región circular centrada en z0 y extendiéndose hacia el polo más cercano. De este modo,
podemos evaluar la función para valores que queden fuera de la región de convergencia de la
serie de potencias original.

Una vez que hemos determinado la serie de potencias para f(z0+ z), podemos repetir el
procedimiento seleccionando un punto z1 que esté dentro de la región de convergencia y
determinando la serie de potencias para f(z1 + z), que será convergente en una región circular
centrada en z1 y extendiéndose al polo más cercano (que viene siendo z = 1 en este ejemplo).
Esto está ilustrado en la siguiente figura:

Continuando de esta manera, podemos extender analíticamente la función sobre todo el plano
complejo excepto en donde la función sea singular, esto es, en los polos de la función.
En general, dada una serie de potencias de la forma:

f(z) = a0 + a1(z - α) + a2(z - α)² + a3(z - α)3 + ...

podemos expresar a la misma función como una serie de potencias centrada en otro número
complejo cercano b tal como:

f(z) = b0 + b1(z - β) + b2(z - β)² + b3(z - β)3 + ...

Para que estas dos series de potencias sean iguales para valores arbitrarios de z, tenemos que
igualar los coeficientes de las potencias de z, de modo que tenemos que tener lo siguiente:

a0 - αa1 + α²a2 - α3a3 + ... = b0 - βb1 + β²b2 - β3b3 + ...

a1 - 2αa2 + 3α²a3 - 4α3a4 + ... = b1 - 2βb2 + 3β²b3 - 4β3b4 + ...

a2 - 3α3 + 6α²a4 - 10α3a5 + ... = b2 - 3βb3 + 6β²b4 - 10β3b5 + ...

Esto puede ser representado mediante matrices de la manera siguiente:

Multiplicamos ahora ambos miembros de esta ecuación matricial por la matriz de coeficientes
del lado derecho obteniendo lo siguiente:
en donde ε = b - a. Esto, desde luego, es equivalente a la aplicación de la expansión en serie de
Taylor. Esto parecería excluír cualquier extensión del dominio de la serie de potencias original.
Por ejemplo, supóngase que la función original haya sido la serie de potencias para 1/(1 – z) en
torno al punto a = 0, de modo tal que los coeficientes a 0, a1, … de la serie de potencias fueran
todos iguales a 1. De acuerdo con la ecuación matricial anterior, el coeficiente b0 para la serie de
potencias sería simplemente:

b0 = 1 + β + β² + β3 + ...

que desde luego converge sólo sobre la misma región que corresponde a la serie de potencias
original. Tampoco sería de ayuda el romper la transformación de la serie en pasos pequeños,
porque las composiciones de la matriz de coeficientes están dadas por:

Siendo así, el efecto neto de subdividir a ε en n segmentos de tamaño ε/n y aplicando la


transformación individual n veces evidentemente es lo mismo que llevar a cabo la
transformación en un solo paso. A partir de esto podríamos concluír que es imposible continuar
analíticamente la serie de potencias más allá de cualquier punto tal como 3i/2 que tenga una
magnitud mayor que 1. Sin embargo, es posible llevar a cabo la continuación analítica de la serie
geométrica en virtud de lo que llamamos convergencia condicional. Esto puede ser mejor
explicado mediante un ejemplo. Empecemos con la siguiente serie de potencias:

f(z) = 1 + z + z² + z3 + z4 + ...

centrada en el origen. Ciertamente podemos expresar esto como una serie de potencias centrada
en el número complejo ε = 3i/4 porque la serie de potencias f(z) y todas sus derivadas son
convergentes en dicho punto (que está situado dentro del círculo unitario de convergencia). Por
la penúltima ecuación matricial anterior haciendo a0 = a1 = a2 = … = 1, los coeficientes de:

f(z) = b0 + b1(z - ε) + b2(z - ε)² + b3(z - ε)3 + ...

son (aquí usamos el hecho de que i² = -1, i3 = - i, i4 = 1, i5 = i, y así sucesivamente):

Se puede demostrar que los valores absolutos de estos coeficientes son bn = (4/5)n+1. Ahora bien,
si tomamos estos como los valores an y aplicamos de nuevo la misma transformación,
desplazando a la serie de potencias por otro margen ε = 3i/4, de modo tal que la serie resultante
esté ahora centrada en 3i/2, encontraremos que el coeficiente b0dado por la penúltima ecuación
matricial anterior es:
en completo acuerdo con la expresión analítica para la función. Esta serie claramente converge,
porque cada término tiene una magnitud geométricamente decreciente. En forma similar
podemos calcular los coeficientes de orden mayor para la serie de potencias centrada en el punto
3i/2, el cual está fuera del radio de convergencia de la serie geométrica original centrada en el
origen. ¿Pero cómo puede ser esto, podrían preguntarse algunos? Esencialmente hemos
multiplicado el vector columna unitario por el vector de coeficiente dos veces, lo cual sabemos
que produce el resultado divergente:

Para examinar esto en mayor detalle, llevaremos a cabo la expansión de las cantidades que
aparecen en los paréntesis cuadrados de arriba para b0, lo cual nos dá:

Cada renglón individual es convergente, y más aún los renglones convergen hacia valores
geométricamente decrecientes, de modo tal que las sumas de los renglones son también
convergentes. Sin embargo, si sumamos los valores individuales en las diagonales, obtenemos:
Podemos ver que los términos para b0 son divergentes si los sumamos diagonalmente, pero son
convergentes si los sumamos por renglones. En pocas palabras, la serie es condicionalmente
convergente, lo cual significa que la suma de la serie depende del orden en el cual sumemos
los términos. Lo mismo aplica a las series para los otros coeficientes.

Puesto que los términos de una serie convergente condicionalmente pueden ser reacomodados
para darnos cualquier valor que queramos, uno puede preguntarse si la continuación analítica,
que está basada tan fundamentalmente en la convergencia condicional, nos puede producir un
resultado único. La respuesta es afirmativa, pero sólo porque estipulemos cuidadosamente el
procedimiento para transformar los coeficientes de las series de potencias de tal manera que las
sumas sean evaluadas mediante renglones y no de otra manera. Este procedimiento está
justificado principalmente por el hecho de que nos produce resultados que están de acuerdo con
las funciones analíticas explícitas en aquellos casos en los que tales funciones nos son conocidas.
Esta es pues la idea general detrás del procedimiento matemático conocido como la
continuación analítica.

Regresamos ahora tras la disgresión a la discusión de la integral de caminos que había quedado
arriba en puntos suspensivos.

La integral de caminos es amortiguada por un exponencial de decaimiento (con exponente


negativo) y convergirá si SE está acotado abajo. En la Cosmología Cuántica, la transformación
implica que debemos integrar sobre hojas (manifolds) que tengan una firma Euclideana en lugar
de espacios-tiempo Lorentzianos. De este modo, calculamos la función de onda mediante:
en donde M es un 4-espacio Euclideano (al haberse llevado a cabo la transformación indicada
hacia un tiempo imaginario) que contiene una rebanada tri-dimensional σ.

Las observaciones astronómicas nos indican que el Universo es grande y suave en una escala
global, y por lo tanto el paso natural consiste en estimar la integral para 3-superficies σ que son
grandes y suaves. Aunque el llevar a cabo esta integración esté más allá de nuestras capacidades,
es posible hacer una estimación de la misma como el exponencial de una “acción efectiva” γ[M].
Podemos pensar de esta “acción efectiva” como si se tratase de una acción con todas las
fluctuaciones cuánticas integradas fuera de la misma:

No parece ser muy útil el intentar definir una función (γ) en términos de una integral de
caminos sobre una función (SE) que desconocemos. Sin embargo, gracias a la Relatividad
General conocemos una expresión aproximada de γ para los espacios grandes. Los términos
principales son simplemente aquellos que corresponden a la acción (Euclideana) para la
Relatividad General:

en donde g es el determinante de la métrica gµv y R es el escalar de Ricci (R = gµv Rµv). Esta


expresión puede ser considerada toscamente como una expansión en series de potencias en el
tamaño inverso del espacio, para hojas grandes (a escalas cosmológicas) el campo de la
gravedad es el campo dominante y podemos despreciar los términos que representan otros
campos. Puesto que esta última ecuación es simplemente la acción para la Relatividad General,
su punto estacionario es la solución a las ecuaciones de campo de Einstein que incluyan a la
constante cosmológica; en el espacio Euclideano esto es una 4-esfera. Para tales espacios , R =
4λ y:

∫d4x √g = 24 π²/λ²

Insertando esto en la ecuación anterior para la integral de acción nos produce γ = -3π/Gλ.
Puesto que la integral de caminos para Ψ(Σ) es igual al exponencial de -γ/h, tenemos:
Si consideramos a λ como un parámetro independiente, esta expresión alcanza un pico
infinitamente grande para λ = 0, con lo cual el problema de fijar a la constante cosmológica a un
valor cercano a cero parecería resuelto. La explicación que podemos dar a esto es que los
Universos en los cuales λ = 0 son los que predominan en la integral de caminos, haciendo
preponderantemente probable que la constante cosmológica se desvanezca. Sin embargo, la
constante cosmológica no se puede suponer como un parámetro libre. De cualquier modo, la
aplicación de la integral de caminos nos abre aquí un nuevo horizonte de investigaciones
posibles.

El éxito de las integrales de caminos para describir en el ámbito de la Mecánica Cuántica a la


física no-gravitatoria es lo que condujo a los intentos de describir a la gravedad de la Relatividad
General mediante integrales de recorrido. La formulación de la gravedad cuántica mediante
integrales de camino no está libre de problemas, como tampoco está claro cómo se relaciona con
intentos más modernos para construír una teoría de la gravedad cuántica como la teoría de las
supercuerdas, mejor conocida últimamente como la teoría-M. Sin embargo, la integral de
caminos puede ser utilizada para calcular correctamente cantidades que pueden ser calculadas
independientemente de otras maneras, como las temperaturas y las entropías de los agujeros
negros.

La propuesta de Vilenkin consiste en tomar como condición inicial una métrica


espacial inexistente. Tal estado no tiene correspondencia física alguna en la teoría clásica de la
Relatividad General, y fue denominado “nada” por Vilenkin. Este es posiblemente el orígen del
mito popular de un Universo creado de la nada. La pregunta sobre el orígen de esta transición se
reduce a la misma categoría que la pregunta sobre la razón de que el decaimiento de un átomo
ocurra en un instante de tiempo y no en otro o a la pregunta sobre si la partícula cuántica pasará
el potencial por medio del efecto túnel o no. Es todo una cuestión de probabilidades, de
naturaleza aleatoria en el marco de la física cuántica. Vilenkin ha demostrado que tal
probabilidad de transición es máxima para universos con secciones espaciales cerradas en los
cuales Ω0 es mayor que la unidad, o sea con una superficie tipo esférica (o elipsoidal) en donde
la geometría no-Euclideana hace que los ángulos de un triangulo sumen más de 180°:
En lo que respecta a la propuesta de Hartle-Hawking, esta consiste en tomar como condición
inicial el conjunto todas las geometrías Euclideanas compactas posibles, como por ejemplo una
4-esfera (geometrías sin dimensión temporal). Intuitivamente consiste en acoplar el espacio-
tiempo en expansión a todas las formas posibles de cerrarlo o redondearlo suavemente, sin picos
o singularidades, en su inicio. En palabras del mismo Stephen Hawking: las condiciones de
contorno del universo consisten en que el Universo no tiene condiciones de contorno:

La teoría desarrollada en 1983 por Stephen Hawking y James Hartle para una “Función de onda
del Universo”, también conocida como la “Teoría de la Propuesta sin Límites“ (No Boundary
Proposal Theory) se puede parafrasear del siguiente modo: la condición límite del Universo es
que no tenga límite. Sólo si el Universo se halla en ese estado carente de límite, las leyes de la
ciencia pueden determinar por sí mismas las probabilidades de cada historia posible, y en este
caso las leyes ya conocidas determinan cómo debe comportarse el Universo. Si el Universo se
halla en cualquier otro estado, la clase de espacios curvos en la suma de historias incluirá
espacios con singularidades. Para determinar las probabilidades de tales historias que incluyan
una singularidad sería necesario invocar algún principio diferente a las leyes conocidas de la
ciencia, y este principio sería ajeno a nuestro Universo, no podría ser deducido desde el seno de
éste. Por otro lado, si el Universo se halla en un estado sin límite, se podría en principio
determinar completamente cómo debe comportarse, hasta la frontera marcada por el mismo
principio de indeterminación. La propuesta sin límite formula predicciones definitivas sobre el
modo en que debe comportarse el Universo. Si estas predicciones no coinciden con las
observaciones, cabe llegar a la conclusión de que el Universo no se halla en un estado sin límite.
La propuesta sin límite se vuelve así una teoría que puede ser rebatida o desmentida por las
observaciones experimentales y reemplazada por otra teoría. Si las predicciones de la teoría
Hartle-Hawking no coinciden con las observaciones, entonces se tiene que considerar la
existencia de singularidades en la clase de historias posibles. Y sería todo lo que se puede
conocer. No se podrían calcular las probabilidades de las historias singulares, ni se podría
predecir cómo debe comportarse el Universo. Para Hawking y Hartle esa imposibilidad de
predicción no importaría mucho de ocurrir sólo en el principio del Universo, que al fin y al cabo
el principio ocurrió hace diez o veinte mil millones de años. Pero sostienen que si la posibilidad
de predicción se quebró en los intensos campos gravitatorios del Big Bang, también podría
venirse abajo en cualquier parte, hasta en una estrella. Según Hawking y Hartle, si las leyes de la
física pudieron quebrarse al principio del Universo, ¿por qué no podrían quebrarse en cualquier
parte? En la Mecánica Cuántica, de naturaleza eminentemente probabilística, hay un principio
básico: todo lo que no está prohibido puede suceder y sucederá. De este modo, si la clase de
historias posibles incluye espacios con singularidades, éstas podrían ocurrir en cualquier parte y
no sólo en el principio. Ello significaría que no habría capacidad de predecir nada. De igual
modo, el hecho de que no se puedan predecir acontecimientos constituiría una prueba
experimental en contra de las singularidades y a favor de la propuesta sin límite.

En las predicciones de la “Teoría de la Propuesta sin Límites” todas las historias posibles del
Universo son finitas en magnitud, cualquier cantidad que se utilice como medida del tiempo
tendrá un valor máximo y otro mínimo, de modo tal que cada historia estará acotada(bounded).
Así el Universo contará con un principio y un final. El comienzo en tiempo real será la
singularidad del Big Bang. Pero en tiempo imaginario ( √-1) el comienzo no será una
singularidad. En otras palabras, las leyes de la física se cumplen en todas partes, incluyendo el
inicio del Universo. En consecuencia, el acontecimiento que se opte por denominar “comienzo
del Universo en tiempo imaginario” será un punto ordinario del espacio-tiempo, muy semejante
a cualquier otro. Las leyes de la ciencia regirían en el principio al igual que en cualquier otro
momento posterior.

Habiendo eliminado la singularidad inicial en sus consideraciones, Hawking y Hartle partieron


en su trabajo asumiendo tomar la integral de caminos solamente sobre métricas no singulares.
En el caso de la integral de caminos ordinaria, se sabe que la medida de la misma está
concentrada sobre trayectorias no diferenciables. Pero éstas constituyen la terminación, en
alguna topología adecuada, del conjunto de integrales de caminos aparejadas con una acción
bien definida. De manera similar, se esperaría que la integral de caminos para la gravedad
cuántica se tomase sobre la terminación del espacio de métricas parejas. Lo que la integral de
caminos no puede incluír son métricas con singularidades cuya acción no está definida.

Como ya se mencionó arriba, por razones prácticas la integral de caminos se formula sobre el
soporte de las cuatro dimensiones del espacio-tiempo puestas en igualdad de condiciones, lo
cual implica que en vez de hablar acerca de algo como la métrica Lorentziana pura:

- x1² + x2² + x3² + x4²

en donde la primera coordenada es la coordenada del tiempo, estaríamos hablando de


algo Euclideano como:

x1² + x2² + x3² + x4²

al poner a x1 = ict con la ayuda de los números imaginarios. Esto nos permite tomar derivadas
con respecto a cualquiera de las cuatro coordenadas estando todas en igualdad de condiciones
(en inglés se acostumbra llamarle a ésto on an equal footing). Y el procedimiento matemático
conocido como continuación analítica nos permite transformar los resultados obtenidos sobre
condiciones tetradimensionales en términos de números de tres dimensiones espaciales y una
de tiempo. Por ello, a veces se le denomina a la dimensión espacial convertida como de “tiempo
imaginario”, porque implica el empleo de cifras imaginarias pero definidas matemáticamente.

Ahora bien, Hawking y Hartle han considerado el uso de la integral de caminos para intentar
describir la gravedad cuántica tomando en consideración métricas Euclideanas que carecen de
singularidades, con dos alternativas posibles: una métrica Euclideana plana fuera de un
conjunto compacto, o una métrica en variedades que son compactas y sin frontera. La primera
clase de métricas asintóticamente Euclideanas es sin lugar a dudas adecuada para cálculos de
dispersión. Se puede apreciar en la siguiente figura:
que con esta clase de métricas se puede estimar el envío de partículas hacia adentro desde el
infinito y observar qué es lo que puede salir hacia el infinito. Todas las mediciones se realizan en
el infinito, donde se tiene una métrica de fondo plano, en la cual se pueden interpretar de la
manera usual pequeñas fluctuaciones en los campos como partículas. Lo que ocurre en la región
de interacción ubicada en el centro se soslaya, esto debido a que se desarrolla una integral de
caminos sobre todas las historias posibles para la región de interacción, es decir, sobre todas las
métricas asintóticamente Euclideanas.

Pero los estudios cosmológicos habitualmente se realizan con mediciones de regiones finitas. Se
procede así, dada la calidad que los humanos tenemos como observadores desde la Tierra. La
ubicación de nuestro planeta es en el interior del Universo, lo cual implica tener una posición de
observación endógena que no nos permite mirar hacia adentro desde el exterior del Universo
con una vista panorámica super-cósmica. Para ver cuál es la diferencia, supongamos primero
que la integral de caminos para la cosmología debe tomarse sobre todas las métricas
asintóticamente Euclideanas. Esto conlleva a dos contribuciones a las probabilidades para
mediciones en una región finita. La primera provendría de métricas
Euclideanas conectadas asintóticamente. La segunda provendría de métricas desconectadas que
consistieran de un espacio-tiempo compacto que contenga la región de mediciones y una
métrica separada asintóticamente:
No se excluyen de la integral de caminos las métricas desconectadas, puesto que a éstas se les
puede aproximar mediante métricas conectadas, donde los distintos componentes están unidos
por tubos delgados o agujeros de gusano (wormhole) de una acción insignificante. En cuanto a
las regiones del espacio-tiempo compactas y desconectadas, estas no afectarían los cálculos de
dispersión, ya que no están conectadas con el infinito, lugar en donde se realizan todas las
mediciones. Sin embargo, sí afectarán a las mediciones en la cosmología realizadas en una
región finita. En efecto, las contribuciones de tales métricas desconectadas predominarán sobre
las contribuciones de las métricas Euclideanas conectadas asintóticamente. Aún así, si se
supusiese que la integral de caminos para la cosmología pasa sobre todas las métricas
asintóticamente Euclideanas, el efecto sería casi el mismo que si ésa pasara sobre todas las
métricas compactas. Por lo tanto, parece más naturla hacer que la integral de caminos para la
cosmología pase sobre todas las métricas compactas sin frontera, como lo proponen Hawking y
Hartle en su teoría de cosmología cuántica. También sugieren ambos que la integral de caminos
para la gravedad cuántica debería pasar sobre todas las métricas Euclideanas compactas. Esto se
puede traducir como el que el cosmos no tenga ninguna condición fronteriza, lo cual puede ser
sostenible dadas las condiciones expansivas, isotrópicas, homogéneas, de las pequeñas
perturbaciones que son observadas en el Universo. Por otra parte, se puede considerar que tanto
el espectro y las estadísticas de esas perturbaciones han sido observables en las fluctuaciones en
la radiación cósmica de fondo. Los resultados obtenidos hasta ahora concuerdan con las
predicciones de la proposición de la inexistencia de fronteras. Ello podría constituír a futuro una
auténtica prueba de la proposición y de todo el programa Euclideano de gravedad cuántica en
cuanto el momento en que las observaciones de las microondas de la radiación cósmica de fondo
se extiendan a escalas angulares más pequeñas. Sin embargo, asalta un hecho. Recordemos que
la integral de caminos implica la suma de una geometría tetradimensional con una inicial y otra
final tridimensionales. La proposición de Hawking y Hartle consiste en abolir las geometrías
tridimensionales y sólo incluír una tetradimensional que al final se empareja con las geometrías
tridimensionales. El uso aquí de la integral de caminos sólo entrega la probabilidad de un
Universo con ciertas probabilidades (el límite de las geometrías tridimensionales) pero creado
de la nada o a partir de un algo exótico que en Mecánica Cuántica se le conoce como
un instantón. El instantón puede ser utilizado para calcular la probabilidad de transición
mecánico cuántica de una partícula a través de una barrera de potencial mediante el efecto tunel
señalado arriba, y uno de los ejemplos más sencillos de un sistema con un efecto instanton es el
de una partícula situada en uno potencial de dos pozos. En contraste con una partícula clásica
cuya energía no es mayor que la energía de la barrera de potencial y por lo tanto es incapaz de
atravesar la barrera, existe una probabilidad de que pueda cruzar dicha barrera “por debajo”
mediante el efecto túnel, y una forma de calcular esta probabilidad es mediante la aproximación
WKB (Wentzel-Kramers-Brillouin) que requiere que el valor de h/2π sea pequeño. La ecuación
de Schrödinger para la partícula es:

Si el potencial V(x) se mantiene constante, la solución de esta ecuación vendría siendo una onda
plana:

en donde:

Esto nos dice que si la energía de la partícula es menor que la energía potencial, uno obtiene una
función que decae exponencialmente. La amplitud asociada de tunelaje es proporcional a:

La integral de caminos nos permite obtener el mismo resultado dándole la interpretación del
instanton. Bajo este formalismo, la probabilidad de transición es expresada de la manera
siguiente (en el paso intermedio se utiliza la notación de paréntesis angulados bra-ket de Dirac):

Llevando a cabo el procedimiento de rotación Wick que es esencialmente el procedimiento de


continuación analítica haciendo la transformación de un marco Lorentziano a uno Euclideano
mediante un tiempo imaginario (t → iτ), obtenemos la siguiente representación:

en donde la acción Euclideana SE para la integral de caminos es:

Para el potencial, esto tiene el efecto de darle un giro de 180 grados parándolo de cabeza,
haciendo que exhiba dos crestas de energía máxima en lugar de dos pozos. De este modo, a los
resultados obtenidos mediante la bien-definida integral de caminos Euclideana se les puede dar
una rotación Wick a la inversa para lograr los mismos resultados físicos que serían obtenidos
mediante un tratamiento adecuado de la integral de caminos Lorentziana potencialmente
divergente. De este modo, el cálculo de la probabilidad de transición para que una partícula
pueda tunelar a través de una región clásicamente prohibida (V(x)) mediante una integral de
caminos Lorentziana equivale a calcular la probabilidad de transición para tunelar a través de
una región clásicamente permitida (con potencial V(X)) mediante una integral de caminos
Euclideana (figurativamente hablando, dentro de la perspectiva Euclideana, esta transición
corresponde a una partícula rodando de la cima de un potencial de dos pozos parado de cabeza
hacia la otra cima del potencial). Esta solución clásica de las ecuaciones Euclideanas del
movimiento es justo el ejemplo de un instantón.
En la práctica, el cálculo de las probabilidades dentro de la Cosmología Cuántica utilizando la
integral de caminos completa es extremadamente laborioso, y se vuelve necesario utilizar cierto
tipo de aproximación conocida como aproximación semi-clásica porque su validez está situada
entre la validez de la física clásica y la validez de la Mecánica Cuántica. En esta aproximación
semi-clásica uno argumenta que la mayor parte de las cuatro geometrías dimensionales que
ocurren en la integral de caminos darán contribuciones muy pequeñas a la integral de caminos y
por lo tanto pueden ser ignoradas. De este modo, la integral de caminos puede ser calculada
considerando unas cuantas geometrías que son las que dan una contribución particularmente
grande a la misma. Estas contribuciones son las que obtenemos precisamente mediante
los instantones.

Hay varios tipos de instantones que pueden ser considerados como candidatos para suministrar
las condiciones iniciales en el Universo real. El mismo Hawking junto con Ian Moss intentaron
describir el inicio del cosmos sobre el supuesto de un Universo cerrado, de geometría
tridimensional, y con una eterna inflación. Si el Universo es abierto o cerrado es, por ahora, una
interrogante sin una respuesta categórica. En el caso de un Universo plano, la geometría
espacial a gran escala es semejante a la del espacio tridimensional de nuestro entorno. Por el
contrario, la superficie de las secciones espaciales de un Universo real cerrado se asemejaría a
tridimensionales esferas finitas de gran radio. Una geometría abierta se parecería a un
hiperboloide infinito. Por lo tanto, para que el Universo sea finito, debe de ser un Universo
cerrado. Esto, por ahora, no es lo que estamos viendo. Hay importantes evidencias
observacionales que están apuntando hacia una cosmología abierta e infinita para el Universo.
Esto dá lugar a una pregunta: ¿existen en ese tipo de espacios cósmicos instantones que puedan
describir la creación de universos abiertos? Un posible instanton podría ser la propuesta que
hicieron en el año 1987 los físicos Sidney Coleman y Franck De Luccia, quienes propusieron que
la materia que detonó el inicio del Universo se encontraba en un estado conocido como “falso
vacío” (false vacuum), el cual en términos clásicos es un estado excitado y estable y en Mecánica
Cuántica es un estado inestable. Según la Mecánica Cuántica, la materia que se encuentra
alojada en un falso vacío puede transferirse a un estado de verdadero vacío. La evolución de un
Universo a partir de un instanton Coleman-De Luccia suele ser representada pictográficamente
de la siguiente manera:
De acuerdo a Coleman y De Luccia, la transferencia cuántica de la materia en el Universo
primigenio procedió vía la formación de núcleos de burbujas alojadas en un falso vacío cuya
materia en descomposición se transcurrió hacia el vacío verdadero. En esta proposición,
sorprendentemente se puede llegar a consignar que el interior de cada burbuja corresponde a un
Universo abierto e infinito en el cual se puede dar la inflación cósmica. Este modelo corresponde
a un Universo abierto que cosmológicamente se le conoce como instanton Coleman-De
Luccia.

Una propuesta alterna al instanton Coleman-De Luccia fue la presentada por Stephen Hawking
y Neil Turok, los cuales propusieron una clase de instanton que da lugar a un Universo abierto,
semejante al propuesto por Coleman y De Luccia, pero sin el requisito de un falso vacío y de un
estado de excitación para la materia inicial. Esta propuesta suele ser representada
pictográficamente de la siguiente manera:
La desventaja de la propuesta hecha por Hawking y Turok es el hecho de que sus instantones
tienen singularidades en aquellos lugares en donde la curvatura del Universo se hace infinita,
singularidades en donde dejan de funcionar las leyes de la física.

Hay situaciones en las cuales tenemos dos teorías diferentes que pueden explicar lo mismo y
predecir el mismo comportamiento de un sistema físico, siendo ambas correctas. Tal es el caso
con la Mecánica Hamiltoniana y la Mecánica Lagrangiana. Pero hay otras situaciones en las
cuales tenemos dos teorías esencialmente incompatibles en las cuales sólo una de ellas puede
ser cierta, o quizá ninguna de las dos. Tal es el caso de la teoría de los instantones de Coleman-
De Luccia y los instantones Hawking-Turok. Las diferencias entre ambas teorías son de una
naturaleza tal que necesariamente una de ellas tiene que ser una teoría falsa. Pero también es
posible que ambas teorías estén erradas, máxime que ambas fueron formuladas en ausencia de
una teoría de la gravedad cuántica que, de existir, sea la verdadera teoría, la teoría de la cual se
puedan derivar como casos especiales la Relatividad General para explicar los fenómenos del
macrocosmos y la Mecánica Cuántica para explicar los fenómenos del microcosmos.

Hablando en términos generales, la Cosmología Cuántica puede ser considerada como una
ciencia apenas en ciernes en la cual se han dado los primeros pasos, y muchos trabajos y
esfuerzos seguramente tendrán que ser descartados en el camino al darnos cuenta de que alguno
de sus postulados o conclusiones estaba esencialmente errado. Sólo el futuro y los posibles
avances tecnológicos que pueda tener en el futuro la humanidad podrán decidir cuál de todas las
teorías para explicar el origen del Universo es la Cosmología Cuántica correcta, si es que hay una
que pueda ser formulada por seres humanos.
Perspectivas futuras
La Teoría de la Relatividad en realidad es una teoría incompleta, y Einstein siempre lo supo. Es
cierto que ha habido algunas mejoras a la misma que pese a las matemáticas intimidantes han
aumentado nuestra comprensión sobre los fenómenos físicos que describe. Una de dichas
mejoras consiste en que la notación tensorial utilizada por Einstein ha sido reemplazada por una
extructura matemática más moderna, el álgebra exterior, basada en el producto cuña (wedge
product) simbolizado con el símbolo “cuña” Λ (wedge), el cual tiene la siguiente interesante
propiedad de anticonmutatividad:

uΛv = - vΛu

Sin embargo, estas mejoras sólo han vuelto a la teoría más elegante, no la han liberado de sus
deficiencias. La primera deficiencia que podríamos citar radica en el mismo principio de
equivalencia sobre el cual descansa toda la Teoría General de la Relatividad. El mismo Einstein
dijo que el estar dentro de un marco de referencia acelerado podía ser considerado, para fines de
análisis, como algo equivalente a estar en presencia de un campo gravitacional, pero nunca dijo
que fueran exactamente la misma cosa (los llamóequivalentes, no iguales), como podemos verlo
en el siguiente esquema comparando ambas situaciones:

Podemos ver claramente que el campo gravitacional de la Tierra posee una estructura esférica
que no puede ser simulada simplemente acelerando un elevador en el espacio con una persona
adentro del mismo. Si dos manzanas sostenidas con medio metro de separación entre las
mismas son soltadas a una gran altura arriba de la Tierra, la distancia entre las manzanas se irá
acortando conforme van cayendo hacia la Tierra porque cada manzana cae a lo largo de una
línea recta dirigida hacia el centro de la Tierra. Pero en el elevador que está siendo acelerado, las
mismas manzanas caen a lo largo de líneas paralelas. En un caso, las manzanas caen de modo tal
que las direcciones de sus caídas están dirigidas hacia un punto de convergencia en donde las
líneas rectas de ambas caídas convergen y se encuentran en el centro de la Tierra, mientras que
en el otro caso tal punto de convergencia no existe. Esta diferencia nos permite concebir muchos
experimentos con los cuales una persona encerrada dentro de un elevador sellado
herméticamente sin vista hacia el exterior puede determinar si está en un elevador que está
siendo acelerado o si está en presencia de un campo gravitacional. Ambas cosas no son iguales.
El principio de equivalencia es útil como una primera aproximación hacia la descripción
matemática de lo que ocurre en presencia de campos gravitacionales intensos, pero está basado
a fin de cuentas en una equivalencia que no es una igualdad, porque no hay forma alguna en la
que una gravedad artificial como la que experimenta un viajero espacial pueda reproducir lo
que es una gravedad genuina con todo y ese punto de convergencia que está ausente en la
gravedad artificial. La gravedad producida artificialmente en el interior de una nave espacial
mientras se está acelerando es algo que consume grandes cantidades de combustible que
eventualmente se agotará. Producir en una nave interestelar una gravedad equivalente a la que
experimentan los objetos en la superficie de la Tierra (9.8 metros/seg²) consume bastante
energía mientras está siendo producida. En cambio, para cuerpos reposando sobre la superficie
de la Tierra, esa misma gravedad no implica gasto alguno de energía. Inclusive los fenómenos de
levitación (suspensión en el aire) experimentados por místicos y santos según las anécdotas en
varios textos religiosos alrededor del mundo son enteramente posibles (por algún mecanismo
que desconocemos) porque el flotar en el aire cerca de la superficie de la Tierra tendría un
consumo energético nulo de acuerdo con el principio de la conservación de la energía (el gasto
energético se produce en todo caso al elevarse aunque sea unos cuantos milímetros venciendo a
la gravedad de la Tierra, lo cual requiere de energía que tiene que salir forzosamente de algún
lado, dificultándole inclusive al místico más iluminado que podamos encontrar la tarea de
levitarse a sí mismo uno o dos kilómetros por encima de la superficie de la Tierra). Hay una
cantidad creciente de científicos que están empezando a sospechar que la presencia de
estos puntos de convergencia en los campos gravitacionales reales que están ausentes del otro
lado de la equivalencia (en los marcos de referencia acelerados) tal vez tenga una trascendencia
mucho mayor de lo que habíamos supuesto en un principio.

Podemos analizar, relativísticamente, un cuerpo en reposo (de masa propia m0) cargado
eléctricamente (con una carga Q). Tanto m0 como Q producirán cada uno un campo
esféricamente simétrico, un campo eléctrico y un campo gravitacional, conviviendo ambos como
una sola unidad por proceder de un mismo cuerpo pero manteniendo existencias
independientes. Y si el cuerpo es puesto en movimiento uniforme, podríamos suponer que
ambos campos esféricos se deforman de la misma manera, con la deformación sometida a la
contracción predicha por las transformaciones de Lorentz. Y si el cuerpo es acelerado,
podríamos suponer que se debe emitir tanto una radiación electromagnética como una
radiación gravitacional (el tema de la emisión de radiación electromagnética producida por una
carga eléctrica que está siendo acelerada ya fue tratado en las entradas correspondientes a la
electrodinámica relativista). Si esto fuera así, entonces una amplia literatura ya existente en
innumerables tratados de electrodinámica, sus fórmulas y sus teoremas, podrían ser
reformulados con cambios mínimos (de hecho, sin cambio alguno excepto notacional) para el
estudio de cuerpos acelerados en la Teoría de la Relatividad. Sin embargo, aquí nos topamos con
un problema fundamental: mientras que en la Teoría de la Relatividad la masa no permanece
invariante al pasar de un sistema de referencia a otro, en la electrodinámica se supone que la
carga eléctrica permanece invariante al pasar de un sistema de referencia a otro. Esto significa
que el campo electromagnético y el campo gravitacional deben tener comportamientos
diferentes al pasar de un sistema de referencia a otro pese a ser originados ambos por el mismo
cuerpo. Una forma de reconciliar este conflicto consiste en suponer que la masa inercial m0 de
un cuerpo, la oposición que presenta el cuerpo a ser acelerado cuando está flotando en el espacio
libre, es diferente de la masa gravitacional, la masa que produce un “peso” del cuerpo como se le
mide al ponerlo en una báscula situada sobre la superficie de la Tierra, y que la masa
gravitacional es la masa utilizada en el tratamiento tensorial de la Relatividad General, con lo
cual podríamos hacer a la masa gravitacional tan invariante como la carga eléctrica. En pocas
palabras, consideraríamos a la masa inercial y a la masa gravitacional como dos propiedades
diferentes de un mismo cuerpo (en su tiempo, el mismo Newton llegó a sospechar que pudieran
ser propiedades diferentes) dependiendo del tipo de experimento que se esté llevando a cabo
(esto es reminiscente de la dualidad onda-partícula de la materia, con la cual una partícula se
puede comportar como un corpúsculo bien definido o como una onda de materia dependiendo
del tipo de experimento que se esté llevando a cabo con la partícula). La masa inercial sería la
masa utilizada para explicar todo lo que sucede en el ámbito de la Teoría Especial de la
Relatividad, mientras que la masa gravitacional sería la masa utilizada para explicar todo lo que
sucede en el ámbito de la Relatividad General. Con esto, la masa gravitacional se comportaría de
la misma manera que la carga eléctrica del cuerpo, y las fórmulas serían las mismas en ambos
casos, lo único que cambiaría sería la naturaleza del campo considerado más no su
comportamiento bajo marcos de referencia en movimiento uniforme y acelerados. Pero esto nos
presenta un nuevo problema, ya que al “desconectar” a la masa inercial de la masa gravitacional
estaríamos demoliendo el mismo principio sobre el cual descansa la Relatividad General: el
Principio de Equivalencia. Este principio de equivalencia es precisamente lo que “conecta” a la
Teoría Especial de la Relatividad con la Relatividad General. Otra posibilidad consistiría en
suponer que la carga eléctrica no es la invariante absoluta que hemos supuesto todo el tiempo, y
que los efectos de la variación de la carga eléctrica al ser situada en marcos de referencia
acelerados son tan minúsculos que pese a estar ahí no han podido ser detectados por estar lejos
del alcance de nuestros métodos experimentales y de nuestras máquinas más potentes. Pero el
fin teórico de la invariancia de la carga eléctrica tendría otra consecuencia inmediata: todas las
fórmulas de la electrodinámica relativista basadas en la invariancia de la carga eléctrica dejarían
de ser completamente válidas, y pasarían a ser meras aproximaciones de algo más general que
está a la espera de ser descubierto. En cualquier caso, algo va a tener que ceder a un nivel tan
fundamental que necesariamente estaríamos hablando de una modificación radical de nuestros
conceptos teóricos más esenciales, las mismas bases sobre las cuales descansa el edificio que
hemos construído hasta ahora.

Pero las deficiencias y los conflictos que se acaban de señalar apenas tocan la superficie de otras
consideraciones mucho más problemáticas.

James Clerk Maxwell en quien Einstein se inspiró había logrado la unificación del campo
magnético y del campo eléctrico en una sola teoría que explicaba todos los fenómenos
electromagnéticos. Por su parte Einstein había logrado una teoría para explicar todos los
fenómenos de índole gravitacional bajo un nuevo concepto de la mecánica. La pregunta lógica
era ahora: ¿por qué no unificar ambas teorías en una sola? Después de todo, si Maxwell ya había
logrado llevar a cabo la unificación del campo magnético y del campo eléctrico en una sola
teoría, la unificación de las ideas de Maxwell y de Einstein podía ser considerado como el
siguiente paso natural. Consecuentemente, la búsqueda de tal unificación fue emprendida por
Einstein, en pos de una gran super-teoría que Einstein llamó la teoría del campo unificado.
Esta hipótesis se basa en la esperanza de que debe de haber una explicación única y simple para
todo, una formula que explique toda la naturaleza del universo, capaz de explicar todas las
fuerzas, una teoria que posiblemente nos proporcione la clave para poder entenderlo “todo”.

El primer triunfo aparente para obtener la unificación de la Teoría de la Relatividad con la teoría
del electromagnetismo fue logrado entre 1919 y 1926 por Theodor Kaluza y Oskar Klein, pero
este triunfo llegó a costa de ampliar el espacio cuatri-dimensional de Einstein a un espacio de
cinco dimensiones, una idea que ya para entonces no parecía tan extravagante. Después de todo,
si un espacio de cuatro dimensiones, más allá del espacio de tres dimensiones (ancho, altura,
profundidad) que percibimos con nuestros sentidos, había logrado la proeza de explicar todos
los fenómenos gravitatorios, ¿por qué no la postulación de una quinta dimensión podría lograr
la unificación de las ecuaciones de Einstein con las ecuaciones de Maxwell? Esta teoría es hoy
conocida como la Teoría de Kaluza-Klein. Se sobreentiende que esta quinta dimensión es
una dimensión puramente matemática que está más allá de nuestros sentidos físicos para poder
visualizarla.

El problema con la Teoría de Kaluza-Klein es que no explica fenómenos que involucran las otras
dos fuerzas de orden atómico que se sabe que existen, la interacción nuclear fuerte y
la interacción nuclear débil. No hay forma alguna en la cual se puedan obtener explicaciones
teóricas a estos fenómenos subatómicos recurriendo únicamente a la Teoría de Kaluza-Klein.

Sin embargo, considerando que la Teoría de Kaluza-Klein, aunque incompleta, había logrado la
hazaña de unificar a la relatividad con el electromagnetismo mediante la postulación de un
espacio de cinco dimensiones en lugar de cuatro, ¿por qué no considerar la posibilidad de
obtener una teoría más amplia agregando más dimensiones al espacio de cinco dimensiones,
con el fin de poder explicar también bajo un mismo esquema la interacción fuerte y la
interacción débil?

Es así como las nuevas teorías para explicarlo todo a partir de una fórmula general han ido
agregando una cantidad creciente de dimensiones matemáticas, las cuales están complicando
enormemente la posibilidad de poder obtener una fórmula matemática sencilla como las
fórmulas generales que obtuvieron Newton y Einstein en sus respectivas formulaciones de la
mecánica gravitatoria. Einstein creía que la fórmula mágica para explicarlo todo debería ser una
fórmula sencilla, comprensible, lo cual es imposible de lograr cuando se le van agregando más y
más dimensiones a un espacio multi-dimensional cada vez más abultado. Es posible que la
fórmula sencilla o por lo menos no tan complicada que Einstein estaba buscando para la
formulación de su teoría del campo unificado ni siquiera exista, y si existe dicha fórmula tal vez
sólo se podrá escribir concibiendo nuevas estructuras matemáticas que por el momento no nos
son claras a nuestro entendimiento. Por lo pronto, lo que se tiene a la mano requiere ya no tanto
de nuevas filosofías sino de un repertorio de herramientas matemáticas que requiere un grado
de Doctorado bastante lejos del alcanzar para el común denominador de la gente. Además de
considerar la posibilidad de ir aumentando el número de dimensiones pasando del 4-espacio
relativista a un N-espacio, también existe la posibilidad de mantenernos en el 4-espacio pero
aumentar el orden de los tensores, saltando (por ejemplo) de los tensores de orden dos a
tensores de orden tres o inclusive tensores de orden cuatro. La geometría Riemanniana ya está
preparada para este brinco al no estar limitada a un 4-espacio y al ser una geometría de
cobertura general. Bajo el esquema de un aumento en el orden de los tensores, el tensor energía-
tensión general T = (Tαβ) de la Relatividad General pasaría a ser un tensor como T= (Tαβγ), el
cual incorporaría todas las propiedades y características ya conocidos para dicho tensor. Del
mismo modo, otros tensores tales como el tensor de Faraday Faumentarían de orden
incorporando lo que ya se tiene hoy. La dificultad presentada por el recurso de echar mano de
tensores de orden mayor, además del trabajo matemático extra que representa este esquema, es
que no se puede dar tal salto sin que esté justificado por nuevas observaciones experimentales
que aún no tenemos. Einstein creía que debía ser posible derivarlo todo recurriendo únicamente
a las capacidades del intelecto sin gastar mucho tiempo en algún laboratorio. Pero a estas
alturas se antoja un poco difícil que este modo de pensar nos pueda llevar muy lejos.

Las complejidades arriba señaladas van a la raíz de otro problema que no ha sido resuelto aún:
la unificación de la teoría de la relatividad con la mecánica cuántica. Es bien sabido que ni la
teoría cuántica explica por qué es imposible viajar a la velocidad de la luz ni la Teoría de la
Relatividad explica nada acerca del comportamiento de las partículas atómicas y subatómicas
como pequeños paquetes de ondas de materia.

Para intentar unificar a la Relatividad General con la mecánica cuántica, se ha propuesto como
partícula elemental de la fábrica espacio-tiempo a una curiosa partícula elemental bautizada
como el gravitón. Y se ha postulado que, a escalas subatómicas, existe una especie de principio
de incertidumbre con el cual en la fábrica espacio-tiempo ocurren cosas tan espectaculares como
el tiempo dando marcha atrás. No es un mero asunto de dilatación del tiempo o inclusive un
congelamiento total del avance del tiempo, sino un tiempo negativo en el que nos dirigimos no
hacia el futuro sino hacia el pasado. Muchos filósofos contemporáneos aún encuentran estas
ideas sumamente difíciles de digerir.

Al igual que la catedral más grande como Notre Dame en París que está construída a fin de
cuentas con muchos ladrillos que son los que le dan su forma y arquitectura, también los
planetas y las estrellas están hechos a fin de cuentas con átomos y moléculas que son los en
última instancia dictan las propiedades de los planetas y las estrellas empezando por la más
fundamental de todas: la atracción gravitatoria. Cada átomo, cada molécula, necesariamente
debe contribuír un poco a dicha atracción, de manera tal que con la fuerza de los números
grandes los efectos se deben manifestar tal y como los vemos.

Esto significa que si la ecuación tensorial básica de la Teoría General de la Relatividad debe
tener un origen, ese origen debe radicar a fin de cuentas en los mismos átomos. Una Teoría
General de la Relatividad más completa que la que actualmente tenemos debe poder obtenerse a
partir de las propiedades de los mismos átomos, y a esos niveles microscópicos el
comportamiento de la materia está dictado por la ecuación de onda de Schrodingerque
resume la dualidad onda-partícula de la materia ultra-microscópica y su comportamiento
probabilístico:

No nos es posible derivar la ecuación tensorial G = (8πG/c²)T de la ecuación de onda de


Schrodinger porque el comportamiento gravitacional de los átomos nunca fue incorporado por
Schrodinger a su ecuación. Lo más lejos que se ha llegado ha sido la fusión de la mecánica
cuántica con la Teoría Especial de la Relatividad dando origen a lo que hoy se conoce como
la mecánica cuántica relativista, pero esto es una referencia a la Teoría Especial de la
Relatividad, no a la Teoría General de la Relatividad. Ese fue uno de los asuntos que quedaron
pendientes en la época de Schrodinger, Pauli, Dirac, y otros, bajo el argumento de que a nivel
atómico los efectos gravitacionales “son despreciables”. Tal vez lo serán para dos o tres átomos
en cercanía el uno con el otro (e inclusive esto está por verse), pero cuando se trata de 1020 o
1030 átomos conglomerados en cercanía el uno con el otro, el argumento de que los efectos
gravitacionales ocasionados por los átomos es despreciable se cae por sí solo.

Einstein intentó proceder a la inversa, intentó incorporar las fuerzas de índole sub-
microscópica a sus ecuaciones tensoriales, de modo tal que lo que sucede a nivel atómico y sub-
atómico pudiera ser explicado como una consecuencia de lo que ocurre a gran escala, y su
fracaso evidente en esta tarea nos debe poner a pensar que una teoría ampliada sobre el
comportamiento de la materia no puede privilegiar el comportamiento del macrocosmos sobre
el comportamiento del microcosmos. Es irónico que Einstein, quien eliminó los conceptos del
movimiento absoluto, del espacio absoluto y del tiempo absoluto, negando así la posibilidad de
observadores privilegiados, haya intentado privilegiar sus propias teorías sobre las teorías que
rigen el comportamiento básico de la materia en el microcosmos. Habiéndose aferrado a este
punto de vista, no es de extrañar que haya terminado con las manos vacías en su búsqueda por
“la gran unificación”. Asimilando los fracasos del pasado, bajo esta óptica la unificación plena de
la mecánica cuántica con la mecánica relativista tiene que darse en el mundo microscópico, y es
la Teoría General de la Relatividad la que tiene que ser incorporada dentro de la mecánica
cuántica y derivada de ella, y no al revés como pretendía hacerlo Einstein.
En base a la naturaleza discreta (cuántica) de todo lo que hay en el Universo, parece sensato
suponer que la conexión entre el mundo probabilístico de la Mecánica Cuántica y el mundo
determinístico de la Teoría de la Relatividad se llevará a cabo reemplazando una sumación por
una integral (saltando con ello del mundo discreto al mundo continuo, que dicho sea de paso es
el eje central de toda la teoría matemática del cálculo infinitesimal):

Σ⇒∫
Después de todo, así fue precisamente como Einstein logró explicar el movimiento Browniano
sentando las bases teóricas de la existencia del átomo y con ello de la teoría atómica moderna,
paradójicamente rehusándose a hacer lo mismo con su propia Teoría de la Relatividad.

Del mismo modo que no es posible continuar subdividiendo a la materia hasta el infinito sin
toparse eventualmente con esas unidades discretas que llamamos átomos, es imposible extender
los alcances de la Teoría de la Relatividad hasta niveles atómicos porque los átomos se
convierten en singularidades que están fuera del alcance del modelo continuo en el cual se basa
el Análisis Tensorial. Sin embargo, si estamos dispuestos a explorar la fundamentación del
Análisis Tensorial sobre una base probabilista en vez de una base determinista, esto nos abre un
nuevo horizonte de posibilidades al parejo con la posibilidad del desarrollo de nuevas
herramientas matemáticas que no se nos habían ocurrido, porque se ha pasado por alto el hecho
de que la Mecánica Cuántica, pese a estar basada en modelos probabilistas, mantiene intacto el
espíritu de la filosofía relativista, inclusive a un grado mucho mayor que la misma Teoría de la
Relatividad aplicada al macrocosmos. Considérese por ejemplo el análisis relativista de la órbita
de un planeta girando en torno al Sol. El modelo relativista de Schwarzschild nos especifica dos
coordenadas angulares para la ubicación del móvil, θ y φ. Sin embargo, una de esas dos
coordenadas angulares permanece fija ya que la órbita del satélite está confinada a un plano.
Esto le dá a la posición angular fija una valor privilegiado (por ejemplo, φ = π/2) sobre todos los
demás valores angulares posibles (por ejemplo, φ = π/4, φ = 0, φ = 3π/2, etc.), lo cual va en
sentido contrario a la relativización de la Naturaleza. En cambio, el modelo probabilista de la
Mecánica Cuántica que sitúa al electrón del átomo de hidrógeno no como una partícula girando
en una órbita circular a un radio fijo alrededor del núcleo atómico sobre un plano orbital fijo
sino como una nube de probabilidad:
destrona el status privilegiado que cierta distancia radial o el valor de cierta coordenada angular
pudieran tener sobre todos los demás valores posibles, no habiendo por lo tanto un valor
privilegiado sobre todas las demás. Lo que hay en todo caso es una mayor probabilidad de
encontrar a un electrón en ciertos lugares que en otros, más no una certeza absoluta, ya que de
haberla tendríamos un modelo determinístico con un conjunto de valores privilegiado sobre los
demás en oposición a la filosofía relativista.

Debe destacarse el hecho de que si en 1915, cuando la Teoría de la Relatividad ya estaba


plenamente desarrollada y dos años después de que hubiera propuesto su modelo atómico
planetario, el físico danés Niels Bohr hubiese adoptado una postura relativista, es muy probable
que en vez de su modelo atómico planetario del átomo:

que concibió para explicar las líneas espectrales -inspirado en modelo planetario mecanístico de
Newton- habría terminado reemplazándolo con un modelo probabilista, anticipándose con ello
a lo que ya se estaba en ciernes en las mentes de otros investigadores. Si en vez de darle al
electrón una órbita situándolo -en un sistema de coordenadas esféricas- a cierto ángulo azimutal
fijo, privilegiando tal valor angular por encima de todos los demás (una posible infinitud de
ellos), y una distancia radial fija privilegiándola de modo absoluto por sobre todas las demás,
hubiera adoptado una postura puramente relativista bajo la cual no hay razón alguna para que
cierto valor de coordenada angular sea privilegiado sobre todos los demás valores posibles, y de
tal modo su modelo habría terminado siendo justo el modelo probabilista que tenemos hoy del
átomo. El modelo planetario mecánico de Bohr, mucho menos relativista que el modelo atómico
basado en nubes de probabilidad, terminó siendo desechado a fin de cuentas, considerado más
como una forma de arte que como ciencia. Resulta irónico que pese a ser el modelo atómico de
Bohr mucho menos relativista que el modelo atómico actual basado en nubes de probabilidad,
del mismo Bohr nos haya venido algo que tal vez pueda ser utilizado exitosamente en el
desarrollo de una Teoría Cuántica de la Gravedad, el principio de correspondencia que nos dice
que para números cuánticos grandes, la ecuación cuántica se convierte en la ecuación clásica
correspondiente. A nivel sub-atómico, la Mecánica Cuántica nos ha demostrado ya su enorme
eficiencia. Al irse juntando cantidades cada vez mayores de átomos, el pequeñisimo efecto
gravitacional individual se debe ir sumando al de los demás emparejándose estadísticamente en
un promedio en el que no vemos ya las contribuciones individuales de cada átomo al gran
promedio, y en el cual el infinito discreto nos produce la ilusión del infinito continuo. Si esto es
así, entonces tal vez debería ser posible, en principio, enunciar el principio de correspondencia
de Bohr en una forma modificada como la siguiente:

Principio de correspondencia de Bohr (revisado): Para un número cuántico grande, la


ecuación cuántica se debe convertir en una ecuación tensorial covariante.

La relatividad, como ya se resaltó, es inherente al modelo probabilista del átomo, y al irse


juntando una cantidad cada vez mayor de átomos la Naturaleza se debe volver menos relativista,
lo cual (afortunadamente) permite que las órbitas de los planetas en torno al Sol sean posibles.
No hay pues conflicto alguno en la posibilidad de que podamos anclar los orígenes de la Teoría
de la Relatividad al mismo átomo, siempre y cuando estemos dispuestos a desechar la
Relatividad determinística-mecanística y estemos dispuestos a considerar la posibilidad de una
nueva frontera: la Relatividad probabilista. Si el mismo Einstein hubiera podido
sobreponerse a su desdén hacia las mismas bases de la Mecánica Cuántica, es posible que habría
desarrollado las herramientas matemáticas al igual que como lo hizo Newton en su desarrollo
del cálculo infinitesimal para el desarrollo de la mecánica Newtoniana. Ciertamente tenía la
inteligencia para ello. Lo que no tenía era ni la voluntad ni el estómago para modificar sus
propios puntos de vista, pese a que la misma Teoría de la Relatividad resultó ser un concepto tan
novedoso como radical y revolucionario que tuvieron que pasar varias décadas para que pudiera
ser asimilada en su plenitud.

Podemos suponer, desde luego, que hay dos leyes físicas básicas totalmente diferentes en el
Universo, las cuales son independientes la una de la otra, una dando origen al comportamiento
cuántico de la materia, y la otra dando origen al comportamiento gravitacional, las cuales
trabajando en una maravillosa y extraña coincidencia son las causantes de lo que vemos hoy.
Pero desde hace ya mucho tiempo que los científicos dejaron de creer en coincidencias. Todo lo
anterior nos conduce a sospechar en la posibilidad de que la ecuación de onda de Schrödinger
tal vez pueda ser ampliada con la adición de un término desconocido:

o la introducción de un factor desconocido:

con lo cual se llevaría a su conclusión aquello que el mismo Schrödinger dejó pendiente. Como
está dada hoy su ecuación, no es posible derivar de la misma la explicación de ningún fenómeno
gravitacional (del mismo modo que no es posible derivar la Teoría General de la Relatividad
explicación alguna para los fenómenos que ocurren en el mundo sub-atómico). Algo nos falta en
ella que tiene que ser agregado, incorporando dentro de la misma un espacio cuatri-dimensional
(o inclusive un espacio de mayores dimensiones, aunque nuestra limitada intuición geométrica
no nos ayude a captarlo en su totalidad).

Para el estudio de los fenómenos microscópicos y para los efectos del cálculo numérico, el factor
desconocido o el término desconocido sería considerado insignificante, despreciable, pero no
sería cero. A medida que se van acumulando más y más átomos y moléculas en un solo lugar, la
contribución de cada uno de ellos a la curvatura del espacio-tiempo deja de ser insignificante,
hasta el punto en que el efecto gravitacional se vuelve predominante, imposible de ignorar. Esto
es lo que debe predecir una ecuación relativista generalizada de Schrödinger. Los
fenómenos físicos en el macrocosmos dependen a fin de cuentas de la contribución producida
por cada átomo y molécula en reposo o en movimiento. Es muy posible que a
nivel individual cada átomo exhiba un efecto probabilista en su contribución a la curvatura del
espacio-tiempo en su entorno, el cual sería promediado fuera (estadísticamente hablando) en un
conglomerado enorme de átomos y moléculas, lo cual a su vez justificaría el modelo
determinista (no-probabilista) defendido por Einstein.

En cierta forma, la ecuación de onda de Schrödinger dada arriba ya está preparada de alguna
manera para la incorporación de una cuarta coordenada haciéndola pasar a un espacio cuatri-
dimensional. Matemáticamente la ecuación se puede expresar de manera más concisa
recurriendo al operador Laplaciano ∇ (nabla ó del):

Este operador es extendido a cuatro dimensiones con la definición de un operador ampliado


conocido como el operador D’Alembertiano definido a partir del siguiente tensor de
orden 1 (vector):

con lo cual, aplicando la convención de sumación y recurriendo a la ayuda del tensor métrico
ημν:

² = ∂μ∂μ

² = ημν∂μ ∂ν

El problema en tratar de unificar la Teoría de la Relatividad con la mecánica cuántica no es tan


sólo un problema de mera índole matemática, sino que confronta cuestiones filosóficas de fondo
que a primera vista parecen imposibles de conciliar. En las fórmulas derivadas por Einstein
existe la presunción de que todo se puede describir rigurosamente mediante el
par causa y efecto. Si se conocen las condiciones iniciales de un problema mecánico, entonces
todo lo que acontecerá en el futuro puede ser predicho a partir de dichas condiciones. El
universo de Einstein es, en efecto, un universo determinístico. Pero en la mecánica cuántica esta
filosofía es echada por la borda empezando con la postulación del principio de
incertidumbre de Heisenberg, el cual nos dice que no es posible determinar a la vez con
precisión ilimitada la posición exacta de una partícula y la velocidad con la cual se está
moviendo, y esto no se trata de un problema en la limitación que nuestros instrumentos de
medición impongan para la medición de tales parámetros, se trata de una cuestión inherente a
la naturaleza de la materia en sí. El universo de la mecánica cuántica es, en efecto, un universo
probabilístico. No hay forma fácil de poder conciliar estos puntos de vista tan diametralmente
opuestos.

En nuestro trayecto hacia la gran unificación de la Teoría de la Relatividad con la mecánica


cuántica contamos ya con algunas unas pistas experimentales que, aunque escasas, están
resultando muy reveladoras. Una de ellas nos viene de un experimento llevado a cabo en 1975
por los investigadores R. Colella, A. Overhauser y S. A. Werner. Se trata del descubrimiento y
corroboración de un efecto de interferencia que depende de un ángulo de corrimiento de fase
cuántico debido a la gravedad, el cual ha sido verificado con un error experimental inferior al 1%
con la ayuda de un interferómetro de neutrones que utiliza neutrones térmicos para el estudio
de los neutrones como ondas de materia. Este es el primer experimento de su tipo en el cual en
los cálculos teóricos el potencial gravitatorio entra directamente dentro de la ecuación de
Schrodinger, y nos revela algo sumamente interesante: La gravedad no es puramente
geométrica a un nivel cuántico puesto que su efecto depende de (m/ħ). Si lo meditamos un
poco, este resultado no nos debe resultar tan sorprendente en virtud de que si la gravedad
mantuviese su aspecto puramente geométrico en el mundo sub-microscópico ello implicaría una
posible sub-división hipotética del espacio-tiempo hasta niveles sub-atómicos, lo cual en turno
convertiría al mundo sub-microscópico en un entorno determinista en donde las reglas de la
mecánica cuántica no deberían de funcionar, lo cual no es el caso. Todo nos parece indicar que,
a niveles sub-atómicos, la suave geometría Riemanniana del continuum se esfuma para dar paso
a otra cosa para la cual la mecánica cuántica trabaja bien aunque aún no haya incorporado
dentro de sí a la gravedad. El experimento COW (Colella, Overhauser, Werner) nos indica sin
equivocación alguna que la gravedad y la Mecánica Cuántica no son algo desconectado, y que a
nivel sub-atómico es posible observar y medir efectos debidos a la gravedad porque inclusive a
este nivel potencial gravitacional.

Einstein tuvo enormes dificultades para aceptar los postulados de la mecánica cuántica, pese a
una cantidad creciente de triunfos de la teoría cuántica en la predicción de fenómenos que
fueron confirmados rigurosamente en el laboratorio uno a uno. Einstein se opuso firmemente a
esta concepción del universo, a grado tal que afirmó en una célebre frase: “Dios no juega a los
dados con el Universo”. Con este modo de pensar, el mismo Einstein se ató sus propias manos
impidiéndose a sí mismo la búsqueda de una teoría que pudiera conciliar su universo
determinístico con el universo probabilístico de la mecánica cuántica. De cualquier modo, el
mismo Einstein reconoció las limitaciones matemáticas inherentes en cualquier esfuerzo por
tratar de extender la Relatividad General hacia el microcosmos:

“Las ecuaciones diferenciales que pueden ser postuladas como ley de campo para los gik no
pueden ser menores del segundo orden, esto es, deben contener por lo menos las segundas
derivadas de los gik con respecto a las coordenadas. Suponiendo que no aparezcan derivadas
mayores de segundo orden en la ley de campo, está determinado matemáticamente por el
principio de la relatividad general. El sistema de ecuaciones puede ser escrito en la forma:

Rik = 0

Los Rik se transforman en la misma manera que los gik, esto es, también ellos forman un tensor
simétrico.

Estas ecuaciones diferenciales reemplazan completamente la teoría Newtoniana del movimiento


de los cuerpos celestes siempre y cuando las masas sean representadas como
singularidades del campo. En otras palabras, ellas contienen la ley de la fuerza así como la
ley del movimiento a la vez que se eliminan 'sistemas inerciales'.

El hecho de que las masas aparezcan como singularidades indica que estas masas por sí mismas
no pueden ser explicadas por campos simétricos gik, o 'campos gravitacionales'. Ni siquiera el
hecho de que únicamente existan masas positivas gravitacionales puede ser deducido de esta
teoría. Evidentemente una teoría relativista de campo completa debe estar basada en un campo
de naturaleza más compleja, esto es, una generalización del campo simétrico tensorial”. (“On the
Generalized Theory of Gravitation”, Albert Einstein, Scientific American, Abril, 1950.)

Precisamente para solventar el problema presentado por este fenómeno “patológico” de las
partículas atómicas y sub-atómicas que necesariamente aparecen como singularidades en las
ecuaciones de campo de Einstein, el físico ruso Anatoli Logunov junto con dos colaboradores
suyos, Mestvirishvili y Petrov, concibió una teoría alternativa a la Relatividad General, a la cual
llamó Teoría Relativista de la Gravitación(desafortunadamente, esta selección de palabras
se presta a la confusión con la teoría de Einstein), cuya formulación es muy similar a la
Relatividad General. Las predicciones de esta teoría y la de Einstein son muy parecidas, ambas
postulan ecuaciones muy similares sobre cómo se curva el espacio-tiempo en presencia de la
materia-energía, y la forma geométrica del espacio tiempo en el vacío resulta similar. Las dos
teorías son diferentes, sin embargo, en sus implicaciones cosmológicas y de equilibrio de
cuerpos muy masivos. La Teoría Relativista de la Gravitación requiere que el gravitón tenga una
masa pequeña pero aún así diferente de cero; en cambio la Relatividad General de Einstein es
compatible tanto con una masa del gravitón diferente de cero, como con una masa del gravitón
exactamente igual a cero. Si la masa del gravitón no fuera cero ello se manifestaría en la
presencia en las ecuaciones de campo de una constante cosmológica, lo cual debe tener
consecuencias detectables. En principio, se pueden diseñar experimentos para descartar una de
las dos teorías, pero hasta la fecha esto sigue un asunto pendiente de resolver. La Teoría
Relativista de la Gravitación, pese a su atractivo en la remoción de las masas puntuales como
singularidades matemáticas de la teoría, no es la principal competidora de la Relatividad
General, de Einstein. Lo es la teoría de gravitación Brans-Dicke desarrollada en 1961 que
también es capaz de explicar la deflexión de la luz en presencia de un campo gravitacional así
como la precesión de las órbitas de los planetas en torno al Sol, y la cual contiene además sus
propias características peculiares tales como el hecho de que la constante de gravitación
universal G no es realmente una constante e inclusive lo que la sustituye dentro de la teoría
Brans-Dicke puede variar de lugar así como en el tiempo. Al igual que como ocurre con la Teoría
Relativista de la Gravitación de Logunov, las predicciones de la teoría Brans-Dicke también
concuerdan con los datos observados experimentalmente hasta la fecha, y aquí también el
diseño de algún experimento que ponga a una teoría sobre la otra sigue un asunto pendiente de
resolver.

Por otro lado, además de que la Teoría de la Relatividad es incapaz por sí sola de explicar los
fenómenos propios del electromagnetismo y ha resistido los intentos de los mejores científicos
de nuestro tiempo por ser unificada con la mecánica cuántica, además es incapaz también de
explicar también otro asunto que ha causado enorme preocupación a los científicos: la presunta
existencia de algo bautizado como la materia oscura. Si aplicamos ya sea las ecuaciones de
Newton o las ecuaciones de Einstein al estudio del comportamiento de las galaxias, de las cuales
las más susceptibles de análisis son las conocidas como las galaxias espirales, las cuales se dá
por hecho que están en movimiento de rotación por la forma que tienen los brazos espirales:
encontramos que simple y sencillamente no hay suficiente masa para proporcionar suficiente
atracción gravitacional (o curvatura en el espacio-tiempo) para retener las estrellas situadas en
los bordes exteriores de las galaxias, las cuales ya deberían haber salido disparadas fuera de las
mismas desde hace mucho tiempo. Debe haber algo más que está proporcionando esa atracción
gravitacional extra para poder retener las estrellas exteriores a las galaxias orbitando en torno al
centro de la galaxia. Ese algo es precisamente la materia oscura. El problema es que no hay nada
allí afuera que nos indique su existencia. Puesto que no parece interferir con la transmisión de la
luz que nos llega desde el interior de otras galaxias exteriores a la nuestra, la materia oscura
parece ser totalmente invisible. Pero a la vez debe ser lo suficientemente masiva para poder
proporcionar una atracción gravitacional enorme que permite que las galaxias puedan mantener
sus estrellas unidas en rotación constante. La única forma de compensar por esta atracción extra
es introduciendo una constante cosmológica dentro de la ecuación tensorial básica de la Teoría
de la Relatividad. Esto sería para justificar los efectos de la materia oscura sin tratar de
comprender la naturaleza de la cual está hecha.

Pero la materia oscura no es el único problema que enfrenta actualmente la Teoría de la


Relatividad. Los descubrimientos astronómicos más recientes nos han confirmado que no sólo
nuestro Universo se está expandiendo, sino que esa expansión que se creía constante y
uniforme se está acelerando. La primera consecuencia de este descubrimiento es que la ley de
Hubble que no anticipaba tales efectos de aceleración en la expansión del Universo está
entrando en serios aprietos. Esta aceleración en la expansión del Universo se cree que es debida
a algo que ha sido bautizado como la energía oscura, una energía de naturaleza puramente
anti-gravitacional. Si pudiésemos en estos momentos producir en la Tierra aunque fuese un
poco de esa materia oscura, podríamos construír naves espaciales que nos podrían llevar a otros
planetas de nuestro sistema solar en cuestión de unas cuantas horas.

La única forma inmediata de compensar por esta repulsión extra es introduciendo otra
constante cosmológica dentro de la ecuación tensorial básica de la Teoría de la Relatividad que
ciertamente será diferente de la constante cosmológica requerida para compensar por los
efectos de la materia oscura, de modo tal que tendríamos dos constantes cosmológicas
diferentes, una para explicar los efectos gravitacionales a distancias cortas (hablando en
términos astronómicos) y la otra para explicar los efectos gravitacionales a distancias grandes.
Tal vez podríamos agrupar ambas constantes cosmológicas dentro de una sola constante
cosmológica que se reduciría a la explicación de los efectos de la materia oscura para distancias
cortas y la explicación de los efectos de la energía oscura para distancias grandes. Esto nos lleva
de nuevo a la Teoría Relativista de la Gravitación propuesta por Anatoli Logunov y sus
colaboradores, mencionada arriba. Esta teoría, al requerir una masa del gravitón que sea
diferente de cero, introduce en las ecuaciones de campo la siguiente constante cosmológica:

en donde mg es la masa del gravitón. Esto tiene una consecuencia importante, ya que la adición
de este término adicional a las ecuaciones de campo proporcionaría una explicación a la
aceleración de la expansión del Universo, aunque deja pendiente el asunto de la explicación
acerca de la materia obscura. Aún si la Teoría Relativista de la Gravitación de Logunov resulta
cierta, la explicación de ambos efectos opuestos por un mismo conjunto de ecuaciones de campo
necesariamente será un asunto de complejidad adicional que nos aleja de la suposición
Einsteniana de que todas las leyes del Universo deben poder ser derivables de unos cuantos
principios que pueden ser expresados en términos elementales. Puesto más elitísticamente, el
Universo estaría construído de modo tal que su funcionamiento no podrá ser entendido más que
por unos privilegiados, a menos de que inventemos una nueva estructura matemética que
permita resumir sus leyes de una manera concisa.

Aquí resulta instructivo reproducir las siguientes palabras del Profesor Heinz Pagels tomadas de
su libro Perfect Symmetry: “Pero mi exhuberancia juvenil generó algo de lo cual no me he
podido liberar hasta el día de hoy, la idea de que una ley física sencilla explique la totalidad de la
existencia material. Tal ley física explicaría el origen del Universo, sus contenidos, y su destino
final. Todas las demás leyes naturales podrían ser derivadas lógicamente de esta ley única. Si tal
ley fuese descubierta, sería el triunfo supremo de la física: la narración lógica de la fundación de
la existencia estaría completa. Nadie, incluídos los físicos, tiene la menor prueba de que tal ley
pueda existir. Es fácil imaginar muchos problemas. Tal vez la misma idea de lo que es una ley
física se quiebra en algún punto. Por ejemplo, la descripción física de la Naturaleza, que hasta
hoy no le ha fallado a los físicos, concebiblemente sea inadecuada para la tarea de poder
enunciar tal ley. Otra posibilidad es que tal ley maestra existe pero la mente humana es incapaz
de encontrarla. Inclusive una super-inteligencia artificial con capacidades que van más allá de la
mente humana estaría limitada por esa misma ley. Entonces, por eso mismo, estaría
imposibilitada para poder descubrir tal ley”. (Sobre esto último, puesto con otras palabras, la
forma y la naturaleza de dicha ley actuando sobre de una super-inteligencia artificial quizá le
impediría a esa super-inteligencia artifical el poder descubrirla; estamos hablando aquí de una
máquina que tendría que ser lo suficientemente inteligente para poder comprender las mismas
leyes que le permitan comprender aquello que está tratando de comprender pese a que está
sujeta a esas misma leyes.) Nadie ha demostrado que tal teoría del todo pueda existir. Pero
tampoco nadie ha demostrado que tal teoría no exista.

Es muy posible que una teoría del todo realmente exista esperando ser descubierta por alguien.
Han aparecido recientemente trabajos apuntando hacia esa dirección. Uno de ellos que tomó
por sorpresa al mundo académico fue presentado por Antony Garret Lisi, el cual remitió su
trabajo al repositorio de Internet arXiv el 6 de noviembre de 2007 bajo el título “Una teoría del
todo excepcionalmente simple” (An Exceptionally Simple Theory of Everything). Este es un
trabajo sorprendente por cuanto su autor no pertenece al mundo habitual de la física académica
sino que se ha dedicado la mayor parte del año a la práctica del surf en Hawai. Al menos desde el
punto de vista matemático, su autor logra lo que se propone, unificar plenamente la Mecánica
Cuántica con la Teoría de la Relatividad. Sin embargo, el título del trabajo suena más que
irónico, porque esta unificación fue llevada a cabo recurriendo a álgebras Lie y a uno de los
grupos más complejos que se conocen dentro de la teoría de grupos, el grupo compacto Lie E8 de
dimensión 248. Y aunque en marzo de 2010 Jacques Distler y Skip Garibaldi publicaron un
trabajo refutando la teoría de Lisi, el hecho de que alguien haya logrado dar con argumentos
convincentes para proporcionar una solución con las matemáticas actuales al problema de la
gran unificación buscada por Einstein debe ser motivo de reflexión, máxime que desde antes de
la publicación de dicho trabajo ha existido una comunidad creciente de científicos que
sospechan que el grupo compacto Lie E8 posiblemente jugará un papel importante en la
obtención de la verdaderateoría del todo. De cualquier modo, no se debe descartar la
posibilidad de que sea necesario el desarrollo de nuevas herramientas matemáticas que logren
“pegar” filosóficamente el mundo determinista y el mundo de la probabilidad como una especie
de dios Jano con dos rostros distintos pero en el fondo una sola y misma persona. Estas nuevas
herramientas matemáticas posiblemente actuarían como el complemento necesario, como la
pieza faltante para poder terminar de ensamblar el rompecabezas. Hasta hoy hemos tratado de
explicarlo todo con las matemáticas que ya se tienen, y tal vez sea necesario romper el esquema
metiendo algo nuevo que no contradiga lo que ya se tiene pero que pueda unificar algo que de
otra manera tal vez sea imposible de unificar.

Como puede verse, aún hay mucho campo de estudio y recreación con amplias oportunidades en
el futuro para quienes quieran continuar la labor emprendida por genios como Einstein. Y
aunque posiblemente algunos se sientan atemorizados al no sentirse intelectualmente a la altura
de Einstein, deben considerar que, más que un cociente intelectual de 500, tal vez lo que se
requiera sean ideas nuevas que a fin de cuentas serán el fruto de la imaginación, la cual tiene
más que ver con la creatividad que con cocientes intelectuales superiores.

Você também pode gostar