Você está na página 1de 478

Mecanica Analtica: Notas de Clase

Rodolfo Alexander Diaz Sanchez


Universidad Nacional de Colombia
Departamento de Fsica
Bogota, Colombia

18 de marzo de 2011
Indice general

Introduction XII

1. Elementos b asicos de Mec anica Newtoniana 1


1.1. Cinem atica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Dinamica: Leyes de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3. Trabajo y energa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4. Torque y momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.5. Dinamica de un sistema de partculas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5.1. Definici
on de centro de masa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5.2. Sistemas de partculas no aislados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5.3. Momento angular y torque de un sistema de partculas . . . . . . . . . . . . . . . . . . . 7
1.5.4. Energa cinetica de un conjunto de partculas . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5.5. Conservaci on de la energa de un sistema de partculas . . . . . . . . . . . . . . . . . . . 11
1.5.6. Transformaci on de la energa cinetica al sistema-C a partir del sistema de laboratorio . 13

2. Principio de DAlembert y ecuaciones de Lagrange 14


2.1. Ligaduras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2. Principio de DAlembert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3. Coordenadas generalizadas y ecuaciones de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3.1. Energas cinetica y potencial en coordenadas generalizadas . . . . . . . . . . . . . . . . 21
2.3.2. Una simetra gauge o de calibraci on para el Lagrangiano . . . . . . . . . . . . . . . . . . 21
2.4. Ecuaciones de Lagrange para potenciales generalizados . . . . . . . . . . . . . . . . . . . . . . . 22
2.5. Ecuaciones de Lagrange con fuerzas disipativas . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6. Algunos aspectos peculiares de las coordenadas y las fuerzas generalizadas . . . . . . . . . . . . 25
2.7. Relacion entre sistemas coordenados y sistemas de referencia . . . . . . . . . . . . . . . . . . . 26
2.8. Ejemplos de uso de la formulaci on Lagrangiana . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.8.1. Partcula en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.8.2. M aquina de Atwood . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.8.3. Cuenta sobre un alambre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.8.4. Gauge electromagnetico en la formulaci on Lagrangiana . . . . . . . . . . . . . . . . . . . 29
2.8.5. Un sistema ligado de dos masas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.8.6. Aro sobre plano inclinado deslizante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.8.7. Un potencial generalizado para una fuerza central . . . . . . . . . . . . . . . . . . . . . 33
2.8.8. Partcula inmersa en un fludo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.9. Ventajas del formalismo Lagrangiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.10. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3. Calculo variacional y multiplicadores de Lagrange 38


3.1. Algunos problemas pr
acticos de naturaleza variacional . . . . . . . . . . . . . . . . . . . . . . . 38
3.1.1. Minimizaci
on del tiempo de cada de una partcula . . . . . . . . . . . . . . . . . . . . . 38
3.1.2. Minimizaci
on de una superficie de revoluci
on . . . . . . . . . . . . . . . . . . . . . . . . 39

ii
INDICE GENERAL iii

3.2. Aspectos fundamentales del c alculo de variaciones . . . . . . . . . . . . . . . . . . . . . . . . . 40


3.2.1. Calculo variacional en una dimensi on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.2.2. Calculo de variaciones multidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.3. Soluci
on de los problemas de aplicaci on planteados . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.3.1. Minimizaci on de la longitud de arco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.3.2. Minimizaci on del tiempo de cada de una partcula: la braquist ocrona . . . . . . . . . . 44
3.3.3. Minimizaci on de una superficie de revoluci on . . . . . . . . . . . . . . . . . . . . . . . . 45
3.4. Ligaduras y multiplicadores de Lagrange (opcional) . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.4.1. Generalizacion a un conjunto arbitrario de variables y de ligaduras . . . . . . . . . . . . 48
3.5. Problemas variacionales con ligaduras (opcional) . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4. Principio variacional de Hamilton y ecuaciones de Lagrange 53


4.1. Aplicacion del c
alculo de variaciones al principio de Hamilton . . . . . . . . . . . . . . . . . . . 54
4.2. Extension del principio de Hamilton a algunos sistemas no hol onomos . . . . . . . . . . . . . . 54
4.2.1. Significado fsico de los multiplicadores de Lagrange: fuerzas de ligadura . . . . . . . . . 56
4.2.2. Formalismo de los multiplicadores para ligaduras hol onomas . . . . . . . . . . . . . . . . 57
4.3. Relaci
on entre el principio diferencial de DAlembert y el Principio variacional de Hamilton . . 58
4.4. Ejemplos de aplicaci on del principio de Hamilton a sistemas con coordenadas dependientes . . 59
4.4.1. Bloque deslizante sobre una semiesfera . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.4.2. Aro sobre plano inclinado con condici on de rodadura . . . . . . . . . . . . . . . . . . . . 61
4.4.3. Esfera en un hueco cilndrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.5. Caractersticas b
asicas de una formulaci on variacional . . . . . . . . . . . . . . . . . . . . . . . 64
4.6. Principio variacional para Lagrangianos que contienen a q (opcional) . . . . . . . . . . . . . . . 64
4.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5. Simetras y cantidades conservadas en el formalismo de Lagrange 69


5.1. Teoremas de conservaci on y propiedades de simetra . . . . . . . . . . . . . . . . . . . . . . . . 69
5.1.1. Momento lineal y coordenadas globales de traslaci on . . . . . . . . . . . . . . . . . . . . 71
5.1.2. Momento angular y coordenadas globales de rotaci on . . . . . . . . . . . . . . . . . . . . 73
5.1.3. Consideraciones generales sobre simetras asociadas a coordenadas cclicas y cantidades
conservadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.2. Funcion energa y conservaci
on de la energa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.2.1. Funcion energa con fuerzas disipativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.3. Teorema de Noether para sistemas discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
5.3.1. Comentarios sobre el teorema de Noether . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5.4. Ejemplos de aplicaci on del teorema de Noether . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.4.1. Invarianza ante traslaci on temporal y conservaci on de la energa . . . . . . . . . . . . . 83
5.4.2. Invarianza ante traslaci on espacial y conservaci on del momento lineal . . . . . . . . . . . 84
5.4.3. Invarianza ante rotaciones espaciales y la conservaci on del momento angular . . . . . . . 85
5.4.4. Transformaciones de Galileo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

6. Ecuaciones de Movimiento de Hamilton 89


6.1. Consideraciones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6.2. Transformaciones de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
6.3. Generaci
on del Hamiltoniano y Ecuaciones de Hamilton . . . . . . . . . . . . . . . . . . . . . . 91
6.4. Algoritmo matricial para la obtenci
on del Hamiltoniano . . . . . . . . . . . . . . . . . . . . . . 92
6.4.1. Hamiltoniano para un cuerpo sometido a una fuerza central en coordenadas esfericas . . 93
6.4.2. Hamiltoniano de una carga no relativista inmersa en un campo electromagnetico . . . . 95
6.5. Forma Simplectica de las Ecuaciones de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . 96
iv INDICE GENERAL

6.6. Coordenadas cclicas y teoremas de conservacion . . . . . . . . . . . . . . . . . . . . . . . . . . 97


6.6.1. Hamiltoniano de un sistema masa resorte en diferentes sistemas coordenados . . . . . . 98
6.7. Procedimiento de Routh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
6.7.1. Partcula sometida a un potencial central atractivo por el metodo de Routh . . . . . . . 101
6.8. Derivacion de las ecuaciones de Hamilton a partir del principio variacional de Hamilton . . . . 102
6.9. El principio de mnima acci
on (opcional) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

7. Transformaciones can onicas 109


7.1. Ejemplos de transformaciones can onicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
7.2. Transformaciones canonicas para el oscilador armonico . . . . . . . . . . . . . . . . . . . . . . . 115
7.3. Transformaciones canonicas usando las ecuaciones de Hamilton simplecticas . . . . . . . . . . . 117
7.4. Acercamiento simplectico para transformaciones can onicas dependientes del tiempo . . . . . . . 119

8. Corchetes de Poisson y otros invariantes can onicos 122


8.1. Corchetes de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
8.2. Propiedades de los corchetes de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
8.3. Corchetes de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
8.4. Otros invariantes can onicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
8.5. Relacion entre la condicion simplectica y las funciones generatrices (opcional) . . . . . . . . . . 126
8.6. Ecuaciones de movimiento en el formalismo de los corchetes de Poisson . . . . . . . . . . . . . . 128
8.7. Constantes de movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
8.7.1. Ejemplo de constantes de movimiento evaluadas por corchetes de Poisson . . . . . . . . 130
8.8. Transformaciones can onicas infinitesimales en el formalismo de los corchetes de Poisson . . . . 131
8.8.1. Cambio de una funci on del sistema bajo una transformaci on can onica en los enfoques
pasivo y activo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
8.8.2. Cambio del Hamiltoniano bajo una transformaci on can onica . . . . . . . . . . . . . . . . 135
8.8.3. El momento angular como generador de TCIs que generan rotaciones . . . . . . . . . . 137
8.9. Construcci on de transformaciones can onicas finitas a partir de transformaciones can onicas infi-
nitesimales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
8.9.1. Aplicacion del operador evoluci on temporal en el movimiento uniformemente acelerado . 140
8.9.2. Aplicacion del operador evoluci on parametrica para la generaci on de rotaciones . . . . . 140
8.10. Propiedades de los corchetes de Poisson de los momentos angulares . . . . . . . . . . . . . . . . 141
8.10.1. Ejemplos de aplicacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

9. Teora de Hamilton-Jacobi y variables acci on angulo 144


9.1. Ecuacion de Hamilton Jacobi para la funci on principal de Hamilton . . . . . . . . . . . . . . . 144
9.1.1. Oscilador arm onico unidimensional con el metodo de Hamilton Jacobi . . . . . . . . . . 147
9.1.2. Oscilador arm onico bidimensional anisotr opico . . . . . . . . . . . . . . . . . . . . . . . 148
9.1.3. Oscilador arm onico bidimensional isotr opico . . . . . . . . . . . . . . . . . . . . . . . . . 149
9.2. Ecuacion de Hamilton Jacobi para la funci on caracterstica de Hamilton . . . . . . . . . . . . . 151
9.3. Paralelismo entre el formalismo de Hamilton Jacobi y el formalismo restringido de Hamilton
Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
9.4. Separacion de variables en la ecuacion de Hamilton Jacobi . . . . . . . . . . . . . . . . . . . . . 154
9.5. Coordenadas ignorables y separabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
9.6. Condiciones m as generales para la separabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
9.7. Fuerzas centrales en el formalismo de Hamilton Jacobi . . . . . . . . . . . . . . . . . . . . . . . 157
9.7.1. Problema bidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
9.7.2. La dinamica de las fuerzas centrales como problema tridimensional . . . . . . . . . . . 158
9.8. Variables acci
on
angulo para sistemas con un grado de libertad . . . . . . . . . . . . . . . . . . 161
9.8.1. El oscilador arm onico unidimensional en variables acci on
angulo . . . . . . . . . . . . . 164
INDICE GENERAL v

9.9. Variables acci


on angulo para sistemas completamente separables1 . . . . . . . . . . . . . . . . . 165
9.9.1. Movimientos periodicos m ultiples de libraci
on . . . . . . . . . . . . . . . . . . . . . . . . 168
9.9.2. Movimientos cuasi peri odicos multiples de rotaci
on . . . . . . . . . . . . . . . . . . . . . 169
9.9.3. Determinacion de las frecuencias para movimiento peri odico multiple tipo libracion . . . 169
9.9.4. Variables acci
on
angulo para sistemas degenerados . . . . . . . . . . . . . . . . . . . . . 171
9.10. Comentarios finales sobre las variables acci
on angulo . . . . . . . . . . . . . . . . . . . . . . . . 173
9.11. El problema de Kepler en variables acci on
angulo . . . . . . . . . . . . . . . . . . . . . . . . . . 173

10.Fuerzas centrales 178


10.1. Reduccion al problema equivalente de una partcula . . . . . . . . . . . . . . . . . . . . . . . . 178
10.2. Ecuaciones de movimiento y primeras integrales . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
10.3. El problema unidimensional equivalente y la clasificaci on de orbitas . . . . . . . . . . . . . . . . 183
10.4. Analisis de curvas de potencial efectivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
10.4.1. Potencial efectivo para interacci on kepleriana . . . . . . . . . . . . . . . . . . . . . . . . 184
10.4.2. Potencial efectivo equivalente para dos cuerpos no interactuantes . . . . . . . . . . . . . 187
10.4.3. Potencial atractivo proporcional al inverso del cubo de la distancia . . . . . . . . . . . . 189
10.4.4. Potencial efectivo para fuerza restauradora lineal . . . . . . . . . . . . . . . . . . . . . . 190
10.5. El teorema del virial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
10.6. Ecuaci on de la orbita y potenciales integrables . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
10.7. Condicion para orbitas circulares estables e inestables . . . . . . . . . . . . . . . . . . . . . . . 195

10.8. Orbitas circulares perturbadas a primer orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196

10.9. Orbitas circulares perturbadas a orden superior al primero y condiciones para orbitas cerradas
(teorema de Bertrand) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
10.10.El problema de Kepler: Ley del inverso al cuadrado (atractiva) . . . . . . . . . . . . . . . . . . 199
10.11.Solucion para la orbita en el problema de Kepler . . . . . . . . . . . . . . . . . . . . . . . . . . 201
10.12.Movimiento en el tiempo en el problema de Kepler . . . . . . . . . . . . . . . . . . . . . . . . . 204
10.12.1.Dependencia temporal en el caso parab olico . . . . . . . . . . . . . . . . . . . . . . . . . 205
10.12.2.Dependencia temporal para el movimiento elptico . . . . . . . . . . . . . . . . . . . . . 205
10.13.Vector de Laplace-Runge-Lenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
10.14.Parametrizaci on de las orbitas keplerianas en el espacio . . . . . . . . . . . . . . . . . . . . . . 210
10.15.Problema de Kepler en variables acci on angulo (revisado) . . . . . . . . . . . . . . . . . . . . . 212
10.16.Dispersi on en un campo de fuerzas centrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
10.16.1.Dispersi on de Rutherford . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
10.16.2.Caractersticas generales de la secci on eficaz . . . . . . . . . . . . . . . . . . . . . . . . . 221
10.17.Transformaci on del problema de la dispersi on entre coordenadas de laboratorio y centro de masa224
10.17.1.Relacion entre el angulo de dispersion medido por el laboratorio y el medido por el centro
de masa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
10.17.2.Caracterizaci on del factor de la colisi
on . . . . . . . . . . . . . . . . . . . . . . . . . . 226
10.17.3.Seccion eficaz en terminos de los dos angulos de dispersi on . . . . . . . . . . . . . . . . 227

11.Interludio matem atico: Matrices, vectores y tensores cartesianos 231


11.1. Propiedades basicas de las matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
11.1.1. Determinantes y trazas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
11.1.2. Matrices rectangulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
11.2. Interpretaci
on activa y pasiva de las transformaciones lineales: cambios de base . . . . . . . . . 236
11.2.1. Transformaciones de similaridad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
11.3. Problema de valores propios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
11.4. Propiedades basicas de las matrices ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
11.4.1. Matrices ortogonales y norma de vectores complejos (opcional) . . . . . . . . . . . . . . 242
11.4.2. Transformaciones ortogonales propias e impropias . . . . . . . . . . . . . . . . . . . . . 243
1
En lo que sigue del captulo no adoptaremos la convenci
on de suma de ndices repetidos a menos que se indique lo contrario.
vi INDICE GENERAL

11.5. Clasificaci
on de vectores y escalares por sus propiedades de paridad . . . . . . . . . . . . . . . 244
11.6. Transformaciones ortogonales propias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
11.6.1. Matrices ortogonales reales propias en tres dimensiones . . . . . . . . . . . . . . . . . . 246
11.7. Matriz adjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
11.8. Matrices unitarias y cambios de base (opcional) . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
11.9. Matrices Hermticas y simetricas reales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
11.9.1. Problema de valores propios de matrices hermticas en tres dimensiones . . . . . . . . . 252
11.9.2. Matrices simetricas reales en R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
11.10.Matrices normales (opcional) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
11.11.Problema de valores propios modificado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
11.11.1.Diagonalizacion simultanea de dos formas cuadr aticas . . . . . . . . . . . . . . . . . . . 259
11.12.Interpretacion geometrica de la diagonalizacion simultanea de una matriz positiva y otra definida
positiva (opcional)2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
11.12.1.Argumentaci on por geometra analtica . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
11.12.2.Argumentaci on por geometra de Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . 263
11.13.Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266

12.Cinem atica del cuerpo rgido 271


12.1. Coordenadas independientes de un cuerpo rgido . . . . . . . . . . . . . . . . . . . . . . . . . . 271
12.2. Asignacion de los grados de libertad de un cuerpo rgido . . . . . . . . . . . . . . . . . . . . . . 273
12.3. Transformaciones ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275

12.4. Angulos de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
12.5. Parametros de Cayley-Klein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
12.6. Teorema de Euler para el movimiento del cuerpo rgido . . . . . . . . . . . . . . . . . . . . . . 279
12.7. Rotaciones finitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
12.7.1. Forma matricial de la formula de rotaci on . . . . . . . . . . . . . . . . . . . . . . . . . . 283
12.7.2. Relaci
on entre n y y los angulos de Euler . . . . . . . . . . . . . . . . . . . . . . . . . 284
12.8. Rotaciones infinitesimales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
12.9. Razon de cambio de un vector visto por sistemas rotantes . . . . . . . . . . . . . . . . . . . . . 289
12.9.1. Raz
on de cambio por argumentos vectoriales . . . . . . . . . . . . . . . . . . . . . . . . 289
12.9.2. Raz
on de cambio por argumentos algebr aicos . . . . . . . . . . . . . . . . . . . . . . . . 290
12.9.3. Segunda derivada en el sistema rotante . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
12.10.Sistemas no inerciales rotantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
12.11.Velocidad angular en terminos de los angulos de Euler . . . . . . . . . . . . . . . . . . . . . . . 294

13.Ecuaciones de movimiento del cuerpo rgido 298


13.1. Momento angular y energa cinetica de movimiento alrededor de un punto . . . . . . . . . . . . 298
13.2. Tensor de inercia y momento de inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
13.3. Compendio de propiedades del tensor de inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . 306
13.4. Ecuaciones de Euler para el movimiento de un cuerpo rgido . . . . . . . . . . . . . . . . . . . . 310
13.4.1. Ecuaciones de Euler con el formalismo de Lagrange . . . . . . . . . . . . . . . . . . . . . 312
13.5. Precesion libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
13.5.1. Construcci on de Poinsot para la precesi on libre . . . . . . . . . . . . . . . . . . . . . . . 314
13.5.2. Elipsoide de Binet y el momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . 315
13.5.3. Elipsoide de Binet, rotacion estacionaria y condiciones para la rotaci on estable . . . . . 317
13.5.4. Solucion algebraica para la precesion libre con simetra axial . . . . . . . . . . . . . . . 318
13.5.5. Estabilidad de solidos irregulares por metodos algebr aicos . . . . . . . . . . . . . . . . . 320
13.6. La peonza simetrica pesada con un punto fijo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320
13.6.1. Reducci on del problema a cuadraturas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320
2
Esta secci
on no es muy util para c
alculos pr
acticos, pero aporta una gran claridad conceptual sobre la diagonalizaci
on simult
anea
de dos formas cuadr aticas. Puede omitirse en una primera lectura.
INDICE GENERAL vii

13.6.2. Analisis cualitativo del movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325


13.6.3. Analisis cuantitativo aproximado de la peonza rapida . . . . . . . . . . . . . . . . . . . 328
13.6.4. Peonza con precesi on regular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332
13.6.5. Peonza inicialmente vertical . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
13.6.6. Efectos de friccion, torques adicionales y aplicaciones de la peonza simetrica pesada . . 335
13.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337

14.Oscilaciones 338
14.1. Pequenas oscilaciones y equilibrio estable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
14.2. Soluci
on de las ecuaciones de movimiento como problema de valores propios . . . . . . . . . . . 341
14.2.1. Un ejemplo con dos grados de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
14.3. Problema de valores propios con degeneraci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
14.3.1. Un ejemplo bidimensional con degeneraci on . . . . . . . . . . . . . . . . . . . . . . . . . 346
14.4. Frecuencias de vibracion libre y coordenadas normales . . . . . . . . . . . . . . . . . . . . . . . 346
14.5. Vibraciones libres de una molecula triatomica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349
14.6. Vibraciones forzadas y amortiguadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353
14.6.1. Vibraciones forzadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353
14.6.2. Vibraciones amortiguadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
14.6.3. Vibraciones amortiguadas forzadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356
14.7. Ejemplos de oscilaciones anarm onicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358

15.Relatividad especial 361


15.1. Propiedades de las transformaciones de Lorentz puras . . . . . . . . . . . . . . . . . . . . . . . 361
15.2. Transformaciones de Lorentz restringidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365
15.3. Transformaciones de Lorentz usando espacios de Riemann de cuatro dimensiones . . . . . . . . 369
15.4. El concepto de formulacion covariante en Fsica . . . . . . . . . . . . . . . . . . . . . . . . . . . 372
15.5. Formulaciones covariantes en el espacio de Minkowski . . . . . . . . . . . . . . . . . . . . . . . 374
15.6. Fuerza y momento en relatividad especial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378
15.7. Energa y relaci
on momento-energa en relatividad especial . . . . . . . . . . . . . . . . . . . . 380
15.8. Formulacion Lagrangiana de la mec anica relativista . . . . . . . . . . . . . . . . . . . . . . . . . 383
15.9. Formulacion no manifiestamente covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384
15.9.1. Movimiento bajo una fuerza constante (hiperb olico) . . . . . . . . . . . . . . . . . . . . 385
15.9.2. Oscilador armonico unidimensional relativista . . . . . . . . . . . . . . . . . . . . . . . . 387
15.9.3. Movimiento de partcula cargada en un campo magnetico . . . . . . . . . . . . . . . . . 388
15.10.Formulaciones lagrangianas covariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389

16.Teora can onica de perturbaciones 393


16.1. Metodo de variacion de constantes para perturbaciones dependientes del tiempo . . . . . . . . 394
16.2. Teora de perturbacion dependiente del tiempo en terminos de los par ametros de movimiento . 395
16.3. Variacion peri
odica y variacion secular de una perturbaci on . . . . . . . . . . . . . . . . . . . . 396
16.4. Ejemplos del uso de la teora de perturbaci on dependiente del tiempo . . . . . . . . . . . . . . 397
16.4.1. Oscilador arm onico como perturbaci on de la partcula libre . . . . . . . . . . . . . . . . 397
16.4.2. Pendulo plano con amplitud finita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 400
16.4.3. Perturbaciones en el problema de Kepler acotado . . . . . . . . . . . . . . . . . . . . . . 404
16.5. Teora de perturbacion independiente del tiempo a primer orden con un grado de libertad . . . 405
16.5.1. Pendulo plano con oscilaci on finita usando metodo de perturbaci on independiente del
tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 408
16.6. Teora de perturbacion independiente del tiempo para orden superior al primero y varios grados
de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409
16.6.1. Oscilador anarm onico unidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
16.7. Teora de perturbaciones independiente del tiempo en presencia de degeneraci on . . . . . . . . 414
viii INDICE GENERAL

16.8. Algunos aspectos cualitativos generales de la teora cl asica de perturbaciones . . . . . . . . . . 415


16.9. Invariantes adiab aticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
16.9.1. Invarianza adiab atica del oscilador arm onico . . . . . . . . . . . . . . . . . . . . . . . . 417
16.9.2. Variaci
on asintotica de J para el oscilador arm onico (opcional) . . . . . . . . . . . . . . 420
16.9.3. Un invariante exacto del oscilador arm onico con frecuencia dependiente del tiempo (op-
cional) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421
16.9.4. Invariantes adiab aticos de partculas cargadas en campos electromagneticos . . . . . . . 423

17.Formulaci on Lagrangiana y Hamiltoniana para Sistemas Contnuos y Campos 426


17.1. Ecuacion de continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
17.2. Transicion de un sistema discreto a un sistema contnuo . . . . . . . . . . . . . . . . . . . . . . 430
17.3. Formulaci on Lagrangiana en una dimensi on para sistemas contnuos con una sola variable de
campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
17.4. Formulaci on Lagrangiana en tres dimensiones para sistemas contnuos con un n umero arbitrario
de variables de campo (Teora cl asica de campos) . . . . . . . . . . . . . . . . . . . . . . . . . . 434
17.5. El tensor esfuerzo energa y teoremas de conservaci on asociados . . . . . . . . . . . . . . . . . . 437
17.5.1. Interpretaci
on fsica de T0 : densidad de energa y vector de Poynting . . . . . . . . . . 438
on fsica de Ti j : densidad de momento lineal y tensor de esfuerzos . . . . . .
17.5.2. Interpretaci 439
17.5.3. Energa y momento total del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
17.5.4. Densidad de momento angular y momento angular total . . . . . . . . . . . . . . . . . . 444
17.6. Formulaci on Hamiltoniana para medios contnuos . . . . . . . . . . . . . . . . . . . . . . . . . . 445
17.6.1. Propiedades b asicas de H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447
17.6.2. Densidades generalizadas y corchetes de Poisson . . . . . . . . . . . . . . . . . . . . . . 448
17.6.3. Formulacion por corchetes de Poisson utilizando descomposici on de Fourier . . . . . . . 449
17.7. Ejemplos de teoras de campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
17.7.1. Un modelo juguete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
17.8. Teora de campos relativista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454
17.9. Algunas teoras de campos relativistas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458
17.9.1. Campo escalar complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459
17.9.2. Ecuacion de seno Gordon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462
Preface

Estas notas de clase tienen como objetivo ser una gua para un curso de mec anica analtica, en donde los
principios de la mec anica cl
asica se examinan a la luz de las formulaciones Lagrangiana y Hamiltoniana y
las variantes que de ellas se derivan. Estas formulaciones ubican a la energa en el papel fundamental que las
fuerzas tienen en la formulaci on Newtoniana. Quiz as el aspecto m as atractivo de estas formulaciones consiste
en su poder para enlazar las simetras de un sistema con las constantes de movimiento, y en la riqueza de
estrategias para extraer informaci on del sistema sin resolver explcitamente las ecuaciones de movimiento. Estos
aspectos se enfatizan fuertemente a lo largo del texto, aunque en algunos casos se estudia la solucion completa
de acuerdo con la conveniencia y la simplicidad de estas soluciones. Se ha pretendido enfatizar en aspectos que
en opini on del autor, han presentado fuerte dificultad en el desarrollo de las clases. A manera de ejemplo, la
discusion del
algebra matricial que precede al estudio de la cinem atica del cuerpo rgido es considerablemente
extensa y detallada haciendo enfasis tanto en lo geometrico como en lo algebr aico. Debe notarse sin embargo
que el contenido de esta secci on de
algebra matricial va m as all
a de las necesidades del curso presente, lo cual
tiene como fin preparar al estudiante para trabajar no solo en los espacios euclidianos Rn sino tambien en los
espacios unitarios Cn que juegan un papel fundamental en mec anica cu antica. Los captulos que se incluyen
son en opini on del autor de gran importancia para la formaci on general del Fsico y constituyen el punto de
partida de muchas ramas de la Fsica.
Es muy claro a lo largo de la lectura de las notas, que estas u ltimas se han generado con una influencia
considerable del clasico texto de Herbert Goldstein, especialmente de la segunda y tercera edici on. No obstante,
existen cambios de enfoque y/o presentaci on de numerosas unidades tem aticas, debidos a la influencia de otros
autores (tales como Jose, Saletan, Cromer, Whittaker, Marion etc.), as como de algunos abordajes propios
del autor. A manera de ejemplo, los angulos de Euler se han introducido de manera que no solo quede claro
el algoritmo de rotaci on, sino la necesidad de dicho algoritmo. Se ha realizado un considerable esfuerzo por
presentar de manera clara la filosofa e implementaci on del metodo de Hamilton-Jacobi. La mayor parte de
herramientas matem aticas necesarias se han aislado en captulos independientes a fin de dar m as flexibilidad
al texto y con el fin de que el lector las capture en su esencia y no las asocie a problemas muy especficos
de la Fsica, lo cual dificulta en general la aplicaci on de estas herramientas en otros escenarios de la Fsica
diferentes a los aprendidos. Algunas secciones se han indicado como opcionales, a fin de facilitar al lector una
primera lectura, y al mismo tiempo, darle al texto la riqueza necesaria para ir m as all
a de lo estrictamente
basico, sugiriendo caminos que incentiven la curiosidad del lector.
Para una adecuada comprensi on de estas notas, el lector debe tener conocimientos a nivel introductorio
sobre mec anica newtoniana, as como de algebra lineal y c alculo diferencial e integral. En algunos pasajes
aislados se asume un conocimiento b asico de electricidad, magnetismo y ondas.
El captulo 1 es un repaso de la mec anica clasica en la llamada formulaci on Newtoniana en donde la
fuerza es la cantidad din amica central. El captulo 2 nos presenta el principio de DAlembert y las ecuaciones de
Lagrange, enfatizando que estas formulaciones apuntan a resolver dos problemas importantes en la din amica
de sistemas cl asicos: (a) excluir a las ligaduras de la formulaci on debido a la dificultad que usualmente se
presenta para obtenerlas y (b) trabajar solo con los grados de libertad independientes, evitando las coordenadas
redundantes. El captulo 3 es un suplemento matem atico sobre el c alculo variacional. A pesar de que este
suplemento ser a aplicado mayormente en el llamado principio variacional de Hamilton, la exposici on muestra
la posibilidad de aplicar esa herramienta matem atica en otros ambitos de la Fsica. El captulo 4 trata sobre la
formulaci on integral del formalismo de Lagrange, cuya formulaci on diferencial fue presentada en el captulo 2.

ix
x PREFACE

En el captulo 5, se presenta una de las ventajas notables de la formulaci on de Lagrange, a saber la explotaci on
sistem atica de las simetras del sistema y su relaci on con las cantidades conservadas.
En el captulo 6 se presenta la formulaci on de Hamilton de la mec anica clasica en la cual se sustituyen
las coordenadas y velocidades generalizadas por las coordenadas generalizadas y momentos conjugados, se
discutir a la ventaja de trabajar con este nuevo sistema de variables (denominadas variables can onicas), as como
las ventajas de pasar de un sistema de n ecuaciones diferenciales de segundo orden, a un sistema de 2n
ecuaciones diferenciales de primer orden. Puesto que la funci on Hamiltoniana se puede expresar en cualquier
conjunto de variables can onicas, es necesario estudiar la relaci on que hay entre los diversos conjuntos de
variables can onicas, as como las transformaciones que nos llevan de un conjunto de variables can onicas a otro,
este ser a el tema del captulo 7. Una forma alternativa de presentar las ecuaciones de Hamilton, es a traves
de diversos invariantes can onicos, entre los cuales se destacan los llamados corchetes de Poisson, con los
cuales las simetras y constantes de movimiento se pueden identificar con gran facilidad, este ser a el tema del
captulo 8. Por otra parte, una elecci on adecuada de variables can onicas puede conducirnos a trivializar las
ecuaciones de movimiento (ecuaciones de Hamilton), en cuyo caso la tarea principal consiste en encontrar la
transformaci on del sistema can onico original al sistema can onico que trivializa dichas ecuaciones, esta es la
esencia de la teora de Hamilton-Jacobi, presentada en el captulo 9.
En este punto culmina la descripci on de estas formulaciones alternativas de la mec anica cl
asica. En los
captulos posteriores, se describen problemas cl asicos especficos que se abordar an con una formulaci on La-
grangiana y/o Hamiltoniana. En el captulo 10 se aborda el problema de las fuerzas centrales, en el cual se
estudia en detalle el problema de Kepler y la teora de la dispersi on por potenciales centrales. Otro interludio
matem atico es presentado en el captulo 11 concerniente a matrices, vectores y tensores cartesianos, en este
captulo se desarrollan diversas herramientas matem aticas necesarias para captulos subsecuentes. En particu-
lar para el captulo 12 de cinem atica del cuerpo rgido, en el cual se analiza el movimiento general de un cuerpo
rgido, utilizando la parametrizaci on por angulos de Euler y la parametrizaci on eje-angulo. En tal captulo se
analiza adem as la raz
on de cambio de un vector visto por un sistema rotante, lo cual nos permitir a estudiar
con naturalidad a los sistemas no inerciales rotantes. En el captulo 13 se estudia la din amica del cuerpo
rgido, privilegiando el estudio de la precesion libre y de la peonza simetrica pesada con punto fijo. El captulo
14 sobre oscilaciones, estudia el problema de la obtenci on de los modos normales de oscilaci on (desacople de
las ecuaciones diferenciales), de un conjunto de osciladores acoplados, como un problema de valores propios
modificado que involucra matrices positivas. Este abordaje del problema posee la ventaja (con respecto a la
forma tradicional utilizada en los cursos de oscilaciones y ondas) que es extendible a coordenadas generalizadas,
incluso si estas no est an asociadas a un sistema ortogonal de vectores unitarios.
En el captulo 15 se introduce la formulaci on Lagrangiana y Hamiltoniana de la relatividad especial. Se
ha utilizado el espacio con eje temporal imaginario ict, con metrica trivial. A pesar de que la mayor parte de
textos de relatividad modernos privilegian la metrica g con eje real, el uso de un eje temporal imaginario
nos permitir a aprovechar la teora de matrices ortogonales desarrollada en los captulos 11 y 12. Por otra
parte, dado que no se abordar a la relatividad general, ambas escogencias poseen aproximadamente las mismas
ventajas. En todo caso, la traducci on entre las dos formulaciones se presenta en la secci on 15.3.
En el captulo 16 se introduce la teora can onica de perturbaciones dependiente e independiente del tiempo,
basada en el formalismo de Hamilton-Jacobi. Se analizar a adem as el fen
omeno de la invarianza adiab atica,
para lo cual las variables acci on-angulo ser an particularmente ventajosas.
Finalmente, el captulo 17 estudia la formulaci on Lagrangiana y Hamiltoniana para la mec anica de medios
contnuos (teora clasica de campos), tanto en el regimen no-relativista como en el relativista, estableciendo la
ecuaci on de continuidad para el flujo de cualquier medio contnuo, y la conservaci on de la carga generalizada.
Este formalismo es aplicable a todo tipo de medios contnuos tales como campos electromagneticos, campos
de presiones, de temperatura, fludos etc. No obstante, en el captulo 17 nos restringimos a describir modelos
suficientemente simples para ilustrar los principios fundamentales.
El material cubierto en estas notas est a pensado para dos cursos cada uno de 16 semanas con una intensidad
de 4 horas semanales. Complementado quiz as, con una introducci on a la teora del caos cl
asico. Por supuesto,
los captulos 3 y 11 relacionados con herramientas matem aticas, podr an tomarse a diferentes ritmos o grados
de detalle, dependiendo del nivel de preparaci on de los lectores en estos temas. Varias distribuciones en la
PREFACE xi

presentaci on de los temas son posibles. Si se toma el orden de captulos en estas notas, un primer curso puede
ser hasta el captulo 10, siendo los captulos remanentes para un segundo curso. Sin embargo, una vez estudiado
el captulo 6 es posible saltar directamente al captulo 10 y continuar la secuencia de captulos obviando algunas
secciones (por ejemplo, la secci on 10.15 en la que se trata el problema de Kepler con variables acci on-angulo),
con excepci on del captulo 16, el cual depende fuertemente de la formulaci on de Hamilton-Jacobi.
Vale la pena resaltar que el material presente son notas de clase y no un libro de texto. Por esta raz on
aparecen algunos desarrollos en excesivo detalle, ya que fueron producto del ejercicio directo de preparaci on
para la clase. Espero que tales desarrollos no se conviertan en un distractor para el lector, quien puede obviar
estos detalles de ser necesario. No obstante, considero que las notas en su presente forma est an autocontenidas
para ser usadas en una clase, o para autoaprendizaje.
Quiero expresar mis agradecimientos a los estudiantes del Departamento de Fsica de la Universidad Na-
cional de Colombia, sede Bogot a, por sus contnuas contribuciones y observaciones sobre el texto y el curso en
general. Al profesor Eduardo Brieva, quien fuera mi instructor de mec anica analtica en mis a
nos de estudiante,
y a quien debo mi comprensi on de buena parte del material aqu presentado. A los profesores John Morales y
William Herrera por las discusiones sobre varios temas que contribuyeron a madurar el presente texto. A mis
hijos Iris Soraya y David Leandro, por ser siempre una fuerza motora de mi existencia.

Rodolfo Alexander Diaz


Facultad de Ciencias. Departamento de Fsica
Universidad Nacional de Colombia
Bogota, Octubre de 2011.
Introduction

En las formulaciones Lagrangiana y Hamiltoniana de la Mec anica Clasica (as como en sus formulaciones
derivadas), existen varias estrategias que aportan un considerable valor agregado con respecto a la formulaci on
Newtoniana. En las presentes notas se ha procurado enfatizar reiteradamente en aquellos puntos que en opini on
del autor, constituyen los valores agregados m as fuertes.
Discutiremos brevemente dos aspectos que constituyen la motivaci on de una formulaci on Lagrangiana: (a)
La eliminaci on de las fuerzas de ligadura, de las ecuaciones de movimiento y (b) el uso del mnimo n umero
posible de coordenadas. Para comprender la motivaci on del incizo (a) bastara que el lector examine con cuidado
un problema como el de una partcula que desliza sobre una trayectoria hiperb olica, e intente encontrar el valor
de la fuerza normal (fuerza de ligadura) que mantiene a la partcula sobre la trayectoria en cuesti on. Para el
incizo (b) basta con decir que cuando un conjunto de N partculas est an ligadas (por ejemplo si las distancias
entre ellas son constantes), el n umero de coordenadas independientes es menor que 3N , pero en la formulaci on
Newtoniana tendremos que plantear las ecuaciones para las 3N coordenadas, obteniendo as informaci on
redundante, para posteriormente incorporar la ligadura. Hay entonces un considerable ahorro al elaborar una
formulacion en donde de entrada se trabaja solo sobre coordenadas independientes. Esta misma filosofa se
conserva en la formulaci on Hamiltoniana.
Otra ventaja de estas formulaciones consiste en que permitir a un uso m as sistem atico de las simetras del
sistema para extraer informaci on total o parcial de este.
De otra parte, aunque a traves del texto se estudian problemas fsicos especficos, es tambien com un abordar
temas introduciendo un pensamiento fsico abstracto, en el sentido de que ciertos aspectos estructurales nos
daran informaci on parcial del sistema, independiente de los detalles de este. A manera de ejemplo: para muchos
sistemas fsicos se puede construr una cantidad denominada lagrangiano, y que depende de un conjunto de
coordenadas generalizadas qi , velocidades generalizadas qi y el tiempo

L = L (q1 , . . . , qn , q1 , . . . , qn ; t)

supongamos que un Lagrangiano es tal que aparece la velocidad generalizada qk pero no aparece su coordenada
generalizada asociada qk , cuando esto ocurre existe una cantidad que es constante de movimiento, denominada
momento conjugado a qk
L
pk = cte
qk
esta caracterstica solo depende de un aspecto estructural del Lagrangiano, no de los detalles del sistema, ni
siquiera importa si el sistema es mec anico, electrico o de otra naturaleza.
Otro aspecto que nos introduce en el pensamiento fsico abstracto es la introducci on constante de canti-
dades generalizadas. Las coordenadas generalizadas son simplemente las variables mnimas independientes
de un sistema y no tienen que ser necesariamente variables de posici on. As mismo, q no es necesariamente
una velocidad lineal. Una densidad generalizada (x, t) es cantidad de carga generalizada por unidad de
volumen, donde la carga generalizada es cualquier cantidad fsica escalar tal como la carga electrica, la masa,
la energa, la probabilidad etc. A esta cantidad escalar se le puede asociar una propiedad de transporte a traves
de una densidad de corriente generalizada, no importa si se transporta energa, masa, carga electrica, pro-
babilidad etc. La din amica de estas densidades y densidades de corriente generalizada ser an validas para estos
y muchos otros escenarios al tiempo. En particular, la formulaci on de la ecuaci
on de continuidad adquirir a un
poder extraordinario con esta forma de pensamiento generalizado.

xii
xiii

Acorde con lo anterior, se ha procurado mantener un balance entre el pensamiento fsico especfico
y el pensamiento fsico abstracto, competencias ambas indispensables en la formaci on del fsico y otros
profesionales afines.
Por otra parte, es muy com un enfocar un curso de mec anica analtica como un puente necesario para
abordar los cursos de mec anica cu antica. En opinion del autor esta no debe constitur la u
nica motivaci on
para dictar un curso de esta naturaleza. Ciertamente los postulados de la mec anica cu antica requieren del
conocimiento de la formulaci on Hamiltoniana y tambien se puede abordar con el formalismo Lagrangiano. Sin
embargo, la mec anica cl
asica posee numerosos problemas abiertos puros y aplicados (caos, mec anica de fludos,
teora de perturbaciones cl asica etc.), que constituyen tambien un campo de accion plausible para el fsico, y
para los cuales el lenguaje que se aborda es usualmente el descrito en estos cursos. Basta con observar que
historicamente, los formalismos Lagrangiano y Hamiltoniano precedieron en varias decadas al nacimiento de
la mec anica cu
antica.
xiv INTRODUCTION
Captulo 1

Elementos b
asicos de Mec
anica
Newtoniana

1.1. Cinem
atica
La cinem atica trata de la descripcion del movimiento de los cuerpos sin referencia a las causas de dicho
movimiento. El tratamiento ser a breve sin una discusion detallada de los conceptos. Para detalles, ver por
ejemplo las referencias. [1, 2]. Asumiremos que tenemos una idea intuitivamente clara de los conceptos de
espacio, tiempo y masa.
El primer concepto que se construye es el de vector posici on. Una partcula puntual ocupa un punto
especfico en el espacio, si elegimos un sistema de referencia, podemos trazar un vector desde el origen de dicho
sistema hasta el punto donde se ubica la partcula, y lo denominamos vector posici on. La posicion entendida
como un punto geometrico en el espacio, no es un vector como tal (no tiene direcci on, magnitud, ni sentido),
lo cual se refleja en el hecho de que el vector posicion depende del origen elegido para el sistema coordenado.
Cuando una partcula se desplaza desde un punto descrito por el vector posici on r0 hasta otro descrito por rf ,
podemos describir el movimiento de esta partcula a traves del vector desplazamiento r, como un vector
que va desde r0 hacia rf . Este vector indica la direccion del desplazamiento y la distancia recorrida (magnitud
del vector).
r rf r0
vale la pena mencionar que r s es un vector como tal, lo cual se refleja en el hecho de que r es independiente
del origen elegido.
Ahora definimos el vector velocidad, como el cambio de posici on (o desplazamiento) por unidad de tiempo

rf r0 r
v=
tf t0 t

si queremos conocer el valor de la velocidad del movil en forma mas detallada, partimos el intervalo anterior
en intervalos mas finos, y definimos una velocidad para cada intervalo

r (ti + ti ) r (ti ) ri
v=
ti ti
la velocidad instant
anea se define como un paso al lmite

ri
lm = vinst
ti 0 ti

a partir de la definici
on de velocidad se obtiene

vi ti = xi

1
2 CAPITULO 1. ELEMENTOS BASICOS

DE MECANICA NEWTONIANA

si sumamos sobre todos los intervalos


N
X N
X
vi ti = xi
i=1 i=1

tomando el lmite cuando N y haciendo el paso al contnuo


Z tf Z rf Z tf
v dt = dr rf r0 = v dt
t0 r0 t0

tambien es u
til definir la raz
on de cambio de la velocidad, a traves del vector aceleraci
on en la forma
v dv

a= ; ainst =
t dt
donde on promedio, en tanto que ainst es la aceleraci
a denota la aceleraci on instant
anea, usualmente esta
u
ltima se denota simplemente como a. Un argumento similar al anterior nos lleva a la ecuaci
on
Z tf Z rf Z tf
a dt = dv vf v0 = a dt
t0 r0 t0

estas ecuaciones y algunas combinaciones especiales de ellas nos proveen el marco para la descripci
on del
movimiento de los cuerpos.

1.2. Din
amica: Leyes de Newton
La dinamica de las partculas puntuales est
a dictaminada por las leyes de Newton, haremos una descripci on
muy breve sin ninguna pretensi on de discusi
on. Para una discusion detallada, ver por ejemplo la referencia [2].
Primera Ley: Existen un conjunto de sistemas de referencia llamados inerciales tales que toda partcula
aislada, posee velocidad constante con respecto a dichos sistemas. El reposo es naturalmente un caso particular
de velocidad constante nula.
Segunda Ley: Nos establece la forma de cuantificar la interacci on de una partcula con el resto del universo,
se enfatiza que esta ley solo es valida para partculas puntuales que por definici
on tienen masa constante.

F = ma
esta ley tambien contiene el principio de superposici
on de las fuerzas, seg
un el cual la fuerza neta o resultante
sobre una partcula es la suma vectorial de cada fuerza aplicada como si cada una de ellas actuara sola. Esto
significa que no hay efectos de interferencia entre las distintas fuerzas aplicadas sobre la partcula.
Tercera Ley: Cuando una partcula A hace una fuerza FAB sobre una partcula B entonces la fuerza
sobre A debida a B (denotada como FBA ) est a relacionada con FAB en la forma

FAB = FBA

esta ley tiene implcita la propagaci on instantanea de se


nales por lo cual su validez es muy limitada. En su
forma fuerte, la fuerza es de naturaleza central, sin embargo existen fuerzas que solo cumplen esta ley en su
forma debil, es decir los pares de fuerzas son opuestos pero no van a lo largo de la lnea que une a las partculas.
Finalmente, en otros casos la ley no se cumple en ninguna de sus versiones, lo cual ocurre cuando el tiempo
de propagaci on de la interaccion es significativo.
Por otro lado, las leyes anteriores se pueden sustituir por sus equivalentes en terminos del concepto de
momento lineal definido como el producto de la masa por la velocidad p mv. La primera ley nos dice que
en los sistemas inerciales el momento lineal de una partcula aislada es constante, la segunda ley se escribira
de la forma F = dP/dt y la tercera ley sera sustituda por el principio de conservaci on del momento para un
sistema aislado de partculas. Estas leyes tienen una rango de validez m as amplio que la formulaci on original,
aunque hay que usar un concepto extendido de momento lineal.
1.3. TRABAJO Y ENERGIA 3

A pesar de que las leyes de Newton me dan en principio una descripci on completa de la evoluci on de
los sistemas, tienen el limitante de que requieren el conocimiento de las fuerzas en funci on del tiempo, en
la pr
actica es mas usual que se conozca la fuerza en funci
on de la posici
on, lo cual nos lleva al concepto de
trabajo.

1.3. Trabajo y energa


Si arrastramos un cuerpo con una fuerza aplicada F y queremos construr un concepto fsico que dependa
del desplazamiento del cuerpo, vemos que solo la componente de la fuerza paralela al desplazamiento contribuye
a este. Tal hecho nos induce a construr el concepto de trabajo instant
aneo de la forma

dW = F dr

la fuerza es 100 % efectiva cuando es paralela al desplazamiento, 0 % efectiva cuando es perpendicular, y su


contribuci
on es negativa cuando la proyecci on de la fuerza sobre el desplazamiento tiene sentido opuesto a
tal desplazamiento. En una trayectoria arbitraria el trabajo que realiza una fuerza F sobre un partcula viene
dada por una integral de lnea con lmites en los extremos A y B de la trayectoria
Z B
W = F dr
A

n
otese que F es una de las fuerzas aplicadas sobre la partcula, y no necesariamente corresponde a la fuerza
resultante. Sin embargo, cuando la fuerza en cuesti
on es la resultante sobre la partcula, la segunda ley de
Newton conduce autom aticamente al teorema fundamental del trabajo y la energa
Z B
1 2 1 2
Fdr = mvB mvA
A 2 2
la cual nos indica que sin importar la trayectoria seguida por la partcula, el trabajo realizado por la fuerza
resultante sobre esta equivale al cambio en la cantidad (1/2) mv 2 que denominamos la energa cinetica de la
partcula. Es indispensable tener claro que el teorema fundamental del trabajo y la energa solo es aplicable
a la fuerza resultante sobre la partcula y no a una de las fuerzas aplicadas. A priori se podra pensar que
esta formulaci on es esteril cuando la queremos aplicar a una fuerza sobre una partcula, dado que el calculo
del trabajo requiere conocer la trayectoria de esta, lo cual presupone que de alguna forma el problema ya
est
a resuelto. Sin embargo, hay tres razones por las cuales la formulacion es u
til a pesar de lo anterior

1. Con frecuencia, existen fuerzas de ligadura que obligan a la partcula a seguir una trayectoria dada (e.g.
pendulo, monta na rusa), de modo que conocemos la trayectoria aunque no conozcamos el valor de la
fuerza de ligadura, ni otras variables din
amicas del sistema (velocidad o aceleraci on en funcion de la
posici
on o del tiempo).

2. Existen fuerzas para las cuales la evaluaci on de la integral de lnea no requiere del conocimiento de la
trayectoria sino solo de los puntos inicial y final. Esto nos lleva al concepto de Fuerza conservativa

3. En el caso de la fuerza resultante el teorema fundamental del trabajo y la energa nos permite encontrar el
trabajo que dicha fuerza hace sobre la partcula, conociendo unicamente las velocidades en los extremos
de la trayectoria as como la masa de la partcula.

Definition 1 Una fuerza conservativa es aquella para la cual el trabajo asociado no depende de la trayectoria
seguida por la partcula sino solo de la posici
on final e inicial

Z B
F dr = U (rA ) U (rB ) (1.1)
A
4 CAPITULO 1. ELEMENTOS BASICOS

DE MECANICA NEWTONIANA

la funci
on escalar U (r) se conoce como energa potencial. Por otro lado, si la fuerza resultante es conservativa,
podemos combinar la definici on de conservatividad con el teorema fundamental del trabajo y la energa y se
obtiene
1 1
mv 2 mv 2 = U (rA ) U (rB )
2 B 2 A
1 2 1
mvA + U (rA ) = mv 2 + U (rB )
2 2 B
esto conduce al teorema de conservaci on de la energa mec anica. Es necesario enfatizar que la conser-
vatividad requiere que la energa potencial definida en (1.1) dependa u nicamente de la posici on. Si la energa
potencial es funci on explcita del tiempo, entonces la suma de Ek + U todava me define la energa total del
sistema, pero esta cantidad ya no se conserva en general. En otros casos la energa potencial puede depender
de la velocidad, aceleraci on etc. Finalmente, en algunos casos no existe ninguna funci on escalar que pueda dar
cuenta del trabajo realizado. En ninguno de estos casos se conserva la energa.
Retomando la definici on (1.1), vemos que a la energa potencial se le puede agregar una constante arbitraria
sin alterar el contenido Fsico de esta, ya que lo que es relevante fsicamente es el cambio en la energa potencial
y no su valor en s. Es f
acil demostrar que para que una fuerza sea conservativa, cada una de estas afirmaciones
es condicion necesaria y suficiente
Z B I
F (r) = U (r) ; F (r) = 0 ; F (r) dr = U (rA ) U (rB ) ; F (r) dr = 0
A

donde todas estas expresiones deben cumplirse para todo r R3 o para toda trayectoria en R3 . Las dos primeras
son condiciones en todo el espacio y las dos siguientes para toda trayectoria (general y cerrada respectivamente).
En todas estas ecuaciones, se debe enfatizar que no debe haber dependencia temporal explcita. Las fuerzas
conservativas mas importantes son las fuerzas constantes y las fuerzas centrales. Dentro de las no conservativas
el rozamiento es la mas destacable.
En el tratamiento de fuerzas centrales existe una cantidad que se conserva y que resulta muy u til en el
tratamiento de este tipo de fuerzas: el momento angular

1.4. Torque y momento angular


Si para una fuerza central elegimos el origen en el punto de convergencia de la fuerza, tenemos claramente
que la cantidad r F es nula. Llamemos a esta cantidad el torque de la partcula relativo a el origen O,
ya que es con respecto a este origen que se construye el vector posicion r. Esta cantidad denotada por ~ se
puede escribir como la derivada temporal total de otra cantidad: el llamado momento angular y definido por
L r p veamos

d dr dp
(r p) = p+r = mv v + r F
dt dt dt
dL
= ~ (1.2)
dt
para una fuerza central con origen en el punto de convergencia, el torque es cero y el momento angular es
una constante de movimiento. Aunque los conceptos de torque y momento angular de una partcula surgen de
manera natural en el caso de fuerzas centrales, son extensibles a cualquier tipo de fuerza y la relacion (1.2)
es v
alida en general. En particular si no hay torque sobre la partcula el momento angular se conserva, de la
misma forma que el momento lineal se conserva ante la ausencia o anulaci on de las fuerzas.
Finalmente, es necesario insistir en la fuerte dependencia que el torque y el momento angular tienen con
respecto al origen coordenado elegido, lo cual se manifiesta a traves de su dependencia del vector posicion r.
De esta forma hay tres cantidades cuya conservaci on ser
a mas adelante extensible a sistemas de partculas,
la energa, el momento lineal y el momento angular

1.5. DINAMICA DE UN SISTEMA DE PARTICULAS 5

1.5. Din
amica de un sistema de partculas
1.5.1. Definici
on de centro de masa
Sea un sistema de partculas con masas m1 , m2 , ..., mn y con velocidades v1 , v2 , ..., vn . Teniendo en cuenta
la definici
on de momento lineal para una partcula, es natural definir el momento lineal total del sistema de
partculas como la suma vectorial de los momentos de sus partculas, es decir:
n
X
P = p1 +p2 +... = m1 v1 + m2 v2 + ... + mn vn = mi vi
i=1

definamos la velocidad del centro de masa vCM del sistema de manera que:

P M vCM (1.3)
donde M es la masa total. Es decir, de manera que el momento del sistema sea el mismo que le correspondera
al caso en que toda la masa estuviera concentrada en el llamado centro de masa, cuya velocidad es vCM . Por
lo tanto:
Pn
P m1 v1 + m2 v2 + ... + mn vn mi vi
vCM = = = i=1 (1.4)
M m1 + m2 + ... + mn M
si suponemos que las masas son independientes de la velocidad, vCM corresponde a la velocidad asociada a la
posici
on:
Pn
m1 r1 + m2 r2 + ... + mn rn mi ri
rCM = = i=1 (1.5)
m1 + m2 + ... + mn M
la cual define la posici
on del centro de masa del sistema relativa a alg
un observador O, que mide los vectores de
posici
on y velocidad ri , vi . Ahora bien, es uno de los principios m
as fundamentales de la naturaleza el llamado
principio de conservaci on del momento el cual establece que si un sistema de partculas est a aislado,
su momento total es constante, y como suponemos que la masa no depende de la velocidad, tenemos de la
ecuaci
on (1.3) que vCM = cte de modo que: El centro de masa de un sistema de partculas aislado se
mueve con velocidad constante con respecto a un sistema inercial.
Un sistema de referencia muy particular es aquel que no rota con respecto a un sistema inercial y cuyo origen
coincide con el propio centro de masa del sistema de partculas. Si colocamos nuestro sistema de referencia sobre
el centro de masa, obviamente vCM = 0 por tanto, el momento total P del sistema de partculas es cero. Por
brevedad designaremos de ahora en adelante al sistema de referencia del centro de masa como sistemaC de
referencia. De modo que podemos escribir:
n
X
PCM = pi = 0 (en el sistema C de referencia) (1.6)
i=1

Este sistema de referencia es muy importante dado que muchos fen omenos fsicos pueden ser descritos m
as
f
acilmente en el sistema de referencia centro de masa que en el sistema del laboratorio.

1.5.2. Sistemas de partculas no aislados


Supongamos que tenemos un sistema S de n partculas, que interact
ua con las m partculas de otro sistema
S .Ahora supondremos que los sistemas S y S juntos forman un sistema aislado. Como el sistema S + S es

aislado, su momento se conserva, luego:


n
X m
X
P= pi + pj = PS + PS = cte (1.7)
i=1 j=1
6 CAPITULO 1. ELEMENTOS BASICOS

DE MECANICA NEWTONIANA

esto significa que cualquier cambio en el momento de S debe venir acompa


nado de un cambio en el momento
de S , a fin de mantener la suma constante.

PS = PS (1.8)

on entre los sistemas S y S se puede describir como un intercambio de momento. Al


Luego, la interacci
tomar la derivada temporal de (1.7) obtenemos:

d
(PS + PS ) = 0
dt
dPS dPS
= (1.9)
dt dt
haciendo una extrapolaci on, es natural llamar a la derivada temporal del momento total del sistema, como la
fuerza externa ejercida sobre S (en analoga al caso de una partcula), es decir:
P
dPS d ( ni=1 pi )
= Fext o = Fext (1.10)
dt dt
la denominacion de externa se debe al hecho de que es producida por su interacci on con S . Las fuerzas internas
que existen en S debidas a la interacci
on entre sus partculas no producen ning un cambio en el momento total
en virtud del principio de conservacion del momento, pues si quitamos las interacciones externas, se tendra
que el momento total PS del sistema permanecera constante y por tanto dP dt = 0 es decir Fext = 0. De all
S
se
concluye que las fuerzas internas de S no contribuyen a la cantidad dPS /dt. Utilizando las ecuaciones (1.9) y
(1.10) tenemos que
Fext = Fext (1.11)
donde Fext es la fuerza externa sobre S la cual es ejercida por las partculas del sistema S. Esta es la extensi
on
on para las interacciones entre S y S .
de la ley de accion y reacci
Por otro lado como PS = M vCM (donde CM define el centro de masa del sistema S y no del sistema
compuesto S + S ) tenemos:

dvCM
M = Fext (1.12)
dt
con lo cual podemos definir de manera natural la aceleraci
on del centro de masa:

dvCM
aCM = (1.13)
dt
M aCM = Fext (1.14)

Nuevamente an alogo al caso de una partcula. Reuniendo las ecuaciones (1.3) (1.13) y (1.14) se puede concluir
que:
La din amica del centro de masa de un sistema de partculas es equivalente al de una partcula de masa
igual a la masa total del sistema concentrada en dicho centro de masa, y sobre la cual se aplicara una fuerza
equivalente a la suma vectorial de las fuerzas externas sobre el sistema.
Adicionalmente, la interacci on entre los sistemas S y S puede ser descrita formalmente de manera analoga
al caso de dos partculas segun se ve en las Ecs. (1.7), (1.8), (1.9), (1.10) y (1.11). En este punto queda por
tanto, mas que justificada la introducci on del concepto de centro de masa.
No obstante, vale la pena aclarar que la formulaci on anterior no resuelve el problema din amico completo
para el sistema S. Para resolver formalmente el problema din amico de cada partcula, vamos a relacionar
Fext con las fuerzas que act uan sobre cada partcula. De aqu en adelante nos olvidaremos del sistema S
cuya influencia sobre S estar a representada por la fuerzas externas sobre S. Sea pi el momento lineal de la
(e)
partcula i de masa mi ; sea Fi la fuerza externa resultante sobre dicha partcula, y Fij la fuerza interna que

1.5. DINAMICA DE UN SISTEMA DE PARTICULAS 7

la partcula j tambien del sistema S, ejerce sobre la partcula i. La fuerza total ejercida sobre la partcula
(e)
i es por tanto igual a la fuerza externa Fi m as la suma de las fuerzas internas de todas las partculas j del
sistema S (excepto la propia partcula i) aplicando la segunda ley de Newton a esta partcula se tiene:

X n
dpi (e)
= Fi + Fij (1.15)
dt
j6=i

asumiremos de aqu en adelante que Fii = 0. Resolviendo esta ecuaci on para cada partcula i del sistema,
se obtiene la soluci
on din
amica completa de este. Observese que aqu s aparecen explcitamente las fuerzas
internas. Ahora sumemos todas las ecuaciones de todas las partculas de la siguiente manera:

n
X n
X n X
X n
dpi (e)
= Fi + Fij
dt
i=1 i=1 i=1 j6=i
Pn Xn Xn X n
d( i=1 pi ) (e)
= Fi + Fij (1.16)
dt
i=1 i=1 j6=i
P P
pero i j Fij se puede escribir como:
n X
X n n n
1 XX
Fij = (Fij + Fji ) (1.17)
2
i=1 j6=i i=1 j>i

sustituyendo (1.17) en (1.16) y usando el principio de acci


on y reacci
on, la ecuaci
on (1.16) nos queda:
Pn n
X
d( i=1 pi ) (e)
= Fi
dt
i=1

comparando con la ecuaci on (1.10) se concluye que la fuerza externa sobre un sistema de partculas es la suma
de las fuerzas externas sobre cada una de las partculas del sistema.

1.5.3. Momento angular y torque de un sistema de partculas


Para un sistema S de varias partculas definimos el torque y el momento angular de cada partcula i de S :

i ri Fi ; Li ri pi

y de manera completamente an
aloga al caso de una partcula se puede probar que

dLi
= i
dt
supongamos adem as que la partcula est
a sujeta a las fuerzas internas que sobre ella realizan las otras partculas
(e) P
del sistema S m
as una fuerza externa resultante. Luego, la fuerza resultante sobre la partcula i es Fi + Fij y
j
su torque resultante es:

n
X
dLi (e)
= i = ri Fi + Fij
dt
j6=i

en analoga con la definici


on de momento lineal total, definimos el torque total como la suma vectorial de
los torques individuales de las partculas, similarmente definimos el momento angular total L. Escribimos
entonces:
8 CAPITULO 1. ELEMENTOS BASICOS

DE MECANICA NEWTONIANA

n
X n
X P
dLi d ( ni=1 Li ) dL
= i = = =
dt dt dt
i=1 i=1

por otro lado:


n
X n
X
= ri F(e) + Fij
i
i=1 j6=i

n 
X  n
X n
X
(e) ri
= ri Fi + Fij
i=1 i=1 j6=i

por otra parte, utilizando la ley de acci


on y reacci
on, puede demostrarse por inducci
on que:

n
X n
X n1
XX n
ri Fij = [(ri rj ) Fij ] (1.18)
i=1 j6=i i=1 j>i

por tanto, el torque total queda:


n 
X  n1
XX n
(e)
= ri Fi + [(ri rj ) Fij ]
i=1 i=1 j>i

Si suponemos especialmente que las fuerzas internas Fij act


uan a lo largo de los vectores relativos rij se
tiene que el segundo termino de la derecha se anula quedando
n 
X 
(e)
= ri Fi
i=1

(e) (e)
donde ri Fi representa el torque debido a las fuerzas externas Fi sobre cada partcula i entonces:
n
X
= i,ext = ext
i=1

de modo que
dL
= ext (1.19)
dt
que constituye la relacion fundamental de la mec
anica rotacional, observese la analoga entre las Ecs. (1.19) y
(1.10). Si ext = 0, se encuentra que:

dL
= 0 L = L1 + L2 + ... + Ln = cte (1.20)
dt
la ecuaci
on (1.20) constituye la ley de conservaci on del momento angular. La cual nos indica que si en un
sistema las fuerzas externas sobre el son tales que su torque total es cero, su momento angular permanece
constante. En particular, el momento angular se conservar a cuando el sistema este aislado.
Vale anotar que la ley de conservaci on del momento angular ha mostrado ser universalmente v alida a
pesar de nuestra suposici on inicial de que las fuerzas vayan a lo largo de las lneas que unen a las partculas
(propiedad que no cumplen por ejemplo las fuerzas magneticas). De manera que a un en los casos en que
nuestra suposicion inicial no es valida, la ley de conservaci
on del momento angular se ha cumplido en todos
los procesos observados hasta ahora, aunque con un concepto extendido de momento angular.

1.5. DINAMICA DE UN SISTEMA DE PARTICULAS 9

Relacion entre el momento angular de un sistema de partculas relativo al sistema-C y el relativo


al laboratorio
Las posiciones de las partculas relativas al laboratorio (denotadas por ri ) y las asociadas al centro de masa
(denotadas por ri ) se pueden relacionar facilmente, y se puede ver que:

ri = ri + rCM (1.21)
vi = vi + vCM (1.22)

siendo rCM y vCM la posici


on y velocidad del centro de masa medidas por el laboratorio. Multiplicando (1.22)
por mi se obtiene

pi = pi + mi vCM (1.23)
utilizando estas relaciones, obtenemos:

n
X n
X   
L = (ri pi ) = ri + rCM pi + mi vCM
i=1 i=1
n n n
!
X  X X 
L = ri pi + rCM pi + mi ri + rCM vCM
i=1 i=1 i=1
n n n
!
X  X X
L = ri pi + rCM pi + mi ri vCM
i=1 i=1 i=1
P P
pero i pi = 0 de acuerdo con (1.6) y utilizando (1.5) se tiene que ( i mi ri ) = M rCM de modo que:

n
X 
L = ri pi + M rCM vCM
i=1
L = LCM + rCM P (1.24)

el termino LCM es el momento angular relativo al centro de masa, o momento angular interno; esto u ltimo
debido a que el momento angular as medido es una propiedad del sistema e independiente del observador. El
segundo termino a la derecha suele denominarse momento angular externo relativo al sistema-L (laboratorio),
y equivale al momento angular (medido desde el sistema laboratorio) correspondiente a una partcula de masa
M colocada en la posicion del centro de masa y con la velocidad del CM. Por ejemplo, cuando un lanzador
arroja una pelota rotando, el momento angular debido a la rotaci on est
a dado por LCM , mientras que el
momento angular debido a la traslaci on de la pelota est
a dado por M rCM vCM con M la masa de la bola.
Para la Tierra LCM es debido a su rotacion y M rCM vCM es debido a su traslacion alrededor del Sol.

Relaci
on entre el torque externo alrededor del centro de masa y el torque alrededor del labora-
torio
Con un argumento similar al anterior se puede calcular la relaci
on entre el torque externo medido por el
laboratorio y el medido por el centro de masa

ext = CM + rCM Fext (1.25)


rCM Fext es el torque de translaci
on y es equivalente al torque medido en el sistema-L para una partcula
ubicada en el centro de masa sometida a la fuerza externa resultante de todo el sistema Fext .
Pero teniendo en cuenta el resultado (1.24) y derivando temporalmente se obtiene:
10 CAPITULO 1. ELEMENTOS BASICOS

DE MECANICA NEWTONIANA

dL dLCM dvCM
= + rCM M
dt dt dt
y tomando las Ecs. (1.12) y (1.19):

dLCM
ext = + rCM Fext (1.26)
dt
Y comparando (1.25) y (1.26) se obtiene:

dLCM
= CM (1.27)
dt
esta relaci
on es funcionalmente identica a (1.19) pero con la diferencia de que (1.19) es v alida s
olo cuando el
torque y el momento angular se miden a partir de un punto fijo (usualmente el origen) en un sistema inercial
de referencia, en tanto que la relaci alida incluso si el sistema de referencia-C no es inercial1 . Esta
on (1.27) es v
ecuaci
on resultara muy util para estudiar el movimiento del cuerpo rgido.

1.5.4. Energa cin


etica de un conjunto de partculas
La fuerza resultante sobre la partcula i es:
n
X
(e)
Fi = Fi + Fij = mi ai
j6=i

(e)
donde Fi es la resultante de las fuerzas externas. El diferencial de trabajo es:
n
X
(e)
dWi = mi ai dri = Fi dri + Fij dri
j6=i

el diferencial de trabajo total realizado sobre el sistema, es entonces la suma de los diferenciales de trabajo de
partcula individual:
n
X n
X n X
X n
(e)
dW = mi ai dri = Fi dri + Fij dri
i=1 i=1 i=1 j6=i

aplicando una identidad an


aloga a (1.18)

n X
X n n1
XX n n1
XX n
Fij dri = [(dri drj ) Fij ] = (drij Fij )
i=1 j6=i i=1 j>i i=1 j>i

dvi dri
por otro lado ai dri = dt dri = dvi dt = dvi vi con lo cual queda:

n
X n
X n1
XX n
(e)
dW = mi dvi vi = Fi dri + (drij Fij )
i=1 i=1 i=1 j>i

integrando a ambos lados la ecuaci


on queda:
Z n Z
X vi n Z
X Bi n1
XX n Z Bij
(e)
dW = mi vi dvi = Fi dri + (drij Fij )
i=1 v0i i=1 Ai i=1 j>i Aij

1
Sin embargo, la relaci
on (1.27) no es v
alida si el sistema-C est
a rotando con respecto al sistema inercial [3].

1.5. DINAMICA DE UN SISTEMA DE PARTICULAS 11

observese que estrictamente aqu se realizan n integrales dado que existen n trayectorias seguidas por cada
una de las n partculas. El primer termino de la derecha es el trabajo realizado por las fuerzas externas a S. El
segundo termino corresponde al trabajo hecho por las fuerzas internas.

Z n 
X 
1 1
dW = mi vi2 mi v0i
2
= Wext +Wint
2 2
i=1
n
X n
X
1 1
W = mi vi2 2
mi v0i = Wext +Wint
2 2
i=1 i=1
Pn
pero i=1 12 mi vi2 es la energa cinetica del sistema en un instante dado. Por tanto el trabajo total realizado por
las fuerzas externas e internas cuando el sistema de partculas se desplaza desde la configuraci on de posiciones
(x01 , ..., x0n ) hasta la configuraci
on de posiciones (xf 1 , ..., xf n ) a traves de las trayectorias (x1 (t) , ..., xn (t)) es
igual al cambio de energa cinetica entre estas dos configuraciones de posici on, sin importar la naturaleza de
las trayectorias. Hemos recuperado por tanto el teorema fundamental del trabajo y la energa para el caso de
un sistema de partculas, el cual enunciaremos de la manera siguiente:
El trabajo total efectuado por las fuerzas externas e internas sobre un sistema de partculas
es igual al cambio producido en su energa cin etica.
Por tanto escribiremos:

Ek Ek,0 = Wext +Wint (1.28)

1.5.5. Conservaci
on de la energa de un sistema de partculas
Supongamos ahora que las fuerzas internas son conservativas, en tal caso se tiene que:
Z Bij
(drij Fij ) = Ep0,int (rij ) Ep,int (rij )
Aij

pero como se trata de interacci on de pares de partculas, la energa potencial depende u


nicamente del vector
relativo entre los pares de partculas i, j. Si suponemos especialmente que la fuerza Fij va a lo largo del vector
rij que une a las dos partculas, se tiene que la energa potencial dependera s
olamente de la distancia entre las
dos partculas:
Z Bij
ij ij
(drij Fij ) = Ep0,int (rij ) Ep,int (rij ) , rij krij k
Aij

en este caso, la energa potencial est


a definida por pares de partculas, a esto se refiere el suprandice i, j en la
ecuaci
on anterior. Por tanto, las fuerzas internas producen un trabajo equivalente a:
n1
XX n h i
ij ij
Ep0,int (rij ) Ep,int (rij )
i=1 j>i

y como sabemos que la suma de fuerzas conservativas es tambien conservativa se tiene que:
n1
XX n n1
XX n
ij ij
Wint = Ep0,int (rij ) Ep,int (rij ) = Ep0,int Ep,int
i=1 j>i i=1 j>i

que al sustiturlo en (1.28) nos da:

Ek Ek,0 = Wext +Ep0,int Ep,int


[Ek + Ep,int ] [Ep0,int + Ek,0 ] = Wext
12 CAPITULO 1. ELEMENTOS BASICOS

DE MECANICA NEWTONIANA

definamos ahora la energa propia del sistema como:

U Ek + Ep,int (1.29)

el nombre de energa propia indica que esta es una propiedad del sistema (y no de agentes externos). Podemos
reescribir la ecuaci
on anterior como:

U U0 = Wext (1.30)

es decir, el cambio en la energa propia del sistema es igual al trabajo realizado por las fuerzas externas sobre
el sistema de partculas.
Como la energa potencial Ep,int (rij ) solo depende de la distancia entre las dos partculas i, j se tiene
ij ji
entonces que Ep,int = Ep,int por lo tanto:

n1
XX n n n
ij 1 X X ij
Ep,int (rij ) = Ep,int (rij )
2
i=1 j>i i=1 j6=i

regresando a la Ec. (1.30) se tiene que si Wext = 0, la energa propia es igual al principio y al final de cualquier
proceso, de modo que podemos enunciar el siguiente principio de conservaci on:
Si las fuerzas externas no realizan ning un trabajo, se tiene que la energa propia del sistema
se conserva (siendo las fuerzas internas conservativas).
Finalmente, supongamos que tambien las fuerzas externas son conservativas de manera que:

Wext = Ep,ext0 Ep,ext

la Ec. (1.30) queda:

U U0 = Ep,ext0 Ep,ext
(U + Ep,ext ) (U0 + Ep,ext0 ) = 0

es decir, la cantidad U + Ep,ext se conserva para cualquier proceso realizado por las fuerzas externas e internas.
Como en el c alculo de U + Ep,ext intervienen todas las fuerzas sobre S, podemos denominar a esta cantidad
como la energa total del sistema

E = U + Ep,ext = Ek + Ep,int + Ep,ext

es decir la energa total del sistema es igual a la energa cinetica mas la energa potencial de las fuerzas internas
y externas, y se tiene que:

E E0 = 0

es decir la energa total se conserva para cualquier proceso realizado por las fuerzas internas y externas siempre
y cuando ambos tipos de fuerzas sean conservativos. Hemos deducido entonces el teorema de conservaci on de
la energa para un sistema de partculas en donde las fuerzas involucradas son todas conservativas2 . En el caso
de una sola partcula, la energa total se reduce a la expresi
on correcta ya que cuando solo hay una partcula
Ep,int = 0 (puesto que la energa potencial interna se debe a la interacci on por pares, de modo que debe
haber al menos dos partculas) y Ep,ext es la energa potencial correspondiente a la fuerza resultante sobre la
partcula.
2
En su forma m as general, la conservaci
on de la energa adquiere el car
acter de principio y su validez es universal, mas all
a de
las suposiciones realizadas para demostrar el teorema.

1.5. DINAMICA DE UN SISTEMA DE PARTICULAS 13

1.5.6. Transformaci
on de la energa cin
etica al sistema-C a partir del sistema de labora-
torio
La energa cinetica depende del observador. No obstante, dicha cantidad medida a partir del centro de
masa del sistema sera una cantidad independiente del observador. Puesto que la energa potencial interna
no depende del sistema de referencia, ya que s
olo es funci
on de las coordenadas relativas entre las partculas,
podemos definir una energa del sistema que sea independiente del observador a traves de la relaci
on:

Uint Ek,CM + Ep,int


que denominamos energa interna del sistema de partculas. Vemos pues que la energa interna es la energa
propia medida por el sistema de referencia del centro de masa. En general, por la energa del sistema S se
entiende que se refiere a su energa interna.
Pero como en la realidad las cantidades se miden desde el laboratorio, es necesario conocer la forma en
que la energa cinetica se transforma cuando pasamos del sistema del laboratorio al sistema centro de masa.
El procedimiento es similar al del caso del momento angular y se deja como ejercicio al lector demostrar que:

1 2
Ek = Ek,CM + M vCM
2
n
X n
X
1 2 1 1 2
mi vi = mi vi2 + M vCM (1.31)
2 2 2
i=1 i=1

el primer termino de la derecha es el debido al movimiento de las partculas del sistema con respecto al centro
de masa, el segundo termino es el debido al movimiento del sistema como un todo (movimiento de su centro
de masa con respecto al laboratorio). La energa propia de S vendra dada entonces por:
1 2
U = Uint + M vCM
2
esta relaci
on muestra que la energa interna es el menor valor que puede tomar la energa propia, y este valor
lo toma cuando se mide en el sistema C de referencia.
Captulo 2

Principio de DAlembert y ecuaciones de


Lagrange

Las ecuaciones de Lagrange son un formalismo equivalente a la formulaci on Newtoniana de la mec anica
pero que tiene una serie de ventajas tanto operativas como formales que veremos en el transcurso de nuestros
desarrollos. Es usual en Fsica realizar una formulaci
on diferencial y una formulaci
on integral equivalente de
cierto formalismo. Por ejemplo, las ecuaciones de Maxwell se pueden escribir en forma integral en la cual
aparecen integrales de lnea, de superficie y de volumen, o alternativamente se pueden escribir en forma
diferencial por medio de divergencias, rotacionales y derivadas parciales del tiempo. Similarmente, la segunda
ley de Newton tiene una versi on diferencial
dP
F=
dt
y una forma integral equivalente que se conoce como teorema del impulso I:
Z T
Fdt = dP F dt = P P0 I
0

la experiencia muestra que las formulaciones integrales y diferenciales tienen cada una sus ventajas y desven-
tajas y en general resultan un buen complemento para obtener un buen panorama de la teora subyacente.
En esta misma tonica queremos obtener el nuevo formalismo a partir de una formulaci on diferencial y una
formulacion integral. La formulaci
on diferencial se cimenta en el llamado principio de DAlembert en tanto
que la formulacion integral se basa en el principio variacional de Hamilton.
Nos ocuparemos primero de la versi on diferencial, pero antes de discutir el principio de DAlembert que la
genera, debemos estudiar el papel de las ligaduras en la Fsica.

2.1. Ligaduras
Aunque las ecuaciones de movimiento (1.15) nos dictaminan formalmente toda la evoluci on del sistema,
desde el punto de vista operativo es en general difcil conocer todas las fuerzas aplicadas sobre cada partcula.
Con frecuencia, los sistemas estan sometidos a ligaduras que obligan a la partcula o sistema de partculas a
moverse en ciertas trayectorias o a restringir su movimiento a ciertas regiones especficas. Tal es el caso de
sistemas como la monta na rusa o el pendulo en donde la trayectoria del m ovil est
a determinada por la normal
y la tension de la cuerda respectivamente, observese que en estos casos particulares no es f acil encontrar a
priori el valor de las fuerzas de ligadura. Otro caso com un es el de un gas en un contenedor, en tal caso la
ligadura se manifiesta como la exclusion de la regi
on exterior al contenedor como posible regi on de movimiento
para las partculas.
Hay varias formas de clasificar las ligaduras. Una de las clasificaciones m as utiles consiste en la caracteri-
zaci
on de las ligaduras como hol onomas y no hol onomas. Las ligaduras hol onomas son aquellas que se pueden

14
2.1. LIGADURAS 15

escribir como ecuaciones que conectan las coordenadas de las partculas y tal vez el tiempo, de la forma

f (r1 , r2 , . . . , rN , t) = 0 (2.1)

un ejemplo sencillo lo constituye el cuerpo rgido para el cual las ligaduras se expresan de la forma

(ri rj )2 c2ij = 0

siendo ri , rj posiciones de un par de partculas del cuerpo rgido y siendo cij sus distancias (constantes). La
monta na rusa y el pendulo son tambien ejemplos de ligaduras hol onomas, ya que el m ovil est
a obligado a
seguir una trayectoria especfica. La ecuaci
on de la trayectoria actua entonces como la ligadura.
Toda ligadura que no cumpla la condici on (2.1), se denomina no hol onoma. En el ejemplo del contenedor
de gas, asumiendo por simplicidad un contenedor esferico de radio a, tendramos una ligadura de la forma

r 2 a2 0

es decir una desigualdad. Naturalmente hay infinidad de ligaduras no hol onomas ya que solo se requiere que
no se cumpla una ecuaci on de la forma (2.1).
Otra clasificaci
on importante es en ligaduras re onomas (que contienen el tiempo como variable explcita)
y escler onomas (el tiempo no aparece explcitamente en la ligadura). Un bloque que se desliza por un plano
inclinado, donde este u ltimo est
a fijo en el espacio, es una ligadura escler onoma. Por otro lado, si el plano
inclinado se mueve de una manera prescrita1 , la ligadura es re onoma. N otese sin embargo, que si el movimiento
del plano inclinado es solo debido a la fuerza de reacci on del bloque, la dependencia temporal entra a traves de
las coordenadas que describen a la curva que hace el bloque; en tal caso, la ligadura como tal es escler onoma.
Como ya se mencion o, en general es difcil hallar las fuerzas de ligadura. Adicionalmente, si tenemos N
partculas, las 3N coordenadas necesarias para determinar las posiciones de las N partculas no son en general
independientes, de modo que los grados de libertad son menores a 3N . En el caso mas general puede ser muy
difcil saber cu
antas coordenadas independientes hay, pero en el caso de las ligaduras hol onomas, este conteo
es muy sencillo ya que si tenemos k ecuaciones hol onomas, el numero de grados de libertad ser a 3N k. Por
tanto, cuando las ligaduras son hol onomas, se pueden encontrar un conjunto de coordenadas generalizadas
que consisten en un conjunto de 3N k grados de libertad independientes que denotaremos por q1 , . . . , q3N k
las cuales se pueden escribir en terminos de las antiguas coordenadas r1 , . . . , rN con ecuaciones de la forma

ri = ri (q1 , . . . , q3N k , t) ; i = 1, . . . , N (2.2)

que contienen implcitamente las ligaduras. Si a este sistema le a


nadimos las ecuaciones de ligadura

fj (r1 , . . . , rN , t) = 0 ; j = 1, . . . , k (2.3)

el conjunto de transformaciones debe ser invertible de modo que cada qi se puede escribir en terminos de
las antiguas coordenadas ri y el tiempo. Es importante notar que en el caso m as general, las coordenadas
generalizadas no se pueden agrupar en triplas que formen un vector euclidiano.
Un ejemplo que ilustra todos estos detalles es el pendulo doble que se muestra en la figura 2.1. Por simplici-
dad asumamos que las lentejas se mueven en un plano. Las coordenadas cartesianas de las dos lentejas nos dan
seis escalares que especifican las posiciones de ambas. Sin embargo, es claro que no todas estas componentes
son independientes. Los angulos 1 y 2 representan un conjunto de grados de libertad (coordenadas inde-
pendientes) que determinan completamente la posici on de las dos lentejas bajo las ligaduras ya mencionadas.
Existen en efecto 4 ecuaciones de ligadura, dos de ellas asociadas al hecho de que las lentejas estan en un plano
(e.g. z1 = 0 y z2 = 0) y otras dos que nos dicen que las longitudes de las cuerdas son constantes2 . Para este
sistema, el par (1 , 2 ) no forma un vector euclidiano en el plano de movimiento, tambien se ve otro aspecto
1
Usualmente debido a alguna fuerza externa que introduce la dependencia temporal en la ecuaci on de ligadura.
2
En este caso, dos ligaduras estan asociadas a condiciones iniciales (la ausencia de una componente z de las velocidades iniciales
de las lentejas), y otras dos est
an asociadas a fuerzas de ligadura (las tensiones de las cuerdas).
16 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

Figura 2.1: Ilustraci


on de un pendulo doble. Un conjunto conveniente de coordenadas son los
angulos 1 y 2
medidos con respecto a la vertical, siempre que el movimiento se restrinja a un plano.

interesante: las coordenadas generalizadas no necesariamente tienen dimensiones de longitud (en este caso son
adimensionales), en general las coordenadas generalizadas pueden tener cualquier tipo de dimensi on.
Dado que cuando las ligaduras son hol onomas las coordenadas dependientes se pueden eliminar, estos
problemas son accesibles para solucionarse al menos formalmente. Las ligaduras no hol onomas deben tratarse
cada una por aparte y no hay una estrategia general de soluci on. Es importante enfatizar que para que
las ligaduras sean holonomas es necesario que las funciones f no contengan como argumento, derivadas u
on3 .
operadores diferenciales de la posici
De momento nos limitaremos a ligaduras hol onomas para las cuales es m as sencillo el conteo de grados de
libertad. Recordemos que una segunda dificultad cuando nos encontramos con ligaduras es el hecho de que las
fuerzas de ligadura son desconocidas y en general difciles de hallar. Para obviar este problema sera deseable
obtener un formalismo en el cual las fuerzas de ligadura no esten includas. Esta es la principal motivaci on
para introducir el llamado principio de DAlembert.

2.2. Principio de DAlembert


Introduciremos primero el concepto de desplazamiento virtual, concebido como el cambio de configuraci on
de un sistema como resultado de un cambio infinitesimal de las coordenadas, denotado como ri , y consistente
con las fuerzas y ligaduras impuestas sobre el sistema en un instante dado t. A diferencia del desplazamiento
real, el cual ocurre en un intervalo de tiempo dt, el tiempo se considera fijo en los desplazamiento virtuales, de
modo que se ignoran los posibles cambios en las fuerzas y en las ligaduras que pueden provenir de la evoluci on
temporal. Comencemos por escribir la segunda ley de Newton, y el trabajo virtual asociado a las fuerzas sobre
una partcula i

N
X
Fi p i = 0 (Fi p i ) ri = 0
i=1

3
Cuando hay operadores diferenciales es en algunos casos posible tener ligaduras integrables que permitan reducir las variables
dependientes con facilidad. Incluso cuando las ligaduras no son integrables, el metodo de multiplicadores de Lagrange puede hacer
esta funci
on, pero volveremos sobre eso mas adelante.
2.3. COORDENADAS GENERALIZADAS Y ECUACIONES DE LAGRANGE 17

como la idea es eliminar a las fuerzas de ligadura de la formulaci


on, haremos la separaci
on de Fi entre las
(a)
fuerzas aplicadas Fi y las fuerzas de ligadura fi
(a)
Fi = Fi + fi
N 
X  N
X
(a)
Fi p i ri + fi ri = 0
i=1 i=1
a continuacion nos restringiremos a sistemas en los cuales los trabajos virtuales netos asociados a las fuerzas de
ligadura se anulan. Es facil ver que esta condicion se cumple en gran n umero de casos, por ejemplo la tension
de la cuerda no realiza trabajo sobre la lenteja de un pendulo (ni virtual ni real). En una monta na rusa sin
rozamiento, la normal no hace trabajo sobre el m ovil. En un cuerpo rgido las fuerzas de ligadura son fuerzas
internas que obligan a las partculas a conservar sus distancias relativas, lo cual conduce a que no hayan cambios
en la energa interna, es decir que no hay trabajo realizado por estas fuerzas internas de ligadura. Cuando
intervienen fuerzas de fricci
on por deslizamiento no se cumple esta condici on de tal manera que debemos excluir
esta situaci
on de nuestra formulaci 4
on actual . Sin embargo, el rozamiento est atico de rodadura no viola esta
condicion ya que no realiza trabajo real ni virtual. Vale la pena anotar que si una partcula esta restringida
a una superficie o curva que a su vez se desplaza en el tiempo, la fuerza de ligadura es instant aneamente
perpendicular a la superficie o curva de modo que el trabajo virtual es cero, aunque el trabajo real en un
intervalo dt no es necesariamente cero (ver Refs. [4, 5] y problema 2.2). Esta u ltima observaci
on justifica la
introduccion de los desplazamientos virtuales, ya que eliminan muchas fuerzas de ligadura que no se eliminan
con los desplazamientos reales.
Asumiendo entonces que las fuerzas de ligadura no producen trabajos virtuales, se tiene que
N 
X 
(a)
Fi p i ri = 0 (2.4)
i=1
a la expresi
on (2.4), se le conoce como principio de DAlembert. Hemos logrado nuestro objetivo en el
sentido de exclur las fuerzas de ligadura de la formulaci
on. De aqu en adelante omitiremos el suprandice
(a) sobreentendiendo que las fuerzas involucradas excluyen a las ligaduras. No obstante, los coeficientes de los

desplazamientos virtuales ri no son necesariamente cero, ya que los desplazamientos virtuales ri al ser com-
patibles con las ligaduras no son en general independientes, est
an conectados por las ecuaciones de ligadura. El
siguiente paso es entonces encontrar un conjunto de coordenadas generalizadas qj que sean independientes
y solo tengan en cuenta los verdaderos grados de libertad del sistema. En tal caso los desplazamientos virtuales
qj ser
an independientes y podremos aseverar que los coeficientes asociados a estos desplazamientos deben ser
nulos. La existencia de estas coordenadas independientes solo se puede garantizar cuando las ligaduras son
holonomas.

2.3. Coordenadas generalizadas y ecuaciones de Lagrange


Supondremos entonces que las ligaduras son hol onomas. En consecuencia, es posible encontrar un conjunto
q1 , q2 , . . . , qn de coordenadas generalizadas independientes que junto con el tiempo, me caracterizan comple-
tamente la configuraci on y din
amica del sistema fsico, y que est an conectadas con las coordenadas originales
en la forma
ri = ri (q1 , q2 , . . . , qn , t) ; i = 1, ..., N (2.5)
usando la regla de la cadena en la Ec. (2.5), podemos escribir la velocidad de la partcula iesima como
n
dri X ri ri
vi = = qk + (2.6)
dt qk t
k=1
4
Estrictamente las fuerzas de fricci
on no son fuerzas de ligadura. Sin embargo, en el caso de la fricci
on deslizante, la magnitud
de dicha fuerza depende de la magnitud de la fuerza de ligadura (la normal), con lo cual, la fuerza aplicada (fricci
on) introduce una
dependencia de la fuerza de ligadura, que no puede ser desacoplada. En el caso de la fricci on est
atica, este problema solo aparece
si dicha fuerza adquiere su valor maximo.
18 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

donde hemos hecho la suposicion de que t qk = dqk /dt qk mas adelante discutiremos esta suposici
on. Tenien-
do en cuenta de nuevo la Ec. (2.5), los desplazamientos virtuales originales se conectan con los desplazamientos
virtuales en coordenadas generalizadas a traves de la relacion
n
X ri
ri = qj (2.7)
qj
j=1

en donde no se incluye la variacion temporal por la definici


on de desplazamiento virtual. Como ya vimos antes,
cuando la ligadura cambia con el tiempo, es posible que solo el trabajo virtual se anule, pero no el trabajo
real. El trabajo virtual en terminos de las coordenadas generalizadas queda entonces
N
X N X
X n X n
ri
Fi ri = Fi qj = Qj qj (2.8)
qj
i=1 i=1 j=1 j=1
N
X ri
Qj Fi (2.9)
qj
i=1

en analoga con la expresi


on original del trabajo virtual, al termino Qj se le llama la fuerza generalizada.
Notese que Qj no necesariamente tiene dimensiones de fuerza al igual que las qj no tienen necesariamente
unidades de longitud, pero el producto Qj qj debe tener unidades de trabajo.
Nos ocuparemos ahora del segundo termino en (2.4)
N
X N
X
p i ri = m i
ri ri
i=1 i=1

utilizando (2.7) resulta


N
X N X
X n
ri
p i ri = m i
ri qj
qj
i=1 i=1 j=1

y usando la identidad    
ri d ri d ri
mi
ri = mi r i mi r i
qj dt qj dt qj
se obtiene
N
X n 
N X
X    
d ri d ri
p i ri = mi r i mi r i qj (2.10)
dt qj dt qj
i=1 i=1 j=1

examinemos el u
ltimo termino de esta ecuaci
on
  X n     
d ri ri ri
= qk +
dt qj qk qj t qj
k=1

intercambiando el orden de las derivadas parciales y usando (2.6), resulta


  n      " n    #
d ri X ri ri X ri ri
= qk + = qk +
dt qj qj qk qj t qj qk t
k=1 k=1
 
d ri vi
= (2.11)
dt qj qj
en lo anterior se asumi o que qk /qj = 0, suposici on que discutiremos m as adelante. Ahora usando la Ec.
(2.6), tenemos
n       X n      
vi X ri qk ri ri ri ri ri
= qk + + = qk + kj +
qj qj qk qj qk qj t qk qj qk t qj
k=1 k=1
2.3. COORDENADAS GENERALIZADAS Y ECUACIONES DE LAGRANGE 19

y suponiendo que ri / qj = 0, se obtiene


vi r i ri
= (2.12)
qj qj qj

sustituyendo (2.11) y (2.12) en (2.10) se obtiene


N
X n 
N X
X   
d vi vi
p i ri = mi vi mi vi qj
dt qj qj
i=1 i=1 j=1
N n
( " N
!# N
!)
X X d X 1 X 1
p i ri = mi vi2 mi vi2 qj (2.13)
dt qj 2 qj 2
i=1 j=1 i=1 i=1

y reemplazando (2.8) y (2.13) en (2.4) resulta


n
( " N
!# N
! )
X d X 1 X 1
2
mi vi mi vi2 Qj qj = 0
dt qj 2 qj 2
j=1 i=1 i=1

denotaremos la energa cinetica del sistema con T de modo que el principio de DAlembert queda
Xn     
d T T
Qj qj = 0 (2.14)
dt qj qj
j=1

a lo largo de estos desarrollos hemos realizado las siguientes suposiciones


qk dqk qk ri
= ; =0 ; =0 (2.15)
t dt qj qj
para comprenderlas, observemos que cuando las ligaduras son hol onomas, la tercera de estas condiciones es
una consecuencia directa del car
acter hol
onomo de las ligaduras como se ve en las Ecs. (2.5). Adicionalmente,
dichas ecuaciones nos muestran que siempre es posible obtener un conjunto de coordenadas independientes
que nos dan cuenta de los verdaderos grados de libertad del sistema. En tal caso cada una de las coordenadas
generalizadas puede depender a lo m as del tiempo, de modo que
qi dqi
qi = qi (t) =
t dt
qi
qi = qi (t) =0 (2.16)
qj

vemos entonces que las dos primeras suposiciones (2.15) provienen de las condiciones (2.16) que resultan cuando
las coordenadas son independientes, en tanto que la tercera de las suposiciones (2.15) proviene directamente
del caracter hol
onomo de las ligaduras.
Por otra parte, el hecho de que las qk solo sean funciones del tiempo, implica ademas que podemos realizar
5
un desplazamiento virtual para una sola coordenada qk sin violar las ligaduras . Al ser independientes todos los
desplazamientos virtuales, podemos hacer que todos los q s sean nulos excepto un qj especfico, por tanto su
coeficiente asociado en la ecuaci
on (2.14) debe ser nulo. Procediendo de la misma forma con cada coordenada,
conclumos que  
d T T
= Qj ; j = 1, ..., n (2.17)
dt qj qj
hay un n
umero n de estas ecuaciones, donde n es el n
umero de grados de libertad (y de coordenadas generali-
zadas).
5
N
otese la importancia de que el desplazamiento sea virtual, pues si el desplazamiento es real, la dependencia temporal de las
coordenadas no permite que en general se mueva una sola coordenada en el sistema.
20 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

on potencial escalar6
Ahora veamos el caso en el cual cada una de las fuerzas Fi son derivables de una funci
V  
V V V
Fi = i V = , , ; i = 1, . . . , N (2.18)
xi yi zi
en este caso las fuerzas generalizadas definidas en (2.9), se escriben como

N
X XN
ri ri
Qj = Fi = i V
qj qj
i=1 i=1
XN  
V xi V yi V zi
Qj = + + (2.19)
xi qj yi qj zi qj
i=1

por otro lado, impondremos como condici on adicional, que dicho potencial sea funci on solamente de las posi-
ciones y el tiempo
V = V (r1 , . . . , rN , t) = V (x1 , . . . , xN , y1 , . . . , yN , z1 , . . . , zN ; t) (2.20)

cuando los argumentos del potencial son los dados por la Ec. (2.20), el termino a la derecha de la Ec. (2.19)
coincide con la derivada parcial de V con respecto a qj con lo cual se obtiene7

V
Qj = (2.21)
qj

reemplazando la expresi on (2.21) en (2.17) y teniendo en cuenta que el potencial V no depende de las veloci-
dades generalizadas qj 8 podemos escribir
 
d (T V ) (T V )
=0 ; j = 1, ..., n
dt qj qj

definimos entonces una nueva funci


on
LT V (2.22)

conocida como el Lagrangiano L asociado al sistema. Con lo cual obtenemos finalmente


 
d L L
=0 ; j = 1, ..., n (2.23)
dt qj qj

las n ecuaciones as obtenidas se conocen como ecuaciones de Lagrange. Observese que estas ecuaciones no
requieren que las fuerzas sean conservativas, ya que el potencial puede ser funcion explcita del tiempo.
En la formulacion Lagrangiana ya vemos algunas ventajas operativas como son: (1) No aparecen las fuerzas
de ligadura, y las fuerzas aplicadas usualmente son par ametros de entrada. Es decir, normalmente conocemos
la forma funcional de las fuerzas aplicadas. (2) Al no haber coordenadas dependientes, el n umero de ecuaciones
es el menor posible. (3) Las ecuaciones son escalares ya que estan basadas en la energa. (4) Las ecuaciones de
Lagrange son identicas en forma en cualquier sistema de coordenadas generalizadas9 .
6
Debemos tener presente que Fi incluye las fuerzas internas y externas sobre la partcula i. Adicionalmente, el potencial V
est
a asociado a todo el sistema de partculas y no a una sola partcula, raz
on por la cual las fuerzas sobre cada partcula se pueden
extraer de el como se observa en la Ec. (2.18).
7
P x i
Si el potencial dependiera por ejemplo de los x i , entonces V /qj tambien tendra terminos de la forma i V
x i qj
de manera
que la igualdad (2.21) ya no se cumple.
8
Cuando las ligaduras son holonomas, la transformaci on entre coordenadas me garantiza que si el potencial no depende de las
velocidades en las coordenadas originales, tampoco depende de las velocidades generalizadas en el nuevo sistema coordenado.
9
Por ejemplo, en coordenadas cartesianas las ecuaciones de Newton tienen la forma F = m x. Sin embargo, al cambiar a
coordenadas polares F 6= m, y la forma de las ecuaciones cambia con el cambio en el sistema coordenado.
2.3. COORDENADAS GENERALIZADAS Y ECUACIONES DE LAGRANGE 21

2.3.1. Energas cin


etica y potencial en coordenadas generalizadas
En virtud de que las ecuaciones de Lagrange implican derivadas en las coordenadas generalizadas, es
necesario conocer el valor de la energa cinetica y potencial en terminos de dichas coordenadas. Utilizando
(2.6), la energa cinetica en terminos de coordenadas generalizadas queda
2
N
X N
X n
X
1 1 ri ri
T = mi vi2 = mi qj +
2 2 qj t
i=1 i=1 j=1

al expandir el binomio obtenemos


!
N n n n  
X 1 X ri X ri ri X ri ri 2
T = mi qj qk + 2 qj +
2 qj qk t qj t
i=1 j=1 k=1 j=1
N   n
"N  # n n
"N    #
X 1 ri 2 X X ri ri 1 XX X ri ri
T = mi + mi qj + mi qj qk
2 t t qj 2 qj qk
i=1 j=1 i=1 j=1 k=1 i=1

vemos que la energa cinetica contiene un termino independiente de las velocidades generalizadas, as como
otro lineal y otro cuadr
atico en dichas velocidades. Es entonces conveniente escribir la energa cinetica en la
forma
n
X n n
1 XX
T = T0 + T1 + T2 = M0 + Mj qj + Mjk qj qk (2.24)
2
j=1 j=1 k=1
N
X  2 N
X X ri ri N
1 ri ri ri
M0 mi ; Mj mi ; Mjk mi
2 t t qj qj qk
i=1 i=1 i=1

si las ecuaciones de transformaci on (2.5) no dependen explcitamente del tiempo (ligaduras holonomas y
escler
onomas), solo el termino cuadr
atico sobrevive.
En cuanto al potencial, su forma explcita en coordenadas generalizadas depende de cada sistema en
particular. En realidad, la forma del potencial es la que usualmente sugiere las coordenadas generalizadas a
usar.

2.3.2. Una simetra gauge o de calibraci


on para el Lagrangiano
Hemos visto que cuando las fuerzas sobre el sistema (excepto quiz as las de ligadura) se pueden escribir como
potenciales que dependen de la posicion y el tiempo, el Lagrangiano contiene toda la informacion fsica del
sistema. No obstante, el Lagrangiano no se construy o como un observable, sino como una funci on generadora
de las ecuaciones dinamicas del sistema. De esto se concluye que si existe otra funci on generadora L que
me lleve a las mismas ecuaciones de movimiento (para un conjunto dado de coordenadas generalizadas) esta
funci
on contiene la misma informacion fsica del Lagrangiano, por tanto L bien puede considerarse como otro
Lagrangiano igualmente v alido para el mismo sistema Fsico y el mismo sistema coordenado. En realidad, la
funci
on Lagrangiana definida por (2.22) no es la u nica que conduce a las ecuaciones de movimiento (2.23).
Efectivamente se puede demostrar que si (q1 , . . . , qn , t) es una funci
on diferenciable en todos sus argumentos,
la nueva funci
on Lagrangiana definida por

d (q, t)
L (q, q,
t) = L (q, q,
t) + (2.25)
dt
conduce a las mismas ecuaciones de movimiento. En algunos casos particulares otras redefiniciones son posibles.
Las ecuaciones de Lagrange poseen entonces una simetra gauge o de calibraci on para el Lagrangiano. Para
verificar que el Lagragiano L conduce a las mismas ecuaciones de movimiento que L, es suficiente demostrar
22 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

que las ecuaciones de Lagrange para un Lagrangiano de la forma L = d [ (q, t)] /dt, son triviales, es decir dan
cero en ambos miembros.
     
d L L d d (q, t) d (q, t)
=
dt qi qi dt qi dt qi dt

n n
d X X
= qj + qj +
dt qi qj t qi qj t
j=1 j=1

n n
d X X 2 2
= ij qj +
dt qj qi qj qi t
j=1 j=1

  X n     
d
= qj +
dt qi qj qi t qi
j=1

Xn      X n     

= qj + qj +
qj qi t qi qj qi t qi
j=1 j=1
= 0
donde hemos usado el hecho de que no depende de qi . Adicionalmente, hemos tenido en cuenta que las
derivadas parciales se pueden intercambiar, siempre y cuando estas u
ltimas sean contnuas en todo el intervalo
espacio temporal en cuesti 10
on .

2.4. Ecuaciones de Lagrange para potenciales generalizados


Las ecuaciones (2.17) se pueden escribir sinteticamente en terminos de un operador diferencial lineal
 
b b d
Oj T = Qj ; Oj (2.26)
dt qj qj
claramente, de esta ecuaci
on podemos llegar a la ecuaci
on de Lagrange (2.23) siempre y cuando la fuerza
generalizada Qj se pueda escribir como
 
b b d
Qj = Oj U ; Oj (2.27)
dt qj qj
siendo U una funci
on escalar de qk , qk , t. Cuando se cumple la condici
on (2.27) la podemos sustituir en (2.26)
y obtener
bj T
O =bj U O
O bj (T U ) = 0
bj L = 0 ; L T U
O (2.28)

Dada la definici bj Ec. (2.26) se ve que la Ec. (2.28) es identica en forma a la Ec. (2.23). Al escalar U se
on de O
le denomina potencial generalizado. Este potencial puede depender de las velocidades generalizadas qk y el
caso Fi = i U (qk , t) est
a includo como caso particular.
El caso especial mas importante en la Fsica de estos potenciales generalizados lo constituye el potencial
generalizado asociado a la fuerza de Lorentz. Sea una carga puntual q de masa m y que viaja con velocidad v.
Asumamos que esta carga se propaga en el vaco en presencia de un campo electrico E y un campo magnetico
B, el valor de la fuerza instantanea que experimenta dicha carga es
F = qE + qv B (2.29)
10
De este procedimiento se ve que si dependiera de los qi , los Lagrangianos relacionados en (2.25), no seran equivalentes.
2.4. ECUACIONES DE LAGRANGE PARA POTENCIALES GENERALIZADOS 23

donde E (r, t) y B (r, t) son funciones contnuas en sus argumentos. Estos campos se pueden generar de un
potencial escalar (r, t) y uno vectorial A (r, t)

A
E = ; B=A (2.30)
t
verifiquemos que el potencial
U = q qA v (2.31)
es un potencial generalizado adecuado para reproducir la fuerza generalizada de Lorentz. En nuestro caso,
dado que el problema no tiene ligaduras, lo m as c
omodo es usar las coordenadas cartesianas como coordenadas
generalizadas, de modo que las coordenadas originales y las generalizadas coinciden. Las fuerzas generalizadas
son simplemente las componentes de la fuerza original (recordemos que las fuerzas generalizadas son cantidades
escalares). Calculemos la cantidad O bj U , en lo que sigue asumimos convencion de suma sobre ndices repetidos
y tendremos en cuenta que xi y x i = vi son independientes entre s. Finalmente, asumiremos que A y solo
son funciones de xi , t pero no son funciones de x i .

U = q qA v = q qAi vi

U Ai vi Ai
= q q vi qAi =q q vi
xj xj xj xj xj xj
U U Ai vi
= =q q vi qAi = qAj
x j vj vj vj vj
 
d U Aj Aj Aj Aj
= q x i q = q vi q
dt x j xi t xi t

usando las Ecs. (2.26, 2.27), tenemos


 
b U d U
Qj = Oj U = +
xj dt x j
Ai Aj Aj
= q +q vi q vi q
xj xj xi t
   
Aj Ai Aj
= q + +q vi
xj t xj xi

definiendo el tensor de Levi-Civit`


a ijk podemos escribir lo anterior en notaci
on mas compacta

Qj = q (j + t Aj ) + q (j Ai i Aj ) vi = q (j + t Aj ) + qjin nrs vi r As
Qj = q ( + t A)j + qjin vi ( A)n = q ( + t A)j + q [v ( A)]j

teniendo en cuenta (2.30) la fuerza generalizada Qj queda

Qj = qEj + q [v B]j

de modo que componente a componente, este potencial genera correctamente la fuerza de Lorentz Ec. (2.29).
El Lagrangiano se escribe
1
L T U = mx i x i q + qAi x i (2.32)
2
tomemos la ecuaci
on de Lagrange asociada a la coordenada generalizada xk con k = 1, 2, 3
 
d L L d
=0 [mx k + qAk ] + qk q (k An ) x n = 0
dt x k xk dt
24 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

la ecuaci
on de movimiento se puede escribir como
 
dAk
m
xk = q (vn k An ) q k + (2.33)
dt
dado que A solo depende de la posici
on y el tiempo se tiene que
dAk Ak Ak xn Ak Ak dxn
= + = + = t Ak + vn n Ak
dt t xn t t xn dt
de modo que la derivada total de Ak se puede expresar en terminos de la denominada derivada convectiva
dAk
= t Ak + v Ak = t Ak + vn n Ak
dt
reemplazando en (2.33)

m
xk = qvn k An q (t Ak + vn n Ak ) qk
m
xk = qvn (k An n Ak ) q (t Ak + k )
  
A
m
xk = q [v ( A)]k q + ()k
t k

usando (2.30) la ecuaci


on queda
xk = q [v B]k + qEk
m
y se observa que las ecuaciones de Lagrange reproducen la expresi
on para la fuerza de Lorentz Ec. (2.29).

2.5. Ecuaciones de Lagrange con fuerzas disipativas


En general las fuerzas generalizadas se pueden descomponer en dos terminos de la siguiente forma

Qj = QU
QU b
j + Qj ; j = Oj U

de tal manera que QU un potencial generalizado en tanto que Qj es un termino que no se puede
j proviene de alg
escribir en terminos de ning
un potencial generalizado. Si introducimos esta expresi on en (2.26)
bj T
O bj U + Qj
= O
bj (T U ) = Qj
O (2.34)

podemos entonces definir un Lagrangiano L = T U y una fuerza generalizada Qj que no proviene de ningun
potencial, de tal manera que usando (2.26), la Ec. (2.34) queda
 
d L L
= Qj (2.35)
dt qj qj
esta ecuacion de Lagrange generalizada es u
til por ejemplo para el caso de fuerzas de fricci
on. Con frecuencia,
la fricci
on viscosa se modela como una interaccion proporcional a la velocidad, de modo que su componente x
se escribe como
Ff x = kx vx (2.36)
y similarmente para las otras componentes. Si el fludo es anisotr
opico, las constantes kx , ky , kz ser
an en general
diferentes. Supondremos sin embargo, que el medio es homogeneo y que por tanto kx , ky y kz no dependen de
la posici
on ni del tiempo. Las fuerzas de fricci
on de este tipo se pueden derivar de una expresi on de la forma
N
1X 2 2 2

= kx vix + ky viy + kz viz (2.37)
2
i=1
2.6. ALGUNOS ASPECTOS PECULIARES DE LAS COORDENADAS Y LAS FUERZAS GENERALIZADAS25

donde la suma es sobre las partculas del sistema. Si el fludo en donde est an inmersas las partculas es
homogeneo, entonces ser
a funci
on de las velocidades u
nicamente. A esta expresi
on se le conoce como funci on
de disipaci on de Rayleigh. A partir de (2.37), la componente x de la fuerza de fricci on sobre la iesima
partcula se escribe

Ffix =
vix
y an
alogamente para las otras componentes. Simb
olicamente se puede escribir

Fif = vi = x i

para ver el significado fsico de la funci


on de disipaci
on, calculemos el trabajo realizado por el fludo sobre el
sistema
N
X N
X N
X N
X
2 2
dWf = Fif dri = Fif vi dt = (kx vix , ky viy , kz viz ) (vix , viy , viz ) dt = kx vix + ky viy + kz v
i=1 i=1 i=1 i=1
dWf = 2 dt

de lo cual se ve que 2 corresponde a la rata de disipacion de energa debida a la fricci


on. La componente de
la fuerza generalizada resultante de la fuerza de fricci
on est
a dada por
N
X X N
ri ri
Qj = Ff i = vi
qj qj
i=1 i=1

usando (2.12), y teniendo en cuenta que la funci


on de disipaci on solo depende de los r i y por tanto de los qi ,
obtenemos
XN
r i
Qj = x i =
qj qj
i=1

Las ecuaciones de Lagrange con un termino de disipaci


on quedan
 
d L L
+ =0 (2.38)
dt qj qj qj

Vemos que cuando existen fuerzas generalizadas que no provienen de un potencial generalizado (denotadas
por Qj ), el Lagrangiano no contiene toda la informaci on fsica del sistema, ya que solo la parte de Qj que
s proviene de potenciales generalizados es absorbida en el. Este hecho resulta claro de la Ec. (2.35), y para el
caso especfico de fuerzas disipativas esto se ve de la Ec. (2.38) en donde la funcion de disipaci
on de Rayleigh
contiene informaci on fsica que no posee el Lagrangiano.

2.6. Algunos aspectos peculiares de las coordenadas y las fuerzas genera-


lizadas
El concepto de fuerza generalizada, definida a traves de las coordenadas generalizadas qj result
o ser
X ri
Qj Fi (2.39)
qj
i

observemos en primer lugar que las coordenadas qj no est an necesariamente asociadas a una partcula. Por
ejemplo, si en el pendulo doble de la Fig. 2.1 tengo una lenteja adicional en la mitad de una de las varillas, la
coordenada generalizada digamos 1 me describe la posici on de dos de las lentejas. Tampoco es necesario que la
coordenada generalizada determine la posici on de una o varias de las partculas en forma directa, por ejemplo
una o mas coordenadas del centro de masa del sistema puede ser u til como coordenada generalizada, y es bien
26 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

sabido que no necesariamente debe haber presencia de masa en este punto. Es quiz as mas apropiado decir
que cada coordenada qj est a asociada al sistema. De esto se desprende que una fuerza generalizada tampoco
est
a necesariamente asociada a una partcula o incluso a un subsistema, solo podemos decir en general que
est
a asociada a una coordenada generalizada qj . Recordemos adem as que qj , Qj pueden tener en principio
cualquier dimensi on siempre y cuando Qj qj tenga dimensiones de energa. En la Ec. (2.39), Fi corresponde
a la resultante de las fuerzas internas y externas sobre la partcula i, pero hay una suma sobre todas las
partculas (las posiciones y fuerzas iniciales ri , Fi s est
an asociadas a partculas), esto enfatiza el hecho de
que Qj no est a necesariamente asociado a una partcula.
Con esta misma filosofa, debemos comprender que un desplazamiento compatible con las ligaduras (real
o virtual) de una sola coordenada independiente, no necesariamente implica el desplazamiento de una sola
partcula del sistema. Tomemos de nuevo el pendulo doble de la Fig. 2.1, los angulos 1 y 2 que cada lenteja
hace con la vertical son un conjunto posible de coordenadas generalizadas independientes. Un desplazamiento
virtual 2 compatible con las ligaduras y que mantenga fijo a 1 es claro que implica solo el movimiento de
la lenteja m2 permaneciendo m1 en su lugar. Sin embargo, un desplazamiento virtual 1 de la lenteja m1
compatible con las ligaduras y que deje fija la coordenada 2 claramente requiere el movimiento de la otra
lenteja, pues mover la lenteja 1 sin mover la lenteja 2 viola las ligaduras y modifica el valor de 2 . Es claro sin
embargo, que al menos virtualmente existe un movimiento simult aneo de las dos lentejas que es compatible con
las ligaduras y que vara la coordenada 1 y deja fija la coordenada 2 . Tal movimiento consiste en desplazar
m1 de modo que l1 permanezca constante y que la lenteja m2 se mueva de tal forma que el vector relativo r12
que une a las dos masas, ejecute una translaci on paralela. Nuevamente no hay una asociaci on directa entre
coordenadas generalizadas y partculas del sistema.

2.7. Relaci
on entre sistemas coordenados y sistemas de referencia
Un conjunto de tres ejes coordenados linealmente independientes que convergen en un punto (origen) forman
un sistema de referencia respecto al cual se pueden medir cantidades fsicas tales como velocidades, desplaza-
mientos, aceleraciones, fuerzas, torques etc. Existen infinitos sistemas de referencia inerciales y no inerciales.
Una vez fijado el sistema de referencia (usualmente inercial), existen infinitos sistemas de coordenadas que se
pueden construr. En particular, para describir un sistema fsico particular es posible usar diversos sistemas
de coordenadas generalizadas para un mismo sistema de referencia. Por ejemplo, las transformaciones
(2.5) describen un cambio de sistema coordenado pero bajo el mismo sistema de referencia. En la mayor parte
del tratamiento de este texto se trabajar a con transformaciones de coordenadas sin cambio en el sistema de
referencia, a menos que se indique lo contrario.
Notemos en particular que aunque el Lagrangiano puede tener un comportamiento funcional diferente
cuando se cambia de sistema coordenado (sin cambio en el sistema de referencia), su valor numerico debe
permanecer intacto ya que la energa cinetica y potencial no sufren ning
un cambio (en su valor numerico). En
contraste, si se cambia de sistema de referencia claramente pueden cambiar la energa cinetica y la potencial, e
incluso es posible que haya que agregar fuerzas ficticias, por tanto un cambio en el sistema de referencia puede
alterar tanto el valor numerico como el comportamiento funcional del Lagrangiano. Es necesario entonces
diferenciar muy bien entre un cambio de sistema coordenado y un cambio de sistema de referencia.

2.8. Ejemplos de uso de la formulaci


on Lagrangiana
2.8.1. Partcula en el espacio
Una partcula de masa m, se mueve bajo la acci on de una fuerza F. Dado que no hay ligaduras, usaremos
coordenadas cartesianas a manera de coordenadas generalizadas. La energa cinetica se escribe
1  T T T
T = m x 2 + y 2 + z 2 ; = = =0
2 x y z
T T T
= mx ; = my ; = mz
x y z
LAGRANGIANA
2.8. EJEMPLOS DE USO DE LA FORMULACION 27

las fuerzas generalizadas Ec. (2.39) nos dan


1
X ri r
Qj Fi =F ; qj = x, y, z
qj qj
i=1

Qx = (Fx , Fy , Fz )
(x, y, z) = Fx
x
similarmente Qy = Fy y Qz = Fz . Con lo cual las ecuaciones de movimiento (2.17) quedan
d d d
= Fx ;
(mx) = Fy ;
(my) (mz)
= Fz
dt dt dt
con lo cual llegamos a las ecuaciones de movimiento de Newton.
Veamos las ecuaciones de la misma partcula pero ahora en dos dimensiones y en coordenadas polares, la
transformaci on a estas coordenadas generalizadas es
x = r cos ; y = r sin
las velocidades son
x = r cos r sin ; y = r sin + r cos
para calcular la energa cinetica calculamos v2
  2  2
v2 = x 2 + y 2 = r cos r sin + r sin + r cos
 
v2 = r 2 cos2 + sin2 + r 2 2 sin2 + cos2 2r r cos sin + 2r r sin cos
v2 = r 2 + r 2 2
por tanto11
1  
T = m r 2 + r 2 2 (2.40)
2
ahora calculemos las fuerzas generalizadas, Ecs. (2.39)
r (r ur ) ur
Qr = F =F = F ur + F r = F ur = Fr (2.41)
r r r
r (r ur ) ur
Q = F =F =Fr = F ru = rF (2.42)

observese que no todas las fuerzas (y coordenadas) generalizadas tienen las mismas dimensiones. Qr tiene
dimensiones de fuerza en tanto que Q tiene dimensiones de torque (o trabajo), las coordenadas generalizadas
respectivas tienen dimensiones de longitud y son adimensionales respectivamente, de modo que los productos
Qj qj siempre tienen dimensiones de trabajo. Escribamos las dos ecuaciones de Lagrange (2.17)12
 
T T d T
= mr ;
2
= mr ; = m r
r r dt r
m r mr 2 = Fr
el segundo termino es el de aceleraci
on centrpeta. Veamos la ecuaci on asociada a
 
T T d T
=0 ; = mr 2 ; = mr 2 + 2mr r
dt
la ecuaci
on resulta
mr 2 + 2mr r = rF
se puede demostrar que el termino de la izquierda es la derivada temporal del momento angular, en tanto que
el termino de la derecha es el torque aplicado. Hemos llegado entonces a la expresi
on en componentes de la
Ec. (1.2).
11
El lector puede tambien calcular la energa cinetica a partir de las Ecs. (2.24).
12
En este problema no podemos usar las ecuaciones de Lagrange dadas por (2.22, 2.23), puesto que no conocemos la forma
especfica de la fuerza y por tanto, no sabemos si esta posee un potencial asociado.
28 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

2.8.2. M
aquina de Atwood

Figura 2.2: (a) M aquina de Atwood. La longitud L = l1 +l2 +R de la cuerda es constante, y por tanto tambien
lo es l = l1 + l2 . (b) Vista aerea de una cuenta sobre un alambre que rota con velocidad angular constante ,
en ausencia de un campo gravitacional.

La m aquina de Atwood mostrada en la Fig. 2.2a, consiste en una polea fija, por la cual pasa una cuerda
que se ata a dos masas m1 y m2 . Asumiremos que la cuerda no desliza sobre la polea y que la masa de la polea
y de la cuerda son despreciables. La ligadura (longitud constante de la cuerda) es hol onoma y escleronoma.
Solo hay una coordenada independiente x, la otra es fijada por la ligadura de longitud constante de la cuerda.
Usando el origen en el centro de la polea, la energa potencial es

1
V = M1 gx M2 g (l x) ; T = (M1 + M2 ) x 2
2
el Lagrangiano queda
1
LT V = (M1 + M2 ) x 2 + M1 gx + M2 g (l x)
2
solo hay una coordenada generalizada x, y por tanto una sola ecuaci
on de movimiento del tipo (2.23)
 
L d L
= (M1 M2 ) g ; = (M1 + M2 ) x

x dt x
(M1 + M2 ) x
= (M1 M2 ) g

de aqu sale el valor de la aceleraci


on el cual coincide con el ya obtenido por metodos tradicionales. Observese
que la fuerza de ligadura de tensi on no aparece en el formalismo y no se puede obtener directamente de el.

2.8.3. Cuenta sobre un alambre


Una cuenta se desliza sin rozamiento por un alambre que rota uniformemente alrededor de un eje fijo
perpendicular al alambre (ver Fig. 2.2b). Este es un ejemplo de ligadura hol
onoma re
onoma, ya que la posici
on
LAGRANGIANA
2.8. EJEMPLOS DE USO DE LA FORMULACION 29

de la cuenta depende explcitamente del tiempo13

x = r cos t ; y = r sin t (2.43)

donde es la velocidad angular de rotaci on del alambre y r la distancia entre la cuenta y el eje de rotaci
on.

Aqu estamos tomando un sistema coordenado polar con = t de modo que = . El potencial es nulo ya
que asumimos que el sistema no est a en un campo gravitacional, de modo que el Lagrangiano es T . La energa
cinetica se puede tomar de (2.40)14
1 
T = m r 2 + r 2 2 (2.44)
2
vemos que en este problema hay una sola coordenada generalizada r, puesto que el tiempo es un par ametro y
no se considera una coordenada. La ecuaci on de movimiento es

r mr 2 = 0 r 2 r = 0
m

la soluci
on general es de la forma

r (t) = Aet + Bet ; r (t) = Aet Bet

si la cuenta est
a inicialmente en reposo sobre el alambre entonces r (0) = 0 y por tanto A = B. La soluci
on
queda entonces 
r = A et et = C sinh t
y la cuenta se mueve exponencialmente hacia afuera para tiempos suficientemente largos, la constante C se
determina con la posici
on inicial. De nuevo el metodo no nos da directamente la fuerza de ligadura que act
ua
sobre la cuenta. Dicha ligadura (fuerza normal N ) se puede hallar con la expresi
on del momento angular

L = |r p| = rmv = rmr = mr 2 = mC 2 sinh2 t


dL
= = 2m 2 C 2 sinh t cosh t
dt
que produce la fuerza normal N = /r, de modo que la fuerza de ligadura es

2m 2 C 2 sinh t cosh t
N = =
r C sinh t
N = 2m 2 C cosh t

la cual act
ua en direcci
on perpendicular al alambre y al eje de rotaci
on.

2.8.4. Gauge electromagn


etico en la formulaci
on Lagrangiana
Los potenciales vectorial A (r, t) y escalar (r, t) en electrodin
amica, contienen toda la informaci on fsica
de los campos electricos y magneticos. Por otro lado, es bien sabido que el campo electromagnetico es invariante
ante la transformaci on gauge
(r, t)
A (r, t) A (r, t) + (r, t) ; (r, t) (r, t) (2.45)
t
donde (r,t) es una funci
on diferenciable en todos sus argumentos, pero por lo dem
as arbitraria. Por otro lado,
ya hemos escrito el Lagrangiano asociado a una partcula cargada q, inmersa en un campo electromagnetico
caracterizado por los potenciales A (r, t) y (r, t), Ec. (2.32) P
ag. 23

L = T q (r, t) + qA (r,t) v (t) (2.46)


13
Como es usual, esta dependencia explcita con el tiempo se debe a alg un agente externo, que mantiene el alambre a velocidad
angular constante.
14
La energa cinetica (2.44), contiene un termino independiente de r.
Esto se debe a que las ecuaciones de transformacion (2.43)
de coordenadas cartesianas a coordenadas generalizadas dependen explcitamente del tiempo (ver discusi on en la secci
on 2.3.1).
30 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

Queremos ver el efecto que las transformaciones (2.45) tienen sobre este Lagrangiano y sobre las ecuaciones
de Lagrange. Con las transformaciones (2.45), el Lagrangiano (2.46) se convierte en
 
(r, t)
L = T q (r,t) + qA (r, t) v (t) = T q (r, t) + q [A (r, t) + (r, t)] v (t)
t

L = (T q + qA v) + q + q v
  t

L = L + q + v (r, t)
t

ahora bien, el termino en parentesis cuadrados corresponde a la llamada derivada convectiva que es igual a
la derivada total en el tiempo teniendo en cuenta que el campo depende solo de las coordenadas y el
tiempo, y no por ejemplo de r u otras derivadas de orden superior (esto se puede verificar f
acilmente con la
regla de la cadena). Podemos escribir entonces

d
L = L + [q (r, t)]
dt
pero esta transformaci
on no afecta a las ecuaciones de movimiento como se discuti o en la secci
on 2.3.2,
mostrando que las transformaciones (2.45) dejan invariante la Fsica como era de esperarse.

2.8.5. Un sistema ligado de dos masas

Figura 2.3: (a) Sistema de dos masas unidas por una barra sin masa. El crculo esta sobre el plano XY y
por tanto, tambien el centro de masa. Aunque cada masa puede tener una componente Z. (b) Sistema de
coordenadas esfericas para determinar la posici
on de una de las masas con respecto al centro de masa.

Sean dos masas identicas m unidas por una barra rgida de peso despreciable y longitud l. El centro de
masa del sistema est
a restringido a moverse sobre un crculo de radio a como lo indica la Fig. 2.3a. El campo
gravitacional es perpendicular al plano del crculo. Calcularemos el Lagrangiano en un sistema adecuado de
coordenadas generalizadas.
LAGRANGIANA
2.8. EJEMPLOS DE USO DE LA FORMULACION 31

Podemos suponer sin perdida de generalidad que el crculo yace sobre el plano XY , y el eje Z va en sentido


contrario al campo gravitacional. De la Fig. 2.3a, es claro que la rapidez del centro de masa es vC = a y
por tanto la energa cinetica del centro de masa es
1
TCM = 2
(m + m) vC = ma2 2
2
La energa cinetica del sistema vista por el laboratorio, es la suma de la energa cinetica del centro de
masa mas la energa cinetica con respecto al centro de masa, como se aprecia en la Ec. (1.31) P ag 13. Para
encontrar la energa cinetica del sistema con respecto al CM, recurrimos a la Fig. 2.3b, en donde describimos
la posici
on de una de las partculas en un sistema coordenado con origen en el CM, tal que los ejes XC YC ZC
son instant
aneamente paralelos a los ejes XY Z. En el CM, los momentos de ambas partculas son opuestos y
como las masas son iguales, las velocidades son iguales y opuestas, la energa cinetica vista por el CM es
1 1
T = mv 2 + mv 2 = mv 2
2 2
donde v es la rapidez de cada partcula vista por el CM. Construyendo coordenadas esfericas r, , sobre
este nuevo sistema de referencia, es claro que r = l/2 de modo que para la partcula en cuesti
on, la posici
on
est
a dada por
l l l
x = sin cos ; y = sin sin ; z = cos
2 2 2
de modo que
l l l
x = ( cos cos sin sin ) ; y = ( sin cos + sin cos ) ; z = sin
2 2 2
la rapidez al cuadrado de cada partcula vista por el centro de masa es

v 2 = x 2 + y 2 + z 2

calculando cada termino al cuadrado tenemos

l2 h 2 i
x 2 = cos2 cos2 2 cos cos sin sin + 2 sin2 sin2
4
l2 h 2 2 i
y 2 = sin cos2 + 2 sin cos sin cos + 2 sin2 cos2
4
l2 2 2
z 2 = sin
4
adicion
andolos se obtiene

l2 2
v 2 = [ cos2 (cos2 + sin2 ) + 2 sin2 (sin2 + cos2 ) + 2 sin2 ]
4
l2 h 2  i
v 2 = cos2 + sin2 + 2 sin2
4
l2 2
v 2 = ( + 2 sin2 )
4
y la energa cinetica total queda

T = TCM + T = ma2 2 + mv 2
l2  2 
T = ma2 2 + m + 2 sin2
4
32 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

teniendo en cuenta que la componente Z de cada partcula es igual en XY Z que en XC YC ZC y que en el


sistema de referencia del CM las posiciones de las dos partculas son opuestas, tenemos V = mgz mgz = 0.
De modo que el Lagrangiano coincide con la energa cinetica.
Puede verse que , , son coordenadas generalizadas independientes ya que cada una se puede mover
en un desplazamiento virtual, sin modificar las otras coordenadas y sin violar las ligaduras. Podemos verlo
tambien por un conteo de grados de libertad: los seis grados de libertad originales para dos partculas, se
pueden traducir en tres grados de libertad de la posici on del centro de masa, y tres m as del vector posicion
relativo entre las dos partculas. La ligadura de mover el CM en un crculo, nos lleva a un solo grado de libertad
para fijar el CM (el angulo ), los tres grados de libertad del vector relativo se reducen a dos por la ligadura
de distancia constante que impone la barra.

2.8.6. Aro sobre plano inclinado deslizante

Figura 2.4: (a) Aro que rueda sin deslizar sobre un plano inclinado o cu na que desliza sobre el suelo sin
rozamiento. (b) Ilustraci
on de las coordenadas generalizadas (, S) y de la geometra b
asica del problema.

Un aro de masa m y radio R rueda sin deslizar sobre un plano inclinado o cu na de masa M que hace un
ngulo con la horizontal como se ve en la Fig. 2.4. Encuentre el Lagrangiano y las ecuaciones de Lagrange
a
si el plano inclinado puede deslizar sin fricci
on a lo largo del suelo.
Tomaremos como coordenadas generalizadas una coordenada que indica la posici on del plano inclinado
(desde el origen hasta el vertice en
angulo recto del plano inclinado), y una coordenada S medida desde el
vertice superior de la cu
na, hasta el punto de contacto del aro con la cuna. La longitud total de la cu
na se
denota por l, y las coordenadas del centro del aro con respecto al origen seran x, y. La Fig. 2.4 nos muestra
que estas coordenadas vienen dadas por
x = + S cos + R sin ; y = R cos + (l S) sin
usando estas coordenadas, teniendo en cuenta que el momento de inercia de un aro es I = mR2 y que S = R
por la condici
on de rodadura, la energa cinetica del aro quedar
a en la forma
 2  2  1
1  1 1  S 2
Thoop = m x 2 + y 2 + I 2 = m + S cos + S sin + mR2
2 2 2 2 R2
de modo que
1 h 2 i 1
Thoop = m + S 2 cos2 + 2S cos + S 2 sin2 + mS 2
2 2
1 h 2 2 i
= m 2S + + 2S cos
2
LAGRANGIANA
2.8. EJEMPLOS DE USO DE LA FORMULACION 33

pero la energa cinetica total debe inclur el movimiento translacional de la cu


na a lo largo de x
1
Tplane = M 2
2
la energa total es entonces
1
T = Thoop + Tplane = mS 2 + (m + M ) 2 + mS cos
2
y la energa potencial nos da
V = mgy = mg [R cos + (l S) sin ]
no es necesario inclur la energa potencial asociada a la cu
na ya que esta no cambia. El Lagrangiano queda
entonces
1
L = mS 2 + (m + M ) 2 + mS cos mg [R cos + (l S) sin ] (2.47)
2
De modo que
 
d L d   L
= 2mS + m cos = 2mS + m cos ; = mg sin
dt S dt S
 
d L d h i L
= (m + M ) + mS cos = (m + M ) + mS cos ; =0
dt dt
con lo cual se obtienen las ecuaciones de Lagrange para S,
2mS + m cos mg sin = 0 (2.48)
(m + M ) + mS cos = 0 (2.49)
Es importante tener en cuenta que la energa cinetica traslacional del aro no se puede escribir en la forma 12 mS 2 ,
ya que S est
a medida con respecto al vertice superior de la cu na, que no define un sistema inercial. Esto debido
al movimiento (en general acelerado) de la cuna con respecto al origen fijo en el suelo (que s se supone inercial).

2.8.7. Un potencial generalizado para una fuerza central


Supongamos que una partcula se mueve en un plano bajo la influencia de una fuerza central dada por
 
1 r 2 2rr
F= 2 1 ur (2.50)
r c2
donde r es la distancia de la partcula al centro de fuerzas y c la velocidad de la luz en el vaco. Esta expresi
on
representa la fuerza entre dos cargas en la electrodin amica de Weber. Queremos plantear un Lagrangiano
asociado a este sistema.
La partcula se mueve en un plano, pero no tiene ligaduras dentro del plano. Lo natural es entonces utilizar
coordenadas generalizadas polares r y . Ya calculamos las expresiones para las fuerzas generalizadas de una
partcula no ligada en coordenadas polares Ecs. (2.41, 2.42) P ag. 27. Puesto que esta fuerza es central tenemos
que Q = rF = 0 y Qr = Fr = F .
Se puede verificar que el potencial dado por
1 r 2
U (r, r)
=+ 2 (2.51)
r c r
es un potencial generalizado valido para reproducir el valor de la fuerza generalizada Qr = F , donde F es
dado en (2.50). Para verlo partimos de las expresiones (2.26, 2.27) para el potencial y la fuerza generalizados,
de modo que la fuerza generalizada asociada al potencial en (2.51) es
 
U d U
Qr = Fr = + (2.52)
r dt r
     
U 1 r 2 d U d 2r 2r r 2r 2r 2 2
r
= 2 2 2 ; = 2
= 2
2
+ 2
= 2 2
+ 2
r r c r dt r dt c r c r c r c r c r
34 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

con lo cual
   
U d U 1 r 2 2r 2 2r 1 r 2 2r 1 r 2 2
rr
+ = 2+ 2 2 2 2+ 2 = 2 2 2+ 2 = 2 1 2
r dt r r c r c r c r r c r c r r c

que reproduce la expresi on (2.50) de la fuerza. Para qj , tambien se cumple la condici


on (2.27) obteniendose
cero en ambos miembros. Pues no debe perderse de vista que U debe reproducir todas las fuerzas generalizadas
asociadas al problema.
Hay dos puntos que vale la pena enfatizar: (a) Los potenciales generalizados deben reproducir la fuerza ge-
neralizada y no la fuerza real (aunque en este caso ambas coinciden en magnitud). (b) El potencial generalizado
no tiene porque ser unico, ya que solo se busca una soluci on a la ecuaci
on diferencial (2.27), sin condiciones
iniciales ni de frontera. La no unicidad del potencial generalizado es de esperarse, puesto que incluso el poten-
cial tradicional no es unico. Por supuesto, el potencial generalizado tiene un gauge m as complejo, ya que si
redefinimos el potencial generalizado en la forma

U (q, q,
t) = U (q, q,
t) + W (q, q,
t) (2.53)

en donde W (q, q,
t) satisface la ecuacion
 
d W (q, q, t) W (q, q,
t)
=0 qj del sistema (2.54)
dt qj qj

es claro que U (q, q,


t) reproduce las mismas fuerzas generalizadas que U (q, q,
t). En particular W = cte es un
gauge posible.
Usando la energa cinetica (2.40) para una partcula en coordenadas polares y el potencial generalizado
(2.51) el Lagrangiano queda
 
1   1 r 2
L = T U = m r 2 + r 2 2 1+ 2
2 r c

puede el lector encontrar una forma sistem atica de encontrar un potencial generalizado, por medio de la
ecuaci
on (2.52) y la expresi
on (2.50) para la fuerza?.

2.8.8. Partcula inmersa en un fludo


Sea una partcula de masa m que cae verticalmente bajo la influencia de la gravedad y de una fuerza viscosa
de la forma F = kv, debida a su inmersi on en un fludo (el aire), donde v es la velocidad instant
anea de la
partcula. Plantearemos las ecuaciones de movimiento para esta partcula a partir de su Lagrangiano y de la
funcion de disipaci
on de Rayleigh. El problema es unidimensional no ligado, de modo que el Lagrangiano es
simplemente

1
L = mz 2 mgz
2
Pero debido a la presencia de una fuerza de fricci
on, el Lagrangiano no contiene toda la informaci
on Fsica
del sistema. Es necesario incorporar la funci
on de disipaci on de Rayleigh. La ecuacion de movimiento viene
dada por (2.38)
 
d L L
+ = 0
dt z z z
m z + mg + kz z = 0 (2.55)

donde hemos usado la funci on de la Ec. (2.37), para una partcula. Puesto que la fuerza viscosa
on de disipaci
aumenta con la rapidez, llega una momento en el cual la fuerza viscosa se anula con el peso (al menos si la
2.9. VENTAJAS DEL FORMALISMO LAGRANGIANO 35

cada dura el suficiente tiempo). Esta condicion de cancelaci


on nos llevar
a entonces a la velocidad terminal de
la partcula
mg
mg + kz zterm = 0 zterm = (2.56)
kz
cuando la partcula alcanza esta velocidad, esta ya no experimenta una aceleraci
on y contin
ua con esta velocidad
hasta que haga contacto con el piso. Esto se aprecia combinando las Ecs. (2.55, 2.56) para obtener zterm = 0.
La Ec. (2.55) se puede resolver para todo tiempo haciendo el cambio de variable
mg
Z = z + ; Z = z
kz

con lo cual la Ec. (2.55) queda

kz kz Z kz
z + g + z = 0 Z + Z = 0 =
m m Z m
cuya soluci
on es

kz kz
ln Z = t + B Z = Ce m t
m
mg kz
z + = Ce m t (2.57)
kz

tomando la condici
on inicial z (t = 0) = v0 , en esta ecuaci
on se tiene que
mg
v0 + =C
kz

con lo cual la ecuaci


on (2.57) queda
 
mg kz mg
z = + v0 e m t (2.58)
kz kz
la velocidad terminal se puede obtener haciendo t , con lo cual se reproduce adecuadamente el valor dado
en la Ec. (2.56). Notese que por los dos caminos seguidos, es claro que la velocidad terminal es independiente
del valor (y del signo) de v0 . En particular, si |v0 | > |zterm | y la partcula va inicialmente hacia abajo (v0 < 0),
la fuerza viscosa disminuye la rapidez de la partcula hasta que alcanza el valor de la velocidad terminal, esto
debido a que inicialmente la fuerza viscosa supera en magnitud al peso. El lector puede obtener f acilmente
z (t) integrando (2.58).

2.9. Ventajas del formalismo Lagrangiano


El Lagrangiano es invariante ante un cambio en las coordenadas generalizadas y es mucho mas conveniente
para definir la mec
anica o en general la Fsica de sistemas contnuos. Por otro lado, diferentes sistemas Fsicos
(incluso no necesariamente mec anicos) pueden exhibir Lagrangianos semejantes15 . Tomemos el ejemplo del
siguiente Lagrangiano
1X 1X X qj2 X
L= Lj qj2 + Mjk qj qk + Vj (t) qj (2.59)
2 2 2Cj
j j6=k j j

con la siguiente funci


on de disipaci
on
1X
= Rj qj2 (2.60)
2
j

15
Hay que aclarar sin embargo que esta caracterstica no solo la presenta la formulaci
on Lagrangiana, en realidad las ecuaciones
diferenciales en la mec
anica Newtoniana ya presentan estas analogas.
36 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE

Se puede demostrar que el Lagrangiano (2.59) y la funci on de disipaci


on (2.60) junto con las ecuaciones
de Lagrange con termino disipativo Ecs. (2.38), reproducen las ecuaciones diferenciales que describen a un
conjunto de circuitos RLC con fuentes, y acoplados a traves de las inductancias mutuas Mjk . Los valores
Lj , Cj , Vj denotan inductancias, capacitancias y voltages de fuentes respectivamente. qj denota las cargas
electricas que en este caso han sido tomadas como las variables din amicas (y por tanto, como las coordenadas
generalizadas), este no es un ejemplo mec anico en el sentido de que las cargas no denotan de ning un modo
posiciones de las partculas o subsistemas. No obstante, el sistema tiene un an
alogo mecanico: la inductancia es
una medida de la resistencia al cambio en el flujo de carga, de modo que es un termino de inercia, caso similar
el de las inductancias mutuas16 . El capacitor act ua como una fuente de energa potencial del tipo oscilador
arm onico simple17 , la resistencia proporciona un termino disipativo tipo Stokes (proporcional a la velocidad
generalizada), y finalmente la fuerza electromotriz equivale a un forzamiento externo que se traduce en una
energa potencial de la forma qj Vj (siendo Vj el voltage en un instante).
Finalmente, cabe resaltar que en el caso de ligaduras hol onomas, en el cual es posible encontrar un con-
junto mnimo de coordenadas independientes, el sistema de ecuaciones Lagrangianas se reduce con respecto al
formalismo Newtoniano. Esto se debe a que cada ecuaci on de movimiento est a asociada a una coordenada y
no a una partcula, y claramente el n umero de coordenadas independientes es menor o igual que 3N , siendo
N el n umero de partculas.

2.10. Ejercicios
1. Tres masas se acoplan por medio de cuerdas en serie, para formar un pendulo triple similar al de la Fig.
2.1. (a) Encuentre un conjunto apropiado de coordenadas generalizadas independientes. (b) Describa un
desplazamiento virtual para cada coordenada, de modo que las otras se mantengan fijas. (c) Plantee el
Lagrangiano asociado. Puede asumir que todas las masas se mueven en un plano.

2. Sea un sistema de referencia inercial S y un plano inclinado que est


a en reposo con respecto a S. Sobre el
plano inclinado desliza un bloque de masa m. Tomemos ahora otro sistema de referencia inercial S que
se mueve a una velocidad constante v = vux con respecto a S. (a) Demuestre que la fuerza normal del
plano inclinado sobre el bloque realiza trabajo (real) sobre el bloque, visto por el sistema de referencia
S . (b) Demuestre que el trabajo virtual de la normal sobre el bloque es cero, tanto en S como en S .
(Para m as comentarios ver Refs. [4, 5]).

3. Demuestre que las ecuaciones de Lagrange del tipo dado en (2.17) se pueden escribir equivalentemente
en la forma
T T
2 = Qj
qj qj
usualmente conocidas como ecuaciones de Nielsen.

4. Encuentre el Lagrangiano y las ecuaciones de Lagrange de un pendulo esferico. Esto es, una masa puntual
que se mueve de modo que su distancia a un punto fijo permanece constante. Plantee un Lagrangiano
para peque
nas oscilaciones en las coordenadas generalizadas apropiadas.

5. Obtenga el Lagrangiano y las ecuaciones de movimiento del pendulo doble ilustrado en la Fig. 2.1 P
ag.
16, asumiendo que el movimiento se realiza en un plano. Plantee el Lagrangiano en una aproximacion de
pequenas oscilaciones para ambas coordenadas generalizadas 1 y 2 .

6. Supongamos una masa m1 que se mueve con movimiento circular uniforme, debido a que est a atada a
una cuerda de longitud constante. Por otro lado, una partcula sometida a una fuerza central atractiva
16
La suma de los terminos con autoinductancias e inductancias mutuas dan una energa cinetica que solo depende cuadr atica-
mente de las coordenadas generalizadas. Lo cual equivale en el caso mec anico a escenarios con ligaduras escleronomas (ver secci
on
2.3.1, Ec. 2.24).
17
Efectivamente, se requiere una cierta energa para cargar el condensador, esta energa queda almacenada y se puede intercambiar
en otra forma de energa.
2.10. EJERCICIOS 37

de la forma F = kr 2 ur , puede realizar un movimiento circular uniforme con las condiciones iniciales
apropiadas (ver captulo 10). No obstante, la fuerza que mantiene la distancia constante en el primer
problema (tension de la cuerda) se considera una fuerza de ligadura. En contraste, aunque la fuerza F =
kr 2 ur mantenga constante la distancia de la partcula al centro de fuerzas, esta NO se trata como
fuerza de ligadura. En que consiste la diferencia?.

7. Encuentre un potencial generalizado U que difiera de manera no trivial del potencial U en la Ec. (2.51)
y que genere las mismas fuerzas generalizadas.
Captulo 3

Suplemento matem atico: c


alculo de
variaciones y multiplicadores de Lagrange

Existen muchos problemas de minimizaci on o maximizaci on que requieren de extender las herramientas
tradicionales del calculo. Es frecuente encontrar problemas en los cuales una trayectoria completa se mapea en
un n umero real y queremos encontrar la trayectoria que minimiza o maximiza dicho n umero. En el presente
captulo estudiaremos el calculo variacional, como herramienta para resolver esta clase de situaciones. Por otra
parte, cuando un proceso de optimizaci on esta sujeto a ligaduras, el metodo de multiplicadores de Lagrange
es una herramienta sistem atica para encontrar los extremos de una funci on sin violar las ligaduras impuestas.
Veremos m as adelante que la combinaci on de las dos herramientas nos generar a una formulaci on lagrangiana
con la capacidad de inclur y resolver las fuerzas de ligadura.

3.1. Algunos problemas pr


acticos de naturaleza variacional
Vamos a enunciar algunos problemas de ndole pr actica que no se pueden resolver con los metodos tradi-
cionales del c
alculo. Aunque el principal objetivo del desarrollo del calculo variacional en este texto ser
a la
discusi
on del principio variacional de Hamilton enunciado en el captulo 4, esta herramienta matem atica tiene
muchas otras aplicaciones de modo que lo desarrollaremos en forma independiente al tema central.

3.1.1. Minimizaci
on del tiempo de cada de una partcula
Consideremos una partcula que se mueve en un campo gravitacional constante y que partiendo del reposo
viaja desde un punto (x1 , y1 ) hasta otro punto m as bajo (x2 , y2 ) con la condici
on de que los puntos no se
encuentran sobre la misma vertical. Encuentre la curva que permita que la partcula haga este recorrido en el
menor tiempo posible.
Planteamiento: Tomemos a X como el eje vertical hacia abajo y a Y como el eje horizontal a la derecha.
Por simplicidad hacemos coincidir al punto (x1 , y1 ) con el origen. Tomando el cero de potencial en el origen,
y teniendo en cuenta que la partcula parte del reposo, se tiene que la energa mec anica de la partcula viene
dada por
1
T + V = mv 2 mgx = 0
2

de modo que la rapidez esta dada por v = 2gx, el tiempo de recorrido es
r  2
q dy
Z Z (x2 ,y2 ) Z (x2 ,y2 ) 2 2
(dx) + (dy) Z (x2 ,y2 ) 1 + dx
ds
t= dt = = = dx
(x1 ,y1 ) v (x1 ,y1 ) 2gx (x1 ,y1 ) 2gx

38

3.1. ALGUNOS PROBLEMAS PRACTICOS DE NATURALEZA VARIACIONAL 39

donde ds denota una longitud de arco infinitesimal de la trayectoria, la expresi


on queda finalmente
Z x2 s
1 + y 2 dy
t= dx ; y (x) (3.1)
x1 =0 2gx dx

por tanto ser


a necesario encontrar el valor de y (x) que hace que la integral (3.1) nos de el menor valor posible.
En calculo ordinario los problemas de minimizaci on usualmente consisten en encontrar el valor de un punto
(por ejemplo sobre la recta real) de modo que una cierta cantidad (funcion) nos de un valor mnimo al evaluarla
en ese punto. En contraste, aqu requerimos encontrar una trayectoria completa que haga que cierta cantidad
sea mnima, puesto que lo que tenemos en este problema es una trayectoria completa que se mapea en un
n
umero (el tiempo).

3.1.2. Minimizaci
on de una superficie de revoluci
on

Figura 3.1: S
olido de revoluci
on generado alrededor de Y . (x1 , y1 ) y (x2 , y2 ) son puntos fijos y se busca la curva
generadora que pase por estos puntos y que minimice la superficie lateral del s olido.

Consideremos la superficie lateral generada por una curva que une dos puntos fijos (x1 , y1 ) y (x2 , y2 ) cuando
se revoluciona alrededor de un eje coplanar con los puntos y la curva (ver Fig 3.1). La idea es encontrar la
ecuacion de la curva en cuesti
on a fin de que el
area lateral generada por este s
olido de revolucion sea mnima.
Planteamiento: Asumiremos que la curva con extremos fijos se revoluciona alrededor del eje Y . Para
calcular el
area lateral total de revoluci
on, calculamos primero el diferencial de area dA sobre una peque na
tira como se muestra en la figura 3.1. Dicho diferencial viene dado por
s  2
q
dy
dA = 2x ds = 2x (dx)2 + (dy)2 = 2x 1 + dx
dx

nuevamente ds es la longitud infinitesimal de arco asociada a la curva. La expresi


on final para el area queda
Z x2 p
dy
A = 2 x 1 + y 2 dx ; y (3.2)
x1 dx

de nuevo la minimizaci
on del
area consiste en encontrar una trayectoria completa que minimice tal cantidad.
40 CAPITULO 3. CALCULO VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

3.2. Aspectos fundamentales del c


alculo de variaciones
Un rasgo general de los ejemplos hasta aqu propuestos es que es necesario resolver el problema de como ha-
llar la trayectoria que hace que el valor de una cierta cantidad (tiempo de cada, superficie etc.) sea estacionario
(mnimo, m aximo, punto de inflexion etc.). Este es uno de los problemas fundamentales del c alculo variacional.
Si denotamos por J a la cantidad generica (tiempo de cada, superficie, etc.) que queremos minimizar podemos
ver que las Ecs. (3.1, 3.2) tienen la siguiente estructura generica
Z x2
dy
J= f (y, y,
x) dx ; y = y (x) , y (3.3)
x1 dx

a la cantidad y la llamaremos coordenada generalizada y la variable independiente x ser a considerada un


parametro que modula la forma de la trayectoria y (x) y de su derivada y (x). Para prop ositos futuros es u
til
considerar el caso en el cual tenemos m as de una coordenada generalizada, de modo que la relaci on (3.3) se
extiende en la forma Z x2
J= f (y1 (x) , . . . , yn (x) , y 1 (x) , . . . , y n (x) , x) dx (3.4)
x1
donde las yi son coordenadas generalizadas independientes entre s y solo pueden depender del par ametro x.
Definiremos ahora un espacio de configuraciones que se construye asignando un eje a cada coordenada
generalizada independiente yi de modo que tenemos un espacio cartesiano n dimensional, es necesario enfati-
zar que NO se asigna un eje asociado al par ametro x. Para un valor fijo de x una configuracion completa de
coordenadas yi corresponde a una nupla y por tanto a un punto en el espacio de configuraciones. Cuando
se mueve el par ametro x cambia la posici on del punto en el espacio de configuraciones trazando una trayec-
toria en dicho espacio. Si queremos minimizar o maximizar J debemos encontrar el conjunto de trayectorias
unidimensionales yi (x) que hagan que la integral (3.4) sea mnima o m axima. N otese que en el lenguaje del
espacio de configuraciones, el problema de minimizar o maximizar J se convierte en el problema de encontrar
la trayectoria en el espacio de configuraciones que minimice tal cantidad. Esta visi on del problema resulta util
en la medida que nos permite visualizar una u nica trayectoria de minimizacion o maximizaci on en lugar de
muchas trayectorias independientes.
Replanteando el problema de la minimizaci on de J, tal minimizaci
on significa que entre todas las trayec-
torias posibles que el sistema puede seguir en el espacio de configuraciones al barrer el par ametro entre los
extremos x1 y x2 , el sistema trazar a la trayectoria que haga que el valor de la integral (3.4) sea estacionario
(estrictamente no sabemos a un si es mnimo m aximo o punto de inflexion). Para una integral de lnea, el
termino estacionario significa que el valor de la integral cuando se toma un cierto camino, tiene el mismo valor
dentro de infinitesimales de primer orden que cuando se toman caminos vecinos a este (caminos que difieren
del original por desplazamientos generalizados infinitesimales). Recordemos que las trayectorias de las que
hablamos aqu, son hipertrayectorias en el espacio n dimensional de configuraciones. Para integrales de lnea
este es el equivalente en funciones ordinarias a puntos con derivada cero. En este caso en lugar de un punto
tenemos una trayectoria entera.

3.2.1. C
alculo variacional en una dimensi
on
Trabajaremos el problema inicialmente en una dimensi on. Sea una funci
on f (y, y,
x) definida sobre un
camino y = y (x) donde x actua como un parametro, y y es una coordenada generalizada. y denota la derivada
respecto al par
ametro x. Queremos encontrar un camino particular y (x) de tal modo que la integral de lnea
on f entre x1 y x2
J de la funci
Z x2
dy
J= f (y, y,
x) dx ; y = y (x) , y (3.5)
x1 dx

adquiera un valor estacionario relativo a caminos vecinos que difieren infinitesimalmente del original. En nuestro
caso, consideraremos solo los caminos que cumplen la condici on y (x1 ) = y1 , y (x2 ) = y2 , ya que esta condici
on
siempre se impone en el principio de Hamilton. Esto se denomina condici on de extremos fijos. Si hacemos

3.2. ASPECTOS FUNDAMENTALES DEL CALCULO DE VARIACIONES 41

una grafica de y vs x, para varias trayectorias posibles, encontramos que todas ellas deben converger en los
extremos de la gr afica, a los puntos (x1 , y1 ) y (x2 , y2 ). N
otese que la gr
afica y vs x no representa el espacio
de configuraciones, ya que este u ltimo no contiene ning un eje que represente al parametro. En este caso, el
espacio de configuraciones es de una sola dimensi on, todos los caminos posibles son lneas rectas que conectan
a y1 con y2 . En consecuencia, lo que distingue a los diferentes caminos es su dependencia con el par ametro x.
Vale decir que la coordenada y es generalizada y por tanto no tiene necesariamente dimensiones de longitud.
Ahora parametrizaremos el problema de tal manera que se pueda hacer uso del c alculo ordinario. Cuando
partimos del camino correcto, la variacion de J debe ser cero con respecto al cambio a una familia de caminos
vecinos que rotularemos con alguna variable infinitesimal . Denotaremos a las trayectorias vecinas como
y (x, ), donde y (x, 0) es el camino correcto. Por ejemplo, si seleccionamos una funci on arbitraria (x) pero
que cumpla con la condici on de que se anula en los extremos i.e. en x = x1 y x = x2 una posible familia de
caminos vecinos estara definida por
y (x, ) = y (x, 0) + (x) (3.6)
claramente, esta familia de funciones converge en sus extremos gracias a la condici on impuesta a (x) de
nulidad en los extremos. Asumiremos de aqu en adelante que el camino correcto y (x, 0) y la funci on (x)
son de clase C 2 (contnuas y no singulares hasta la segunda derivada en todos sus argumentos) en el intervalo
[x1 , x2 ]. Con cualquier familia de curvas en la vecindad de y (x), el variacional J es funci
on de
Z x2
J () = f (y (x, ) , y (x, ) , x) dx (3.7)
x1

dado que hemos definido que la curva correcta se encuentre cuando = 0, la condici on de punto estacionario
para J se puede ahora expresar en terminos de cantidades del c
alculo ordinario en la forma
 
dJ
=0 (3.8)
d =0
derivando la Ec. (3.7) bajo el signo integral de la forma usual, tenemos
Z x2  
dJ f y f y
= + dx (3.9)
d x1 y y
naturalmente se asume que x/ = 0 ya que es un par ametro que me caracteriza cada curva en tanto que
x se mueve a lo largo de cada curva (con fijo) claramente los dos son independientes1 . Veamos la segunda
integral en el miembro derecho de la Ec. (3.9)
Z x2 Z x2    Z x2   
f y f y f y
dx = dx = dx (3.10)
x1 y x1 y x x1 y x
para integrar por partes elegiremos
  
f y
u= ; dv = dx
y x
  h  i
con lo cual du = d f = dxd f
dx puesto que en la integral solo se hace variaci
on en el par
ametro x.
 y  y
y
Por otro lado, v = , y al integrar por partes queda
Z    Z x2   
x2
f y f y x2 d f y
dx = dx (3.11)
x1 y x y x1 x1 dx y

donde la continuidad hasta segundas derivadas de y (x, ) asegura que el intercambio de las derivadas parciales
es posible. Teniendo en cuenta que todas las curvas deben pasar a traves de los puntos (x1 , y1 ) y (x2 , y2 ), se
1
En la Ec. (3.6) el termino (x) que determina la desviaci
on del camino variado con respecto al camino real, tiene toda su
dependencia de la variable x en la funci
on (x).
42 CAPITULO 3. CALCULO VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

llega a que la derivada parcial de y con respecto a deben ser cero en x1 y en x2 . En consecuencia, el primer
termino de la derecha en (3.11) se anula y por tanto, la integral (3.10) queda
Z x2 Z x2   
f y d f y
dx = dx (3.12)
x1 y
x1 dx y
reemplazando (3.12) en (3.9) se obtiene
Z x2    
dJ f d f y
= dx (3.13)
d x1 y dx y
Combinando (3.8) con (3.13) se ve que la condici
on para que J adquiera un valor estacionario es
  Z x2      
dJ f d f y
= dx = 0 (3.14)
d =0 x1 y dx y =0
por otro lado, la expresion (y/)=0 es una funci on arbitraria de x excepto por exigencias de continuidad
hasta la segunda derivada y la condicion de extremos fijos. Por ejemplo, para el conjunto particular de familias
definidas por (3.6) el factor (y/)=0 viene dado por la funci on arbitraria (x). Aplicaremos ahora a la Ec.
(3.14) el lema fundamental del c alculo de variaciones, seg
un el cual si se cumple
Z x2
M (x) (x) dx = 0 (3.15)
x1

para todas las funciones arbitrarias (x) contnuas hasta la segunda derivada, entonces M (x) debe ser identi-
camente cero en el intervalo (x1 , x2 ). La demostraci on formal se puede encontrar en los textos de c alculo
variacional pero se puede dar una visi on eurstica de este lema: Imaginemos que construmos una funci
on (x)
que es positiva en una vecindad de un cierto punto y cero en las otras regiones, en consecuencia la integral
(3.15) solo ser
a valida si M es cero en este punto arbitrariamente escogido. Por tanto, M debe ser cero en todo
el intervalo de integracion. Usando este lema para la expresi on (3.14) se obtiene
  
f d f
=0 (3.16)
y dx y
esta ecuaci
on diferencial nos da entonces como soluci on la trayectoria y = y (x) que deja estacionaria la
cantidad J. Ahora bien, la desviaci
on infinitesimal de un camino dado con respecto al camino correcto y (x, 0)
en el punto x viene dado por  
y (x, )
d y (x) (3.17)
=0
como en esta variacion el parametro x es fijo, el desplazamiento anterior corresponde a los desplazamientos
virtuales de las coordenadas generalizadas discutidos en la formulaci on de Lagrange (en la formulacion de
Lagrange, el par
ametro es el tiempo y permanece fijo cuando se hace un desplazamiento virtual de la coordenada
generalizada) por eso la notacion y. Por otro lado, la variaci
on de J con respecto a su valor cuando se toma
el camino correcto es  
dJ
d J (3.18)
d =0
la estacionaridad del variacional J cuando se eval
ua sobre el camino correcto se manifiesta entonces como
J = 0. Multiplicando la Ec. (3.14) por d y usando (3.17) y (3.18) resulta
Z x2    
f d f
J = y dx = 0 (3.19)
x1 y dx y
requiriendo que y (x) satisfaga la ecuaci
on (3.16). La variaci
on de una integral de lnea usualmente se denota
como para diferenciarla de la variaci on de una funcion ordinaria. La Ec. (3.19) no contiene informaci on
nueva con respecto a (3.14) pero resulta m as adecuada para una extensi on del formalismo cuando tenemos n
coordenadas generalizadas como veremos a continuaci on.
DE LOS PROBLEMAS DE APLICACION
3.3. SOLUCION PLANTEADOS 43

3.2.2. C
alculo de variaciones multidimensional
Veamos la extensi
on al caso de n coordenadas generalizadas. El variacional lo escribimos como
Z 2
J= f (y1 (x) , . . . , yn (x) , y 1 (x) , . . . , y n (x) , x) dx (3.20)
1

donde todas las variables yi , y i son independientes entre s, y solo pueden depender del par
ametro x. En este
caso tenemos una hipertrayectoria correcta y una familia posible de hipertrayectorias vecinas se puede escribir
como
yi (x, ) = yi (x, 0) + i (x) ; i = 1, . . . , n (3.21)
donde yi (x, 0) con i = 1, . . . , n, denotan la soluci
on (trayectoria correcta en el espacio de configuraciones).
Las i (x) son independientes entre s, pero deben anularse en los extremos y ser contnuas hasta la segunda
derivada, por lo demas son completamente arbitrarias. Un c alculo semejante al anterior nos conduce a
Z 2X n  
J f yi f y i
d = d + d dx
1 yi y i
i=1

de nuevo el segundo termino se puede integrar por partes


Z 2 Z 2  
f 2 yi f yi 2 d f yi
dx = dx (3.22)
1 y i x y i 1 1 dx y i
y una vez mas el primer termino a la derecha se anula cuando imponemos la condici on de extremos fijos. La
variaci
on J con respecto a la trayectoria correcta del sistema, queda entonces
  Xn Z 2   
J f d f
d = J = yi dx (3.23)
=0 1 yi dx y i
i=1

donde an
alogamente al caso unidimensional
 
yi
yi = d
=0

dado que las coordenadas generalizadas son independientes, sus variaciones yi tambien lo son2 . Por ejemplo,
para la familia de curvas vecinas definidas por la Ec. 3.21, equivale a que los i (x) sean independientes. En
virtud de la independencia de los yi , si la suma sobre i en la Ec. (3.23) es nula, debe ser nulo cada sumando.
Apelando entonces al lema fundamental del c alculo variacional, se llega a que la condici
on de estacionaridad
J = 0 nos lleva a   
f d f
= 0 , i = 1, . . . , n (3.24)
yi dx y i
las soluciones yi (x) forman entonces la trayectoria en el espacio de configuraciones que hace de J un valor
estacionario. Estas ecuaciones se conocen como las ecuaciones de Euler-Lagrange. Se pueden estudiar gene-
ralizaciones a variacionales en donde por ejemplo la funci on f dependa de derivadas superiores de y, existan
varios parametros xj o se relaje la condicion de extremos fijos. Para el analisis del principio de Hamilton que
se ver
a en el captulo 4, las condiciones aqu trabajadas son lo suficientemente generales.

3.3. Soluci
on de los problemas de aplicaci
on planteados
Las Ecs. (3.16, 3.24) son generales y aplicables a muchos sistemas incluso no mec anicos. Estamos entonces
preparados para resolver los problemas propuestos al principio del captulo y otros de caractersticas similares.
2
Puesto que las coordenadas generalizadas yi son independientes, cada una se puede mover sin mover las otras y sin violar
posibles ligaduras. Y puesto que en el proceso x es fijo, los yi corresponden a los desplazamientos virtuales que vimos en el
principio de DAlembert.
44 CAPITULO 3. CALCULO VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

3.3.1. Minimizaci
on de la longitud de arco
Antes de resolver los problemas planteados, veamos un problema de gran simplicidad y valor pedag ogico.
Dados dos puntos fijos en un plano, encontrar la trayectoria que minimiza la longitud de arco. La longitud de
arco diferencial para una curva bidimensional se obtiene f
acilmente
p dy
(ds)2 = (dx)2 + (dy)2 ds = 1 + y 2 dx ; y
dx
la longitud de arco total se escribe entonces como
Z x2 p
S= 1 + y 2 dx (3.25)
x1

comparando (3.5) con (3.25) es claro que


p
f (y, y,
x) = 1 + y 2

de las expresiones !
 
f d f d y
=0 ; = p
y dx y dx 1 + y 2
usando la Ec. (3.16) resulta !
d y
p =0
dx 1 + y 2
el termino entre parentesis debe ser constante
!
y
p =c
1 + y 2

ahora bien, para que se cumpla esta relacion es necesario que a su vez y sea una constante relacionada con c
(aunque esta relaci
on no es relevante), de lo cual se obtiene la ecuaci
on de la trayectoria

y = a y = ax + b

que corresponde a una lnea recta, las constantes de integraci


on a y b se determinan con los puntos fijos de la
trayectoria. Estrictamente, solo se ha demostrado que la trayectoria da un valor estacionario para la longitud
de arco pero sabemos por intuici on que corresponde a un mnimo. En realidad se puede encontrar el tipo de
extremo a traves de la segunda derivada funcional.

3.3.2. Minimizaci
on del tiempo de cada de una partcula: la braquist
ocrona
En la secci
on 3.1.1 planteabamos el problema de una partcula que se mueve en un campo gravitacional
constante desde un punto fijo inicial a otro final y se peda encontrar la curva que minimice el tiempo de cada.
El planteamiento del problema nos llev o a la Ec. (3.1)
Z x2 s
1 + y 2
t= dx
0 2gx

dado que la constante 2g no afecta el problema, identificamos la funci
on f como
r
1 + y 2
f= (3.26)
x
DE LOS PROBLEMAS DE APLICACION
3.3. SOLUCION PLANTEADOS 45

f
como y = 0 la ecuaci
on de Euler Lagrange queda
 
d f f 1
=0 = cte
dx y y 2a

la parametrizaci
on de la constante de integraci
on se hace por comodidad. Realizando f / y en (3.26) resulta

y 1 y 2 1 
p = = 2ay 2 = x 1 + y 2
x (1 + y 2 ) 2a x (1 + y 2 ) 2a
x x2
y 2 = =
(2a x) (2ax x2 )

que se puede escribir en la forma Z


x dx
y=
2ax x2
haciendo el cambio de variable
x = a (1 cos ) ; dx = a sin d (3.27)
la integral queda de la forma
Z Z Z
a (1 cos ) (a sin d) a (1 cos ) sin d sin
y = q = p = a (1 cos
2a [a (1 cos )] [a (1 cos )]2
2
(2 2 cos ) (1 2 cos + cos ) 1 cos2
Z
y = a (1 cos ) d

cuya soluci
on es
y = a ( sin ) + b (3.28)
Con = 0, las Ecs. (3.27, 3.28) nos dan x = 0 y y = b. Si el punto inicial coincide con el origen entonces y = 0
cuando x = 0. Por tanto b = 0, y la constante a se ajusta para que la curva pase por el punto (x2 , y2 ). Las
ecuaciones (3.27, 3.28) para x e y quedan entonces

x = a (1 cos ) ; y = a ( sin )

que coinciden con las ecuaciones parametricas del cicloide, con par
ametro . Este perfil especfico del cicloide
se denomina una braquistocrona.

3.3.3. Minimizaci
on de una superficie de revoluci
on
En la secci
on 3.1.2 tomamos una superficie generada por una trayectoria que une dos puntos fijos y que
se revoluciona alrededor de un eje coplanar con los puntos y la curva. La idea era encontrar la ecuaci
on de la
trayectoria en cuesti
on que minimizara el
area generada. El planteamiento nos llevo a la Ec. (3.2)
Z x2 p
A = 2 x 1 + y 2 dx
x1

La funci
on f vendr
a dada por p
f =x 1 + y 2
y empleamos las ecuaciones de Euler Lagrange (3.16) para lo cual calculamos

f f xy
=0 ; =p
y y (1 + y 2 )
46 CAPITULO 3. CALCULO VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

con lo cual la Ec. (3.16) nos da


" #
d xy xy 
p = 0 p = cte a x2 y 2 = a2 1 + y 2
dx (1 + y 2 ) (1 + y 2 )

y 2 x2 a2 = a2

despejando y Z
a a dx
y = p ; y= p
(x2 a2 ) (x2 a2 )
esta integral nos da x
y = a cosh1 +b
a
donde a y b son constantes de integraci on que se determinan requiriendo que la curva pase por los puntos
(x1 , y1 ) y (x2 , y2 ). Esta ecuaci
on se puede invertir para escribir
 
yb
x = a cosh
a

que se reconoce como la ecuaci on de la catenaria, que es la curva que se forma cuando una cuerda flexible
cuelga libremente entre dos puntos fijos en un campo gravitacional uniforme.
Notese que si definimos x = x/a y y = y/a obtenemos

x = cosh y b/a

obtenemos una ecuaci on con un solo par ametro b/a. Es decir, un reescalamiento de la curva nos deja un solo
parametro relevante.
Para algunos pares de puntos fijos se puede encontrar un conjunto u nico de constantes de integraci
on a
y b. Para otros puntos es posible encontrar dos catenarias a traves de los puntos fijos en tanto que en otros
casos no hay soluci on para los valores de a y b. Adicionalmente, solo hemos demostrado que la curva deja a
la superficie en un valor estacionario, de modo que la catenaria no siempre representa un valor mnimo, en
algunos casos representa un punto de inflexi on. Para algunas combinaciones de pares de puntos fijos el mnimo
absoluto en la superficie de revolucion se genera a partir de una curva compuesta de segmentos de lnea recta.
Esta clase de soluci on no se puede encontrar con el formalismo presentado aqu, ya que en nuestra formulaci on
las f (, x) y las (x) se consideran contnuas hasta la segunda derivada, en tanto que la curva descrita arriba
no es derivable en los puntos de quiebre entre segmentos.
Las anteriores consideraciones muestran las restricciones que se derivan de nuestra formulaci on sobre la
condicion variacional estacionaria.

3.4. Ligaduras y multiplicadores de Lagrange (opcional)


A continuacion estudiaremos un metodo sistematico para tratar problemas en los que se pretende encontrar
los extremos de una funcion en donde sus argumentos estan sujetos a ligaduras. La tecnica de los multiplicadores
de Lagrange que ilustraremos aqu, no esta necesariamente asociada a problemas variacionales, pero se puede
combinar con estos u ltimos, especialmente cuando tenemos ligaduras integrales.
Supongamos que queremos encontrar el extremo de una funci on de tres variables independientes x1 , x2 , x3 ;
en tal caso la condici
on de extremo (o punto de silla) es

df = 0 (3.29)

es decir
f f f
df = dx1 + dx2 + dx3 = 0 (3.30)
x1 x2 x3
3.4. LIGADURAS Y MULTIPLICADORES DE LAGRANGE (OPCIONAL) 47

dado que las variables son independientes, podemos variar por ejemplo x1 sin variar x2 y x3 de modo que
dx2 = dx3 = 0 con lo cual x1 f = 0. Procediendo identicamente con las otras variables vemos que la condici
on
necesaria y suficiente para tener un extremo es
f f f
= = =0 (3.31)
x1 x2 x3
sin embargo ocurre con frecuencia que las variables que se utilizan a priori para describir al sistema no son
independientes. En muchos casos la ligadura se puede escribir en forma de una ecuacion de la forma

(x1 , x2 , x3 ) = 0 (3.32)

en este caso la Ec. (3.31) no necesariamente se cumple ya que las variables no se pueden mover independiente-
mente. Una forma de tratar el problema es despejar una variable de modo que nos quedamos con dos variables
independientes y hacemos el tratamiento normal con dos variables independientes. Sin embargo, este despeje
puede ser muy difcil en la pr
actica, por lo cual exploraremos un metodo alternativo conocido como el metodo
de los multiplicadores indeterminados de Lagrange.
De la Ec. (3.32), es claro que d = 0, de modo que se cumple una relacion similar a (3.30) que escribiremos
en la forma

dx3 = dx1 + dx2
x3 x1 x2
con lo cual tenemos
f f x f
df = dx1 + dx2 + 3 dx3
x1 x2 x3 x3
 
f f x3 f
= dx1 + dx2 dx1 + dx2
x1 x2 x3 x1 x2
 
f f x f
df = dx1 + dx2 + dx1 + dx2 ; 3 (3.33)
x1 x2 x1 x2 x3

donde hemos supuesto que x3 6= 0. N otese que con este procedimiento, hemos logrado que la expresi
on de
df quede en terminos solo de los diferenciales independientes dx1 y dx2 . Escribamos ahora
 
f f f
df + d = dx1 + dx2 + dx3 + dx1 + dx2 + dx3
x1 x2 x3 x1 x2 x3

puesto que df = d = 0 tenemos que df + d = 0. Teniendo en cuenta esto y redistribuyendo terminos, se


tiene      
f f f
+ dx1 + + dx2 + + dx3 = 0 (3.34)
x1 x1 x2 x2 x3 x3
ahora tenemos en cuenta que dos de las variables son independientes, digamos x1 , x2 . N
otese que el multipli-
cador en la Eq. (3.33) ha sido definido de modo que

f
+ =0 (3.35)
x3 x3
siempre que x3 6= 0. La Eq. (3.34) queda de la forma
   
f f
+ dx1 + + dx2 = 0
x1 x1 x2 x2

y dado que x1 y x2 se pueden variar independientemente, cada termino entre parentesis debe anularse
   
f f
+ =0 ; + =0 (3.36)
x1 x1 x2 x2
48 CAPITULO 3. CALCULO VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

cuando se cumplen las Ecs. (3.35, 3.36) se tiene que df = 0 y f es un extremo (o punto de silla). Si a nadimos la
ecuacion de ligadura (3.32) tendremos cuatro ecuaciones con cuatro inc ognitas x1 , x2 , x3 , . N
otese sin embargo
que en general nuestro interes es calcular los xi , de modo que no necesita ser hallado. Por esta raz on, a se
le denomina multiplicador indeterminado de Lagrange. Es claro que el metodo falla cuando todos los
coeficientes de se anulan en el extremo i.e. si


= 0 para i = 1, 2, 3;
xi xi =xi,0

donde (x1,0 , x2,0 , x3,0 ) es el punto donde se ubica el extremo de f . En este caso resulta imposible despejar .
En lo anterior hemos identificado a f como la funci on que toma un valor extremo y la ecuaci on que
expresa la ligadura. Sin embargo, la forma de las Ecs. (3.35, 3.36) nos muestran que podemos intercambiar los
papeles de estas funciones.

3.4.1. Generalizaci
on a un conjunto arbitrario de variables y de ligaduras
Supongamos que tenemos una funci
on con n variables f = f (x1 , . . . , xn ) y que dichas variables est
an
sujetas a m ligaduras de la forma

k (x1 , . . . , xn ) = 0 ; k = 1, . . . , m (3.37)
con m n. Multipliquemos cada ecuaci
on de ligadura por un factor k

k k (x1 , ..., xn ) = 0 ; k = 1, . . . , m (no suma)

es claro que
m n m
" n #
X X f X X k
df + k dk = dxi + k dxi
xi xi
k=1 i=1 k=1 i=1
m n
( m
)
X X f X k
df + k dk = + k dxi
xi xi
k=1 i=1 k=1
Pm
y dado que df = dk = 0 tenemos que df + k=1 k k = 0 de modo que
n
( m
)
X f X k
+ k dxi = 0 (3.38)
xi xi
i=1 k=1

como los xi no son independientes, los terminos entre parentesis no necesariamente son nulos. No obstante,
podemos ahora elegir las m n primeras variables como independientes, en tanto que las m u ltimas estan
determinadas por las ligaduras (3.37). Ahora aprovechamos el car acter indeterminado de los k para eliminar
las coordenadas dependientes, lo cual haremos exigiendo que los k tomen valores tales que se satisfagan las
ecuaciones
Xm
f k
+ k = 0 ; i = n m + 1, ..., n (3.39)
xi xi
k=1
para las u
ltimas m variables. Al reemplazar (3.39) en (3.38) se obtiene
nm
( m
)
X f X k
+ k dxi = 0
xi xi
i=1 k=1

y como las coordenadas involucradas en esta ecuaci


on son las independientes, podemos afirmar que cada
termino entre parentesis es cero de modo que
X k m
f
+ k = 0 ; i = 1, ..., m n (3.40)
xi xi
k=1
3.5. PROBLEMAS VARIACIONALES CON LIGADURAS (OPCIONAL) 49

y uniendo las Ecs. (3.39, 3.40) se obtiene simplemente


m
X k
f
+ k = 0 ; i = 1, ..., n (3.41)
xi xi
k=1

siendo m el numero de ligaduras y n el n


umero de variables xi . Hay un multiplicador k por cada ligadura k .
Las Ecs. (3.41) junto con las ligaduras (3.37) nos dan un conjunto de n + m ecuaciones con n + m inc ognitas
(las n variables y los m multiplicadores k ).

Minimizaci
on de la superficie de un cilindro con volumen constante
Encontraremos el radio R y la altura H de un cilindro circular recto, que minimice su area superficial total,
manteniendo constante el volumen V0 del cilindro.
La funci
on a minimizar es el
area superficial total del cilindro que depende de las variables R y H

f (R, H) = 2R2 + 2RH (3.42)

la ecuaci
on de ligadura (3.37) corresponde en este caso a la restricci
on de mantener el volumen constante, y
se puede escribir como
(R, H) = R2 H V0 = 0 (3.43)
puesto que solo hay una ecuacion de ligadura, hay un solo multiplicador indeterminado . Reemplazando (3.42,
3.43) en (3.41) las ecuaciones para f (R, H) con multiplicadores para las variables R y H son
f (R, H) f (R, H)
+ = 0 ; + =0
H H R R
2R + R2 = 0 ; R + 2RH = 0
2 + R = 0 ; 1 + 2H = 0

en la u
ltima lnea hemos tomado la soluci
on no trivial R 6= 0, con lo cual se obtiene
2
= ; R = 4H
R
reemplazando esto u
ltimo en la ecuaci
on de ligadura (3.43)

(4H)2 H = V0
r r
3 V0 4V0
H = ; R=
16

3.5. Problemas variacionales con ligaduras (opcional)


Tomemos de nuevo el problema variacional en el cual buscamos un camino que haga que la integral (3.20)
Z 2
J= f (y1 (x) , . . . , yn (x) , y 1 (x) , . . . , y n (x) , x) dx (3.44)
1

sea estacionaria. Siendo las yi coordenadas generalizadas que solo pueden depender del par ametro x. La codici
on
de estacionaridad es
Z 2
J = f (y1 (x) , . . . , yn (x) , y 1 (x) , . . . , y n (x) , x) dx = 0 (3.45)
1

asumamos sin embargo, que el problema debe respetar ciertas restricciones que se manifiestan en ecuaciones
de ligadura de la forma
k (y1 , y2 , . . . , yn ; x) = 0 ; k = 1, 2, . . . , m (3.46)
50 CAPITULO 3. CALCULO VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

multiplicando cada una de las ecuaciones (3.46) por un multiplicador indeterminado que en general depende
del par
ametro, i.e. k = k (x), sumando sobre k e integrando en el mismo rango que en la ecuaci
on 3.44, se
obtiene
Z 2Xm
k (x) k (y1 , y2 , . . . , yn ; x) dx = 0
1 k=1

es claro por tanto que


Z m
2X
k (x) k (y1 , y2 , . . . , yn ; x) dx = 0 (3.47)
1 k=1

en algunas ocasiones, las ligaduras de por s adquieren forma integral i.e.


Z 2
k (y1 , y2 , . . . , yn ; x) dx = cte ; k = 1, 2, . . . , m
1

en este caso podemos multiplicar cada una de estas ecuaciones por un k (que en este caso no dependera del
parametro x), sumar sobre k y aplicar la variaci
on quedando
Z m
2X
k k (y1 , y2 , . . . , yn ; x) dx = 0 (3.48)
1 k=1

otese que las Ecs. (3.47, 3.48) son esencialmente identicas excepto por la dependencia de k del par
n ametro x
en la Ec. (3.47). Sumando cualquiera de estas dos ecuaciones con la Ec. (3.45) resulta
Z " m
#
2 X
f (yi , y i , x) + k k (yi ; x) dx = 0
1 k=1

redefiniendo
m
X
g (yi , y i , x) f (yi , y i , x) + k k (yi ; x)
k=1

tenemos que
Z 2
g (yi , y i , x) dx = 0
1

y con el mismo procedimiento que nos llev


o de la Ec. (3.20) a la Ec. (3.23), obtenemos
Z 2 n Z
X 2   
g d g
g (yi , y i , x) dx = yi dx = 0 (3.49)
1 1 yi dx y i
i=1

en esta caso no podemos decir que cada integrando es cero ya que los desplazamientos virtuales yi no son
independientes. De nuevo, usamos el car acter indeterminado de los multiplicadores de Lagrange para exigir
que los terminos asociados a las coordenadas dependientes se anulen
  
g d g
= 0 , i = n m + 1, . . . , n (3.50)
yi dx y i

con lo cual la Ec. (3.49) queda

X Z 2
nm
g
 
d g

yi dx = 0
1 yi dx y i
i=1
3.5. PROBLEMAS VARIACIONALES CON LIGADURAS (OPCIONAL) 51

y dado que las coordenadas que quedan son independientes, podemos afirmar que cada integrando es cero, y
junto a las Ecs. (3.50) esto nos lleva a
  
g d g
= 0 , i = 1, . . . , n (3.51)
yi dx y i
m
X
g (yi , x) f (yi , y i , x) + k k (yi ; x) (3.52)
k=1

los multiplicadores de Lagrange tienen aplicaciones en m ultiples escenarios de la Fsica m


as alla de los que
utilizaremos en el presente texto (ver por ejemplo la Ref. [6]).

Minimizaci
on del area lateral de un s
olido de revoluci
on

Figura 3.2: S
olido de revoluci
on generado por la funci
on f (x) definida en el intervalo [x0 , xf ], cuando se rota
alrededor del eje X.

Sea una funcion f (x) definida en un intervalo [x0 , xf ] de longitud L, de tal manera que genera un s olido de
revoluci on alrededor del eje X como el de la Fig. 3.2. Queremos encontrar una funci on f (x) de tal manera que
el s
olido generado posea la mnima area lateral, pero de tal forma que el volumen V0 permanezca constante.
Un diferencial de area lateral, es el
area lateral del cilindro de radio f (x) y altura dx como se ve en la Fig.
3.2, i.e. dA = 2f (x) dx. El area lateral es entonces
Z xf
2 f (x) dx = A (3.53)
x0

Un diferencial de volumen del s


olido, es el volumen del cilindro de radio f (x) y altura dx de modo que
dV = f (x)2 dx. La ligadura de volumen constante queda entonces en la forma
Z xf
f (x)2 dx = V0 (3.54)
x0

en este caso la funci


on f (x) que se pretende optimizar es la coordenada generalizada y x es el par
ametro del
cual depende. Tenemos entonces las asignaciones
df (x)
y (x) f (x) , y f
dx
52 CAPITULO 3. CALCULO VARIACIONAL Y MULTIPLICADORES DE LAGRANGE

Para evitar confusiones, conviene hacer un cambio de notaci


on en la Ecs. (3.51, 3.52)
       X m
G d G
= 0 ; G f, f, x F f, f, x + k k (yi ; x) (3.55)
f dx f
k=1
dado que la cantidad a optimizar es el
area lateral, y el volumen act
ua como la ligadura, podemos escribir
Z xf   Z xf  
J A= F f, f, x dx ; f, f, x dx = V0 (3.56)
x0 x0

comparando las Ecs. (3.56) con las Ecs. (3.53, 3.54), tenemos que
   

F f, f , x = F (f ) = 2f ; f, f , x = (f ) = f 2 (3.57)
es decir F y solo dependen de la coordenada generalizada y no dependen explcitamente del par
ametro x ni
de f. Sustituyendo (3.57) en la segunda de las Ecs. (3.55), tenemos entonces
 
G f, f, x = G (f ) = 2f + f 2

que al reemplazar en la primera de las Ecs. (3.55) nos da


1
2 + 2f = 0 ; f =

dado que es constante en el caso de ligaduras
integrales, tenemos que f (x) = 1 = cte y el solido de
revoluci 1
on es un cilindro cuyo radio es . Notese que efectivamente f (x) y f (x) generan el mismo solido
de revoluci
on. Definiremos entonces f (x) R > 0. El radio del cilindro se puede determinar de la ligadura
(3.54) r
Z xf
2 2 V0
R dx = R L = V0 f (x) R =
x0 L

3.6. Ejercicios
1. Encuentre el radio R y la altura H de un cilindro circular recto, que minimice su
area lateral, manteniendo
constante el volumen V0 del cilindro.
2. Sea una elipse descrita por la ecuaci
on
 x 2  y 2
+ = 1.
a b
Encuentre el rect angulo inscrito de mayor
area. Muestre que el cociente entre el
area de este rect
angulo
y el
area de la elipse es 2/.
3. Sea f (x) el generador de un s
olido de revoluci
on alrededor del eje X como en la Fig. 3.2. Encuentre la
funci
on f (x) que genere un s
olido de revoluci
on con el mnimo volumen, manteniendo fijo el valor del
area lateral.

4. Para un s
olido de revoluci
on como el de la Fig. 3.2, con densidad constante, los momentos de inercia
con respecto a los ejes X e Y vienen dados por (ver problema 1 pag 337, y Ref. [7])
Z xf Z xf
IX
IX = f (x)4 dx ; IY = + x2 f (x)2 dx
2 x0 2 x0

utilizando ligadura de masa constante para el s


olido encuentre (a) La funci
on f (x) que minimiza IX , (b)
la funci
on f (x) que minimiza a IY . (c) A que s
olidos de revoluci
on corresponden estas funciones?.
5. Encuentre la curva f (x) de longitud L, limitada por abajo por el eje X, que pasa por los puntos (a, 0)
y (a, 0), y que encierra la mayor
area. Este tipo de problemas se conocen como problemas isoperimetricos
o problemas de Dido.
Captulo 4

Principio variacional de Hamilton y


ecuaciones de Lagrange

En el captulo 2, las ecuaciones de Lagrange se derivaron de un principio diferencial (principio de DAlembert),


puesto que se basaba en desplazamientos virtuales infinitesimales de cada coordenada generalizada del sistema,
a partir de cierta configuraci on instantanea. En el presente captulo, derivaremos las ecuaciones de Lagrange de
un principio integral en el cual a partir de cierta configuraci on instant anea, se consideraran desplazamientos
finitos de cada coordenada generalizada en cierto intervalo de tiempo, y se realizar an variaciones virtuales
infinitesimales de estos movimientos.
Dado que las coordenadas generalizadas dan en general todas las variables independientes del sistema para
determinar la configuraci on de este, es u
til describir el movimiento del sistema a traves de dichas variables
usando el tiempo como par ametro. Si tenemos n coordenadas generalizadas qi es u til construir un hiperespacio
cartesiano n dimensional donde cada eje coordenado representa a una de las qi . Una configuraci on instant
anea
del sistema estara representada por un punto en este hiperespacio, que llamaremos espacio de configura-
ciones. Ahora bien, la evoluci on del sistema (el paso del tiempo) se representa a traves del movimiento de
este punto en el espacio de configuraciones, dibujando una curva en dicho espacio. En este espritu cuando
hablemos del movimiento del sistema entre los tiempos t1 y t2 estaremos hablando del movimiento del
punto en el espacio de configuraciones, y la trayectoria de movimiento del sistema ser a la curva trazada
por este punto. Por supuesto el tiempo act ua como par ametro en esta hipercurva y a cada punto de la trayec-
toria puede estar asociado mas de un valor del tiempo1 . El espacio de configuraciones no tiene necesariamente
ninguna conexi on con el espacio fsico tridimensional, sus coordenadas no necesariamente definen longitudes
y las nuplas, en este espacio no necesariamente definen vectores euclidianos. De la misma forma la hiper-
curva que define la trayectoria de movimiento del sistema no necesariamente est a asociada a la trayectoria de
una partcula real, tengamos en cuenta que un punto en el hiperespacio de configuraciones y su movimiento,
describen la configuraci on y movimiento de todo el sistema.
De las condiciones para derivar las ecuaciones de Lagrange, surge de manera natural la siguiente definici on:
Un sistema monog enico, es aquel para el cual todas las fuerzas (excepto tal vez las de ligadura) son
derivables de un potencial escalar generalizado que es funci on de las coordenadas generalizadas, las velocidades
generalizadas y el tiempo, en el sentido de las Ecs. (2.26, 2.27). N otese que esta definici
on se traduce en el
hecho de que para esta clase de sistemas, el Lagrangiano contiene toda la informaci on Fsica del sistema. Por
ejemplo, un sistema con fuerzas disipativas no es monogenico ya que la fuerza de rozamiento viscosa descrita
por la ecuacion (2.36) no se puede escribir en terminos de un potencial generalizado, esto se traduce en el hecho
de que el Lagrangiano no contiene toda la din amica del sistema y dicha informaci on debe ser completada con
la funci
on de disipaci on de Rayleigh como se puede ver en la Ec. (2.38).
Volviendo a los sistemas monogenicos, cuando el potencial generalizado solo es funci on de las coordena-
das generalizadas, tenemos un sistema conservativo. A continuaci on enunciaremos un principio asociado al
1
Decimos que el tiempo es un par
ametro porque no construmos un eje asociado al tiempo en el espacio de configuraciones. El
movimiento del par
ametro tiempo regula el barrido del punto sobre la curva en el espacio de configuraciones.

53
54 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

movimiento del sistema, cuando este es monogenico


Principio de Hamilton: El movimiento en el espacio de configuraciones de un sistema monogenico desde
un punto P1 en el tiempo t1 hasta un punto P2 en el tiempo t2 , es tal que la integral de lnea
Z t2
I L (q1 , . . . , qn , q1 , . . . , qn , t) dt (4.1)
t1

tiene un valor estacionario para la trayectoria real del movimiento.


A la integral anterior se le llama la acci on y el Lagrangiano se define en la forma usual L T U . Esto
significa que entre todas las trayectorias posibles que el sistema puede seguir en el espacio de configuraciones
entre los tiempos t1 y t2 , el sistema viajar
a a traves de la trayectoria que haga que el valor de la integral (4.1)
sea estacionario. Para una integral de lnea, el termino estacionario significa que el valor de la integral cuando
se toma un cierto camino, tiene el mismo valor dentro de infinitesimales de primer orden que cuando se toman
caminos vecinos a este (caminos que difieren del original por desplazamientos generalizados infinitesimales).
Insistimos en que todas las trayectorias de las que hablamos aqu, son realmente hipertrayectorias en el espacio
de configuraciones y no est an asociadas en general a ninguna trayectoria real. Para integrales de lnea este es
el equivalente en funciones ordinarias a puntos con derivada cero. En este caso en lugar de un punto tenemos
una trayectoria entera.
De acuerdo con el principio de Hamilton, la trayectoria del sistema es tal que la variaci on de la acci
on para
valores fijos de t1 y t2 es nula
Z t2
I = L (q1 , . . . , qn , q1 , . . . , qn , t) dt = 0 (4.2)
t1

cuando las ligaduras son holonomas el principio de Hamilton es condici on necesaria y suficiente para la vali-
dez de las ecuaciones de Lagrange. Una ventaja de esta formulaci on es que la acci
on es invariante ante una
transformacion de un sistema de coordenadas generalizadas a otro. Adicionalmente, veremos que el formalis-
mo variacional permitira inclur las ligaduras en el formalismo y tratar algunos problemas con ligaduras no
holonomas. Finalmente, una formulaci on variacional es m
as adecuada en el tratamiento de campos y sistemas
contnuos.

4.1. Aplicaci
on del c
alculo de variaciones al principio de Hamilton
En el principio de Hamilton el sistema debe ser monogenico de modo que el Lagrangiano no depende
de derivadas temporales de q mas altas que la primera i.e. L = L (qi , qi , t). La condici
on de extremos fijos
est
a implcita en su enunciado, y finalmente el u
nico par
ametro es el tiempo. De lo anterior es claro que el
problema de la estacionaridad de la accion es un problema variacional como el tratado en la secci on 3.2 del
captulo 3. Comparando las ecuaciones (3.20) y (4.1), vemos que podemos utilizar las ecuaciones (3.24) con
las siguientes asignaciones
x t, yi qi , f (yi , y i , x) L (qi , qi , t)
con lo cual las Ecs. (3.24) conducen a las ecuaciones de Lagrange
 
d L L
=0
dt qi qi
al derivar estas ecuaciones debemos suponer que las coordenadas generalizadas son todas independientes, lo
cual siempre es posible cuando las ligaduras son hol
onomas.

4.2. Extensi
on del principio de Hamilton a algunos sistemas no hol
onomos
Si recordamos el procedimiento hecho en las secciones (3.2.1) y (3.2.2) observaremos que en la deducci
on
de las ecuaciones de Lagrange a partir del principio de Hamilton, el hecho de que la ligadura sea holonoma
DEL PRINCIPIO DE HAMILTON A ALGUNOS SISTEMAS NO HOLONOMOS
4.2. EXTENSION 55

solo se usa en el u ltimo paso cuando se considera que todas las coordenadas generalizadas (y sus despla-
zamientos virtuales) son independientes entre s. Sin embargo, cuando las ligaduras son no holonomas, las
coordenadas generalizadas ya no ser an independientes y no es posible reducirlas por medio de ecuaciones de
la forma f (q1 , .., qn , t) = 0. De modo que en general tendremos que trabajar con un sistema coordenado no
independiente.
Desde el punto de vista del principio variacional, esto influye en la forma en que se construyen los caminos
variados. Un desplazamiento y (o q), nos lleva de un punto en el camino real a otro punto sobre un camino
variado, cuando las coordenadas son independientes es el camino variado final el que importa y no la forma
como se construye. Pero cuando tenemos coordenadas no independientes relacionadas entre s por ligaduras,
la forma en que se construye el camino influye ya que los desplazamientos virtuales en general no respetan las
ligaduras. Por tanto resulta importante si el camino variado fue construdo con desplazamientos que respetan
o no las ligaduras.
Un conjunto de ligaduras no hol onomas para el cual es susceptible el tratamiento variacional, es el conjunto
de ligaduras de la forma
n
X
alk dqk + alt dt = 0 ; l = 1, . . . , m (4.3)
k=1

es decir una relaci


on lineal entre los diferenciales de las coordenadas y el tiempo. El ndice l determina el
numero de ecuaciones l = 1, . . . , m. Los coeficientes alk , alt pueden ser funciones de las coordenadas y el
tiempo. Estas ligaduras son en general no integrables a menos que se cumplan las relaciones

f f
alk = ; alt = (4.4)
qk t

para alguna funci on f = f (qi , t). En tal caso la ligadura es realmente hol
onoma. Tomaremos el caso general
en donde las relaciones (4.4) no necesariamente se cumplen. En principio se podra pensar en construir un
camino variado a traves de desplazamientos virtuales infinitesimales del camino real que sean compatibles con
la ligadura (4.3). Sin embargo se ha demostrado que no se puede construir tal camino variado, a menos que
las ligaduras sean integrables en cuyo caso dichas ligaduras son realmente hol onomas. Construiremos de todas
formas un principio variacional en el cual los desplazamientos virtuales generaran los caminos variados aunque
no sea en forma compatible con las ligaduras. Como los desplazamientos virtuales son fijos en el tiempo, las
ligaduras para los desplazamientos virtuales se escriben
n
X
alk qk = 0 ; l = 1, ..., m (4.5)
k=1

el camino variado en general no satisface las ecuaciones (4.3). La idea es ahora reducir los desplazamientos
virtuales a los independientes. Para eliminar los desplazamientos virtuales sobrantes se utiliza el metodo de los
multiplicadores indeterminados de Lagrange. Para ello multiplicamos la ecuaci on (4.5) por una cantidad
indeterminada l que puede ser funci on de las coordenadas y del tiempo
n
X
l alk qk = 0 (4.6)
k=1

por supuesto, hay m cantidades l una para cada ecuaci on de ligadura. Si asumimos que el principio de
Hamilton es tambien v onomos2 , y usamos las Ecs. (3.23), entonces el principio de
alido para sistemas no hol
Hamilton conduce a
Z 2 X n   
L d L
dt qk = 0 (4.7)
1 qk dt qk
k=1

2
La naturaleza de la ligadura no aparece en el principio de Hamilton. Solo se exige que el sistema sea monogenico.
56 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

con el fin de poder introducir los l dentro del principio de Hamilton, sumamos la Ec. (4.6) sobre los valores
de l e integramos en el tiempo entre t1 y t2
Z 2 "X n X m
#
dt l alk qk = 0 (4.8)
1 k=1 l=1

ahora sumamos (4.7) y (4.8) obteniendose


Z 2 X n
"   m
#
d L L X
dt + l alk qk = 0 (4.9)
1 dt qk qk
k=1 l=1

las qk siguen siendo dependientes, ya que estan ligadas por las m ecuaciones (4.5). De modo que las n m
primeras de ellas se pueden elegir en forma independiente, en tanto que las m u
ltimas est
an determinadas por
las Ecs. (4.5). Para eliminar los desplazamientos sobrantes, aprovechamos la arbitrariedad en las cantidades
l . Exigiremos entonces que estas cantidades satisfagan las ecuaciones
  m
d L L X
+ l alk = 0 ; k = n m + 1, . . . , n (4.10)
dt qk qk
l=1

es decir, para las u


ltimas m coordenadas generalizadas. Reemplazando (4.10) en (4.9) se obtiene
" #
Z 2 nmX d  L  L X m
dt + l alk qk = 0
1 dt qk qk
k=1 l=1

pero ahora las qk que intervienen son las independientes, de modo que se puede afirmar que
  m
d L L X
+ l alk = 0 ; k = 1, . . . , n m. (4.11)
dt qk qk
l=1

las Ecs. (4.10, 4.11) nos dan el sistema completo de ecuaciones de Lagrange para sistemas no hol
onomos
  m
d L L X
+ l alk = 0 ; k = 1, . . . , n. (4.12)
dt qk qk
l=1

este sistema tiene n ecuaciones con n + m inc ognitas (n coordenadas y m multiplicadores). Las m ecuaciones
faltantes seran las ecuaciones de ligadura (reales) Ecs. (4.3), que enlazan las qk . No obstante, es m
as conveniente
para la soluci on del sistema tener estas ligaduras en forma de ecuaciones diferenciales de primer orden
n
X
alk qk + alt = 0 ; l = 1, . . . , m (4.13)
k=1

de modo que las ecuaciones (4.12, 4.13) definen el sistema completo de n + m ecuaciones e inc
ognitas.

4.2.1. Significado fsico de los multiplicadores de Lagrange: fuerzas de ligadura


Ahora nos preguntamos por el significado de los multiplicadores de Lagrange. Para ello supongamos que
quitamos las ligaduras del sistema y las sustitumos por fuerzas aplicadas que mantienen intacta la din
amica
de este. Las ecuaciones de movimiento quedan entonces de la forma
 
d L L
= QLk ; k = 1, ..., n (4.14)
dt qk qk

donde QLk son las fuerzas generalizadas asociadas a las fuerzas aplicadas que emulan a las de ligadura. Na-
turalmente, estas fuerzas aplicadas deben ser iguales a las de ligadura para mantener intacta la din
amica del
DEL PRINCIPIO DE HAMILTON A ALGUNOS SISTEMAS NO HOLONOMOS
4.2. EXTENSION 57

sistema3 . Por otro lado, la invarianza de la din


amica tambien requiere que las ecuaciones (4.12) y (4.14) sean
identicas. Esto conduce a
m
X
QLk = l alk ; k = 1, ..., n (4.15)
l=1
esto significa que esta formulaci
on tiene una informacion adicional que no habamos obtenido con las anteriores
formulaciones: las fuerzas de ligadura. Para ver con mayor claridad la relaci on entre los l y las fuerzas reales
de ligadura, aplicamos la definicion de fuerza generalizada a las Ecs. (4.15)
N
X X m
ri
FL
i = l alk ; k = 1, ..., n (4.16)
qk
i=1 l=1

donde FL i representa las fuerzas reales de ligadura. Vemos que en la relaci


on interviene una suma sobre todas
las fuerzas reales de ligadura y otra suma sobre todos los multiplicadores, la relaci
on entre multiplicadores y
fuerzas reales de ligadura es entonces bastante indirecta.

4.2.2. Formalismo de los multiplicadores para ligaduras hol


onomas
Por supuesto las ligaduras no holonomas descritas por (4.3) no son las m as generales pero cubren una
gran cantidad de casos que se presentan en los sistemas reales. Por otro lado, las ligaduras (4.3) incluyen a las
ligaduras hol
onomas cuando las ecuaciones se vuelven integrables. Efectivamente, una ligadura de la forma

fl (q1 , . . . , qn , t) = 0 ; l = 1, . . . , m (4.17)

es equivalente a la ecuaci
on diferencial
!
X fl fl
dqk + dt = 0 ; l = 1, . . . , m (4.18)
qk t
k

que es igual a (4.3) con las asignaciones4


fl fl
alk = ; alt = (4.19)
qk t
reemplazando estas relaciones en (4.12) se obtiene
  m
X
d L L fl
= l ; k = 1, . . . , n. (4.20)
dt qk qk qk
l=1

de modo que la Ec. (4.20) corresponde a las ecuaciones de Lagrange con multiplicadores indeterminados en
el caso de ligaduras hol
onomas. Las fuerzas generalizadas provenientes de ligaduras hol
onomas se escriben
entonces
Xm
fl
QLk l (4.21)
qk
l=1
estas mismas ecuaciones se pueden obtener partiendo P directamente de la forma de la ligadura hol onoma
fl (q, t) = 0 e introduciendo un termino de la forma l l fl = 0 en el principio de Hamilton, con un procedi-
miento similar al realizado para ligaduras no hol onomas.
3
Para llegar a la Ec. (4.14), podemos seguir el procedimiento de la secci on 2.2, pero de modo que en la Ec. (2.4) no se excluyan
las fuerzas de ligadura de la formulaci on. Seguimos entonces el procedimiento que nos lleva de (2.4) hasta (2.17), de tal modo que
(a) (a)
Qj en esta u ltima ecuacion de puede descomponer como Qj = Qj + QL j , donde Qj proviene de las fuerzas aplicadas originales,
(a) (a) bj U como en las Ecs.
y QL j est
a asociada a las nuevas fuerzas aplicadas que emulan a las de ligadura. Si Qj = qj V o Qj = O
(2.21, 2.27), podemos construr un lagrangiano L = T U donde el potencial incluye solo a las fuerzas aplicadas originales, con lo
cual se llega a la Ec. (4.14).
4
La ecuacion (4.18) es eqivalente a (4.17), siempre y cuando al integrar (4.18) exijamos que la constante de integraci on sea nula.
58 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

La introduccion de multiplicadores de Lagrange en ligaduras holonomas se justifica en uno de estos casos (1)
Comenzamos con coordenadas no independientes y queremos eliminar las dependientes5 (2) queremos hallar
las fuerzas de ligadura, es necesario tener en cuenta que los multiplicadores de Lagrange solo extraen el valor
de la magnitud de las fuerzas de ligadura, la direcci
on se debe determinar por consideraciones fsicas. Esto se
debe a la arbitrariedad para definir el signo del multiplicador, en realidad se puede hacer el cambio l l
(siempre y cuando sea para todos los l ), y la formulacion es igualmente consistente.

4.3. Relaci
on entre el principio diferencial de DAlembert y el Principio
variacional de Hamilton
Aunque no es evidente, la version del principio de Hamilton tanto para sistemas hol onomos como no
holonomos, tambien requiere que el trabajo virtual de las fuerzas de ligadura sea nulo. Para ver esto, escribamos
el principio de Hamilton en la forma
Z t2 Z t2 Z t2
L dt = T dt U dt = 0
t1 t1 t1

siguiendo los procedimientos variacionales ya descritos teniendo en cuenta que el potencial generalizado es
funci
on de las coordenadas generalizadas, las velocidades generalizadas y el tiempo, se tiene
Z t2 n 
Z t2 X  
U d U
T dt = qk dt
t1 t1 qk dt qk
k=1

ahora teniendo en cuenta (2.26) y (2.27) resulta


Z t2 Z t2 n
X
T dt = Qk qk dt (4.22)
t1 t1 k=1

en esta forma el principio de Hamilton dice que la diferencia de la integral temporal de la energa cinetica entre
dos caminos vecinos es igual a menos la integral temporal del trabajo realizado en los desplazamientos virtuales
entre los caminos. El trabajo calculado proviene solo de las fuerzas que derivan del potencial generalizado (ya
que implcitamente el potencial del Lagrangiano solo contiene fuerzas aplicadas y no de ligadura). Por tanto, se
requiere que las ligaduras no realicen trabajos virtuales a fin de que las fuerzas generalizadas asociadas a dichas
ligaduras no entren en el miembro derecho de la Ec. (4.22). En consecuencia, si queremos mantener el principio
de Hamilton tanto para el caso hol onomo como el no hol onomo, es necesario que las fuerzas adicionales de
ligadura no holonomas no trabajen en desplazamientos virtuales qk .
Otra manera de ver que las fuerzas de ligadura no entran en el principio variacional de Hamilton, se obtiene
partiendo de las ecuaciones (4.5) de ligadura para desplazamiento virtual
n
X
alk qk = 0 , l = 1, . . . , m (4.23)
k=1

multiplicando estas ecuaciones por l y sumando sobre l, obtenemos


m n n
" m #
X X X X
l alk qk = 0 l alk qk = 0 (4.24)
l=1 k=1 k=1 l=1

y sustituyendo (4.15) en (4.24) se obtiene X


QL
k qk = 0 (4.25)
k
5
Cuando las ligaduras son holonomas, siempre es formalmente posible encontrar las coordenadas mnimas independientes. Sin
embargo, en algunos casos especficos la tarea puede ser muy difcil. Los multiplicadores de Lagrange son un metodo sistem
atico
alternativo para llegar a las coordenadas independientes mnimas.
DEL PRINCIPIO DE HAMILTON A SISTEMAS CON COORDENADAS DEP
4.4. EJEMPLOS DE APLICACION

que nos conduce a la nulidad de los trabajos virtuales de las fuerzas de ligadura.
Por supuesto esta demostracion se restringe a ligaduras hol
onomas o no holonomas que cumplan la condicion
(4.23). En nuestro caso, la ligadura no-holonoma que m as usaremos ser
a la correspondiente a la condici
on de
rodadura, que claramente cumple con la condici on (4.23)6 y no realiza trabajo virtual.

4.4. Ejemplos de aplicaci


on del principio de Hamilton a sistemas con coor-
denadas dependientes
4.4.1. Bloque deslizante sobre una semiesfera
Comencemos con un ejemplo de ligadura hol onoma. Sea una semiesfera de radio a, cuya base est
a montada
en la tierra. Una masa M est a en el tope de la semiesfera y no sufre fricci
on. La masa desliza debido a un
ligero desplazamiento. Sea z el eje vertical y el plano xz ser
a el plano de movimiento. Si medimos el
angulo a
partir del eje z, el Lagrangiano y las ligaduras los podemos escribir en coordenadas cartesianas o polares. Para
tener en cuenta las ligaduras es necesario introducir coordenadas generalizadas que no son independientes y
que esten relacionadas con las ligaduras, usemos entonces las coordenadas r y de las cuales solo una de ellas
es realmente independiente, la ligadura de que r es constante se debe a la fuerza normal. El Lagrangiano y las
ligaduras en coordenadas cartesianas es
1  p
L = M x 2 + z 2 M gz ; F1 (x, y) = a x2 + z 2 = 0
2
x = r sin ; x = r sin + r cos ; z = r cos ; z = r cos r sin

en tanto que el Lagrangiano y las ligaduras en coordenadas polares resulta


1  2 
L = M r + r 2 2 M gr cos
2
f1 (r, ) = a r = 0 (4.26)

la ligadura nos muestra que la coordenada r no es independiente. As que podemos reducir a el conjunto de
coordenadas generalizadas independientes. No obstante, escribiremos las ecuaciones de Lagrange usando las
dos coordenadas r,. Calcularemos adem as las fuerzas generalizadas asociadas a las ligaduras con base en la
Ec. (4.21)
 
d L L f1
= M r ; = M r 2 M g cos ; QLr = 1 = 1
dt r r r
 
d L d   L f1
= M r 2 = M r 2 + 2M r r ; = M gr sin ; QL = 1 =0
dt dt

aplicando las Ecs. (4.20, 4.21) se tiene

M r M r 2 + M g cos = 1 (4.27)
M r 2 + 2M r r M gr sin = 0 (4.28)

las ecuaciones de Lagrange (4.27, 4.28) junto con la ecuaci on de ligadura (4.26) forman un sistema de 3
ecuaciones y tres inc
ognitas (r, , 1 ), cuya soluci
on es u
nica bajo las condiciones iniciales adecuadas. Hay un
solo multiplicador 1 ya que solo tenemos una ligadura. Aplicando la ligadura llegamos a r = a y r = r = 0,
y sustituyendolo en la ecuaciones (4.27, 4.28) obtenemos

M a 2 + M g cos = 1 ; M a2 M ga sin = 0
g 1 g
2 cos = ; = sin (4.29)
a Ma a
6
Ver ejercicios 1, 2, de la P
ag. 66.
60 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

este es un problema de dos ecuaciones con dos inc


ognitas que tiene soluci
on u
nica bajo las condiciones iniciales
adecuadas. Una solucion parcial se puede obtener con el ansatz7

2 = A B cos (4.30)

Derivando (4.30) se obtiene


B
2 = B sin = sin
2
comparando esta expresion con la segunda de las Ecs. (4.29) resulta B = 2g/a con lo cual el ansatz (4.30) nos
da
2g
2 = A cos
a
Usando condiciones iniciales de la forma = = 0 en t = 08 nos da A = 2g/a de modo que9

2g 2g
2 = cos + (4.31)
a a
ahora reemplazando (4.31) en la primera de las Ecs. (4.29) se tiene que

2g 2g g 1
cos + cos =
a a a Ma
g 1
(2 3 cos ) =
a Ma
con lo cual queda finalmente
1 = M g (3 cos 2)
usando los metodos tradicionales de soluci
on se puede ver que el multiplicador corresponde numericamente al
valor de la fuerza de ligadura normal. Esto tambien se puede ver haciendo uso de las Ecs. (4.16, 4.19), teniendo
en cuenta que hay una sola fuerza de ligadura y un solo multiplicador

r f1
N = 1
qk qk

aplicando esta ecuaci


on para qk = r y usando las Ecs. (4.26) resulta

(rur ) f1
N = 1 (N ur ) ur = 1
r r
1 = N

donde hemos usado el hecho de que la fuerza normal va a lo largo de ur . Se puede ver que estrictamente
el multiplicador solo nos puede proporcionar la magnitud de la normal ya que la fuerza de ligadura (vecto-
rial) aparece en un producto punto que nos hace perder informaci on sobre la direcci
on, a esto se le suma la
ambig uedad del signo del multiplicador.
Este problema ilustra muchas caractersticas de la tecnica de multiplicadores de Lagrange
7
a inspirado en el hecho de que = (g/a) sin se asemeja a la ecuaci
Este ansatz est on de un pendulo simple (con
y ) de oscilaciones no necesariamente peque 2
nas, en tal problema se puede obtener por conservaci on de la energa
mecanica de lo cual se obtendra una expresion similar a nuestro ansatz Ec. (4.30).
8
Naturalmente, debe ser ligeramente distinto de cero para que exista movimiento. Sin embargo, usamos estas condiciones
teniendo en cuenta que en ausencia de rozamiento, la velocidad angular se puede aproximar arbitrariamente a cero.

9
La Ec. (4.31) tambien se puede obtener as: = ddt = dd d
dt
= dd . De la segunda de las Ecs. (4.29) y usando la expresion
anterior tenemos que
Z Z Z
g g
d = sin d d = cos
0 a 0 0 a 0

con lo cual se llega a la Ec. (4.31).


DEL PRINCIPIO DE HAMILTON A SISTEMAS CON COORDENADAS DEP
4.4. EJEMPLOS DE APLICACION

1. Las ecuaciones de Lagrange solo se pueden solucionar teniendo en cuenta las ecuaciones de ligadura, para
formar el sistema de n + m ecuaciones e inc
ognitas.

2. Observese que el metodo para calcular las fuerzas generalizadas de ligadura conduce automaticamente
a encontrar las coordenadas espureas. En este caso existe un multiplicador que elimina la coordenada
sobrante r.

3. La fuerza de ligadura pudo ser hallada y est a asociada a 1 . Debe tenerse en cuenta sin embargo, que no
hay una relacion uno a uno entre multiplicadores y fuerzas generalizadas de ligadura, en realidad cada
fuerza generalizada de ligadura es una combinaci on lineal de todos los i como lo muestran las Ecs. (4.15,
4.21). La relaci
on entre fuerzas reales de ligadura y multiplicadores es m as indirecta todava.

4.4.2. Aro sobre plano inclinado con condici


on de rodadura
Veamos un ejemplo con la condici on de rodadura, como es un aro de radio a que rueda sin deslizar sobre
un plano inclinado que est onoma10 pero
a fijo en el suelo. La ligadura implcita en la rodadura es realmente hol
la tecnica de c
alculo ser
a identica al caso de ligaduras no holonomas de la forma (4.3). La otra ligadura de que
el aro esta sobre el plano inclinado est a implcita en la escogencia de las coordenadas generalizadas
Definimos el eje x paralelo a la superficie del plano inclinado hacia abajo y un angulo que barre el radio
vector del aro. Como coordenadas generalizadas se escoge x, . La condici on de rodadura provee una ligadura
entre ambas
dx a d = 0 (4.32)
la energa cinetica tiene una parte traslacional y una rotacional
1 1 1  
T = M x 2 + I 2 = M x 2 + K 2 2
2 2 2
escribirlo en terminos del radio de giro K, permite resolver de una vez el mismo problema con figuras tales
como el aro, la esfera, el cilindro, el disco e incluso figuras como el elipsoide de revoluci
on (ver ejercicio 3, P
ag.
67). De momento haremos K = a (aro con densidad constante). La energa potencial es

V = M g (l x) sin 0

siendo l la longitud del plano inclinado y 0 su inclinaci


on. El Lagrangiano queda
1  
L = M x 2 + a2 2 M g (l x) sin 0 (4.33)
2
con lo cual tenemos
 
d L L
= Mx ; = M g sin 0
dt x x
 
d L L
= M a2 ; =0
dt

dado que hay una ecuaci on de ligadura, se requiere solo un multiplicador de Lagrange. Comparando (4.32) con
(4.3) los coeficientes que acompa nan a la ligadura son

a1 = a ; a1x = 1 ; a1t = 0 (4.34)

las fuerzas generalizadas de ligadura se obtienen de (4.15) y (4.34)

QL L
x = 1 a1x = 1 ; Q = 1 a1 = a1
10
Esto se debe a que esta es una condici on de rodadura en donde el aro se restringe a moverse en un plano. Cuando esta
restricci
on deja de ser cierta, la ligadura es realmente no-hol
onoma, como se aprecia en los ejercicios 1, 2, P
ag. 66.
62 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

de modo que las ecuaciones de Lagrange junto con las ecuaciones de ligadura quedan

M g sin 0 = 1 ; M a2 = a1 ; a = x
Mx (4.35)

constituye un conjunto de tres ecuaciones para x, ,1 . Diferenciando la ligadura respecto al tiempo se obtiene
a = x
, sustituyendo en la segunda de las Ecs. (4.35) se tiene que M x = 1 al sustituir esto en la primera de
las Ecs. (4.35) queda
g sin 0
x
=
2
con lo cual
g sin 0 M g sin 0
= ; 1 = (4.36)
2a 2
puesto que hay un solo multiplicador, podemos obtener la magnitud de la fuerza de ligadura usando una sola
fuerza generalizada de ligadura, digamos QL x . La fuerza (real) de ligadura esta dada por FL = N + Fr siendo
N la normal y Fr la fuerza de rozamiento est atico. Utilizando las ecuaciones (4.15, 4.16) tenemos que

r r
QL L
x =F = (N + Fr ) = 1 a1x
x x
es facil ver que r = xux , por tanto x r = ux , utilizando esto y la Ec. (4.34) resulta11

(N + Fr ) ux = 1

ahora teniendo en cuenta que N = N uy y que Fr = kFr k ux se tiene que

M g sin 0
kFr k = 1 Fr =
2
donde hemos usado la Ec. (4.36). N otese que hemos obtenido informaci on sobre la fuerza de rozamiento pero
no sobre la normal. Esto era de esperarse, ya que la fuerza de rozamiento est
atico es la que genera la condici
on
de rodadura, que fue la ecuaci
on que usamos como ligadura.

4.4.3. Esfera en un hueco cilndrico


Una esfera de radio est a restringida a rodar sin deslizar en la mitad inferior de la superficie interna de
un hueco cilndrico de radio interior R (ver Fig. 4.1). Determine el Lagrangiano, la ecuaci on de ligadura y las
ecuaciones de Lagrange con multiplicadores indeterminados.
Utilizaremos las coordenadas y indicadas en la figura 4.1. Estas coordenadas no son independientes ya
que la condicion de rodadura establece una relaci on entre ellas. El centro de masa de la esfera se mueve en
un arco circular con radio R y velocidad angular , de modo que la velocidad al cuadrado del centro de
h i2
masa de la esfera es v 2 = (R ) . Las energas cinetica y potencial en estas coordenadas se escriben en
la forma
1 h i2 1
T = m (R ) + I 2 ; V = mg [R (R ) cos ]
2 2
siendo m la masa de la esfera y tomamos V = 0 en el punto m as bajo del cilindro hueco12 . I es el momento
ametro, cuyo valor es (2/5) m2 , el Lagrangiano queda entonces en
de inercia de la esfera con respecto a su di
la forma
1 1
L = T V = m (R )2 2 + m2 2 mg [R (R ) cos ]
2 5
11
A priori podemos pensar que la posicion debe ser r = xux + auy que es la posicion del centro de masa. Sin embargo, la fuerza
de rozamiento se aplica sobre el punto de contacto sobre la superficie de modo que r = xux es el punto de aplicaci on de dicha
fuerza (y tambien de la normal). En todo caso, esta diferencia no altera las derivadas.
12
Podramos tomar el cero de potencial en el punto m as bajo del centro de masa de la esfera, pero esto supone un corrimiento
del potencial en una constante, lo cual es Fsicamente irrelevante.
DEL PRINCIPIO DE HAMILTON A SISTEMAS CON COORDENADAS DEP
4.4. EJEMPLOS DE APLICACION

Figura 4.1: Esfera de radio , que rueda sin deslizar en la mitad inferior de una superficie cilndrica de radio
R.

la condici
on de rodadura nos da la ligadura

f (, ) = R = 0 (4.37)

existe entonces un solo multiplicador de Lagrange y las ecuaciones de Lagrange con multiplicadores quedan
   
L d L f L d L f
= ; =
dt dt
que explcitamente nos da

mg (R ) sin m (R )2 = R (4.38)
2
m2 = (4.39)
5
de (4.39) se obtiene
2
= m (4.40)
5
y usando (4.37), encontramos  
2 R 2
= m = mR (4.41)
5 5
sustituyendo (4.41) en (4.38) se encuentra la ecuaci
on de movimiento con respecto a .
 
2 2
mg (R ) sin m (R ) = mR R
5
 
2 2 2
g (R ) sin = R + (R )
5
g (R ) sin
= h i
2 2 2
5 R + (R )
= 2 sin
64 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

es la frecuencia de peque
nas oscilaciones dada por
v
u g (R )
u
= th i
2 2 2
5 R + (R )

la ecuaci
on para es la de un pendulo simple de amplias oscilaciones. Una vez resuelto (t), la ecuaci
on de
se obtiene directamente de (4.37), as mismo la soluci
on para el multiplicador se obtiene de (4.41). Cual es la
asociaci
on entre fuerzas de ligadura y el multiplicador en este problema?.

4.5. Caractersticas b
asicas de una formulaci
on variacional
Una ventaja notable de la formulaci on variacional es su independencia con respecto a un cambio en las
coordenadas generalizadas13 , ya que el Lagrangiano es independiente de esta escogencia. Por otro lado a
partir del principio de Hamilton se puede ver f acilmente porque la adici on de una derivada total de la forma
dF (q, t) /dt en el Lagrangiano no afecta la dinamica, cuando este termino se integra en el tiempo, el resultado
solo depende de los puntos inicial y final los cuales son fijos. Esto equivale a anadir una constante a la acci
on,
que claramente no afecta la condici on de estacionaridad.
Muchas teoras de la Fsica mas all
a de la mec anica subyacen en un principio variacional. Con frecuencia
ocurre que la necesidad de modificar el contenido Fsico de una teora sugiere la forma de hacer el mismo cambio
en otras teoras. Tal es el caso de la cuantizaci
on de partculas que indic o como construr posteriormente el
proceso de quantizaci on de los campos, basados en un principio variacional y una formulaci on Lagrangiana.

4.6. Principio variacional para Lagrangianos que contienen a q (opcional)


Ciertos problemas de la mec anica cl
asica est
an descritos por Lagrangianos que contienen derivadas tem-
porales de qi m as altas que la primera, este es el caso en ciertas aplicaciones de la teora del caos. Es usual
denominar como mec anica generalizada a este tipo de problemas. En particular cuando el Lagrangiano es de
la forma L (q, q, q, t) se suele hablar de mecanica de la sacudida. Asumiremos que para un Lagrangiano de la
forma L (q, q, q, t), el principio de Hamilton se cumple con variaci on cero en los extremos tanto en las qi como
en las qi , en cuyo caso hablaremos de un principio variacional de Hamilton extendido.
Veremos entonces como son las ecuaciones de movimiento para un Lagrangiano de la forma

L = L(qi , qi , qi , t) (4.42)

bajo el postulado de que se cumple el principio variacional de Hamilton extendido. La acci


on queda entonces
de la forma Z 2
I= L(qi , qi , qi , t)dt
1
y se tiene que
Z 2X 
I L qi L qi L qi
d = d + d + d dt (4.43)
1 qi qi qi
i
Asumiremos suma sobre ndices repetidos cuando los ndices aparezcan. De momento omitiremos los ndices
para simplificar los c
alculos. En analoga con la Ec. (3.17, 3.18) tenemos

I q
d = I ; q = d

con lo cual la Ec. (4.43) queda
13
Debe aclararse sin embargo, que el espacio de configuraciones y la trayectoria en dicho espacio, s dependen de las coordenadas
generalizadas empleadas.
(OPCIONAL)
4.6. PRINCIPIO VARIACIONAL PARA LAGRANGIANOS QUE CONTIENEN A Q 65

Z 2 
L L q L q
I = q + d + d dt (4.44)
1 q q q
Integrando por partes el termino de la mitad nos da en analoga con la Ec. (3.11)
Z Z Z 2  
2
L q 2
L 2 q L q 2 q d L
dt = dt = dt (4.45)
1 q 1 q t q 1 1 dt q
el primer termino a la derecha es cero debido a la condici
on de extremo fijo en las qi . sustituyendo (4.45) en
la expresi
on (4.44) resulta
Z 2   
L d L L q
I = q q + d dt (4.46)
1 q dt q q
donde hemos usado de nuevo la definici
on q = (q/) d. El u
ltimo integrando requiere dos integraciones
por partes
Z Z Z 2  
2
L q 2
L 2 q L q 2 q d L
dt = dt = dt
1 q 1 q t q 1 1 dt q
y usando la condici
on de extremo fijo en las qi , vemos que se elimina el primer termino a la derecha. Una
segunda integraci
on por partes nos da

Z 2    Z 2 2   
q d L q d L
dt = dt
1 dt q 1 t dt q
   Z 2  
d L q 2 q d2 L
= dt
dt q 1 1 dt2 q
el primer termino a la derecha se elimina por la condicion de extremo fijo en los qi . Por tanto
Z 2 Z 2   
L q q d2 L
dt = 2
dt (4.47)
1 q 1 dt q
reemplazando (4.47) en (4.46) y usando la definici
on de q se tiene que
Z 2      
L d L d2 L
I = q q + 2 q dt
1 q dt q dt q
factorizando qs, y colocando los ndices de nuevo resulta
Z 2 X   
L d L d2 L
I = + 2 qi dt = 0
1 qi dt qi dt qi
i
puesto que las qi son independendientes, las variaciones qi son independientes y podemos aplicar el lema
fundamental del calculo variacional y ver que I = 0 requiere que tanto el integrando como los coeficientes de
qi se anulen separadamente, llegando entonces a las ecuaciones de movimiento:
   
L d L d2 L
+ 2 =0 ; i = 1, 2, ..., n. (4.48)
qi dt qi dt qi
Notese que para utilizar el principio variacional de Hamilton extendido, el espacio de configuraciones debe
ser de dimension 2n, con qi y qi en los ejes, ya que la condici
on completa de variacion cero en los extremos
requiere esta extensi
on del espacio. Adem as estas condiciones de variaci
on cero conducen a la invarianza de
las ecuaciones de movimiento, bajo el siguiente tipo de transformaciones gauge del Lagrangiano
dF (q,
q, t)
L = L + (4.49)
dt
66 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

Tomemos como ejemplo sencillo de aplicaci


on el siguiente Lagrangiano

1 k
L = mq q q 2 (4.50)
2 2
para el cual tenemos

L 1 d L
= mq kq ; =0
q 2 dt q
      
d2 L d d 1 d 1 1
= mq = mq = m
q
dt2 q dt dt 2 dt 2 2
al reemplazar estas relaciones en las ecuaciones de movimiento (4.48) tenemos

m
q kq = 0
Que corresponde a la ley de Hooke. N otese que el Lagrangiano (4.50) a pesar de su apariencia extra
na,
nos da las ecuaciones del oscilador arm
onico cuando usamos este formalismo de sacudida de las ecuaciones
de Lagrange. Para entender porque, utilizaremos la invarianza gauge en (4.49), para obtener el Lagrangiano
(4.50) a partir del Lagrangiano usual para el oscilador arm
onico simple LSHO

 
d mq q mq2 kq 2 mq q mq2
L = LSHO + =
dt 2 2 2 2 2
mq q kq 2
L =
2 2
es muy importante enfatizar que los Lagrangianos L y LSHO son equivalentes solo bajo el principio de Hamilton
extendido con variaci on cero en q, q.
De otra forma el Gauge (4.49) ya no sera v alido.
De lo anterior se ve que se requiere un principio variacional especfico o equivalentemente, un tipo especfico
de ecuaciones de movimiento, para que un Lagrangiano dado tenga toda la informaci on fsica del sistema.

4.7. Ejercicios
1. Supongamos un disco de radio R que rueda sobre un plano horizontal XY , de manera que permanece
siempre vertical. Sean (x, y) las coordenadas del centro del disco. Definimos tambien un
angulo de rotaci
on
alrededor del eje del disco, y un angulo entre el eje X y el eje del disco (ver Fig. 4.2). Si el disco
rueda sin deslizar, demuestre que la condici on de rodadura se manifiesta en una ligadura de la forma
dx R sin d = 0 ; dy + R cos d = 0 (4.51)

2. Supongamos que tenemos un conjunto de ecuaciones diferenciales lineales de ligadura del tipo
n
X
gk (x1 , . . . , xn ) dxk = 0 (4.52)
k=1

este tipo de ligaduras son hol


onomas solo si existe una funci
on integrante f (x1 , . . . , xn ) que convierta a
estas ecuaciones en diferenciales exactas i.e.
n
X n
X f f
gk (x1 , . . . , xn ) dxk = df = dxk gk = (4.53)
xk xk
k=1 k=1

multiplicando la u
ltima ecuaci
on por f y derivando el producto parcialmente con respecto a xj se obtiene
f f 2f
(f gk ) = +f (4.54)
xj xj xk xj xk
4.7. EJERCICIOS 67

Figura 4.2: Disco vertical que rueda sin deslizar sobre el plano XY .

invirtiendo el rol de los ndices j, k, se obtiene una ecuaci


on similar, y el miembro derecho de tal ecuaci
on
es identico al miembro derecho de la Ec. (4.54) si las segundas derivadas parciales son contnuas. Por
tanto, la funcion integrante debe cumplir la condici on14

(f gk ) (f gj )
= ; j, k = 1, . . . , n (4.55)
xj xk

demuestre que no se puede encontrar una funci on integrante para la ligadura de rodadura Ec. (4.51). Sin
embargo, tal funci
on integrante s existe cuando es constante en la Ec. (4.51), como ocurre por ejemplo
con un disco que rueda sobre un plano inclinado.

3. Resolver el ejercicio de la secci


on 4.4.2, sustituyendo el aro por una esfera, un cilindro, un disco y un
elipsoide de revoluci
on. Asuma constante la densidad de cada figura.

4. Demuestre que el gauge (4.49), deja invariantes las ecuaciones de movimiento (4.48), que se derivan del
principio de Hamilton extendido, asociado al formalismo de la sacudida. Demuestrelo (a) apelando
directamente a las ecuaciones diferenciales, (b) apelando al principio variacional de Hamilton extendido.

5. En la seccion 2.8.6 Pag. 32, se estudi


o la din
amica de un aro que rueda sin deslizar sobre una cu na que
desliza sin rozamiento sobre el suelo. Trate la ligadura de rodadura utilizando el metodo de multiplica-
dores de Lagrange. Contraste los resultados con los obtenidos en la secci on 4.4.2, Pag. 61, en la cual la
cu
na esta fija en el suelo.
14
En las condiciones (4.53, 4.55) podemos agregar la coordenada temporal digamos xn+1 t, y las Ecs. (4.53, 4.55) seran
v
alidas para j, k = 1, . . . , n + 1. N
otese que esta es la estructura de las Ecs. (4.3), P
ag. (55).
68 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECUACIONES DE LAGRANGE

Figura 4.3: Esfera de masa m y radio r que rueda sin deslizar sobre un cilindro fijo de radio R.

6. Una esfera de masa m y radio r rueda sin deslizar sobre un cilindro fijo de radio R, como se indica en
la Fig. 4.3;;;. Si la esfera comienza a rodar sin deslizar desde el punto m
as alto del cilindro y partiendo
del reposo. (a) Plantee las ecuaciones de Lagrange con multiplicadores que den cuenta de la fuerza de
ligadura del cilindro sobre la esfera. (b) Encuentre el punto donde la esfera se separa del cilindro. (c)
Resuelva el mismo problema reemplazando la esfera por un aro y por un cilindro, cada uno con masa m
y radio r.
Captulo 5

Simetras y cantidades conservadas en el


formalismo de Lagrange

5.1. Teoremas de conservaci


on y propiedades de simetra
Las estrategias planteadas hasta el momento nos permiten encontrar las ecuaciones diferenciales que deter-
minan la dinamica de un sistema con n grados de libertad. Como estas ecuaciones son de segundo orden en el
tiempo, se requieren 2n constantes de integraci on que usualmente se determinan con las condiciones iniciales
en las coordenadas y velocidades generalizadas. Desafortunadamente, la mayora de problemas no son inte-
grables completamente. No obstante, hemos aprendido del formalismo Newtoniano, que incluso para sistemas
no integrables es posible extraer mucha informaci on valiosa del sistema aunque las ecuaciones de movimiento
no esten completamente resueltas. En general, esta informaci on se traduce en principios de conservaci
on que
debemos reexaminar en este nuevo formalismo.
La soluci
on completa de una ecuaci on de segundo orden requiere formalmente de dos procesos de integra-
ci
on, con frecuencia ocurre que podemos hacer un primer proceso de integraci on pero el ultimo proceso de
integraci
on no se puede llevar a cabo facilmente. En otras palabras, podemos obtener ecuaciones de la forma

f (q, q,
t) = cte

que son ecuaciones diferenciales de primer orden. Estas estructuras se conocen como primeras integrales de las
ecuaciones de movimiento. Mucha informaci on se puede extraer de estas primeras integrales, en particular las
leyes de conservaci
on.
Consideremos un sistema de partculas puntuales bajo la influencia de fuerzas que se derivan de potenciales
que solo dependen de la posicion. En este caso podemos escribir

L T V T X1 
= = mk x 2k + y k2 + zk2
x i x i x i x i x i 2
k
L
= mi x i = pxi
x i

que corresponde a la componente x del momento lineal de la partcula iesima. Esto sugiere la forma de elabo-
rar el concepto de momento generalizado cuando usamos coordenadas generalizadas. El momento generalizado
pj asociado a la coordenada generalizada qj se define como

L
pj (5.1)
qj

por razones que veremos posteriormente, a pj tambien se le conoce como momento can onicamente conjuga-
do a qj . N
otese que pj no tiene necesariamente dimensiones de momento lineal. Cuando tenemos potenciales

69
70CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS EN EL FORMALISMO DE LAGRANGE

dependientes de la velocidad incluso en coordenadas cartesianas el momento generalizado difiere del momen-
to mec
anico. Un ejemplo notable es el de un conjunto de partculas en un campo electromagnetico, cuyo
Lagrangiano es1
X1 X X
L= mi r 2i qi (xi ) + qi A (xi ) r i
2
i i i
qi en este caso denota carga electrica. El momento generalizado es
L
pxi = = mi x i + qi Ax (5.2)
x i
que es el momento mec anico asociado a la partcula mas un termino adicional que depende del campo.
En algunas ocasiones el Lagrangiano no depende de una cierta coordenada qj (aunque puede depender de
su velocidad generalizada qj ), en este caso se dice que qj es una coordenada cclica o ignorable, y la ecuaci
on
de Lagrange asociada a esta coordenada se reduce a
 
d L
=0 (5.3)
dt qj
de la definici
on de momento generalizado se observa que
dpj
= 0 pj = cte (5.4)
dt
de lo cual resulta un teorema de conservaci on: el momento generalizado can onicamente conjugado a
una coordenada cclica se conserva. Vale recalcar que la validez de este teorema depende de que las
coordenadas generalizadas sean independientes entre s, ya que de ello dependen las ecuaciones de Lagrange
(sin multiplicadores ). Por ejemplo, podemos apreciar en la Ec. (4.33), que en el ejemplo del aro que rueda
sin deslizar sobre un plano inclinado fijo en el suelo, el Lagrangiano no contiene a la coordenada , sin embargo
la cantidad p no es una constante de movimiento debido a que el angulo aparece en la ecuacion de ligadura
dx a d = 0.
N
otese otra diferencia importante entre el concepto de momento mec anico y el de momento generalizado.
El primero se asocia a una partcula y el segundo se asocia a una coordenada generalizada. Por otro lado, ya se
ha mencionado que una coordenada generalizada no necesariamente est a asociada a una partcula y por tanto
el momento conjugado tampoco lo estar a.
Los momentos generalizados conservados constituyen primeras integrales de movimiento, pues al pasar de
(5.3) a (5.4) hemos pasado de una ecuaci on diferencial de segundo orden a una de primer orden, lo cual equivale
a hacer una integracion. Formalmente, la velocidad generalizada de una coordenada cclica puede ser reempla-
zada por el momento conservado, de modo que la variable cclica desaparece completamente del Lagrangiano,
este procedimiento desarrollado por Routh, ser a discutido en el captulo de formulaci
on Hamiltoniana secci on
6.7.
Las condiciones de conservaci on del momento generalizado son mas generales que las que se derivan en
mec anica Newtoniana para el momento lineal y angular. Por ejemplo, un momento conservado aparece incluso
cuando la ley de acci on y reacci
on no es v alida. En particular, este es el caso cuando estan presentes fuerzas
electromagneticas. Supongamos que tenemos una partcula inmersa en un campo electromagnetico, tal que los
potencial electrodinamicos no dependen de x. De esta forma x no aparece en el Lagrangiano (aunque s aparece
x)
y el momento can onico px viene dado por la Ec. (5.2)
px = mx + qAx = cte
De la teora electrodin
amica clasica, es bien conocido que cuando A y no dependen de x, la cantidad qAx
es la componente x del momento lineal del campo electromagnetico asociado con la carga q, el momento
mecanico mx esta asociado unicamente a la carga. Por tanto, el momento can onico px es una cantidad mixta
que est
a asociada tanto a la carga como al campo, esto no supone ninguna contradicci on ya que como dijimos,
el momento can onico est
a realmente asociado a la coordenada y no a la partcula (ni al campo).
1
Notese que cuando al sistema de partculas le a nadimos el campo, no es necesario diferenciar para una partcula entre la
contribuci
on debida a las fuerzas internas y las externas, ya que ambas contribuciones est
an contenidas en el campo.
Y PROPIEDADES DE SIMETRIA
5.1. TEOREMAS DE CONSERVACION 71

Example 2 Para el problema de la secci on 2.8.6 del aro que rueda sin deslizar sobre un plano inclinado, que
a su vez se desliza sobre el suelo sin rozamiento, el Lagrangiano est
a dado por la Ec. (2.47) P ag. 33

1
L = mS 2 + (m + M ) 2 + mS cos mg [R cos + (l S) sin ] (5.5)
2
Se observa que en este Lagrangiano la coordenada es cclica, y por tanto su momento canonicamente con-
jugado es constante. Esto nos conduce a una primera integral de movimiento (ecuacion diferencial de primer
orden)
L
p = = (m + M ) + mS cos = K

esta expresi
on se puede encontrar tambien al integrar una de las ecuaciones de Lagrange que resultaron en el
problema, Ec. (2.49), Pag. 33.

Para el anterior ejemplo, es importante mencionar que el Lagrangiano 5.5, est a escrito en coordenadas real-
mente independientes y por esta raz on el momento conjugado p es realmente una constante de movimiento.
Ya mencionamos que en un problema similar, obtuvimos un Lagrangiano Ec. (4.33), que contiene una coor-
denada cclica que no conduce a la conservaci on de su momento can onico, en virtud de que las coordenadas
generalizadas en tal problema no eran independientes. Por otro lado, el ejemplo anterior tambien muestra con
claridad que la invarianza de un momento conjugado equivale a un proceso de integraci on que nos lleva a
una ecuaci on diferencial de primer orden. Sin embargo, en este ejemplo particular este proceso de integracion
es trivial y se poda ejecutar sin mayores dificultades desde las ecuaciones de Lagrange mismas. Es necesario
decir no obstante, que el proceso que nos lleva de las ecuaciones de Lagrange (de segundo orden) a primeras
integrales de movimiento (ecuaciones de primer orden), puede ser muy complejo en general, y esto justifica la
introduccion del concepto de coordenada cclica y de la conservacion de su momento conjugado asociado.
Veremos ahora que los teoremas usuales de conservaci on est
an contenidos en la regla general sobre coor-
denadas cclicas.

5.1.1. Momento lineal y coordenadas globales de traslaci


on
Pensemos primero en una coordenada generalizada qj cuyo cambio dqj represente una traslaci on del sistema
on2 . Esto implica que el corrimiento del sistema como un todo debe ser compatible
como un todo en cierta direcci
con las ligaduras. En algunos casos las fuerzas externas podran imponer ligaduras sobre el sistema que impidan
esta clase de movimiento, con lo cual qj no sera una coordenada generalizada independiente.
Supondremos entonces que (a) qj es una coordenada generalizada independiente. Asumiremos adem as
que (b) La coordenada qj no aparece en la energa cinetica, (c) el potencial no depende de las velocidades
generalizadas, esto excluye de la formulaci on por ejemplo a las fuerzas electromagneticas. La ecuaci on de
Lagrange asociada a esta coordenada queda
   
d (T V ) (T V ) d T V
= + =0
dt qj qj dt qj qj

la derivada total en el tiempo del momento generalizado esta dada por


 
d T V
p j = = = Qj (5.6)
dt qj qj

a continuaci
on veremos que esta es la ecuaci
on de movimiento para el momento lineal total a lo largo de qj .
Es decir que Qj es la componente de la fuerza (en el sentido Newtoniano) en la direcci
on qj , en tanto que pj
2
Por ejemplo, un conjunto de partculas colineales insertadas en una varilla sin masa. Una coordenada qj puede ser una
coordenada cartesiana cuyo eje va a lo largo de la varilla. Un desplazamiento dqj implica que el sistema se mueve como un todo
gracias a la ligadura de cuerpo rgido entre las partculas. El corrimiento de una coordenada cartesiana del centro de masa de un
sistema es otro ejemplo.
72CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS EN EL FORMALISMO DE LAGRANGE

es la componente del momento lineal a lo largo de tal direcci


on. La fuerza generalizada Qj viene dada por
X ri
Qj = Fi (5.7)
qj
i

notese que al ser qj una variable de traslaci on, sus unidades s deben ser de longitud y se puede definir
unvocamente un vector unitario de traslaci on n, a lo largo de dqj . Como dqj representa una traslaci on del
sistema a lo largo de cierto eje, la diferencia entre los vectores ri (qj ) y ri (qj + dqj ) va a lo largo de n, y tiene
como magnitud dqj
ri ri (qj + qj ) ri (qj ) dqj n
= lm = =n (5.8)
qj qj 0 qj dqj
observese que se ha escrito n y no ni ya que al ser una traslaci
on del sistema como un todo, cada partcula se
desplaza en la misma direcci on que las otras. De aqu resulta
X
Qj = Fi n = n F
i

por lo tanto, Qj representa la componente de la fuerza total sobre el sistema a lo largo de la direcci
on n de
traslaci
on. Para ver el significado del momento can onico, calculemos pj
!
T 1X X r i
pj = = mi r 2i = mi r i
qj qj 2 qj
i i
X ri
pj = mi vi
qj
i

donde hemos usado (2.12). Teniendo en cuenta (5.8) llegamos a


X
pj = n mi vi
i

que corresponde a la componente del momento mec anico lineal total del sistema a lo largo de la direcci on de
traslacion. Vemos que en este caso, el momento generalizado asociado a una sola coordenada qj result o estar
asociado al momento lineal de todo el sistema, esto no es de extra nar, ya que qj represent o una traslaci on
para el sistema como un todo. Esto enfatiza el hecho de que el momento generalizado est a asociado a una
coordenada y no a una partcula. El mismo comentario vale para la fuerza generalizada. En realidad, todas las
variables generalizadas en la formulaci on Lagrangiana est an asociadas a coordenadas en lugar de partculas.
A este hecho se debe en parte la facilidad de extender este formalismo a campos y sistemas contnuos.
Vale la pena mencionar que en el presente tratamiento solo se asumi o que el potencial no dependa de la
velocidad generalizada qj pero podra depender de las velocidades generalizadas de otras coordenadas. Por
otro lado, para sistemas aislados cuyo potencial no dependa de qj las dem as condiciones se satisfacen (para
una direcci on arbitraria de la traslaci
on), ya que al no existir fuerzas externas no hay ligaduras externas que
signifiquen una violacion de las ligaduras cuando el sistema se traslada como un todo. Adicionalmente, debido
a la homogeneidad del espacio, una traslaci on del sistema como un todo es equivalente para un sistema aislado
a un corrimiento del origen, de lo cual es claro que la energa cinetica no puede depender de qj . N otese que
si el sistema no es aislado, un corrimiento del origen no necesariamente es equivalente a un corrimiento del
sistema, ya que el corrimiento del sistema lo puede estar acercando o alejando de ciertos objetos externos,
en tanto que un corrimiento en el origen no. Si por ejemplo ubicamos un plano infinito de masa o de carga
uniformemente distribuda por ejemplo sobre el plano XY , es claro que una traslaci on en x e y cumplir a las
condiciones aqu expuestas, pero un corrimiento en z probablemente no.
Si ahora suponemos (d) que la coordenada de traslaci on qj es cclica, qj no podra aparecer en el potencial
de modo que
V
Qj = 0 = p j
qj
Y PROPIEDADES DE SIMETRIA
5.1. TEOREMAS DE CONSERVACION 73

lo cual nos da la conservaci


on de la componente del momento lineal total del sistema a lo largo de la direcci
on
de traslaci
on. De modo que si cierta componente de la fuerza (Newtoniana) total del sistema es nula, la
correspondiente componente del momento lineal es constante. Esta condici on tambien la cumplen los sistemas
aislados para una direccion arbitraria de la traslaci
on, en virtud de la homogeneidad del espacio, por tanto
vemos que el momento total del sistema se debe conservar para sistemas aislados cuyo potencial no dependa
de las velocidades generalizadas. En este caso hablamos del teorema de conservaci on del momento lineal. Sin
embargo, es un hecho experimental que el momento lineal total de un sistema aislado se conserva incluso si no
se cumple dicha condici on (aunque con un concepto extendido de momento), con lo cual la conservaci on del
momento adquiere el car acter de principio.

5.1.2. Momento angular y coordenadas globales de rotaci


on

Figura 5.1: Rotaci


on infinitesimal del sistema como un todo, caracterizada por el desplazamiento angular dqj .

De manera similar al caso anterior, veremos que si dqj corresponde a una rotaci on del sistema como un todo
alrededor de cierto eje, el momento generalizado corresponde al momento angular del sistema a lo largo del
eje de rotaci on en tanto que Qj corresponde a la componente del torque en la direcci on de dicho eje. Cuando
la variable qj se vuelve cclica se llega a la conservaci on del momento angular.
Asumiremos las mismas condiciones del caso anterior pero para una coordenada qj que produce la rotaci on
del sistema como un todo alrededor de un eje fijo. La Fig. 5.1 muestra la rotaci on en una cantidad dqj de
la partcula iesima del sistema, donde por comodidad y sin perdida de generalidad se ha colocado el eje de
rotacion a lo largo del eje Z. ri (qj ) es la posici
on de esa partcula cuando la coordenada generalizada vale qj y
ri (qj + dqj ) es la posici
on de la partcula iesima cuando la rotaci on dqj se ha realizado, es el angulo entre
ri y el eje de rotacion y Ri el radio del crculo descrito por la partcula i alrededor del eje de rotaci on. Como
hemos asumido que T es independiente de qj y que V es independiente de qj llegamos de nuevo a (5.6), y la
74CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS EN EL FORMALISMO DE LAGRANGE

fuerza generalizada Qj est


a dada de nuevo por (5.7) pero en este caso la derivada adquiere un sentido diferente

ri

kdri k = Ri dqj = ri sin dqj = ri sin
qj

on de dri y por lo tanto la de ri /qj es perpendicular a n (vector unitario a lo largo del eje de
la direcci
rotaci
on). Adicionalmente dado que ri no cambia de magnitud, se tiene que dri (y por tanto ri /qj ) es
tambien perpendicular a ri . Por tanto, ri /qj es perpendicular a n y a ri y su magnitud es ri sin = nri sin ,
de lo cual se deduce que
ri
= n ri (5.9)
qj
la fuerza generalizada queda entonces
X X
Qj = Fi (n ri ) = n (ri Fi )
i i

donde hemos usado la identidad a (b c) = b (c a), llamando Ni ri Fi el torque de la partcula


iesima, resulta X
Qj = n Ni = n N
i

la fuerza generalizada corresponde entonces a la componente del torque total del sistema a lo largo del eje de
rotaci
on. Veamos el momento conjugado

T X r i X ri X X
pj = = mi vi = mi vi = mi vi (n ri ) = n (ri mi vi )
qj qj qj
i i i i
X
pj = n Li = n L
i

el momento can onico es entonces la componente del momento angular total en la direcci on del eje de rotaci
on.
Si la variable qj se vuelve ignorable, se llega a la conservaci
on de la componente del momento angular total en
la direcci
on del eje de rotaci
on. La variable qj es en este caso una variable angular y por tanto, adimensional.
Vemos que las condiciones anteriores se cumplen para un sistema aislado. La discusi on es muy similar al
caso traslacional salvo que esta vez apelamos a la isotropa del espacio y no a la homogeneidad. Recordemos
que la homogeneidad nos dice que la estructura del espacio es la misma si cambiamos el origen del sistema
coordenado, en tanto que la isotropa nos menciona que la estructura del espacio se ve igual si hacemos una
reorientacion de los ejes coordenados (sin cambiar el origen).

5.1.3. Consideraciones generales sobre simetras asociadas a coordenadas cclicas y can-


tidades conservadas
Es sencillo ver que el hecho de que una variable sea cclica est a asociado con algun tipo de simetra del
sistema. Por ejemplo, si la traslaci on del sistema como un todo no afecta al problema, lo que estamos diciendo
es que el sistema es invariante bajo traslaciones en cierta direcci on, y por lo tanto dicha invarianza ante la
operacion de traslaci on conduce a la conservaci on del momento lineal en la direccion de dicha traslaci
on. Por
otra parte si un sistema permanece invariante ante una rotaci on alrededor de cierto eje, la componente del
momento angular a lo largo de dicho eje se conserva. Los teoremas de conservaci on est
an fuertemente ligados a
las simetras del sistema. Si el sistema es esfericamente simetrico, el momento angular del sistema se conserva
en todas direcciones. Estas consideraciones de simetra para llegar a primeras integrales es aplicable incluso a
sistemas muy complejos en los cuales no es posible resolver la din amica completa.
Veamos una aplicaci on: supongamos que tenemos un sistema de partculas inmerso en un potencial generado
por una distribuci on homogenea de masa, carga etc. que forma un plano infinito (el plano XY ). Claramente la
traslaci
on de este sistema (si es localizado) a lo largo de x e y no afecta la din
amica de este, pero una traslaci
on
ENERGIA Y CONSERVACION
5.2. FUNCION DE LA ENERGIA 75

en z puede posiblemente afectarlo. Por otro lado tambien hay una clara invarianza cuando rotamos al sistema
alrededor de z. Sin conocer los detalles del sistema, deducimos que px , py y Lz se conservan. Si en vez del plano
XY , la distribucion externa solo ocupa al semiplano infinito x 0, entonces solo permanece la invarianza de
py . La relaci
on estrecha entre las simetras y las constantes de movimiento, constituyen uno de los principios
mas profundos y fructferos en la Fsica y adquiere una dimensi on a
un mayor a la luz del Teorema de Noether
que discutiremos m as adelante.

5.2. Funci
on energa y conservaci
on de la energa
Por supuesto, tambien es de esperarse que el teorema de conservaci on de la energa se pueda obtener del
formalismo Lagrangiano, cuando las fuerzas del sistema son derivables de un potencial que solo depende de la
posici
on. Por otro lado, hemos visto que la ausencia de una coordenada generalizada en el Lagrangiano conduce
a la conservaci
on de un momento generalizado, es natural entonces preguntarse si la ausencia explcita de la
variable tiempo conduce a alg un teorema de conservacion, la analoga no es tan directa puesto que no hemos
asociado un momento generalizado relacionado con la variable tiempo ni tiene sentido una variable t, en ese
sentido no podemos hablar del tiempo como una variable cclica, pues el tiempo aparece como un par ametro
que adem as de aparecer explcitamente, regula la evoluci
on de las coordenadas.
Al igual que en el caso de los momentos, veremos que del formalismo Lagrangiano sale un teorema de
conservacion mas general que incluye a la conservaci
on de la energa como caso particular.
Consideremos un Lagrangiano que es funci on de las coordenadas generalizadas, velocidades generalizadas
y el tiempo (la dependencia temporal explcita puede provenir de las variaciones de fuentes exteriores, o de
ligaduras dependientes del tiempo), con lo cual la derivada total respecto al tiempo es

dL X L dqj X L dqj L
= + + (5.10)
dt qj dt qj dt t
j j

a partir de las ecuaciones de Lagrange  


L d L
= (5.11)
qj dt qj
y reemplaz
andolo en (5.10)

dL X  d  L  dqj X L dqj L
= + +
dt dt qj dt qj dt t
j j
dL X  d  L  L
= qj +
dt dt qj t
j

lo cual se puede reescribir en la forma



d X L L
qj L + =0 (5.12)
dt qj t
j

la cantidad entre parentesis se denomina funci


on energa, y se denota por h

X L X
t)
h (q, q, qj L= qj pj L (5.13)
qj
j j

la funci
on energa es identica en valor al Hamiltoniano, cuya formulaci
on veremos m
as adelante. Sin embargo,
se denota con una letra diferente (el Hamiltoniano se denota como H) ya que las dos funciones difieren en
76CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS EN EL FORMALISMO DE LAGRANGE

cuanto a los argumentos que utilizan, h es funci


on de qj , qj , t. en tanto que H es funci
on de qj , pj , t siendo
pj el momento conjugado a qj . Aplicando (5.13), la ecuacion (5.12) se escribe
dh L
= (5.14)
dt t
de lo cual se ve en forma inmediata que si el Lagrangiano no es funci on explcita del tiempo, es decir su
dependencia temporal aparece solo a traves de q (t), y q (t), la funci
on energa es una constante de movimiento.
h es en consecuencia, una primera integral de movimiento y se le denomina integral de Jacobi.
En este punto conviene clarificar que para que una cierta cantidad sea constante de movimiento, es necesario
y suficiente que su derivada total con respecto al tiempo (y no necesariamente la parcial) sea nula. Para ver
la raz
on de esto, recordemos el significado de cada una de estas derivadas, la derivada parcial corresponde a
dejar las coordenadas y velocidades generalizadas fijas y solo se mueve el par ametro tiempo, el hecho de que
la derivada parcial se anule significa entonces que la cantidad en cuesti on se mantiene constante en un proceso
virtual en el cual las coordenadas y velocidades generalizadas del sistema se mantuvieran fijas y solo variara el
parametro tiempo, es decir solo evolucionan las influencias exteriores al sistema3 . Una cantidad es constante
de movimiento cuando se mantiene constante su valor en un proceso real, y en un proceso real las coordenadas
y velocidades generalizadas tambien evolucionan a medida que transcurre el tiempo, en consecuencia es la
derivada total la que describe correctamente la evoluci on de una cierta cantidad con el tiempo. En particular,
la cantidad sera constante de movimiento si y solo si su derivada total es cero.
Mas adelante veremos que para el Hamiltoniano (que coincide numericamente con la funci on energa) las
derivadas temporales total y parcial coinciden (ver Ec. 6.26). Naturalmente esto tambien ser a v
alido para la
funci
on energa, de modo que en este caso muy particular la anulaci on de la derivada parcial nos conduce a que
h sea constante de movimiento. Debemos enfatizar sin embargo, que en general las derivadas total y parcial
con respecto al tiempo de una cantidad arbitraria pueden ser muy diferentes.
Bajo ciertas circunstancias, la funcion h es la energa total del sistema. Para determinar bajo que circuns-
tancias, recordemos que la energa cinetica se puede escribir de la forma
T = T0 (q) + T1 (q, q)
+ T2 (q, q)

donde T0 es independiente de las velocidades generalizadas, T1 es lineal en las velocidades generalizadas, y T2
es una funcion cuadratica de estas (ver Ec. 2.24). Para un amplio n
umero de sistemas, una descomposici on
similar es posible con el Lagrangiano completo
t) = L0 (q, t) + L1 (q, q,
L (q, q, t) + L2 (q, q,
t) (5.15)
donde L2 es una funci on homogenea de segundo grado (no simplemente cuadr atica) en q.
L1 es homogenea
de primer grado en q. No hay ninguna raz on de primeros principios para asumir que el Lagrangiano tenga
esta forma, pero esta estructura aparece en una gran cantidad de problemas. Por ejemplo, el Lagrangiano
adquiere esta forma cuando el potencial no depende en forma explcita de la velocidad. Sin embargo, a un para
ciertos potenciales dependientes de la velocidad, esta separaci
on es posible como se puede ver para el caso mas
caracterstico del potencial de una carga en un campo electromagnetico.
Aplicaremos ahora el teorema de Euler, que nos dice que si f es una funci on homogenea de grado n en las
variables xi entonces
X f
xi = nf (5.16)
xi
i
aplicando la definici
on de la funci
on h, Ec. (5.13), para Lagrangianos de la forma (5.15), resulta

X L X L0 X L1 X L2
h= qj L= qj L0 + qj L1 + qj L2
qj qj qj qj
j j j j

3
Vale decir que en este caso estamos hablando de un proceso virtual muy diferente al definido para el principio de DAlembert.
Pues en el escenario actual es el tiempo el que evoluciona y se fijan las coordenadas de las partculas, en tanto que para el principio
de DAlembert es todo lo contrario.
ENERGIA Y CONSERVACION
5.2. FUNCION DE LA ENERGIA 77

y aplicando el teorema de Euler (5.16), para funciones homogeneas


h = L0 + L1 L1 + 2L2 L2
h = L2 L0 (5.17)
Si las transformaciones de coordenadas descritas en (2.2) no dependen explcitamente del tiempo, la estructura
de la energa cinetica descrita en (2.24), resulta T = T2 . Si adicionalmente, el potencial no depende de las
velocidades generalizadas, se tendra que L2 = T , y L0 = V , de tal manera que
h=T +V =E
y la funcion de energa corresponde en este caso a la energa total del sistema. Esta energa no necesariamente
se conserva puesto que el potencial puede ser funci on explcita del tiempo. Cuando se asume adicionalmente a
las condiciones anteriores, que el potencial no depende explcitamente del tiempo, la Ec. (5.14) nos conduce a
la conservaci on de h y en este caso a la conservacion de la energa total del sistema. Notese sin embargo, que
las condiciones de conservaci on de h son en general, muy diferentes de las condiciones para la conservaci on
de la energa. h no necesariamente corresponde a la energa, y cuando corresponde a la energa del sistema
no necesariamente se conserva. Es particularmente importante el hecho de que mientras el valor numerico del
Lagrangiano es independiente de las coordenadas generalizadas empleadas, la funci on h depende en valor y en
forma funcional del sistema coordenado elegido. Mas a un, esta cantidad puede ser conservada para una cierta
escogencia de coordenadas y no serlo para otra, o ser la energa total en un sistema coordenado y no serlo en
otro. En realidad, para un mismo sistema fsico, diferentes funciones h pueden ser generadas de acuerdo con
el sistema de coordenadas elegido, esto se puede ver de la definici on (5.13) ya que qj y pj son muy diferentes
cuando cambiamos de sistema coordenado.
Uno de los casos m as comunes en mec anica cl
asica es aquel en el cual la energa cinetica es de la forma
2
T = mqi /2 2
o pi /2m y la energa potencial depende solo de las coordenadas generalizadas. En este caso, h es
la energa total del sistema y se conserva.

5.2.1. Funci
on energa con fuerzas disipativas
Un caso interesante ocurre cuando tenemos fuerzas disipativas que se pueden generar de una funci
on de
on . Tomando de nuevo como punto de partida la Ec. (5.10) y teniendo en cuenta que las ecuaciones
disipaci
de Lagrange con fuerzas disipativas tipo Rayleigh vienen dadas por (2.38) vemos que la Ec. (5.11) debe ser
corregida para obtener  
L d L
= +
qj dt qj qj
con esto la Ec. (5.12) queda en la forma

d X L L X
qj L + + qj = 0
dt qj t qj
j j

y junto con (5.13) adquieren la forma


dh L X
+ = qj
dt t qj
j
on de dada por la Ec. (2.37), nos muestra que esta funci
la definici on es homogenea de grado 2 en las qs.

Aplicando de nuevo el teorema de Euler, resulta
dh L
= 2 (5.18)
dt t
Si L no es funci
on explcita del tiempo y el sistema es tal que h es la energa del sistema, la Ec. (5.18) nos dice
que 2 es la rata de energa de disipacion
dE
= 2 (5.19)
dt
que concuerda con lo demostrado en la secci on (2.5), aunque all fue probado en circunstancias menos generales.
78CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS EN EL FORMALISMO DE LAGRANGE

5.3. Teorema de Noether para sistemas discretos


Veremos a continuaci on que la relaci
on entre simetras y leyes de conservaci
on se puede englobar de una
forma muy general en el celebrado teorema de Noether, que contiene a los casos ya estudiados como casos
particulares. En terminos simples este teorema asocia a cada simetra contnua del sistema una cantidad
conservada. Veamos su enunciado preciso.

Theorem 3 Teorema de Noether: Si las ecuaciones de movimiento de Lagrange son invariantes bajo una
transformacion contnua de coordenadas [t, q] [t (t) , q (q,t)] entonces existe una integral de movimiento
i.e. una cantidad conservada.

Demostracion: Dado un Lagrangiano L (q, q, t) que depende de las coordenadas qi (i = 1, ..., n), sus
derivadas temporales qi y el tiempo t, podemos introducir unas nuevas coordenadas con la transformacion

t t (t) ; qi qi (q,t) (5.20)

esta transformaci
on debe ser invertible ya que de lo contrario, el nuevo conjunto coordenado no sera indepen-
diente. Parametrizaremos las nuevas coordenadas en la forma:

t t + t (t) , qi qi + qi (q,t) (5.21)


inicialmente las transformaciones t y qi son arbitrarias, por notaci
on se tiene que:

dqi dq
qi ; qi i
dt dt
podemos conectar estas cantidades a traves de las relaciones

dqi dqi dt d (qi + qi ) dt


qi =
=
= (5.22)
dt dt dt dt dt
y teniendo en cuenta que
 1  1  1
dt dt d [t + t] d 1
= = = 1 + t = d
(5.23)
dt dt dt dt 1 + dt t

podemos reemplazar (5.23) en (5.22) y se tiene que


 
d 1
qi = qi + qi d

dt 1 + dt t
de modo que:  
d 1
qi qi qi = qi + qi d
 qi
dt 1 + dt t
Si consideramos transformaciones infinitesimales de modo que qi y t se convierten en cantidades diferen-
ciales, se tiene que:
       
d d d d d d
qi qi + qi 1 t qi = qi qi t + qi qi t qi
dt dt dt dt dt dt
d d
qi qi qi t (5.24)
dt dt
donde hemos despreciado terminos de orden cuadr atico en t, q.
Dado que la Fsica no puede cambiar con esta transformaci on de coordenadas, la acci
on debe permanecer
invariante:
5.3. TEOREMA DE NOETHER PARA SISTEMAS DISCRETOS 79

Z t2 Z t (t2 )


    
S (t1 , t2 ) L [q (t) , q (t) , t] dt = S t (t1 ) , t (t2 ) L q t , q t , t dt
t1 t (t1 )

para que esto se cumpla, se requiere de la siguiente igualdad


     dt
L q , q , t L q q , t , q q , q , t , t t (5.25)
dt
para verificarlo basta con hacer una transformaci
on de coordenadas y tiempo a la acci
on
Z t2 Z t (t2 ) Z t2





L [q (t) , q (t) , t] dt L q t , q t , t dt = L [q, q,
t] dt
t1 t (t1 ) t1

donde en la ultima igualdad hemos aplicado justamente (5.25) y los lmites de integraci on cambian por el
hecho de que cambia el diferencial del cual dependen estos.
Si la forma de las ecuaciones de movimiento es invariante ante esta transformacion de coordenadas, se dice
que dicha transformacion es simetrica. En el caso m
as simple, el lagrangiano como tal es invariante:
 
L q , q , t = L q , q , t
esto sin embargo, no es necesario, ya hemos visto que es suficiente que se cumpla la relaci
on.
  d 
L q , q , t = L q , q , t + q , t (5.26)
dt
es decir, que ambas funciones lagrangianas pueden diferir en una derivada total con respecto al tiempo. Si
insertamos la ecuaci
on (5.26) en (5.25), se tiene:
    dt  d 
L q q , t , q q , q , t , t t = L q
, q

, t + q
, t (5.27)
dt dt
de lo cual queda:

 


  dt

d
 dt
L q q , t , q q , q , t , t t = L q , q , t + q ,t
dt dt dt
 dt d 
t] = L q , q , t
L [q, q, + q , t
dt dt
que junto con (5.23) nos da la ecuaci
on:

 dt d 
t] L q , q , t
L [q, q, = q , t
 dt
 dt
 d d 
t] L q , q , t 1 + t
L [q, q, = q , t
dt dt

de modo que
  d d 
t] L q , q , t = L q , q , t
L [q, q, t + q , t (5.28)
dt dt
y dado que la transformaci
on es contnua, es posible considerar transformaciones infinitesimales en (5.21).
Definiendo

L q , q , t L [q, q,
t] L
y tomando (5.21), la ecuaci
on (5.28) se convierte en:
80CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS EN EL FORMALISMO DE LAGRANGE

d d
L L [q, q,
t] L (q + q, q + q,
t + t) = L (q + q, q + q,
t + t) t + (q + q, t + t)
dt dt
pero por expansion de Taylor

d d 
L (q + q, q + q,
t + t) t) t + O 2
t = L (q, q,
dt dt
despreciando terminos cuadr
aticos en q y/o t, resulta

d d
L = L (q, q,
t) t + (q + q, t + t)
dt dt
En particular, si escojemos q = t = 0, se tiene que q = q y t = t , adem as usando (5.24) se obtiene q =
d
0, de modo que q = q . Con estas consideraciones y usando la Ec. (5.27) se tendra que dt (q, t) = 0. Podemos
a
nadir este cero para reescribir L como

d d
L = L (q, q,
t) t + [ (q + q, t + t) (q, t)]
dt dt
d d
L = L (q, q,
t) t (q, t) (5.29)
dt dt
por otro lado, dado que estamos escribiendo L en funcion de q, q, t la regla de la cadena para L nos da
X  L L

L
L = qi + qi + t (5.30)
qi qi t
i

igualando (5.29) con (5.30) y usando (5.24) resulta:

X  L L

L d d
qi + qi + t + L t = (q, t)
qi qi t dt dt
i
X L    
L d d L d d
qi + qi qi t + +L t = (q, t)
qi qi dt dt t dt dt
i
X  L L d
 X  L d  
L d

d
+ qi qi t + +L t = (q, t)
qi qi dt qi dt t dt dt
i i
" #
X  L L d

L X L d d
+ qi + t + L qi t = (q, t) (5.31)
qi qi dt t qi dt dt
i i

la Ec. (5.31) describe la condicion que un sistema mec anico tiene que cumplir para que las ecuaciones de
movimiento permanezcan invariantes ante una transformaci on infinitesimal dada por (5.21). El problema se
reduce usualmente a la existencia (o no existencia) de una soluci on para la funci
on en la Ec. (5.31) para
una transformacion especfica de la forma (5.21). En particular, si se cumplen las condiciones

d () d (t)
=0 y =0 (5.32)
dt dt
entonces la Ec. (5.29) nos lleva a que L = 0. Por tanto, bajo estas condiciones la funci
on Lagrangiana misma
permanecera invariante bajo la transformacion de coordenadas. Si la Ec. (5.31) se satisface, entonces al usar
las ecuaciones de movimiento  
L d L
=
qi dt qi
5.3. TEOREMA DE NOETHER PARA SISTEMAS DISCRETOS 81

se obtiene: " #
X  d  L  L d  L X L d d
+ qi + t + L qi t = (q, t) (5.33)
dt qi qi dt t qi dt dt
i i

el primer y tercer terminos a la izquierda de (5.33) se pueden escribir en la forma


(  ) X
X  d  L  L d  d X L

L L d
 X 
d L

+ qi = + qi qi qi (5.34)
dt qi qi dt dt qi qi qi dt dt qi
i i i i
" # (" # ) !
X L d d X L dL d X L
L qi t = L qi t t + t qi (5.35)
qi dt dt qi dt dt qi
i i i

reemplazando (5.34) y (5.35) en (5.33) se obtiene


(   ) X   
d X L L L d X d L L
+ qi qi qi + t +
dt qi qi qi dt dt qi t
i i i
(" # ) !
d X L dL d X L d
+ L qi t t + t qi + (q, t) = 0
dt qi dt dt qi dt
i i

organizando los terminos que aparecen bajo la derivada temporal total resulta

( ! )
d X L X L X  L  d X 
d L

2 qi +
L qi t + (q, t) qi qi +
dt qi qi qi dt dt qi
i i i i
!
L dL d X L
+ t t + t qi = 0
t dt dt qi
i

simplificando terminos
( ! ) (   )
d X L X L d X L
2 qi + L qi t + (q, t) qi +
dt qi qi dt qi
i i i
" !#
L dL d X L
+ + qi t = 0
t dt dt qi
i

de nuevo agrupamos los terminos con derivada temporal total


( ! ) " ! #
d X L X L L d X L dL
qi + L qi t + (q, t) + + qi t = 0 (5.36)
dt qi qi t dt qi dt
i i i

usando regla de la cadena para dL/dt y las ecuaciones de Lagrange, evaluamos el termino proporcional a t
! !
L d X L dL L d X L X L X L L
+ qi = + qi qi qi
t dt qi dt t dt qi qi qi t
i i i i
X d L   X L X L X L
= qi + qi qi qi
dt qi qi qi qi
i i i i
X L X L X L X L
= qi + qi qi qi = 0
qi qi qi qi
i i i i

por tanto la ecuaci


on (5.36) se reduce a:
82CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS EN EL FORMALISMO DE LAGRANGE

( ! )
d X L X L
qi + L qi t + (q, t) =0
dt qi qi
i i
es decir que la cantidad !
X L X L
qi + L qi t + (q, t) = cte (5.37)
qi qi
i i
es una constante de movimiento o cantidad conservada (integral de movimiento). En sntesis, si para una
transformaci on especfica de coordenadas de la forma (5.21), existe un valor de (q, t) que satisfaga la Ec.
(5.31), dicho valor de nos conducir a a una constante de movimiento de la forma (5.37). Recordemos que la
condicion (5.31) equivale a la invarianza de las ecuaciones de movimiento ante la transformaci on (5.21).

5.3.1. Comentarios sobre el teorema de Noether


1. Es importante enfatizar en que dicho teorema solo es v
alido para transformaciones contnuas del espacio
tiempo, ya que en la demostraci
on es fundamental el uso de transformaciones infinitesimales.
2. Aunque (q, t) es una funci
on arbitraria, esta debe ser derivable hasta segundo orden en todas sus varia-
bles y esta segunda derivada debe ser contnua. Ya que en una parte de la demostracion se intercambian
las segundas derivadas.
3. El teorema implica la invarianza de la acci
on (i.e. de las ecuaciones de movimiento). Sin embargo, no
implica la invarianza del lagrangiano mismo, esta solo se cumple si d () /dt = 0, d (t) /dt = 0.
4. En teora de campos (ver secci on 17.3) se puede hacer una demostraci on similar con las siguientes
correspondencias: q (q) , q (q) , L L donde (q) representa los campos (un arreglo
vectorial de ellos), (q) representa sus derivadas con respecto al espacio y el tiempo, y L representa
una densidad Lagrangiana con Z
L L d3 q,

5. A pesar de que la funcion actua como un gauge para el Lagrangiano, vemos que la cantidad conser-
vada depende del cambio de esta funcion evaluado entre los dos sistemas coordenados. Esto es l ogico
ya que surge de manera natural a partir de la transformaci on de coordenadas que se hizo. En realidad
esta cantidad se debe fijar a traves de la Ec. (5.31) con el fin de que la transformaci
on en cuesti
on deje
invariantes a las ecuaciones de movimiento.
6. N
otese que la soluci
on para en la Ec. (5.31), no tiene porque ser u
nica. Por otro lado, puede ocurrir que
no exista soluci
on, en este caso la transformacion de coordenadas no es una transformaci on de simetra
del sistema y no tendramos una cantidad conservada.
7. Es necesario ditinguir entre la transformacion de coordenadas [t, q] [t , q ] y la transformaci
on gauge

L = L + d/dt. N otese que esta ultima solo es v
alida en un sistema coordenado fijo.
8. En esta demostraci
on se ha supuesto que el Lagrangiano depende de q, q y t. No se habla sobre Lagran-
gianos con dependencia de las derivadas de orden superior.
9. El teorema implica que las simetras del sistema deben reflejarse en su acci
on S.
10. Una estrategia muy fructfera para el uso del teorema de Noether es la siguiente: para una transformaci
on
de coordenadas especfica, buscamos las condiciones requeridas para que la Ec. (5.31) tenga soluci on,
con la soluci on as obtenida vamos a la Ec. (5.37) para encontrar la constante de movimiento que se
genera. Las condiciones que se necesiten para que (5.31) tenga soluci on, ser
an entonces las condiciones
fsicas que debe tener mi sistema para que la transformaci
on de coordenadas sea una transformaci on de
simetra para mi sistema, y por ende para que la cantidad generada en (5.37) sea realmente conservada.
DEL TEOREMA DE NOETHER
5.4. EJEMPLOS DE APLICACION 83

5.4. Ejemplos de aplicaci


on del teorema de Noether
5.4.1. Invarianza ante traslaci
on temporal y conservaci
on de la energa
Supongamos que las ecuaciones de movimiento de un sistema fsico son invariantes ante una translaci
on
temporal. Que condici
on debe satisfacer el Lagrangiano y cual es la cantidad conservada?.
Una traslaci
on temporal se puede escribir como: q = q = 0, t (t) = = cte. De la ecuaci
on (5.31)
resulta:

" #
L X L d d
+ L qi = (q, t)
t qi dt dt
i
L d
= (q, t) (5.38)
t dt
si L no depende explcitamente del tiempo entonces = cte y adem as el Lagrangiano mismo es invariante
ante la transformaci
on en cuesti
on. Por tanto, la cantidad conservada dada por la Ec. (5.37) sera
!
X L X L
qi + L qi + = cte
qi qi
i i

teniendo en cuenta que qi = 0 y como y son constantes resulta:


! !
X L X
h (qi , qi , t) qi L = pi qi L H = cte
qi
i i

es decir, la funcion energa del sistema (Funcion Hamiltoniana), es la constante de movimiento. Cuando el
Hamiltoniano corresponde a la energa del sistema llegamos a la conservaci on de la energa. Vale decir que de
acuerdo con nuestras condiciones, la energa se conserva incluso para algunos sistemas no aislados, pues si los
campos externos son independientes del tiempo, el Lagrangiano no depender a del tiempo que es la condici on
requerida para llegar a la conservaci on de esta cantidad (adem as de las condiciones para que el Hamiltoniano
sea la energa del sistema).
En la discusion anterior asumimos que el Lagrangiano no depende explcitamente del tiempo, con lo cual
el Lagrangiano mismo permanece invariante ante la traslaci on temporal. Vale la pena preguntarse si podemos
encontrar una condici on mas general en la cual las ecuaciones de movimiento permanezcan invariantes ante
dicha transformaci on, pero no necesariamente el Lagrangiano mismo. Asumamos en consecuencia que el La-
grangiano puede depender explcitamente del tiempo, dado que L = T V , usualmente la energa cinetica
no depende explcitamente del tiempo (a menos que la transformaci on a coordenadas generalizadas dependa
explcitamente del tiempo), si asumimos que en cambio la energa potencial es dependiente del tiempo, la Ec.
(5.38) queda

V 1 d
=
t dt
en general no es posible encontrar un que satisfaga esta ecuaci on, ya que V
t no tiene que ser una derivada
total. Efectivamente en este caso la funcion energa no es constante de movimiento y no hay garanta de que
se pueda encontrar alguna funci on que s sea constante de movimiento.
En las tres secciones siguientes asumiremos que la funci on Lagrangiana del sistema en coordenadas carte-
sianas est
a dada por
1
L = mr2 V (r) (5.39)
2
y encontraremos las condiciones para que las traslaciones espaciales, las rotaciones y las transformaciones de
Galileo sean transformaciones de simetra del sistema. As mismo encontraremos las cantidades conservadas
asociadas a cada simetra y veremos que los resultados son consistentes con los ya obtenidos.
84CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS EN EL FORMALISMO DE LAGRANGE

5.4.2. Invarianza ante traslaci


on espacial y conservaci
on del momento lineal
Por simplicidad asumamos que solo hay traslaci
on a lo largo del eje x3 . Las transformaciones correspon-
dientes a traslaciones espaciales son:
x1 = x2 = 0 , x3 = cte , t = 0 (5.40)
Para t = 0 la Ec. (5.31) se reduce a:
X  L L d

d
+ xi = (x, t) (5.41)
xi x i dt dt
i

si existe un que cumpla esta condici


on se tiene de (5.37) que:
X L
xi + (q, t) = cte (5.42)
x i
i
para la forma de nuestro Lagrangiano Ec. (5.39) se tiene que
L V L
= ; = mx i (5.43)
xi xi x i
esto es v
alido para la invarianza traslacional, rotacional y galileana ya que hasta ahora solo hemos usado
t = 0. En el caso de la invarianza traslacional, usando (5.41), (5.40) y (5.43), se tiene:
X V d
xi = (x, t)
xi dt
i
V X 

x3 = (x, t) x i (x, t)
x3 xi t
i
X  
V
(x, t) x i = x3 (x, t) (5.44)
xi x3 t
i

claramente, la expresi
on de la derecha no contiene a los x i , por lo tanto los coeficientes de la izquierda tampoco
pueden contenerlos i.e.

(x, t) = 0 (x, t) = (t)
xi
de modo que la condici on (5.44) se reduce a:

V d
x3 = (t)
x3 dt
debido a la forma de nuestro Lagrangiano, el potencial V solo es funci on de la posici
on de modo que a la
izquierda tenemos un termino que solo depende de la posicion y a la derecha otro que solo depende del tiempo,
V
de lo cual se sigue que x 3
debe ser independiente de (x,t), es decir es constante. Integrando4 :
 
V
x3 t = (5.45)
x3
con este valor de las ecuaciones de movimiento son invariantes en forma ante una transformaci
on espacial
de x3 . Es decir, que cuando se cumple (5.45), la traslaci
on espacial es una transformaci
on de simetra, la
constante de movimiento se sigue de (5.42)
L
x3 + (t) = cte
x 3
 
V
mx 3 + t = cte
x3
4
Una posible constante de integraci
on se puede absorber en .
DEL TEOREMA DE NOETHER
5.4. EJEMPLOS DE APLICACION 85

V
recordando que la fuerza se escribe como Fi = x i
. tendremos en general que

mx 3 F3 t = cte

ahora bien, si tenemos una invarianza similar asocida a x1 y x2 , la cantidad conservada es:
e = p Ft = mr Ft = cte
P (5.46)

es decir que el momento lineal p, es una funci on lineal del tiempo. Recordemos que bajo las condiciones
aqu establecidas, las componentes de la fuerza deben ser constantes de modo que F es un campo de fuerzas
constante y homogeneo.
V
Volviendo a la invarianza en solo x3 , si en particular suponemos que x 3
= F3 = 0. Se sigue que la
cantidad conservada es justamente la componente del momento en esa direcci on.
L
= mx 3 = p3 = cte. (5.47)
x 3
adicionalmente, se puede ver de (5.45) que cuando F3 = 0, = 0 y el Lagrangiano como tal es invariante.
Por supuesto, la invarianza del vector momento se seguir a si cada componente de la fuerza se anula.
Por tanto, vemos que el principio de conservaci on del momento se sigue de la invarianza del Lagrangiano
ante una traslacion espacial, pero no de la invarianza de las ecuaciones de movimiento. Cuando solo esta u ltima
se cumple para todas las coordenadas, F es un campo de fuerzas constante y homogeneo.
La existencia de un campo constante y homogeneo ilustra la diferencia entre homogeneidad local y homo-
geneidad global del espacio. El espacio que ocupa el campo es localmente homogeneo, porque ning un punto de
dicho espacio se puede distinguir de otro por una medici on local (en nuestro caso, se obtendra el mismo valor
de la fuerza en cada punto). Sin embargo, esta fuerza tiene que ser generada por alguna fuente (las placas de
un condensador, una masa distante etc.) la existencia de dicha fuente destruye la homogeneidad global del
espacio. Por tanto, la homogeneidad local del espacio implica que el momento es una funci on lineal del tiempo
en tanto que la homogeneidad global implica su conservaci on.

5.4.3. Invarianza ante rotaciones espaciales y la conservaci


on del momento angular
Por simplicidad, supondremos que la rotaci
on se realiza en el plano X Y, las transformaciones correspon-
dientes son:     
cos sin x1 x1
=
sin cos x2 x2
Si consideramos que la rotaci
on est
a descrita por un
angulo infinitesimal constante, la transformaci
on queda:
    
1 x1 x1
=
1 x2 x2

x1 = x1 () x2
x2 = x1 + x2

de modo que

x1 = x1 x1 = () x2
x2 = x2 x2 = () x1
x3 = t = 0 (5.48)

a partir de (5.41) se obtiene:


X  L L d

d
+ xi = (x, t) (5.49)
xi x i dt dt
i
86CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS EN EL FORMALISMO DE LAGRANGE

para la forma de nuestro Lagrangiano se aplican las Ecs. (5.43). Usando (5.43) y (5.48), los miembros de la
izquierda de (5.49) se escriben como
X L  
L L L V V
xi = x1 + x2 + x3 = x2 + x1
xi x1 x2 x3 x1 x2
i

X L d 
L d L d
xi = x1 + x2 = mx 1 () x 2 + mx 2 () x 1 = 0
x i dt x 1 dt x 2 dt
i

aplicando estas relaciones en (5.49)


 
V V d
x2 + x1 = (x, t) (5.50)
x1 x2 dt
d
(r V )3 = (x, t) (5.51)
dt

(r V )3 = x i (x, t) + (x, t) (5.52)
xi t

(r V )3 (x, t) = x i (x, t) (5.53)
t xi
pero dado que los terminos de la izquierda no dependen de x i los coeficientes de x i a la derecha deben anularse
con lo cual xi = 0 i.e. (x, t) = (t). Con lo cual la Ec. (5.53) queda
d
(r V )3 = (t) (5.54)
dt
Por tanto, el miembro de la izquierda depende de coordenadas espaciales y el de la derecha solo del tiempo,
de tal forma que cada miembro debe ser constante, lo cual nos lleva a:

(r V )3 = cte

con lo cual las ecuaciones de Lagrange son invariantes en su forma, este termino corresponde a menos la tercera
componente del torque. Es decir que la invarianza de las ecuaciones de Lagrange ante las rotaciones espaciales
alrededor de un eje, requiere que la componente del torque a lo largo de dicho eje sea uniforme y constante.
Esto es analogo a la condici
on de que la fuerza sea constante y uniforme para que las ecuaciones de Lagrange
sean invariantes ante traslaciones espaciales. Integrando (5.54) obtenemos el valor de (t)

(t) = () (r F)3 t = () ~3 t (5.55)

reemplazando (5.43, 5.48, 5.55) en (5.37), la constante de movimiento queda


L L
x1 + x2 () ~3 t = cte
x 1 x 2
mx 1 () x2 + mx 2 () x1 () ~3 t = cte
mx 1 x2 + mx 2 x1 ~3 t = cte
(r p)3 ~3 t = cte

si asumimos que hay invarianza ante rotaciones en tres ejes mutuamente perpendiculares, la constante de
movimiento es
L ~3 t = cte (5.56)
que es el an alogo de (5.46) en el caso de invarianza traslacional. En este caso el momento angular es funci
on
lineal del tiempo.
Volviendo a la invarianza ante rotaciones con respecto a x3 , vemos que si la tercera componente del torque
es cero la Ec. (5.54) nos dice que
d
(r V )3 = 0 (x, t) = 0
dt
DEL TEOREMA DE NOETHER
5.4. EJEMPLOS DE APLICACION 87

y es una constante, esto nos lleva a la invarianza del Lagrangiano puesto que se cumplen las condiciones
(5.32). Reemplazando ~3 = 0 en (5.56) la constante de movimiento es
L3 = cte (5.57)
que es el analogo de (5.47) para traslaciones espaciales. Luego la conservaci
on del momento angular total se
sigue de la invarianza del Lagrangiano ante rotaciones en tres ejes independientes.
Notese la analoga con las traslaciones espaciales, la invarianza de las ecuaciones de movimiento ante
traslaciones tena como condicion que las fuerzas fueran constantes y la invarianza del Lagrangiano mismo
nos llevaba a la conservacion del momento lineal. En este caso la invarianza rotacional de las ecuaciones de
movimiento requiere torques constantes y uniformes, y la invarianza del Lagrangiano mismo nos lleva a la
conservacion del momento angular. Es de anotar que en ambos casos cuando las ecuaciones quedan invariantes
pero no el Lagrangiano, las cantidades conservadas no son el momento lineal o el momento angular sino las
cantidades definidas en (5.46, 5.56).

5.4.4. Transformaciones de Galileo


omenos fsicos se ven desde dos sistemas de referencia inerciales S y S , es necesario conciliar
Cuando los fen
las observaciones de cada uno, para lo cual es necesario conocer la forma en que se conectan las coordenadas
cartesianas de espacio y tiempo de los dos sistemas en cuestion. Las transformaciones de Galileo nos proveen
on. Por simplicidad asumiremos que el sistema S viaja con velocidad constante v3 a lo largo del eje
esa conexi
X3 del sistema S, con lo cual las transformaciones de Galileo se escriben en la forma siguiente
x1 = x1 ; x2 = x2 ; x3 = x3 + v3 t ; t = t
x1 = x2 = t = 0 ; x3 = x3 x3 = v3 t
para transformaciones infinitesimales (i.e. velocidades relativas infinitesimales) tenemos:
x3 = x3 + (v3 ) t ; (v3 ) = cte
x1 = x2 = t = 0 ; x3 = (v3 ) t (5.58)
para encontrar la condicion para que esta sea una transformacion de simetra, tomamos de nuevo la Ec. (5.31)
y le aplicamos las Ecs. (5.58) y (5.43)
X  L L d

d
+ xi = (q, t)
xi x i dt dt
i
 
L L d d
+ (v3 ) t = (q, t) (5.59)
x3 x 3 dt dt
  X
V
t + mx 3 (v3 ) = x i (5.60)
x3 xi t
i

escribiendo explcitamente la sumatoria y reorganizando terminos


 
V
(v3 ) t + + m (v3 ) + x 3 + x 1 + x 2 = 0 (5.61)
x3 t x3 x1 x2
en virtud de la independencia de los x i , los coeficientes de x 1 , x 2 , x 3 y los terminos independientes de x i en
(5.61) deben ser nulos, por lo tanto.
V
= =0 ; = m (v3 ) ; t (v3 ) = (5.62)
x1 x2 x3 x3 t
de modo que solo es funci
on de x3 y t. Integrando la segunda de las Ecs. (5.62) resulta
= mx3 (v3 ) + f (t) (5.63)
d
= f (t)
t dt
88CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS EN EL FORMALISMO DE LAGRANGE

y la tercera de las Ecs. (5.62) queda entonces


V d V 1 d
t (v3 ) = f (t) (v3 ) = f (t) (5.64)
x3 dt x3 t dt
1 d V
y como t dt f (t) solo depende del tiempo y x3 (v3 ) solo del espacio, se tiene que
V
= cte
x3
ya que v3 es constante. La condici on Fsica requerida para la existencia de es entonces que la componente
F3 de la fuerza sobre la partcula sea constante y uniforme. Con esta condici on, podemos integrar facilmente
(5.64) y se obtiene
V t2
f (t) = (v3 ) + C (5.65)
x3 2
reemplazando (5.65) en (5.63)  
1 V 2
= mx3 + t (v3 ) + C
2 x3
la constante se puede absorber en la cantidad conservada. Nuevamente usamos (5.37) para encontrar la cantidad
conservada y le aplicamos las Ecs. (5.43, 5.58)
X L
xi + (q, t) = ca
x i
i
L
x3 + (q, t) = ca
x 3
 
1 V 2
mx 3 (v3 ) t + mx3 + t (v3 ) = cb
2 x3
1 V 2
mx 3 t mx3 + t = c1
2 x3
y la cantidad conservada queda finalmente
1
mx 3 t mx3 F3 t2 = c1 (5.66)
2
De nuevo enfatizamos que F3 debe ser constante. Si adicionalmente, L tambien tiene invarianza traslacional
V
x3 = F3 = 0,la cantidad conservada se reduce a:

mx 3 t mx3 = c1
p3
x3 x 3 t = c2 = x3
t
m
el valor de la constante en la u
ltima ecuaci
on se determina f
acilmente haciendo t = 0 y se obtiene
p3
c2 = x3 (0) = x3 t
m
y como F3 = 0, la partcula se mueve con velocidad constante en la direcci on x3 . Recordemos que x 3 se refiere
o v3 se refiere a la velocidad del sistema S con respecto a S.
a la velocidad de la partcula, en tanto que v3

5.5. Ejercicios
1. Sea L (qi , qi , qi ) un Lagrangiano asociado al formalismo de la sacudida (ver secci
on ;;;). Para este
Lagrangiano definamos una coordenada cclica qk como una coordenada que no aparece en el Lagrangiano,
pero aparece qk y/o qk . Defina una cantidad adecuada (un momento can onico extendido asociado a qk )
que sea constante de movimiento cuando qk es cclica. Sugerencia: Observe la ecuaci on de movimiento
(4.48), cuando est a asociada a una coordenada cclica.
Captulo 6

Ecuaciones de Movimiento de Hamilton

La formulacion Hamiltoniana no tiene un contentido Fsico nuevo, y no es particularmente ventajosa para


la soluci
on de problemas concretos en mec anica. El poder de este formalismo consiste en que es f acilmente
extendible a otras
areas de la Fsica, en Mecanica Cl
asica este formalismo permite desarrollos posteriores como
son la teora de Hamilton Jacobi, la teora de perturbaciones y el caos. Asumiremos ligaduras hol onomas y
sistemas monogenicos.

6.1. Consideraciones generales


Dado que las ecuaciones de Lagrange constituyen un conjunto de n ecuaciones diferenciales de segundo
orden, 2n constantes de movimiento se requieren para su completa soluci on, ellas pueden ser por ejemplo los
valores de las coordenadas y velocidades generalizadas en un cierto tiempo, o el valor de las coordenadas en dos
tiempos distintos. La dinamica del sistema se puede describir con una trayectoria en el espacio n dimensional
de configuraciones, donde el tiempo act ua como un parametro que traza la curva. En este formalismo, cada
ecuacion involucra una de las n coordenadas y su correspondiente velocidad generalizada. En su forma m as
simple, las ecuaciones requeran que las n coordenadas sean independientes. Para el formalismo Hamiltoniano,
la independencia de las n coordenadas es esencial.
La idea fundamental detr as del formalismo Hamiltoniano, es la de convertir las n ecuaciones de segundo
orden, en 2n ecuaciones de primer orden. Naturalmente, el n umero de ecuaciones diferenciales debe duplicarse
puesto que las ecuaciones de primer orden solo requieren una condici on inicial y el numero de condiciones
iniciales totales (2n) debe conservarse. Las 2n ecuaciones diferenciales parciales deben escribirse en terminos
de 2n variables independientes. De esta forma, la descripcion de la din
amica del sistema se har a ahora en un
sistema coordenado 2n dimensional (espacio de fase) cuyas coordenadas ser an las 2n variables independientes.
Es natural aunque no obligatorio, pensar que las primeras n coordenadas ser an las coordenadas generalizadas
qk , veremos adicionalmente que las ecuaciones de movimiento quedan altamente simetricas si se eligen como
las otras n coordenadas los momentos can onicamente conjugados definidos a traves de la ecuacion (5.1).

L (q, q, t)
pj (6.1)
qj

a las cantidades (q, p) se les conoce como variables can onicas. La conjugaci on de ecuaciones de primer orden
y variables q, p resulta particularmente motivante, puesto que ya se discuti o que muchas primeras integrales de
movimiento conducen a cantidades conservadas, esto implica que al ser las ecuaciones de Hamilton de primer
orden tales primeras integrales deben aparecer de manera m as directa1 . Adem as si una variable qi es cclica, su
momento conservado es constante y dado que los momentos son parte del conjunto de variables independientes,
estas constantes aparecen de manera m as directa en el formalismo.
1
Al ser las ecuaciones de Lagrange de segundo orden, se requiere realizar un proceso de integraci
on para llegar a primeras
integrales, las cuales son de primer orden.

89
90 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

En realidad en las Ecuaciones de Lagrange las variables q, q fueron tratadas todas como independientes,
pero cada ecuacion involucraba a q y q. Dado que ahora queremos escribir un formalismo en terminos de las
variables qk , pk , t, debemos realizar un cambio de variables del conjunto (qk , qk , t) al conjunto (qk , pk , t). Por
simplicidad consideremos primero un Lagrangiano que depende de una sola coordenada generalizada y una
sola velocidad generalizada L (q, q). Un diferencial de esta funci
on se escribe como
L L
dL = u dq + v dq ; u ; v
q q
donde u y v son funciones de q y q. Para poder escribir con base en esto una funci
on H (q, p), requerimos
escribir un diferencial de esta funci
on en la forma
H H
dH = u dq + v dp ; u ; v
q p
donde u , v son funciones de q y p. El procedimiento matem
atico para realizar la transformaci
on de la funci
on
L (Lagrangiano) a la funci on H (Hamiltoniano), se denomina una transformaci on de Legendre.

6.2. Transformaciones de Legendre


Escribiremos el problema en una notaci
on mas general. Sea f (x, y) de modo que el diferencial de f se
escribe como
f f
df = u dx + v dy ; u ; v (6.2)
x y
queremos cambiar la base de variables de (x, y) a (u, y). Por tanto un diferencial de una funcion g (u, y) se
escribe en terminos de los diferenciales du y dy. Definamos g como una funci
on de u y de y definida por

g = f ux (6.3)

escribamos el diferencial de g

dg = df u dx x du = u dx + v dy u dx x du
dg = v dy x du

este diferencial tiene entonces la forma deseada. Las variables x y v son ahora funciones de u y y de la forma
g g
x= ; v=
u y
que son los analogos de (6.2). Un ejemplo de uso frecuente de la transformaci
on de Legendre en Fsica aparece
en la termodin amica. Para un gas experimentando un proceso reversible, se puede demostrar que el cambio
diferencial de energa dU se puede escribir como
U U
dU = T dS P dV ; T = ; P =
S V
siendo T, S, P, V la temperatura, la entropa, la presion y el volumen respectivamente. A partir de la funcion
energa interna U (S, V ) se puede generar la entalpa H (S, P ), a traves de una transformaci
on de Legendre

H = U + P V dH = dU + P dV + V dP = T dS P dV + P dV + V dP
H H
dH = T dS + V dP ; T = ; V =
S P
las energas libres de Helmholtz y de Gibbs, est
an dadas por otras transformaciones de Legendre

F U TS ; G H TS
DEL HAMILTONIANO Y ECUACIONES DE HAMILTON
6.3. GENERACION 91

6.3. Generaci
on del Hamiltoniano y Ecuaciones de Hamilton
La unica diferencia importante entre las transformaciones de Legendre arriba descritas y las requeridas
para generar una funcion de (qk , pk , t), con base en una funci
on de (qk , qk , t), es que en el u
ltimo caso un
n
umero n de variables debe ser transformado. Comencemos por escribir el diferencial total de L
L L L
dL = dqk + dqk + dt (6.4)
qk qk t
donde emplearemos de aqu en adelante, convenci on de suma sobre ndices repetidos. De las ecuaciones de
Lagrange y la definici
on de momento conjugado se tiene
 
d L L
p k = = (6.5)
dt qk qk
de modo que (6.4) se escribe como
L
dt
dL = p k dqk + pk dqk + (6.6)
t
La funci
on Hamiltoniana o Hamiltoniano se genera por medio de la siguiente transformaci
on de Legendre

H (q, p, t) qk pk L (q, q,
t) (6.7)

la forma diferencial de H se obtiene de su definici


on (6.7) y de la forma diferencial del Lagrangiano (6.6)

dH = pk dqk + qk dpk dL
L
dH = pk dqk + qk dpk p k dqk pk dqk dt
t
L
dH = qk dpk p k dqk dt (6.8)
t
y el diferencial adquiere la forma deseada, puesto que el diferencial dqk ha sido removido por la transformaci
on
de Legendre. El diferencial de H tambien se puede escribir de la forma
H H H
dH = dqk + dpk + dt (6.9)
qk pk t
comparando (6.8) con (6.9) teniendo en cuenta que todas las variables q, p son independientes entre s, se
obtiene un conjunto de 2n + 1 ecuaciones
H
qk = ; k = 1, . . . , n
pk
H
p k = ; k = 1, . . . , n (6.10)
qk
L H
= (6.11)
t t
Las Ecs. (6.10), son conocidas como ecuaciones de movimiento de Hamilton, y constituyen el conjunto de
2n ecuaciones de primer orden que se buscaba. El primer conjunto de ecuaciones se puede considerar como el
inverso de las Ecs. (6.1) que definen al momento conjugado, con lo cual se puede pensar que no dan ninguna
informacion nueva. Esto es cierto desde el punto de vista de la resoluci on de problemas, pero dentro del
formalismo ambos conjuntos de ecuaciones tienen gran significado si el Hamiltoniano puede ser conocido de
alguna manera.
Como se puede ver comparando (5.13) con (6.7), la funci on energa h y el hamiltoniano H son numerica-
mente identicos, pero se usa un smbolo diferente para cada una puesto que h es funci on de q,q,t
en tanto que
el Hamiltoniano debe ser funcion exclusiva de q,p,t. El procedimiento para utilizar las ecuaciones de Hamilton
se ve mas bien laborioso ya que comprende las siguientes etapas
92 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

1. Con un conjunto de coordenadas generalizadas independientes se construye el Lagrangiano L (q, q,


t) =
T V
2. Se definen los momentos conjugados a traves de (6.1) como funciones de q,q,t

3. Se usa (6.7) para construir el Hamiltoniano. Sin embargo, la Ec. (6.7) deja al Hamiltoniano como funci
on
mixta de q, q,
p, t
4. Las ecuaciones (6.1) se invierten para obtener q en funci
on de q, p, t. Este proceso de inversi
on presenta
varias dificultades que veremos mas adelante.
5. Los resultados anteriores se aplican para eliminar las q de H con el fin de expresar esta funci
on u
nicamente
en terminos de q, p, t

6.4. Algoritmo matricial para la obtenci


on del Hamiltoniano
Afortunadamente, en mucho casos reales es posible abreviar los pasos descritos en la secci
on anterior, gracias
a la caracterstica ya mencionada para muchos Lagrangianos de ser separables en tres terminos homogeneos
de orden cero, uno y dos en las q (ver Ec. 5.15). Recordando que h es numericamente igual a H, retomaremos
el an
alisis realizado en la secci
on (5.2), de modo que la Ec. (5.15) conduce a (5.17)
h = H = L2 L0 (6.12)
si adem
as las transformaciones que llevan a las coordenadas generalizadas no dependen explcitamente del
tiempo, y las fuerzas derivan de un potencial que no depende de las q,
el Hamiltoniano ser
a la energa total
H =T +V (6.13)
Ahora haremos una suposicion un tanto mas restrictiva (pero suficientemente general) que la que se asume en
(5.15). Asumiremos que el Lagrangiano tiene la estructura
1
L = L0 (q, t) + qi ai (q, t) + qi qk Tik (q, t) (6.14)
2
En tal caso, el Hamiltoniano H viene dado por la siguiente prescripci on
1
H = pn qn L0 (q, t) qi ai (q, t) qi qk Tik (q, t) (6.15)
2
si se cumple cualquiera de las relaciones (6.12, 6.13, 6.15), los pasos 3 y 4 arriba indicados se abreviaran. En
particular, bajo la suposici
on (6.15), los pasos del 2 al 5 se pueden realizar de una vez al menos formalmente.
Para ello escribiremos (6.14) en forma matricial

L (q, q, e + 1 qT
t) = L0 (q, t) + qa e q (6.16)
2
donde q, a son matrices columna (no vectores Euclidianos!), T es una matriz n n, que sin perdida de
generalidad se puede tomar como simetrica2 y q e es la traspuesta de q. Los elementos de las matrices son en
general funciones de q y t. La transformaci on de Legendre que define al Hamiltoniano Ec. (6.15), se puede
escribir matricialmente como
 
e e e 1e
H = qp L = qp L0 (q, t) + qa + qT q
2
H = q e (p a) 1 qTe q L0 (q, t) (6.17)
2
2
Un termino cuadr
atico en q tpico del Lagrangiano es de la forma M12 q1 q2 . En la suma sobre ndices de qi Tij qj aparecen dos
terminos relacionados con este coeficiente de modo que M12 q1 q2 = (q1 T12 q2 + q2 T21 q1 ) /2 (teniendo en cuenta el factor 1/2 en la
Ec. 6.16). Esto implica que la u
nica restriccion sobre T es que M12 = (T12 + T21 )/2 . En consecuencia, los elementos de la matriz
se pueden definir de muchas maneras, en particular podemos elegir T12 = T21 = M12 , y lo mismo para los otros coeficientes, en
cuyo caso la matriz ser
a simetrica.
DEL HAMILTONIANO
6.4. ALGORITMO MATRICIAL PARA LA OBTENCION 93

derivando (6.14) se obtienen los momentos conjugados


 
L 1
pn = = L0 (q, t) + qi ai (q, t) + qi qk Tik (q, t)
qn qn 2
1 1
pn = an (q, t) + qk Tnk (q, t) + qi Tin (q, t)
2 2
teniendo en cuenta que la matriz T se eligi
o como simetrica y que los ndices k, i son mudos, se obtiene

pn = an (q, t) + Tnk qk

de modo que los momentos conjugados escritos en forma de matriz columna p est
an dados por

p = Tq + a p a = Tq

invirtiendo esta ecuaci


on
q = T1 (p a) (6.18)
este paso presupone que existe el inverso de T, lo cual usualmente est
a garantizado por la positividad de la
3
energa cinetica . Transponiendo la ecuaci
on anterior se cumple
e (e
q= e) T1
pa (6.19)

donde hemos usado el hecho de que T1 tambien es simetrica. Observese que las expresiones (6.18, 6.19)
permiten reemplazar las q en terminos de los p, q, t ya que a y T solo son funciones de q, t. Es decir hemos
logrado el proceso descrito en el paso 4 de invertir las ecuaciones (6.1). Reemplazando (6.18, 6.19) en el
Hamiltoniano (6.17)
  1   
H = (e
pa e) T1 (p a) pe
(e a) T1 T T1 (p a) L0 (q, t)
2
1 1
pe
H = (e a) T (p a) (e pe a) T1 (p a) L0 (q, t)
2
1
H = pe
(e a) T1 (p a) L0 (q, t) (6.20)
2
Por lo tanto, si el Lagrangiano se puede escribir en la forma (6.16), el Hamiltoniano se escribe directamente
en la forma (6.20). En el caso mas usual, la matriz T es diagonal, en cuyo caso el inverso es tambien diagonal
donde T1 ii = Tii1 .

6.4.1. Hamiltoniano para un cuerpo sometido a una fuerza central en coordenadas esf
eri-
cas
A manera de ejemplo, consideremos el movimiento de un cuerpo bajo una fuerza central en coordenadas
esfericas, calculemos primero la energa cinetica
1 
T = m x 2 + y 2 + z 2
2
para las coordenadas esfericas tenemos

x = r sin cos ; y = r sin sin ; z = r cos


x = r sin cos + r cos cos r sin sin
y = r sin sin + r cos sin + r sin cos
z = r cos r sin
3
Tecnicamente, la matriz T es simetrica real y definida positiva. Esto implica que sus valores propios y su determinante son
estrictamente positivos con lo cual la matriz es invertible (ver secci
on 11.11).
94 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

 2
v 2 = x 2 + y 2 + z 2 = r sin cos + r cos cos r sin sin
 2
+ r sin sin + r cos sin + r sin cos
 2
+ r cos r sin

v 2 = r 2 sin2 cos2 + r 2 2 cos2 cos2 + r 2 2 sin2 sin2


+2rr sin cos cos cos 2rr sin cos sin sin
2r 2 cos cos sin sin
+r 2 sin2 sin2 + r 2 2 cos2 sin2 + r 2 2 sin2 cos2
sin sin cos sin + 2rr
+2rr sin sin sin cos
+2r 2 cos sin sin cos
+r 2 cos2 + r 2 2 sin2 2rr
cos sin

reorganizando los terminos cuadr


aticos y cruzados se obtiene

v 2 = r 2 sin2 cos2 + r 2 sin2 sin2 + r 2 cos2


+r 2 2 cos2 cos2 + r 2 2 cos2 sin2 + r 2 2 sin2
+r 2 2 sin2 sin2 + r 2 2 sin2 cos2
sin cos cos cos + 2rr
+2rr sin sin cos sin 2rr
cos sin
sin cos sin sin + 2rr
2rr sin sin sin cos
2r 2 cos cos sin sin + 2r 2 cos sin sin cos


v 2 = r 2 sin2 cos2 + sin2 + r 2 cos2

+r 2 2 cos2 cos2 + sin2 + r 2 2 sin2

+r 2 2 sin2 sin2 + cos2
+2rr sin cos (cos cos + sin sin ) 2rr
cos sin

 
v 2 = r 2 sin2 + cos2 + r 2 2 cos2 + sin2
+r 2 2 sin2 + 2rr
sin cos 2rr
cos sin

y la energa cinetica final es


1 1 h i
mv 2 = m r 2 + r 2 2 + r 2 2 sin2
2 2
la energa potencial se escribe V (r) de modo que el Lagrangiano tiene la forma
m 2 
L=T V = r + r 2 sin2 2 + r 2 2 V (r)
2
este Lagrangiano se puede descomponer en la forma L = L0 + L1 + L2 , adicionalmente la transformaci on de
coordenadas cartesianas a esfericas no depende explcitamente del tiempo y el potencial no dependede las 
q ni
del tiempo, por tanto el Hamiltoniano es la energa total, y adem
as se conserva. Claramente T = T2 r, =
,
L2 y V (r) = L0 por lo tanto el Hamiltoniano tiene la forma (6.12). En arreglo matricial este Lagrangiano se
escribe
 0  m 0 0 r
1
L = V (r) + r 0 + r 0 mr 2 sin2 0
2
0 0 0 mr 2
DEL HAMILTONIANO
6.4. ALGORITMO MATRICIAL PARA LA OBTENCION 95

comparando con (6.16) resulta


1
0 m 0 0 m 0 0
1
L0 = V ; a = 0 ; T = 0 mr 2 sin2 0 ; T1 = 0 mr 2 sin2
0
0 0 0 mr 2 0 0 1
mr 2

reemplazando estas expresiones en (6.20)


1
 m 0 0 pr
1 1 0 1 p + V (r)
H= pe T1 p + V (r) = pr p p mr 2 sin2
0
2 2 1
0 0 mr 2
p

!
1 p2 p2
H= p2r + 2 2 + 2 + V (r)
2m r sin r

si reescribimos el problema en coordenadas cartesianas, el Hamiltoniano tiene otra forma funcional

m pi pi
T = x i x i H (xi , pi ) = + V ( xi xi )
2 2m

escribiendo los momentos conjugados pi en un arreglo en forma de matriz columna queda

pp
H (xi , pi ) = + V ( xi xi )
2m

las componentes de p se pueden tomar relativos a cualquier sistema coordenado que deseemos. Pero es impor-
tante no confundir pk con la componente kesima de p. Por ejemplo p 6= (p) , el primero tiene dimensiones
de momento angular y el segundo tiene dimensiones de momento lineal. De aqu en adelante, cuando se use
un vector para representar a un momento conjugado, se referir a a momentos conjugados a coordenadas car-
tesianas de posici
on, a menos que se indique lo contrario (recordemos que en general las nuplas de pk no
forman vectores euclidianos al igual que en el caso de las qk ).

6.4.2. Hamiltoniano de una carga no relativista inmersa en un campo electromagn


etico
Como un segundo ejemplo consideremos una carga no relativista inmersa en un campo electromagnetico,
el Lagrangiano se escribe

1 1 
L = mv 2 q + qA v = m x 2 + y 2 + z 2 + qAx x + qAy y + qAz z q
2 2
 m 0 0 x  Ax
1
= x y z 0 m 0 y + L0 + q x y z Ay
2
0 0 m z Az

de nuevo comparando con (6.16) resulta




qAx m 0 0
L0 = q ; a = qAy ; T = 0 m 0 = m1
qAz 0 0 m

px qAx 1/m 0 0
1
p a = py qAy ; T1 = 0 1/m 0 =
m
pz qAz 0 0 1/m
96 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

y reemplazando en (6.20)
1
H = (e a) T1 (p a) L0
pe
2
 1 px qAx
1 py qAy + q
= px qAx py qAy pz qAz
2 m
pz qAz
1
H = (pi qAi ) (pi qAi ) + q
2m
1
H = (p qA)2 + q
2m
donde el momento conjugado p ya haba sido calculado en la secci
on (5.1), Ec. (5.2)

pi = mx i + qAi

de modo que el Hamiltoniano queda


mx 2
H= + q
2
notese que en este caso el potencial tiene un termino lineal en las velocidades de modo que el Hamiltoniano no
corresponde a T + U . Sin embargo, en este caso particular el Hamiltoniano a un corresponde a la energa total,
ya que el termino magnetico, que es el que rompe la condici on para que H = T + U , no produce trabajo4 y
la energa potencial (entendida como la capacidad para realizar trabajo) depende solo de . De lo anterior se
deduce que la condici on H = T + U es suficiente pero no necesaria para que H sea la energa del sistema.

6.5. Forma Simpl


ectica de las Ecuaciones de Hamilton
Las ecuaciones de Hamilton son muy simetricas excepto por un signo relativo. Una estrategia muy fructfera
para llegar a ecuaciones mas simetricas es el uso de las ecuaciones de Hamilton en notaci
on simplectica. Para
un sistema con n grados de libertad, construmos una matriz columna con 2n elementos y definida por

i = qi , i+n = pi ; i n (6.21)

similarmente la matriz columna H


tiene elementos
   
H H H H
= ; = ; in (6.22)
i qi i+n pi

finalmente definamos una matriz J de dimension 2n 2n


   
0 1 e 0 1
J ; J (6.23)
1 0 1 0

donde cada elemento representa una submatriz n n. Es f


acil verificar las siguientes propiedades para J
e = JJ
JJ e =1 ; J
e = J = J1
J2 = 1 ; det J = +1 (6.24)

las ecuaciones de Hamilton (6.10) se pueden escribir entonces de forma compacta, as


H
= J (6.25)

4
N
otese que la noci
on de potencial generalizado se cre
o como un artificio para poder absorber en el Lagrangiano la informaci
on
fsica contenida en ciertas fuerzas, pero no como artificio para calcular trabajo que es la forma en que surgen los potenciales que
solo dependen de la posici on y est
an asociados a la energa de la partcula.
6.6. COORDENADAS CICLICAS Y TEOREMAS DE CONSERVACION
97

por ejemplo, para dos coordenadas esto se escribe como



q1 0 0 1 0 H/q1
q2 0 0 0 1 H/q2

p 1 = 1 0 0 0 H/p1
p 2 0 1 0 0 H/p2

q1 0 0 1 0 p 1
q2 0 0 0 1
p 2
p 1 = 1 0 0 0 q1
p 2 0 1 0 0 q2

donde se ha hecho uso de las Ecs. (6.22, 6.10). Esta forma matricial simplectica de las ecuaciones de Hamilton,
sera muy utilizada en lo que sigue. La palabra simplectico significa entrelazado, efectivamente la ecuaciones
de Hamilton entrelazan a q y p y tal entrelazamiento en la parametrizaci on (6.25) se produce gracias a los
elementos fuera de la diagonal de la matriz J en la Ec. (6.23)

6.6. Coordenadas cclicas y teoremas de conservaci


on
En el formalismo Lagrangiano hemos definido una coordenada cclica o ignorable como aquella coordenada
generalizada que no aparece en el Lagrangiano aunque puede aparecer su velocidad generalizada correspon-
diente. Vimos que para este tipo de coordenadas su momento conjugado es una constante de movimiento.
Ahora bien, a partir de las Ecs. (6.5) y (6.10) se deduce

L H
p j = =
qj qj

de aqu se deduce que una coordenada cclica tambien est


a ausente en el Hamiltoniano, esto tambien se puede
ver de la transformaci
on de Legendre que define a H, Ec. (6.7)

L
H pk qk L (q, q,
t) = qk L (q, q,
t)
qk
donde claramente la coordenada cclica no aparece al lado derecho. Recprocamente, si cierta coordenada
est
a ausente de H aunque puede aparecer su momento conjugado, este u ltimo se conserva. Por tanto las
constantes de movimiento asociadas a variables cclicas aparecen de inmediato como se anticip o debido a que las
ecuaciones son de primer orden y que los momentos conjugados se tomaron como coordenadas independientes.
Esto significa que los teoremas de conservaci on que se derivaron en la secci on 5.1 se pueden derivar de la
formulaci
on Hamiltoniana, as como la conecci on entre simetras del sistema y constantes de movimiento. En
particular, la invarianza ante traslaciones del sistema como un todo en cierta direcci on conduce a la conservaci on
de la componente del momento lineal del sistema en esa direcci on, esta coordenada de traslaci on no aparece
en H. La invarianza ante una rotaci on con respecto a cierto eje hace que dicha coordenada generalizada de
rotaci
on (
angulo), no aparezca en el Hamiltoniano y lleva a la conservaci on de la componente del momento
angular total a lo largo del eje de rotacion.
Cuando trabajamos la funci on energa en la seccion 5.2, vimos que si L no es funci on explcita del tiempo,
h es una constante de movimiento. Naturalmente, esto es tambien v alido para H. Con el fin de probar la
consistencia de esta aseveracion llegaremos a la misma conclusi on por otro camino: Tomando la derivada total
de H con respecto al tiempo
dH H H H
= qi + p i +
dt qi pi t
usando las Ecs. de Hamilton (6.10), se eliminan los dos primeros terminos de la derecha, y utilizando (6.11)
resulta
dH H L
= = (6.26)
dt t t
98 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

de aqu resulta que si t no aparece explcitamente en el Lagrangiano (t L = 0) tampoco aparece explcitamente


en el Hamiltoniano (t H = 0) y adem as H sera una constante de movimiento (dH/dt = 0). Recordemos que la
conservacion de h (y H) no significa necesariamente que esta funci on coincida con la energa total del sistema.
Por otro lado, tambien se vi
o en la seccion 5.2 que la funci
on h (y por tanto H) es la energa total del sistema
si se cumplen las siguientes condiciones: (a) El Lagrangiano es expresable en la forma L = L0 + L1 + L2 siendo
cada sumando una funci on homogenea de grado cero uno y dos en las qi (b) las transformaciones que definen las
coordenadas generalizadas Ecs. (2.1) no dependen explcitamente del tiempo, y (c) el potencial es independiente
de las velocidades generalizadas. Si el potencial depende explcitamente del tiempo, entonces la energa del
sistema (el Hamiltonino) no es una constante de movimiento, pero si adem as de las anteriores condiciones
ocurre que el potencial no depende explcitamente del tiempo, la energa del sistema (el Hamiltoniano) es una
constante de movimiento.
La anterior discusi on muestra que la identificaci on de H como la energa del sistema o como constante
de movimiento son dos cosas aparte aunque no necesariamente excluyentes. Otro aspecto discutido en la
seccion 5.2 es la dependencia tanto funcional como numerica de h con respecto a la escogencia del sistema
de coordenadas generalizadas. Lo mismo ocurre para H, es posible por ejemplo que para una escogencia de
coordenadas H se conserve en tanto que con otra escogencia el nuevo H no se conserve. Por otro lado, es
plausible que el Hamiltoniano en cierto sistema coordenado corresponda a la energa del sistema en tanto que
en otro sistema coordenado no lo sea. Esta es una de las diferencias mas fundamentales entre H y L, ya que
este ultimo cambia en forma funcional pero no en magnitud, cuando se hace un cambio a otras coordenadas
generalizadas.

6.6.1. Hamiltoniano de un sistema masa resorte en diferentes sistemas coordenados

Figura 6.1: Sistema masa resorte donde el resorte se ata a un carro que viaja a velocidad constante.

Veamos un ejemplo un tanto academico que muestra claramente la dependencia del Hamiltoniano con las
coordenadas generalizadas elegidas: Sea una partcula atada a un resorte cuyo extremo est a sujeto a un carro
que se mueve con velocidad constante v0 como muestra la figura 6.1. La masa descansa sobre una superficie
sin rozamiento. Tomemos como coordenada generalizada la posici on x de la partcula en cualquier instante.
Por simplicidad asumimos que en t = 0 el resorte tiene longitud cero y que la masa (y el punto O de uni on
del resorte con el carro) pasan por el origen en ese instante. El Lagrangiano se escribe
mx 2 k
L (x, x,
t) = T V = (v0 t x)2 m
x = k (x v0 t)
2 2
6.6. COORDENADAS CICLICAS Y TEOREMAS DE CONSERVACION
99

una forma de resolver el problema es cambiar a una variable x

x = x v0 t (6.27)

m
x = kx (6.28)

donde x es el desplazamiento de la partcula medido desde el punto O . La Ec. (6.28) nos dice que el sistema
de referencia asociado al carro movil ve un movimiento arm onico simple como se espera del principio de
equivalencia de Galileo.
Veamos ahora la formulaci on Hamiltoniana. En terminos de la variable x vemos que la transformaci on
(identidad) a coordenadas generalizadas no depende explcitamente del tiempo, el Lagrangiano se puede des-
componer en la forma L = L0 + L1 + L2 y adem as el potencial no dependen de la velocidad generalizada x.
Por tanto, el Hamiltoniano es la energa total del sistema y queda

p2 k
H (x, p, t) = T + V = + (x v0 t)2
2m 2
sin embargo H no es una cantidad conservada puesto que depende explcitamente del tiempo. Esto es fsi-
camente entendible ya que una agente externo debe proveer de energa al sistema para que el carro viaje a
velocidad constante en contra de la reacci
on de la partcula.
Ahora formulemos el Lagrangiano haciendo una transformaci on de la coordenada x a la coordenada x Ec.
(6.27). El Lagrangiano queda

dx 2
d 2
m dt k 2 m dt (x + v0 t) k  2
L = (x v0 t) = x + v0 t v0 t
2 2 2 2
 2 2 2
m [x + v0 ] k mx mv0 k
L x , x , t = x2 = + mv0 x + x2 (6.29)
2 2 2 2 2
escribiendo el Lagrangiano de acuerdo con la estructura (6.16) en donde las matrices son 1 1 tenemos
 mv02 k 2 1
L x , x , t = x + mv0 x + x mx
2 2 2
mv02 k 2
L0 = x ; a = mv0 ; T = m (6.30)
2 2
el nuevo Hamiltoniano se obtiene reemplazando (6.30) en (6.20)
 1   1  1  k mv02
H x , p , t = p a T 1 p a L0 = p mv0 p mv0 + x2
2 2 m 2 2
 2 2 2
(p mv0 ) kx mv0
H x , p , t = +
2m 2 2
al escribir el nuevo Hamiltoniano notamos que aparece un termino lineal en x . Adem as la transformaci on
a coordenadas generalizadas depende explcitamente del tiempo seg un se ve en la Ec.(6.27). Esto indica que
H ya no es la energa total del sistema. En cambio, s es una constante de movimiento ya que no depende
explcitamente del tiempo y H /t = dH /dt = 0. Por otro lado, se puede notar que el termino mv02 /2 es
una constante que se puede remover tanto del Lagrangiano como del Hamiltoniano sin afectar las ecuaciones
de movimiento. Finalmente, se puede ver que excepto por tal termino constante H se puede identificar con la
energa total de movimiento de la partcula relativa al carro movil. Ambos Hamiltonianos difieren en magnitud,
forma funcional y dependencia temporal. Sin embargo, se puede verificar que ambos conducen al mismo
movimiento de la partcula.
Con lo anterior podra quedar la sensaci on de que hemos cambiado de sistema de referencia en virtud de
que x es la coordenada que medira el sistema del carro m ovil (lo llamaremos sistema S ) y H sera la energa
total relativa a dicho sistema tambien. No obstante, la coordenada x es medida por el sistema original fijo a
tierra (lo llamaremos S), esto se puede ver en la forma en que se construye el Lagrangiano Ec. (6.29), tanto la
100 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

energa cinetica como la potencial se siguen midiendo con respecto al sistema S aunque se escriban en terminos
de la coordenada x . Efectivamente, ante un cambio de sistema de coordenadas el Lagrangiano preserva su
magnitud (aunque no su forma funcional). En contraste, ante un cambio de sistema de referencia tanto la
magnitud como la forma funcional del Lagrangiano pueden cambiar. El Hamiltoniano H se construy o usando
el Lagrangiano (6.29) de modo que tambien est a asociado al sistema S. Las interpretaciones como coordenada
relativa a S y energa relativa a S son una forma de ver a estas cantidades, pero no han sido construdas en
este sistema de referencia. Nuevamente se insiste en no confundir un cambio de sistema de referencia con un
cambio de sistema de coordenadas generalizadas.

6.7. Procedimiento de Routh


Hemos mencionado que la formulacion Hamiltoniana no es en general adecuada para la soluci
on directa de
problemas mec
anicos. Sin embargo, hay una importante excepcion a este hecho: la formulaci
on Hamiltoniana
es muy adecuada para el tratamiento de problemas que involucran variables cclicas.
Pensemos en un sistema cuyo Lagrangiano se puede escribir como

L (q1 , . . . , qs ; q1 , . . . , qn ; t)
es decir las u
ltimas ns coordenadas son cclicas (naturalmente s < n). Dado que en el formalismo Lagrangiano
todas las velocidades generalizadas aparecen y pueden ser en general funciones del tiempo, el problema tiene
a
un n grados de libertad a pesar de la existencia de las coordenadas cclicas. En contraste, en el formalismo
Hamiltoniano las coordenadas cclicas se vuelven realmente ignorables, ya que los correspondientes momentos
conjugados se vuelven constantes de movimiento que denotaremos por k . El Hamiltoniano se puede escribir
en la forma
H = H (q1 , . . . , qs ; p1 , . . . , ps ; s+1 , . . . , n ; t)
el Hamiltoniano describe un problema de solo s grados de libertad, y las coordenadas cclicas han sido comple-
tamente ignoradas, excepto que se manifiestan como constantes de integraci on k que se determinan con las
condiciones iniciales. El comportamiento de la coordenada cclica como tal se encuentra integrando la siguiente
ecuaci
on de movimiento
H
qn =
n
esto sugiere utilizar un metodo que permita aprovechar las ventajas del formalismo Hamiltoniano con las
coordenadas cclicas junto con el formalismo Lagrangiano para las coordenadas no cclicas. Esto se logra usando
una transformacion matem atica que convierta la base de las q,q en la base q, p solo para las coordenadas cclicas.
De esta forma se obtienen s ecuaciones de Lagrange para las coordenadas no cclicas, y 2 (n s) ecuaciones de
Hamilton para las coordenadas cclicas. Asumiendo que las coordenadas qs+1 , . . . , qn son cclicas, se propone
una nueva funci on R (conocida como el Routhiano) que defina una transformaci on de Legendre parcial en
donde solo se transformen los terminos asociados a las variables cclicas, por tanto R est a definida por
n
X
R (q1 , . . . , qs ; q1 , . . . , qs ; ps+1 , . . . , pn ; t) pi qi L (6.31)
i=s+1

esto equivale a escribir

R (q1 , . . . , qs ; q1 , . . . , qs ; ps+1 , . . . , pn ; t) Hcicl (ps+1 , . . . , pn ; t) Lno cicl (q1 , . . . , qs ; q1 , . . . , qs ; t)


para las s coordenadas no ignorables i.e. k = 1, . . . , s podemos calcular
  " n
! #  
d R d X L d L
= pi qi =
dt qk dt qk qk dt qk
i=s+1
n
!
R X L L
= pi qi =
qk qk qk qk
i=s+1
6.7. PROCEDIMIENTO DE ROUTH 101

y teniendo en cuenta las ecuaciones de Lagrange resulta


 
d R R
= 0, k = 1, . . . , s (6.32)
dt qk qk
en tanto que para las n s coordenadas ignorables i.e. k = s + 1, . . . , n tenemos que
n
!  
R X L L d L
= pi qi = =
qk qk qk qk dt qk
i=s+1
R
= p k = 0
qk
donde hemos tenido en cuenta las ecuaciones de Lagrange (2.23), la definici
on de momento conjugado (5.1),
y el hecho de que los momentos conjugados a variables cclicas son constantes. Por otro lado para k = s +
1, . . . , n tambien tenemos !
Xn
R L
= pi qi = qk
pk pk pk
i=s+1
con lo que queda finalmente
R R
= p k = 0 ; = qk ; k = s + 1, . . . , n (6.33)
qk pk
de modo que se logra el objetivo de tener ecuaciones tipo Lagrange para las variables no cclicas, Ecs. (6.32)
y tipo Hamilton para las variables cclicas Ecs. (6.33). Este metodo se conoce como procedimiento de Routh.
Es necesario escribir el Routhiano con los argumentos dados en la Ec. (6.31).

6.7.1. Partcula sometida a un potencial central atractivo por el m


etodo de Routh
Para ilustrar el metodo tomemos como ejemplo el problema de una partcula sujeta a un potencial central
bajo la influencia de una fuerza atractiva proporcional a r n1 . Este movimiento siempre se realiza en un
plano en virtud de la conservaci
on del momento angular. El Lagrangiano se escribe
m 2  k
L= r + r 2 2 + n
2 r
la coordenada ignorable es y su momento conjugado se denotar a por p . El Routhiano se escribe

m 2  k
R = p L = p r + r 2 2 n (6.34)
2 r
este es el valor del Routhiano que se obtiene por reemplazo directo en (6.31). No obstante, esta expresi on no
est
a escrita con los argumentos adecuados, ya que seg un (6.31) el Routhiano se debe escribir en terminos de
las coordenadas no cclicas (en este caso r), las velocidades generalizadas de las coordenadas no cclicas (r),
los momentos conjugados asociados a las variables cclicas (p ) y el tiempo (que aqu  no aparece),
 es decir
R = R (r, r,
p ). Ahora bien en (6.34) el Routhiano est a escrito en terminos de R = R r, r,
p , , por tanto es
necesario encontrar a = (r, r,
p ) para que el Routhiano quede con los argumentos adecuados. Esta relaci on
la sacamos a partir del momento conjugado p
L p
p = = mr 2 =
mr 2
reemplazando esta expresi
on en el Routhiano queda
 p  m  p 2  k
2 2
R (r, r,
p ) = p 2
r + r 2
n
mr 2 mr r
2  2 
p 1 1 p k
R (r, r,
p ) = 2
mr 2 2
n
mr 2 2 mr r
102 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

p2 1 k
R (r, r,
p ) = mr 2 n
2mr 2 2 r
debemos aplicar la ecuaci
on de Lagrange para la coordenada no cclica r, para lo cual calculamos
 
R d R R p2 nk
= mr ; = m r ; = 3 + n+1
r dt r r mr r

p2 nk
m
r+ 3
n+1 = 0
mr r
p2 nk
r 2 3 + = 0 (6.35)
m r mr n+1
ahora debemos aplicar las ecuaciones de Hamilton a la coordenada cclica y su momento conjugado
R R p
= 0 ; =
p mr 2
p
p = 0 ; = (6.36)
mr 2
cuya soluci
on es
p = mr 2 = l = cte
el formalismo de Routh es frecuentemente u
til para problemas pr
acticos en Fsica y en Ingeniera. Sin embar-
go, como instrumento formal para posteriores construcciones en mec anica clasica, el formalismo puramente
Hamiltoniano es mucho mas fructfero.

6.8. Derivacion de las ecuaciones de Hamilton a partir del principio va-


riacional de Hamilton
La derivaci
on hasta aqu desarrollada de las ecuaciones de Hamilton esta basada en un principio diferencial
que hace uso directo de las Ecuaciones de Lagrange combinado con una transformaci on de Legendre. La
pregunta natural es entonces de que manera pueden surgir estas ecuaciones a partir de un formalismo integral.
Vimos que el formalismo Lagrangiano puede extraerse de una formulaci on integral via principio variacional de
Hamilton. Estos principios variacionales seran u
tiles en contextos mas all
a de la mec
anica. Es natural entonces
tratar de derivar las ecuaciones de Hamilton partiendo del principio variacional de Hamilton como fuente de
una formulacion integral de estas ecuaciones
Z t2
I L dt = 0 (6.37)
t1

En la formulacion Lagrangiana las integrales se eval


uan con base en las trayectorias en el espacio de configura-
ciones (adaptado para la formulaci on Lagrangiana). La filosofa del formalismo Hamiltoniano requiere tratar
a las coordenadas q, p como independientes entre s. Por tanto, el espacio adecuado para trabajar trayectorias
en este formalismo consiste en tener 2n ejes coordenados uno para cada qi y uno para cada pi , un punto en este
espacio (espacio de fase) traza una curva a traves del parametro tiempo. En consecuencia, las integrales deben
ser evaluadas con base en las trayectorias en el espacio de fase. Dado que el conjunto q, p se considera inde-
pendiente, el integrando sera, en general funci
on de q, q,
p, p.
Usando la Ec. (6.7) que define al Hamiltoniano,
en la Ec. (6.37) resulta Z t2
I = [pi qi H (q, p, t)] dt = 0 (6.38)
t1

A la Ec. (6.38) se le suele denominar principio modificado de Hamilton en virtud de que la integral de lnea se
est
a realizando en un espacio diferente (el espacio de fase). Teniendo en cuenta que las tecnicas desarrolladas
DE LAS ECUACIONES DE HAMILTON A PARTIR DEL PRINCIPIO VARIACIONAL DE HA
6.8. DERIVACION

en la secci
on 3.2 son v
alidas para cualquier conjunto de variables y sus derivadas con respecto a un par
ametro
(en nuestro caso el tiempo)5 , tenemos que genericamente nuestro principio variacional se escribe
Z t2
I = f (q, q,
p, p)
dt = 0
t1

de lo cual resultan 2n ecuaciones de Euler Lagrange


 
d f f
= 0 ; j = 1, . . . , n
dt qj qj
 
d f f
= 0 ; j = 1, . . . , n (6.39)
dt pj pj
por tanto, las ecuaciones que se derivan del principio de Hamilton modificado, se obtienen aplicando las
relaciones (6.39) con
f (q, q,
p) = pi qi H (q, p, t) (6.40)
resultando
H H
p j + = 0 ; qj =0
qj pj
De modo que hemos llegado a las ecuaciones de Hamilton a traves del principio variacional modificado de
Hamilton. Se puede argumentar que los momentos no pueden considerarse independientes en virtud de su
definicion (5.1) que nos muestra que p es en general funci on de q y q, con lo cual no se puede variar q
o q,
sin variar p. Recordemos sin embargo, que la filosofa misma del formalismo Hamiltoniano requiere de
considerar a q y p independientes, es decir que una vez establecido el formalismo Hamiltoniano la definici on
(5.1) no constituye parte del formalismo. Los momentos conjugados son elevados a la categora de variables
independientes, con un papel an alogo a las coordenadas y conectados con ellas y con el tiempo solo a traves
de las ecuaciones de movimiento y no a traves de definiciones. Visto desde el punto de vista de un conteo de
grados de libertad, al introducir los momentos olvidando su definici on, estamos aumentando el n umero de
grados de libertad, pero tambien estamos aumentando el n umero de ecuaciones de modo que el n umero de
grados de libertad real se conserva.
Un aspecto similar ocurre en la formulaci on Lagrangiana, estrictamente q y q no son independientes en
virtud de la definici
on q = dq/dt, pero cuando escribimos las ecuaciones de Lagrange olvidamos la definici on
de q y la elevamos al estatus de independiente, la dependencia original se recupera a traves de las n ecuaciones
de movimiento.
Podemos preguntarnos si el principio modificado de Hamilton contiene nueva Fsica respecto al original,
sin embargo este principio fue establecido con el fin de obtener las ecuaciones de Hamilton, al igual que el
principio variacional original fue construdo con el fin de reproducir las ecuaciones de Lagrange. Una vez que
el Hamiltoniano es construdo, la transformaci on de Legendre muestra que las formulaciones de Lagrange y
Hamilton as como los respectivos principios variacionales de donde vienen, contienen todos la misma Fsica.
Vale la pena mirar si las restricciones de punto fijo en el principio de Hamilton sufren alg un cambio en el
principio de Hamilton modificado. Por ejemplo, en el espacio de configuraciones, extremo fijo significa qi = 0
, en tanto que en el espacio de fase significa qi = pi = 0. Para esto nos debemos preguntar si es necesaria la
condici on de extremo fijo en el espacio de fase para llegar a las ecuaciones de Euler Lagrange dadas por (6.39).
Si volvemos a la demostraci on de las ecuaciones de Euler Lagrange en la secci on 3.2, vemos que la condici on de
extremo fijo se requiere para eliminar el primer termino de la derecha en la Ec. (3.22). No obstante, teniendo
en cuenta que nuestro integrando definido por (6.40) no es funci on explcita de p j se observa que la eliminaci
on
del termino ya descrito, es autom atica para las variables pj y no requiere de condici on de punto fijo en estas
variables. Por tanto, el principio de Hamilton modificado conduce a las ecuaciones de Hamilton bajo las mismas
condiciones variacionales que el principio de Hamilton original, es decir bajo la condici on de extremo fijo solo
en las qi .
5
Desde el punto de vista matem atico el espacio de fase es simplemente un espacio de configuraci
on de dimensi
on 2n, ya que lo
que se hace es cartesianizar las variables independientes q y p colocando un eje para cada variable independiente.
104 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

La anterior discusi on muestra que la condici on pj = 0 no es una condicion necesaria pero s sera una
condicion suficiente para llegar a las ecuaciones de Hamilton. Existen en realidad grandes ventajas al imponer
extremos fijos en el espacio de fase, ya que en este caso obtenemos una simetra Gauge para el Hamiltoniano
similar a la que posee el Lagrangiano, es decir se puede adicionar al integrando una funci on de la forma
dF (q, p, t) /dt, siendo F dos veces diferenciable, sin afectar la validez del principio variacional. Como ejemplo
d
sencillo si adicionamos al integrando en la Ec. (6.38) un termino de la forma dt (qi pi ) el principio modificado
de Hamilton quedara
Z t2
[p i qi H (q, p, t)] dt = 0 (6.41)
t1

n otese que ahora el integrando s depende de p j . Por tanto, si queremos que esta nueva expresi on aun nos
conduzca a las ecuaciones de Hamilton, es necesario imponer pj = 0 (con esta nueva expresi on no necesitamos
que qj = 0, pero al hacer la transformaci on inversa y volver al integrando original, se ve que dicha condicion
s es necesaria). De modo que si requerimos una simetra gauge que permita adicionar un termino de la
forma dF (q,p,t)
dt se requiere de condicion de extremo fijo en el espacio de fase6 . El integrando en (6.41) no es el
Lagrangiano ni se puede relacionar f acilmente con el Lagrangiano a traves de una transformaci on puntual. La
condici on de extremo fijo en el espacio de fase provee un metodo para llegar a la formulacion Hamiltoniana sin
pasar por una formulaci on Lagrangiana. Esto elimina la necesidad de ligar las q, q de un Lagrangiano, con las
q, p de un Hamiltoniano. Esto ser a importante cuando estudiemos transformaciones de variables en el espacio
de fase que preservan la forma de las ecuaciones de Hamilton.
La independencia entre q y p en la formulaci on Hamiltoniana es una de las grandes diferencias con las
formulaci on Lagrangiana en la cual los momentos aparecen como una definici on Ec. (5.1). Podemos pensar
como si tuvieramos 2n coordenadas generalizadas y sus derivadas temporales. Solo ampliando el n umero de
grados de libertad de n a 2n se pueden obtener ecuaciones de primer orden.

6.9. El principio de mnima acci


on (opcional)
Existe otro principio variacional muy u til asociado con el formalismo Hamiltoniano conocido como principio
de mnima accion. Para esto planteamos otro tipo de variacional . Recordemos que teniendo la curva correcta
definida entre los tiempos t1 y t2 ; el variacional define la familia de curvas que poseen extremo fijo tanto en
el tiempo como en el espacio de configuraciones, es decir todas las curvas est an definidas en este intervalo de
tiempo y de modo que qi (t1 ) = qi (t2 ) = 0. La nueva variaci on relaja ambas condiciones, las curvas vecinas
pueden estar definidas en un intervalo temporal diferente [t1 + t1 , t2 + t2 ], y sus coordenadas generalizadas
no tienen que coincidir con las del camino correcto en los extremos. Es posible por ejemplo, que una curva
vecina no se intersecte con la curva correcta en ning un punto. La Fig. 6.2 ilustra la variaci on en el espacio
de configuraciones
Usaremos no obstante la misma parametrizaci on que se uso para la variaci
on (ver Ec. 3.21)

qi (t, ) = qi (t, 0) + i (t) (6.42)

donde es el par
ametro infinitesimal que conduce al camino correcto cuando se anula. Naturalmente, ya no es
necesaria la condici
on de que las i (t) se anulen en los extremos t1 y t2 (ni en los extremos t1 + t1 y t2 + t2
de un camino variado). Solo requerimos que sean funciones contnuas y diferenciables en cualquier intervalo
real o variado.
Evaluemos la variaci
on de la integral de acci on.
Z t2 Z t2 +t2 Z t2
L dt L () dt L (0) dt (6.43)
t1 t1 +t1 t1

6
Notese que en ausencia de la condici on pj = 0, aun tenemos un gauge aunque m as debil, ya que podramos adicionar un
(q,t)
factor de la forma dFdt . Esto no es lo deseable ya que la idea es que F contenga todas las variables independientes.
6.9. EL PRINCIPIO DE MINIMA ACCION
(OPCIONAL) 105

on de la variaci
Figura 6.2: Ilustraci on y de la variaci
on en el espacio de configuraciones.

donde L () representa el valor de L cuando tomamos el camino variado siendo L (0) el camino correcto.
La variaci
on se descompone en dos partes, una surge del cambio en los lmites de integraci
on y la otra del
parametro i.e. la variaci
on de la curva como tal. Escribiremos la primera integral como
Z t2 +t2 Z t2 Z t1 +t1 Z t2 +t2
= +
t1 +t1 t1 t1 t2

con lo cual (6.43) queda


Z t2 Z t2 Z t2 Z t1 +t1 Z t2 +t2
L dt = L () dt L (0) dt L () dt + L () dt (6.44)
t1 t1 t1 t1 t2

es u
til parametrizar L () como
L () L (0) + F ()

donde F () nos da cuenta de la desviaci on en el Lagrangiano debida a la evaluacion en la curva vecina, con
respecto a su valor en la curva real. Claramente F () es una cantidad infinitesimal. Definiremos ahora la
variaci
on, la cual mantiene fijo el intervalo temporal, pero no tiene extremos fijos en las qi (ver Fig. 6.2). Con
estas consideraciones (6.44) queda de la forma
Z t2 Z t2 Z t1 +t1 Z t2 +t2

L dt = L dt [L (0) + F ()] dt + [L (0) + F ()] dt
t1 t1 t1 t2
Z t2 Z t2 Z t1 +t1 Z t2 +t2

L dt = L dt L (0) dt + L (0) dt
t1 t1 t1 t2
Z t1 +t1 Z t2 +t2
F () + F () dt
t1 t2
106 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

y dado que las cantidades t1 , t2 y F () son infinitesimales, las dos u


ltimas integrales nos dan diferenciales
de segundo orden y por tanto se desprecian. La variaci on queda finalmente
Z t2 Z t2

L dt = L (t2 , = 0) t2 L (t1 , = 0) t1 + L dt
t1 t1

Se ve entonces que el cambio en los lmites de integraci


on es (a primer orden en infinitesimales), el integrando
del camino correcto por las diferencias en los lmites de tiempo. La segunda parte de la variaci on es causada
por la variacion del camino a traves del parametro , pero esta vez entre los mismos lmites de integraci on que
el camino original.
La variacion en la integral de la derecha puede realizarse a traves de una parametrizaci on del camino
variado, como en la secci on (3.2), pero la variacion de qi no se anula en los extremos. Retomando la ecuaci on
(3.22) el primer termino de la derecha en dicha ecuaci on ya no se anula. Por lo tanto
Z Z   

t2 t2
L d L L 2
L dt = qi dt + qi
t1 t1 qi dt qi qi 1

usando las ecuaciones de Lagrange7 , esta nueva variaci


on se escribe
Z

t2
L 2
L dt = qi
t1 qi 1

y la variaci
on queda Z t2  2
L dt = L (t) t + pi qi 1 (6.45)
t1

qi (1) es la variaci
on en qi con respecto a la coordenada en la curva correcta tomada en el tiempo t1 , otro

tanto ocurre con qi (2). La idea es escribir la variaci
on de la acci
on en terminos de las variaciones de las
coordenadas, calculemos entonces qi (2)

qi (2) = qi (t2 + t2 , ) qi (t2 , 0) = qi (t2 + t2 , 0) qi (t2 , 0) + i (t2 + t2 )


 
qi (t2 + t2 , 0) qi (t2 , 0)
qi (2) = t2 + i (t2 )
t2

donde hemos usado la parametrizaci on (6.42) y eliminado constribuciones de segundo orden. A primer orden
en las cantidades infinitesimales y t2

qi (2) = qi (2) t2 + qi (2)

otese que i (t2 ) nos da una variaci


n on solo si no se impone que i se anule en los extremos con t1 y t2 fijos.
De manera similar se calcula para el otro extremo quedando

qi = qi + qi t (6.46)

y reemplazando (6.46) en (6.45) resulta


Z t2
L dt = (L t pi qi t + pi qi )|21
t1
Zt2
L dt = (pi qi H t)|21
t1

para obtener el principio de mnima acci


on, realizaremos algunas suposiciones adicionales
7
Al tomar ecuaciones de Lagrange estamos asumiendo principio de Hamilton.
6.9. EL PRINCIPIO DE MINIMA ACCION
(OPCIONAL) 107

1. Consideraremos sistemas en donde L, y por tanto H no dependan explcitamente del tiempo, de modo
que H es una cantidad conservada.

2. Restringiremos las variaciones de tal manera que para los caminos vecinos H tambien sea conservada al
igual que en el camino correcto.

3. Exigiremos ademas que los caminos variados cumplan el requerimiento de que qi se anule en los extremos
(pero no t). Esto implica entonces que qi (t1 ) para el camino real debe coincidir con qi (t1 + t1 ) para
el camino variado, y similarmente para t2 .

Un ejemplo particular de trayectoria vecina que podra satisfacer los tres requisitos, es un camino en donde
la lnea que describe la trayectoria variada en el espacio de configuraciones coincida con la lnea de la
trayectoria real, la diferencia consiste en la rapidez con que se desplaza el punto que describe la trayectoria en
ambos casos, es decir que las funciones qi (t) est an alteradas en el camino variado. En este caso es necesario
cambiar los tiempos en los extremos de la curva variada a fin de que H se mantenga constante en todos los
puntos de la trayectoria variada.
Teniendo en cuenta las condiciones adicionales impuestas, la variaci on de la acci
on es
Z t2
L dt = H (t2 t1 ) (6.47)
t1

por otro lado, bajo las mismas condiciones, la acci


on como tal queda
Z t2 Z t2
L dt = pi qi dt H (t2 t1 )
t1 t1

escribiendo la variaci
on de esta acci
on, resulta
Z t2 Z t2
L dt = pi qi dt H (t2 t1 ) (6.48)
t1 t1

comparando (6.47) con (6.48) se obtiene el principio de mnima acci


on
Z t2
pi qi dt = 0 (6.49)
t1

el nombre de este principio proviene del hecho de que la integral en (6.49), se le conoca antiguamente como la
acci
on. La literatura moderna utiliza el termino accion para la integral involucrada en el principio variacional
de Hamilton. Para la integral en (6.49) se utiliza con frecuencia el termino accion abreviada.
El principio de mnima acci
on se puede escribir de diversas maneras. Por ejemplo, si la ecuaci
on que define a
las coordenadas generalizadas no depende explcitamente del tiempo, la energa cinetica solo contiene factores
homogeneos de segundo grado en q.
1
T = Mjk (q) qj qk
2
si adicionalmente, el potencial no depende de las velocidades generalizadas (es decir el Hamiltoniano es la
energa del sistema), los momentos canonicos se derivan solo de T
T 1
pi = = (Mik qk + Mji qj )
qi 2
1
pi qi = (Mik qk qi + Mji qj qi ) = 2T
2
empleando esta u
ltima igualdad en (6.49) resulta
Z t2
T dt = 0 (6.50)
t1
108 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON

si ademas T se conserva al igual que H (por ejemplo es el caso de un cuerpo rgido aislado puesto que en tal
caso la energa potencial es solo interna y no cambia con el tiempo). El principio de mnima accion adquiere
entonces la forma
(t2 t1 ) = 0
esta ecuaci on nos dice que de todos los caminos posibles entre dos puntos en el espacio de configuraciones,
consistente con la conservaci on de H y T , el sistema se mover a a lo largo de un camino particular para el
cual el tiempo de transito es el mnimo posible (mas estrictamente estacionario). En esta forma el principio de
mnima acci on nos recuerda al principio de Fermat en optica geometrica, en donde una rayo de luz atraviesa el
camino que minimiza el tiempo de viaje. N otese que para llegar a esta conclusi
on por este camino, fue necesario
que el intervalo temporal de integraci on no fuera fijo, como efectivamente ocurre en la variaci on.
Pensemos ahora el caso especial de una partcula asumiendo que T no es necesariamente constante, la
energa cinetica se escribe
 
m ds 2
T =
2 dt
donde s denota la longitud de arco. De esta ecuaci
on se puede despejar dt
ds
dt = p
2T /m

de modo que podemos reemplazar el dt de la acci


on abreviada (6.50)
Z Z Z r
t2 t2 t2
ds T
T dt = 0 T =0 ds = 0
t1 t1 2T t1 2

finalmente se puede escribir Z t2 p


H V (q)ds = 0 (6.51)
t1

la Ec. (6.51) se conoce usualmente como la forma de Jacobi para el principio de mnima acci on. Este resultado
es extendible a caminos en espacios de configuraciones con curvatura que describen a un sistemapde partculas
(ver Goldstein). El punto atraviesa el camino en el espacio de configuraciones a una rapidez 2T /m. Si T
es constante, la forma de Jacobi del principio de mnima acci on nos dice que el punto del sistema viaja por
el camino mas corto en el espacio de configuraciones (es decir una geodesica). Tal resultado tiene muchas
aplicaciones en optica geometrica y en optica electr
onica.
Existen una gran variedad de principios variacionales. Por ejemplo, un principio variacional derivable del
principio de mnima acci on abreviada es el principio de mnima curvatura de Hertz, seg
un el cual, una partcula
libre se mueve a lo largo del camino de mnima curvatura, lo cual conduce a su vez al movimiento a lo largo
de geodesicas.
Los principios variacionales no contienen fsica nueva y son en general poco ventajosos para resolver pro-
blemas pr acticos, su utilidad yace en la facilidad para desarrollar nuevas formulaciones de la estructura te
orica
de la mecanica y otros campos de la Fsica mas all a de la mecanica.
Captulo 7

Transformaciones can
onicas

Hay un tipo de problema que sera de muy f


acil soluci
on con el formalismo Hamiltoniano, el caso en el cual
H es una constante de movimiento y todas las coordenadas generalizadas son cclicas, de modo que todos los
momentos conjugados son constantes
pi = i ; i = 1, . . . , n
y dado que el Hamiltoniano no puede ser funci
on ni del tiempo ni de las coordenadas cclicas, este se escribe
como
H = H (1 , . . . , n )
y las ecuaciones de Hamilton para qi son simplemente
H
qi = = i ; i = 1, . . . , n (7.1)
i
dado que las i son funciones de las i u
nicamente, son tambien constantes en el tiempo. Las Ecs. (7.1) tienen
soluci
on inmediata
qi = i t + i ; i = 1, . . . , n
donde las i as como las i se determinan con las 2n condiciones iniciales. Podra pensarse que este clase de
problemas son de interes solo academico. No obstante, cabe recordar que existe en general mas de un sistema
coordenado generalizado para un sistema dado. Por ejemplo, para fuerzas centrales el uso de coordenadas
cartesianas no conduce a variables cclicas en tanto que las coordenadas polares producen autom aticamente
una variable cclica. El n
umero de variables cclicas depende en general del sistema de coordenadas generalizadas
utilizado. Es posible entonces que encontremos un conjunto de coordenadas en las que todas las coordenadas
sean cclicas, una vez encontrado el resto del problema es muy sencillo. Dado que en general el sistema
coordenado mas obvio no va a ser normalmente cclico, debemos desarrollar un metodo para transformar este
conjunto coordenado en otro que sea m as adecuado. Las transformaciones de este tipo que hemos usado hasta
el momento, son de un conjunto {qi } de coordenadas generalizadas a otro conjunto {Qi }

Qi = Qi (qi , t) ; i = 1, . . . , n (7.2)

on de coordenadas cartesianas a polares tiene esta forma1 . Estas transformaciones


por ejemplo, la transformaci
se conocen como transformaciones puntuales.
En el formalismo Hamiltoniano, los momentos conjugados est an al mismo nivel que las coordenadas de tal
modo que las transformaciones puntuales deben realizarse en el espacio de fase y no en el de configuraciones,
por tanto debemos estudiar transformaciones del tipo

Qi = Qi (q, p, t) ; Pi = Pi (q, p, t) (7.3)


1
No toda transformaci on de coordenadas cartesianas a otro conjunto de coordenadas es del tipo (7.2), ya que estas u
ltimas
se refieren a transformaciones entre dos conjuntos de coordenadas independientes. Por ejemplo, las transformaciones descritas
por (2.2), relacionan en general a un conjunto de coordenadas dependientes (las cartesianas) con otro conjunto de coordenadas
independientes (las qi ).

109
110 CAPITULO 7. TRANSFORMACIONES CANONICAS

En el formalismo Hamiltoniano, solo interesan aquellas transformaciones para las cuales exista una funci on
K (Q, P, t) tal que las ecuaciones de movimiento en el nuevo sistema de coordenadas Q, P , tengan la estructura
de las ecuaciones de Hamilton, es decir

K K
Q i = ; Pi = (7.4)
Pi Qi

Esta clase de transformaciones se denominan transformaciones can onicas. La funcion K (Q, P, t) juega
el papel del Hamiltoniano en el nuevo sistema coordenado Q, P . Esta funci on se denomina Hamiltoniano
transformado o Kamiltoniano. Dado que estas transformaciones deben ser invertibles, resulta arbitrario decir
cual es el nuevo Hamiltoniano o Kamiltoniano y el antiguo Hamiltoniano.
Es importante mencionar que la transformaci on de coordenadas debe ser independiente del problema, lo
cual significa que dadas las ecuaciones de transformaci on (7.3) entonces las expresiones (7.4) deben ser las
ecuaciones de movimiento sin importar la forma del Hamiltoniano original. Aunque la transformaci on pudo ser
inspirada en un problema especfico, las mismas transformaciones deben conducir a las ecuaciones de Kamilton,
cuando se aplican a otro problema con el mismo n umero de grados de libertad, aunque naturalmente el valor
especfico numerico y funcional de H y K s sera especfico para cada problema.
Si Qi , Pi son coordenadas canonicas, ellas deben satisfacer el principio variacional modificado de Hamilton
en la forma Z t2  
Pi Q i K (Q, P, t) dt = 0 (7.5)
t1

al mismo tiempo, las antiguas variables can


onicas deben satisfacer el mismo principio
Z t2
(pi qi H (q, p, t)) dt = 0 (7.6)
t1

teniendo en cuenta que el principio modificado de Hamilton tiene variaci on cero en los extremos2 , la validez
simult
anea de (7.5) y (7.6) conduce a que los dos integrandos esten relacionados de la siguiente forma

dF
(pi qi H (q, p, t)) = Pi Q i K (Q, P, t) + (7.7)
dt
donde F es una funcion de las coordenadas del espacio de fase y del tiempo con derivadas contnuas hasta se-
gundo orden. es una constante independiente de las coordenadas y el tiempo, que produce una transformaci on
de escala.
Veamos un caso de transformaci on de escala. Pasemos de {q, p} a otro conjunto {Q , P } con una transfor-
macion de la forma
Qi = qi ; Pi = pi (7.8)
las ecuaciones de Hamilton (7.4) seran satisfechas si elegimos el kamiltoniano K (Q , P ) H (q, p). Los
integrandos correspondientes al principio de Hamilton modificado est an relacionados por

(pi qi H) = Pi Q i K

que es de la forma (7.7) con = , y dF/dt = 0. Sin embargo, si tenemos una transformaci on {q, p} {Q , P }
con 6= 1, siempre podemos encontrar un conjunto intermedio de coordenadas {Q, P } relacionadas con
{Q , P } por una transformaci
on de escala de la forma (7.8) tal que tenga el mismo valor . La transformacion
entre los dos conjuntos {q, p} y {Q, P } satisface entonces la Ec. (7.7) pero con = 1

dF
pi qi H (q, p, t) = Pi Q i K (Q, P, t) + (7.9)
dt
2
Recordemos que para llegar a las ecuaciones de Hamilton solo requerimos que qi = 0, pero tambien podemos imponer pi = 0,
con el fin de enriquecer el gauge del Hamiltoniano
111

de esto se ve que la transformacion de escala es basicamente trivial y no aporta significativamente al formalismo


de las transformaciones can onicas, de modo que trabajaremos las transformaciones dadas por (7.9). Cuando
6= 1 se habla de transformaciones can onicas extendidas. Cuando = 1 hablamos simplemente de una
transformaci on canonica. Lo que hemos visto es que una transformaci on canonica extendida siempre se puede
separar en una transformaci on canonica seguida de una transformaci on de escala. Cuando la transformaci on
canonica no depende explcitamente del tiempo se habla de transformaci on canonica restringida. De aqu en
adelante se trabaja con transformaciones can onicas (no extendidas) a menos que se indique lo contrario.
El u
ltimo termino a la derecha de (7.9) solo contribuye a la variaci on de la acci
on en los extremos y por lo
tanto se anula si F es una funci on de (q, p, t) o de (Q, P, t) o cualquier mezcla de las coordenadas de los dos
espacios de fase {q, p} y {Q, P }, dado que todas ellas tienen variaci on cero en los extremos. Adem as, por medio
de las ecuaciones de transformaci on (7.3) y sus inversas, es posible expresar a F en terminos de coordenadas
nuevas y viejas. En realidad estas funciones adquieren mayor utilidad cuando se expresan con un n umero igual
de variables viejas y nuevas (adem as del tiempo). En ese sentido F act ua como puente entre los dos sistemas
de coordenadas y se denomina la funci on generadora de la transformaci on.
Veamos de que manera F puede generar la transformaci on. Asumamos que F es funci on de las n primeras
coordenadas generalizadas, nuevas y viejas i.e. de q, Q

F F1 (q, Q, t) (7.10)

la ecuaci
on (7.9) toma la forma
dF1
pi qi H = Pi Q i K +
dt
F 1 F1 F1
pi qi H = Pi Q i K + + qi + Qi (7.11)
t qi Qi
pasando todo a un solo lado
   
F1 F1 F1
0=H+ pi qi + Pi + Qi K +
qi Qi t
y dado que las coordenadas nuevas y viejas son separadamente independientes y H,K, F1 no son funciones de
qi ni de Q i , se llega a que los coeficientes que acompa
nan a qi , Q i deben anularse
F1 F1
pi = ; Pi = ; i = 1, . . . , n (7.12)
qi Qi
quedando finalmente
F1
K=H+ (7.13)
t
las primeras n de las Ecs. (7.12) definen a pi como funciones de qj , Qj y t. Asumiendo que son invertibles, se
pueden despejar las Qi en terminos de qj , pj , t, lo cual nos dara la primera mitad de las transformaciones
(7.3). Una vez establecidas, las Qi (qj , pj , t) se pueden sustituir en la segunda serie de Ecs. (7.12) de tal manera
que se obtienen las Pi como funciones de qj , pj , t. Finalmente, la relaci on (7.13) nos da la coneccion entre el
nuevo Hamiltoniano K y el antiguo H, de esta relaci on se ve que K difiere numericamente de H solo si F1
depende explcitamente del tiempo. Es necesario tener en cuenta que K debe ser funci on de Q, P, t, para lo
cual los argumentos de H es decir q, p, t deben ser convertidos en Q, P, t a traves de la inversa de las relaciones
(7.3), de la misma forma, qi , t se expresa en terminos de Q, P, t con lo cual la funci on K ya queda en terminos
de los argumentos correctos.
El procedimiento anterior describe formalmente como se pueden obtener las transformaciones can onicas
partiendo de una funci on generatriz F1 . Este proceso puede ser revertido para obtener la funci on generatriz
comenzando con las transformaciones can onicas (7.3). Se comienza por invertir el primer conjunto de transfor-
maciones (7.3) con el fin de expresar los pi como funciones de q, Q, t, tal expresi on se reemplaza entonces en el
segundo conjunto de transformaciones (7.3) con lo cual se obtienen los Pi tambien como funciones de q, Q, t.
112 CAPITULO 7. TRANSFORMACIONES CANONICAS

Con esto las ecuaciones (7.12) constituyen un conjunto de 2n ecuaciones diferenciales que en principio permi-
ten encontrar a F1 siempre que las transformaciones sean realmente can onicas. Se puede ver que existe una
arbitrariedad en la soluci
on para F1 a la cual se le puede adicionar una funci on arbitraria cuyo argumento es
el tiempo solamente. Esta funci on aditiva claramente no afecta las ecuaciones de transformaci on, y en algunas
ocasiones F1 puede tener otras ambig uedades.
En ocasiones no es adecuado escribir la funci on generatriz en terminos de los argumentos q, Q, t. Por
ejemplo, la transformacion puede ser tal que los pi no se puedan escribir como funciones de q, Q, t, sino
mas bien como funciones de q, P, t. En este caso se debe buscar una funci on generatriz que sea funci
on de las
antiguas coordenadas q y los nuevos momentos P . Claramente la Ec. (7.11) debe reemplazarse por una relaci on
similar pero que involucre a P i en lugar de Q i . Esto se logra escribiendo a F en (7.9) como

F F2 (q, P, t) Qi Pi (7.14)

sustituyendo (7.14) en (7.9) y usando regla de la cadena se tiene que


dF2 d
pi qi H (q, p, t) = Pi Q i K (Q, P, t) + (Qi Pi )
dt dt
F 2 F2 F2
pi qi H (q, p, t) = Pi Q i K (Q, P, t) + + qi + Pi Q i Pi Qi P i
t qi Pi
F2 F2 F2
pi qi H = K (Q, P, t) + + qi + Pi Qi Pi
t qi Pi
pasando todo a un extremo
   
F2 F2 F2
pi qi + Qi P i + H K + =0
qi Pi t

por razones similares al caso de F1 los terminos proporcionales a qi y P i , deben anularse y por lo tanto
los tres u
ltimos terminos de la izquierda deben cancelarse. De estas cancelaciones se obtienen las ecuaciones
fundamentales para F2 y para K
F2 F2
pi = ; Qi = (7.15)
qi Pi
F2
K = H+ (7.16)
t
al igual que con el caso anterior, el primer conjunto de ecuaciones (7.15) debe resolverse para Pi en funci on
de qj , pj , t, con lo cual se tiene la segunda mitad de las transformaciones (7.3). La primera mitad de estas
transformaciones se obtiene sustituyendo P (q, p, t) en la segunda mitad de las Ecs. (7.15).
Obviamente, existen otros dos tipos b asicos de funciones generatrices F3 (p, Q, t) y F4 (p, P, t), para las
cuales el procedimiento es an alogo y se sintetiza en la tabla 7.1 se puede observar que los cuatro tipos basicos
de funciones generatrices est an conectados a traves de transformaciones de Legendre. Por ejemplo, la transici on
entre F1 y F2 equivale a ir de las variables q, Q a las variables q, P con el segundo conjunto de relaciones (7.12)
F1 (q, Q, t)
Pi =
Qi
ya que de esta relacion se puede obtener Pi en terminos de q, Q, t la cual formalmente se puede despejar para
obtener Qi (q, P, t), que permitira reemplazar el conjunto q, Q por el conjunto q, P . Esta es precisamente la
forma requerida para una transformaci on de Legendre de la base de variables (q, Q) a la base de variables
(q, P ), como se discuti
o en la secci
on 6.2. En analoga con la Ec. (6.3), escribimos

F2 (q, P, t) = F1 (q, Q, t) + Pi Qi (7.17)

lo cual es equivalente a igualar (7.10) con (7.14). De manera similar a partir de (7.10), y las definiciones de las
otras funciones generatrices dadas en la tabla 7.1, se puede ver que todas las otras funciones generatrices se

7.1. EJEMPLOS DE TRANSFORMACIONES CANONICAS 113

Funci
on generatriz Derivadas de las Fi Caso especial trivial
F1 F1
F = F1 (q, Q, t) pi = qi ; Pi = Q i
F1 = qi Qi , Qi = pi , Pi = qi
F2
F = F2 (q, P, t) Qi Pi pi = qi ; Qi = F 2
Pi F2 = qi Pi , Qi = qi , Pi = pi
F = F3 (p, Q, t) + qi pi qi = F
pi
3 F3
; Pi = Q i
F3 = pi Qi , Qi = qi , Pi = pi
F = F4 (p, P, t) + qi pi Qi Pi qi = F
pi
4
; Qi = F
Pi
4
F4 = pi Pi , Qi = pi , Pi = qi

Cuadro 7.1: Funciones generatrices de los 4 tipos, sus ecuaciones diferenciales asociadas y algunos ejemplos
simples.

pueden ver como transformaciones de Legendre de F1 . En particular, F4 se obtiene con dos transformaciones
de Legendre de F1 dado que requiere el cambio de los dos conjuntos de argumentos. Sin embargo, no toda
transformacion canonica puede ser generada por medio de alguna de las cuatro funciones generatrices b asicas.
De modo que en algunos casos, estas transformaciones de Legendre pueden conducir a funciones generatrices
nulas o indeterminadas. Por esta raz on es preferible definir cada tipo de funci
on generadora relativa a F de
la Ec. (7.9), la cual es una funci
on de 2n coordenadas y momentos independientes, pero que no tiene sus
argumentos bien definidos.
En particular, la funcion generatriz apropiada no necesariamente es del tipo 1,2,3 o 4 para todas sus
coordenadas y/o momentos. Es posible y en algunos casos necesario para ciertas transformaciones can onicas,
usar una funcion generatriz que sea mezcla de los cuatro tipos. A manera de ejemplo, podra ser conveniente
que para cierta transformacion canonica con dos grados de libertad, definamos una funci on generatriz de la
forma
F (q1 , p2 , P1 , Q2 , t)
esta funci
on generatriz estara relacionada con F de (7.9) a traves de

F = F (q1 , p2 , P1 , Q2 , t) Q1 P1 + q2 p2

esto define una transformaci


on de Legendre adecuada para cambiar Q1 por P1 y para cambiar q2 por p2 . Las
ecuaciones de transformaci
on se obtienen a traves de las relaciones
F F
p1 = ; Q1 =
q1 P1
F F
q2 = ; P2 =
p2 Q2
F
K = H+
t

7.1. Ejemplos de transformaciones can


onicas
Consideremos primero una funci
on del segundo tipo de la forma

F2 = qi Pi (7.18)

a partir de las Ecs. (7.15, 7.16), las ecuaciones de transformaci


on ser
an
F2 F2
pi = = Pi ; Qi = = qi ; K = H
qi Pi
las coordenadas nuevas coinciden con las antiguas, de modo que F2 es una funci on generatriz de la transfor-
macion identidad. Tomemos ahora F3 = pi Qi , esta transformaci
on genera la transformaci
on canonica I, i.e.
Qi = qi , Pi = pi .
114 CAPITULO 7. TRANSFORMACIONES CANONICAS

Un tipo m
as general de transformaci
on del tipo F2 que incluye a (7.18) como caso particular, se define por

F2 = fi (q1 , . . . , qn ; t) Pi + g (q1 , . . . , qn ; t) (7.19)

donde las fi son un conjunto de funciones independientes, y g es una funci on diferenciable en q, t, ambas tienen
como argumentos las coordenadas antiguas y el tiempo. Usando el segundo conjunto de Ecs. (7.15) las nuevas
coordenadas Qi vienen dadas por
F2
Qk = = fk (q1 , . . . , qn ; t) (7.20)
Pk
de modo que con esta transformaci on las coordenadas nuevas solo dependen de las coordenadas antiguas y
el tiempo pero no de los antiguos momentos. Esto define una transformaci on puntual como la expresada en
(7.2). Para definir una transformacion puntual las funciones fi deben ser independientes e invertibles, de
modo que las qj se puedan expresar en terminos de las Qk . Dado que las fi son por lo dem as arbitrarias, se
concluye que toda transformaci on puntual puede ser parte de una transformaci on can onica (recuerdese que
una transformacion canonica requiere conocer tambien las transformaciones en los pi ). La ecuaci
on (7.16) nos
da el nuevo Hamiltoniano.
Veamos ahora las ecuaciones de transformaci on para el momento conjugado que induce (7.19), el primer
conjunto de Ecs. (7.15) lleva a
F2 fi g
pj = = Pi + (7.21)
qj qj qj
estas ecuaciones se pueden invertir para dar P en funci on de (q, p). Este procedimiento es m
as sencillo si se
usa una formulacion matricial, definiremos entonces arreglos matriciales de la forma
   
f fi g g
(p)j pj ; (P)i Pi ; ;
q ji qj q j qj

con lo cual la transformaci


on (7.21) se escribe

f g
p= P+ (7.22)
q q

de aqu se puede despejar P


 1  
f g
P= p (7.23)
q q
observese que a diferencia de las Qi que solo dependan de las qj y el tiempo, las Pi dependen de qj , pj , t.
Otra funci
on generadora interesante es la siguiente

F1 = qk Qk

las ecuaciones de transformaci


on (7.12) son

F1 F1
pi = = Qi ; Pi = = qi
qi Qi

esta funci
on generatriz intercambia los momentos y las coordenadas excepto por un signo. La funcion F4 = pi Pi
produce la misma transformaci on. Este hecho enfatiza el estatus independiente otorgado a los momentos, ya
que tanto los momentos como las coordenadas se necesitan para describir el movimiento en la formulaci on
Hamiltoniana y la distinci on entre ambos es asunto de nomenclatura, puesto que podemos intercambiar los
nombres con un costo no mayor a un cambio de signo. No hay ning un remanente en la teora de q como
coordenada espacial o de p como masa por velocidad. En realidad, de las propias ecuaciones de Hamilton

H H
p i = , qi =
qi pi

7.2. TRANSFORMACIONES CANONICAS
PARA EL OSCILADOR ARMONICO 115

se puede ver que este intercambio es can onico, con el cambio de signo apropiado. Si qi se sustituye por pi , las
ecuaciones permanecen en la forma can onica solo si pi es sustitudo por qi .
Podemos ver adicionalmente que la transformaci on de permutaci on no se puede generar a partir de una
funci
on generatriz del tipo F2 (q, P, t), ya que el sistema de ecuaciones parciales que se deriva de (7.15) nos
dice que
F2 (q, P, t)
pi =
qi
esto implica que pi debe escribirse como funci on de q, P, t pero en la transformaci on de permutacion pi no es
funci
on de ninguna de estas variables, en realidad solo es funci on de las nuevas coordenadas Q. F2 no es una
generatriz adecuada para la transformaci on de permutaci on.
Similarmente, una funci on tipo F1 (q, Q, t) no puede generar la transformaci on identidad, ya que las Ecs.
(7.12) nos llevan a
F1 (q, Q, t)
pi =
qi
definen a pi en funcion de q, Q, t, pero en esta transformaci on pi solo es funci
on de Pi . Adicionalmente, no
es posible obviar esta dificultad definiendo una funci on F1 mediante una transformada de Legendre del tipo
(7.17)
F1 (q, Q, t) = F2 (q, P, t) Pi Qi
si sustitumos F2 por la expresi
on (7.18) escribiendo Q en vez de q obtendramos
F1 (q, Q, t) = Qi Pi Pi Qi = 0
que no es una funci on generatriz. Similar resultado se obtiene si se intenta generar la transformaci on de
permutaci on F2 . No obstante, se puede demostrar que una funci
on a partir de una funci on F3 puede generar
la transformacion identidad y que una funcion tipo F4 puede generar la permutaci on.
Finalmente, una transformaci on que deja algunas parejas (q, p) inalteradas, e intercambia el resto (con un
cambio de signo), es una transformaci on canonica de tipo mixto. En un sistema de dos grados de libertad, la
transformacion
Q1 = q1 , P1 = p1
Q2 = p 2 , P2 = q2 (7.24)
es generada por la funci
on
F = q1 P1 + q2 Q2 (7.25)
que es una mezcla entre funciones de tipo F1 y F2 . El termino tipo F1 produce permutaci
on y el termino tipo
F2 es del tipo identidad.

7.2. Transformaciones can


onicas para el oscilador arm
onico
El Hamiltoniano para el oscilador arm
onico se escribe como
1  k
H= p 2 + m2 2 q 2 ; 2
2m m
esta forma en suma de cuadrados en q y p sugiere que para que la nueva coordenada sea cclica, podemos
hallar una transformaci
on de la forma
f (P )
p = f (P ) cos Q ; q = sin Q (7.26)
m
Dado que la transformaci
on (7.26) no depende explcitamente del tiempo, el Hamiltoniano no cambia numeri-
camente y en las nuevas coordenadas queda
f 2 (P )  f 2 (P )
K=H= cos2 Q + sin2 Q = (7.27)
2m 2m
116 CAPITULO 7. TRANSFORMACIONES CANONICAS

de modo que Q resulta cclica. Solo nos queda hallar la forma de f (P ) tal que la transformaci
on sea can
onica.
El cociente entre la Ecs. (7.26) nos lleva a
p = mq cot Q (7.28)

que es independiente de f (P ). Esta transformaci on es de la forma p = p (q, Q) lo cual sugiere buscar una
funci
on generatriz tipo F1 , pues el primer conjunto de Ecs. (7.12) nos da pi = pi (q, Q, t) en la forma

F1 (q, Q, t)
p= (7.29)
q

y la soluci
on m
as sencilla de F1 para la Ec. (7.28) es

mq 2
F1 (q, Q, t) = cot Q (7.30)
2

naturalmente, F1 debe satisfacer la otra mitad de las ecuaciones de transformaci


on (7.12)

F1 mq 2
P = = (7.31)
Q 2 sin2 Q

despejando q se obtiene
r
2P
q= sin Q (7.32)
m
que al compararla con la segunda de las Ecs. (7.26) nos da

f (P ) = 2mP (7.33)

al reemplazar este factor en el nuevo Hamiltoniano (7.27) queda

H = P

que claramente es cclico en Q, con lo cual P es una constante de movimiento. Como H es constante y es la
energa del sistema, el nuevo momento can onico viene dado por

E
P = (7.34)

y la ecuaci
on de Hamilton para Q se reduce a

H
Q = =
P
cuya soluci
on es
Q = t + (7.35)

siendo una constante de integraci


on fijada por las condiciones iniciales. Sustituyendo (7.34) y (7.35) en (7.32)
resulta r
2E
q= sin (t + )
m 2
que es la soluci
on conocida para el oscilador arm
onico.
Cabe ahora la pregunta, que nos asegura que la transformacion definida por (7.26) y por (7.33) es can
oni-
ca?. Lo asegura el hecho de que tal transformacion es generada por una funci on generatriz tipo 1 Ec. (7.30)
que cumple con sus ecuaciones diferenciales Ecs. (7.29) y (7.31).

7.3. TRANSFORMACIONES CANONICAS
USANDO LAS ECUACIONES DE HAMILTON SIMPLECTICAS117

7.3. Transformaciones can


onicas usando las ecuaciones de Hamilton simpl
ecti-
cas
El metodo de las funciones generatrices es formalmente completo para tratar el problema de caracterizar
todas las transformaciones canonicas, puesto que el principio de Hamilton modificado me garantiza la existencia
de una funci on generatriz para cualquier transformaci on que deje invariante la forma de las ecuaciones de
Hamilton. Sin embargo, en la pr on generatriz3 y si no estamos
actica puede ser muy difcil encontrar una funci
seguros de si la transformacion es canonica puede ser muy difcil demostrar la existencia o no existencia de
la funcion generatriz. Por esta raz
on, se hace necesario encontrar metodos que sean m as sistematicos para
verificar si una transformaci
on es o no es canonica.
Otro metodo para tratar las transformaciones can onicas, consiste en la utilizaci
on de las ecuaciones de
Hamilton simplecticas descritas en la secci
on 6.5 a traves de las Ecs. (6.25). Consideraremos primero el caso
de transformaciones can onicas restringidas, es decir que no dependen explcitamente del tiempo

Qi = Qi (q, p) ; Pi = Pi (q, p) (7.36)

la primera caracterstica notable es que el Hamiltoniano no cambia ante una transformaci on can
onica restrin-
gida, como se ve de (7.13). Su forma funcional puede ser diferente pero se conserva su valor numerico. La
idea es que la transformaci on sea canonica, lo cual es equivalente a exigir que las nuevas coordenadas Q, P
cumplan ecuaciones de Hamilton para el nuevo Hamiltoniano K = H
H H
Q i = ; P i = (7.37)
Pi Qi

Estudiaremos el primer conjunto de Ecs. (7.37), evaluemos primero Q i el cual se calcula con base en
(7.36), y en las ecuaciones de Hamilton para las coordenadas antiguas (es decir asumiendo que las coordenadas
originales tambien son canonicas)
Qi Qi Qi H Qi H
Q i = qj + p j = (7.38)
qj pj qj pj pj qj

ahora calculamos el termino de la derecha en el primer conjunto de Ecs. (7.37), para lo cual se requieren las
inversas de (7.36)
qj = qj (Q, P ) ; pj = pj (Q, P ) (7.39)
las cuales nos permite calcular H (q, p, t) en terminos de Q, P, t, as como el termino en cuesti
on
H H pj H qj
= + (7.40)
Pi pj Pi qj Pi

El primer conjunto de Ecs. (7.37), nos conduce a igualar los terminos de la derecha en (7.38) y (7.40) con lo
cual resulta        
Qi pj Qi qj
= ; = (7.41)
qj q,p Pi Q,P pj q,p Pi Q,P
donde los subndices enfatizan los argumentos en los cuales queda evaluada cada expresi on. Con un procedi-
miento similar, el segundo conjunto de Ecs. (7.37) nos lleva a las siguientes condiciones
       
Pi pj Pi qj
= ; = (7.42)
qj q,p Qi Q,P pj q,p Qi Q,P

el conjunto de condiciones (7.41) y (7.42) se conoce usualmente como condiciones directas para una
transformaci
on can
onica restringida.
3
Vale la pena mencionar que los cuatro tipos b
asicos de funciones generatrices que se han estudiado no cubren el espectro de
todas las transformaciones can
onicas.
118 CAPITULO 7. TRANSFORMACIONES CANONICAS

El procedimiento anterior se puede realizar en forma matricial usando las ecuaciones de Hamilton simplecti-
cas descritas en la secci
on 6.5. Partimos de la formulaci
on simplectica descrita en las Ecs. (6.25).

H
= J (7.43)

con J y definidos por (6.21, 6.23). Similarmente, el nuevo conjunto coordenado Qi , Pi define una matriz
columna de dimensi on 2n an aloga a , denotamos esta matriz por , y para una transformacion can
onica
restringida, las Ecs. (7.36) se pueden escribir como

= () (7.44)

y realizamos un proceso an
alogo al realizado, tomando (7.37) como punto de partida. La condicion canonica
exige que
H
= J (7.45)

donde hemos tenido en cuenta que una transformaci on canonica restringida no cambia el valor numerico del
Hamiltoniano como se vi
o en el formalismo de la funci on generatriz. Evaluemos primero el termino de la
izquierda en (7.45)
i
i = j i, j = 1, . . . , 2n
j
definimos entonces la matriz jacobiana de la transformaci
on

i
Mij i = Mij j (7.46)
j

matricialmente queda
= M (7.47)
reemplazando (7.43) en (7.47) resulta
H
= MJ (7.48)

por otro lado, a traves de la relaci
on inversa de (7.44), H se puede escribir como funci
on de , y podemos
evaluar tambien el termino de la derecha en (7.45)

H H j H H fij H
= = Mji =M
i j i i j j

matricialmente esto se escribe


H f H
=M (7.49)

reemplazando (7.49) en (7.48)
f H
= MJM (7.50)

y teniendo en cuenta la condicion (7.45), en comparaci
on con (7.50), se concluye que la transformaci
on (7.44)
es can
onica si M satisface la condici
on
MJMf=J (7.51)
esta condici
on tambien es necesaria para una transformacion canonica restringida, como se puede ver invir-
tiendo los pasos anteriores. Para una transformaci
on can
onica extendida restringida (independiente del tiempo
e incluyendo una transformaci on de escala), donde K = H, la condicion (7.51) resulta

f = J
MJM (7.52)

7.4. ACERCAMIENTO SIMPLECTICO
PARA TRANSFORMACIONES CANONICAS DEPENDIENTES DEL TI

retornando a la condici f 1
on (7.51), esta se puede escribir de varias maneras. Por ejemplo, multiplicando por M
a la derecha en ambos miembros
MJ = JM f 1 (7.53)
la transposici
on y la inversi
on se pueden tomar en cualquier orden. Si se comparan explcitamente las con-
diciones que se derivan de (7.53), se observa que coinciden con las expresadas en las Ecs. (7.41) y (7.42).
Adicionalmente, usando (6.24) vemos que la Ec. (7.53) se puede transformar en

f 1 (J)
JMJ (J) = J2 M
JM = Mf 1 J

o equivalentemente
f
MJM =J (7.54)
La ecuaci on (7.51), o la versi
on equivalente (7.54) se conocen como condiciones simpl ecticas para una
transformaci on can
onica y la matriz M que satisface esta condici
on, se denomina matriz simpl ectica.
Veamos un ejemplo explcito. Tomemos la funci on mixta definida en la Ec. (7.25) F = F2 (q1 , P1 ) +
F1 (q2 , Q2 ). Las matrices columna y son

q1 Q1
q2 Q2
=
p1 ; =
P1
p2 P2

tomando las ecuaciones de transformaci on (7.24) y deriv


andolas con respecto al tiempo, se pueden comparar

estas transformaciones con las descritas por = M (Ec. 7.47) con el fin de obtener la matriz M

Q1 1 0 0 0 q1 q1
Q 2 0 0 0 1 q2 p 2
= =
P1 0 0 1 0 p 1 p 1
P2 0 1 0 0 p 2 q2

este resultado tambien se puede obtener diferenciando los resultados obtenidos por medio de las funciones
generatrices (columna 3 filas 2 y 3 de la tabla 7.1). Por otro lado, las ecuaciones de Hamilton para las nuevas
variables i.e. = J (H/) (Ec. 7.45), se expresan sin dependencia con la funcion generatriz

Q1 0 0 1 0 P 1
Q 2 0 0 0 1
= P2
P1 1 0 0 0 Q 1
P2 0 1 0 0 Q 2

donde P i = H/i para 1 y 2 y Q i = H/i para 3 y 4 . M es funci


on de F pero no as J la cual es
una matriz constante (ver Ec. 6.23). Este formalismo no se puede aplicar en todos los casos. En particular,
no se puede construir una matriz simple M para generar la transformaci on can
onica usada para el oscilador
armonico en la secci
on 7.2.

7.4. Acercamiento simplectico para transformaciones can


onicas depen-
dientes del tiempo
Cuando la transformacion a las nuevas coordenadas depende explcitamente del tiempo, ya no son v alidos los
argumentos anteriores. Sin embargo, se sigue cumpliendo que la condici on simplectica es necesaria y suficiente
para que la transformaci
on sea canonica. Esto se puede probar por argumentos similares a los arriba expuestos,
120 CAPITULO 7. TRANSFORMACIONES CANONICAS

pero es mas f
acil a traves de otro camino que explota el hecho de que el tiempo act
ua como un par
ametro en
la transformaci
on can onica. Una transformaci
on canonica de la forma

= (, t)

evoluciona contnuamente con el tiempo a partir de un cierto t0 . Es una transformaci


on contnua uniparametri-
ca. Si la transformaci
on
(t) (7.55)
es can
onica, se tiene que en particular la transformaci
on

(t0 ) (7.56)

onica siendo t0 un tiempo fijo, se sigue entonces de la definici


es can on de transformaci
on can
onica, que la
transformaci
on caracterizada por
(t0 ) (t) (7.57)
es tambien canonica. Puesto que en (7.56) el tiempo es fijo, esta transformaci on canonica debe satisfacer la
condici
on simplectica (7.54). Si podemos probar que (7.57) cumple la condici on simplectica, es f
acil mostrar
que la transformacion general (7.55) tambien la cumple.
Para demostrar que la condicion simplectica es a
un necesaria y suficiente para transformaciones de la forma
(7.57) usaremos la noci on de transformacion can onica infinitesimal (TCI) en la cual todas las coordenadas
nuevas difieren de las antiguas por cantidades infinitesimales

Qi = qi + qi (7.58)
Pi = pi + pi (7.59)

que matricialmente se puede escribir como


= + (7.60)
la notaci
on qi , pi no se refiere a desplazamientos virtuales, simplemente cambios infinitesimales en las coorde-
nadas (cambio en coordenadas no implica movimiento del sistema ni real ni virtual). Como una transformaci on
canonica infinitesimal difiere solo infinitesimalmente del operador identidad, es natural comenzar con una fun-
ci
on generatriz de la identidad coloc andole una desviaci
on infinitesimal

F2 = qi Pi + G (q, P, t) (7.61)

es una par
ametro infinitesimal y G es una funcion diferenciable en sus 2n + 1 argumentos. Dado que esta
funci
on generatriz es de tipo 2, podemos emplear las Ecs. (7.15) de transformaci
on para los momentos
F2 G
pj = = Pj +
qj qj
con lo cual
G
pj Pj pj = (7.62)
qj
adicionalmente, usando las Ecs. (7.15) para transformaci
on de coordenadas
F2 G
Qj = = qj +
Pj Pj
dado que el segundo termino a la derecha es lineal en , y que Pj solo difiere de pj infinitesimalmente, entonces
es consistente a primer orden cambiar la variable de derivaci on Pj por pj . De esta forma G se escribe en
terminos de q, p, t u
nicamente. El cambio infinitesimal qj se puede escribir a primer orden como
G
qj Qj qj = (7.63)
pj

7.4. ACERCAMIENTO SIMPLECTICO
PARA TRANSFORMACIONES CANONICAS DEPENDIENTES DEL TI

ambas ecuaciones de transformaci


on se pueden sintetizar en una ecuaci
on matricial
G
= J (7.64)

una transformacion infinitesimal que nos interesa directamente, es la transformaci
on (7.57) cuando t difiere de
t0 en una cantidad infinitesimal
(t0 ) (t0 + dt) (7.65)
dt hace las veces del . Dado que entre (, t0 ) y (, t) con t0 y t arbitrarios, la transformaci
on es contnua, se
puede construir como una sucesi on de transformaciones infinitesimales en pasos de dt. Por lo tanto, bastar a con
probar que la transformaci on infinitesimal (7.65) satisface la condici on simplectica (7.54). La TCI (7.64), tiene
asociada una matriz jacobiana, y se puede ver f acilmente que esta u ltima es simplectica. Tomando la definicion
de matriz jacobiana (7.46) para una transformaci on infinitesimal como (7.60) se obtiene
i
M =1+
j
y usando (7.64), resulta
 
G
M = 1+ J

 2 
G
M = 1 + J (7.66)

definimos la matriz  
2G 2G

ij i j
la cual es claramente simetrica. Teniendo adem
as en cuenta que J es antisimetrico, y trasponiendo M en (7.66)
resulta
^ 
f 2G e
M = 1+ J

 2 
f G
M = 1 J

para chequear la condici f


on simplectica (7.54) debemos hacer el producto MJM
  2     2 
f G G
MJM = 1 J J 1 + J

 2   2 
G G 
= J+J2 J2 + O 2

 2   2 
G G 
f
MJM = J + + O 2


f
MJM = J+O 2

donde hemos usado la propiedad J2 = 1, de modo que a primer orden en , se cumple la condici on simplectica
para la transformaci on infinitesimal (7.65). Por tanto cualquier transformacion canonica obedece la condici on
simplectica a
un cuando sea explcitamente dependiente del tiempo.
A pesar de que en este acercamiento poco se ha usado el formalismo de la funci on generatriz, tanto el
formalismo simplectico como el de la funci on generatriz est
an conectados. Se puede demostrar por ejemplo que
la condicion simplectica implica la existencia de una funcion generatriz. Cualquiera de los dos formalismos se
puede usar indistintamente de acuerdo con las necesidades y conveniencias. En particular, cualquiera de los
dos formalismos sirve para demostrar que las transformaciones can onicas forman un grupo matem atico.
Captulo 8

Corchetes de Poisson y otros invariantes


can
onicos

Hemos visto que las transformaciones canonicas son aquellas que preservan la forma de las ecuaciones de
Hamilton. Esto nos motiva a buscar estructuras que sean invariantes can onicas, ya que si una cierta cantidad
preserva su forma ante transformaciones can onicas, entonces es posible que dicha cantidad pueda enlazarse
f
acilmente con las ecuaciones de movimiento en cualquier base can
onica. Por otro lado, los invariantes can
onicos
tienen el potencial de expresar ecuaciones de movimiento equivalentes a las de Hamilton. Teniendo esto en
mente estudiaremos un invariante canonico muy importante: los corchetes de Poisson. Adicionalmente, veremos
como las ecuaciones de movimiento y las cantidades conservadas se pueden escribir en el lenguaje de los
corchetes de Poisson. Haremos adem as una breve mencion de otros invariantes canonicos

8.1. Corchetes de Poisson


Los corchetes de Poisson de dos funciones u, v con respecto a las variables can
onicas q, p se definen por

u v u v
[u, v]q,p (8.1)
qi pi pi qi

vemos que esta forma bilineal tiene la misma estructura simplectica de las ecuaciones de Hamilton en donde
q se acopla con p, y p con q. Por esta raz
on, esta definici
on se puede escribir en una estructura matricial
tambien simplectica
^
u v
[u, v] = J (8.2)

en particular podemos tomar como funciones u, v elementos del conjunto de variables can
onicas (q, p). A partir
de la definici
on (8.1)
o (8.2) estos corchetes tienen los valores

[qj , qk ]q,p = 0 = [pj , pk ]q,p


[qj , pk ]q,p = jk = [pk , qj ]q,p (8.3)

en notaci
on matricial  
[i , j ]q,p [, ]q,p [, ]
ij

todas estas propiedades se pueden escribir en una sola ecuaci


on

[, ] = J (8.4)

otro conjunto de funciones u, v interesantes seran los elementos del conjunto de variables transformadas (Q, P )
, con respecto a las antiguas variables (q, p)
o o . Escribiendo estos corchetes en notacion matricial usando

122
8.1. CORCHETES DE POISSON 123

(8.2), resulta

^ 

[, ] = J

pero las derivadas parciales definen precisamente el Jacobiano de la transformaci
on, con lo cual tenemos
f
[, ] = MJM (8.5)

si la transformaci
on es can
onica, la condici
on simplectica (7.54) nos lleva a escribir

[, ] = J (8.6)

se pueden revertir los pasos para mostrar que si (8.6) es v


alida, la transformaci
on es canonica.
Los corchetes de Poisson de variables can onicas en s tales como (8.4, 8.6), se denominan corchetes
fundamentales de Poisson. Las Ecs. (8.4) escritas en las nuevas variables can onicas, dan

[, ] = J (8.7)

y comparando (8.6) con (8.7) vemos que ambos tienen el mismo valor cuando se eval uan con respecto a
cualquier conjunto de coordenadas can onicas. En otras palabras, los corchetes de Poisson fundamentales son
invariantes bajo transformaciones can onicas. La ecuaci
on (8.5), muestra que la invarianza es una condici on
necesaria y suficiente para que la matriz de transformaci on sea simplectica. La invarianza de los corchetes
fundamentales de Poisson es en consecuencia, equivalente en todos los sentidos a la condici on simplectica.
Veremos ahora que todos los corchetes de Poisson son invariantes ante transformaciones can onicas. Reto-
memos el corchete de Poisson para funciones arbitrarias u, v Ec. (8.2), la derivada de v con respecto a se
puede escribir en analoga con la Ec. (7.49)
v v i v fki v
= = Mik = M
k i k i i
v f v
= M

similarmente
^  ^  ^
u f u = u M
= M

reemplazando estas expresiones en (8.2)
^ ^
u v u f v
[u, v] = J = MJM

si la transformaci
on es can
onica, la condici
on simplectica (7.51) nos lleva a
^
u v
[u, v] = J [u, v] (8.8)

por tanto todos los corchetes de Poisson son invariantes can onicos. Este resultado nos permite omitir
el subndice que denota el conjunto de variables que se usan para evaluar el corchete, siempre y cuando las
variables que se usen sean can onicas. Vale la pena anotar sin embargo, que las transformaciones de escala,
as como las transformaciones canonicas extendidas, en donde la condicion simplectica toma la forma (7.52),
NO dejan invariantes a los corchetes de Poisson.
Recordemos que la definici
on original de transformaciones canonicas surge de la necesidad de conservar la
forma de las ecuaciones de Hamilton ante un cambio de coordenadas generalizadas y momentos conjugados.
Esto sugiere que, dado que los corchetes de Poisson son invariantes can
onicos, podemos construr ecuaciones de
movimiento en terminos de corchetes de Poisson que sean invariantes en forma ante transformaciones canonicas.
Desarrollaremos entonces un formalismo paralelo al formalismo de Hamilton basado en los corchetes de Poisson.
124 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

8.2. Propiedades de los corchetes de Poisson


Los corchetes de Poisson poseen una serie de propiedades algebraicas de fundamental importancia, las
cuales resumimos en la siguiente forma

[u, u] = 0 ; [u, v] = [v, u] (antisimetra) (8.9)


[au + bv, w] = a [u, w] + b [v, w] (linealidad) (8.10)
[uv, w] = [u, w] v + u [v, w] (8.11)
0 = [u, [v, w]] + [v, [w, u]] + [w, [u, v]] (no asociatividad) (8.12)

donde u, v, w son funciones arbitrarias de las variables can


onicas y del tiempo en tanto que a y b son constantes.
Todas estas propiedades son directas a partir de la definici on (8.1), excepto quizas (8.12) conocida como la
identidad de Jacobi. A manera de ejemplo demostremos la propiedad (8.11) directamente con la definici on

   
(uv) w (uv) w v u w v u w
[uv, w] = = u + v u + v
qi pi pi qi qi qi pi pi pi qi
   
u w u w v w v w
[uv, w] = v+u
qi pi pi qi qi pi pi qi
[uv, w] = [u, w] v + u [v, w]

Veamos ahora la demostracion de la identidad de Jacobi (8.12). Esta propiedad muestra que la suma de
corchetes de Poisson dobles construdos con permutaciones cclicas de tres funciones es cero. Estrictamente,
esta propiedad se puede demostrar con un reemplazo explcito a partir de la definici
on, sin embargo, un cambio
de nomenclatura puede abreviar notablemente la demostraci on, las derivadas parciales las escribiremos como

u 2v
ui ; vij = uji (8.13)
i i j

con esta notaci


on el corchete de Poisson se escribe

[u, v] = ui Jij vj

esta notaci
on resulta particularmente practica para expresar los corchetes dobles de Poisson. Escribamos el
primer corchete doble de (8.12) en esta notaci
on

[u, [v, w]] = ui Jij [v, w]j = ui Jij (vk Jkl wl )j


ahora calculamos la derivada parcial con respecto a j usando regla del producto, teniendo en cuenta que las
Jkl son constantes,

[u, [v, w]] = ui Jij (vk Jkl wlj + vkj Jkl wl )


y el mismo procedimiento se realiza para los otros dos corchetes dobles en (8.12), con lo cual se obtiene otros
cuatro terminos, para un total de 6 terminos. Los otros terminos se pueden obtener por permutacion circular
de u, v, w

[w, [u, v]] = wi Jij (uk Jkl vlj + ukj Jkl vl )


[v, [w, u]] = vi Jij (wk Jkl ulj + wkj Jkl ul )

Todos los 6 terminos tienen una segunda derivada en alguna de las funciones u, v, w. Tomemos los dos terminos
que contienen segunda derivada en w

W1 ui Jij vk Jkl wlj ; W2 vi Jij wkj Jkl ul


8.3. CORCHETES DE LAGRANGE 125

el primero proviene de [u, [v, w]] y el segundo de [v, [w, u]]. Reescribamos estos terminos teniendo en cuenta
que las segundas derivadas parciales se pueden intercambiar y que la matriz J es antisimetrica

W1 ui Jij vk Jkl wlj = vk Jkl wlj Jij ui = vk Jkl wlj Jji ui


W2 = vi Jij wkj Jkl ul = vi Jij wjk Jkl ul = W1

donde hemos tenido en cuenta que todos los ndices se suman y por tanto son mudos. Es claro entonces que
W1 + W2 = 0, de modo que los dos pares de terminos que contienen segundas derivadas en w se anulan. Por
argumentos identicos, los otros dos pares que contienen segundas derivadas en u y v se anulan, con lo cual se
demuestra la identidad de Jacobi Ec. (8.12). N otese que la u
nica propiedad que se us o de J fue su antisimetra.
De aqu en adelante abandonamos la notaci on definida por (8.13). Si imaginamos al corchete de Poisson
como una ley de combinaci on u operaci
on producto entre los elementos u, v, la identidad de Jacobi nos dice
que este producto o ley de combinaci on no es asociativo, y nos dice cual es el efecto cuando cambia la secuencia
de multiplicaciones. Con frecuencia ocurre que tenemos una ley de combinaci on o producto entre elementos
u, v que satisface las propiedades (8.9-8.12) ademas de la propiedad

[ui , uj ] = ckij uk (8.14)

siendo ckij cantidades denominadas constantes de estructura. En este caso, el conjunto de todos los elementos
u, v junto con la operaci on producto, forman un algebra no conmutativa conocida como algebra de Lie. N
otese
que en este contexto la notaci on [ui , uj ] se refiere a una ley de combinaci
on cualquiera y no a los corchetes de
Poisson. A las constantes ckij se les conoce como constantes de estructura.
En el espacio tridimensional, los corchetes de Poisson cumplen la propiedad (8.14) de una manera bien
particular. O bien, todas las constantes de estructura son cero, o bien solo hay un termino en el lado derecho
de la ecuaci on (8.14), para cada par de ndices i, j.
Un comentario final sobre algebras de Lie, nombraremos dos conjuntos de algebras de Lie particularmente
u algebra definida sobre los vectores Euclidianos en R3 con la ley de combinaci
tiles en Fsica, la primera es el on

V [A, B] A B

la segunda es el algebra definida sobre el conjunto de matrices n n con la operaci


on producto definida por
el conmutador entre ellas
M [A, B] AB BA

lo interesante es que muchos resultados solo dependen de la estructura de


algebra y no de la forma explcita
de la ley de combinaci
on.

8.3. Corchetes de Lagrange


Sean u, v dos funciones pertenecientes a un conjunto de 2n funciones de las variables can onicas, y que son
independientes entre s. Invirtiendo las ecuaciones se pueden escribir las variables can
onicas en funcion de este
conjunto de 2n funciones. El corchete de Lagrange de u y v con respecto a las variables (q, p) se define como

qi pi pi qi
{u, v}q,p =
u v u v
^

{u, v} = J
u v

la prueba de su invarianza can onica es muy similar a la de los corchetes de Poisson. Hay una especie de
relaci
on inversa entre los corchetes de Poisson y Lagrange, que se manifiesta en la siguiente propiedad. Sea ui
un conjunto de 2n funciones de las variables can onicas e independientes entre s. Con este conjunto se puede
126 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

formar el vector u de dimensi on 2n, y la matriz 2n 2n definida por {u, u}ij {ui , uj }. Similarmente se
define la matriz [u, u] para corchetes de Poisson, se deja como ejercicio verificar que

{u, u} [u, u] = 1 (8.15)

sin embargo, los corchetes de Lagrange no son de tan amplio uso como los de Poisson. La razon estriba en el
hecho de que esta nueva ley de combinaci
on posee las mismas propiedades fundamentales de los corchetes de
Poisson, pero con una importante excepcion: los corchetes de Lagrange no obedecen la identidad de Jacobi y
por tanto no forman un algebra de Lie.

8.4. Otros invariantes can


onicos
Un invariante can onico muy importante es la magnitud de un elemento de volumen en el espacio de fase.
Una transformaci on can
onica transforma el espacio de fase 2n dimensional con coordenadas i en otro
espacio de fase con coordenadas i . El elemento de volumen

(d) = dq1 . . . dqn dp1 . . . dpn

se transforma a un nuevo elemento de volumen (d)

(d) = dQ1 . . . dQn dP1 . . . dPn

como es bien sabido, las magnitudes de los dos elementos de volumen est
an enlazadas a traves del valor absoluto
del determinante de la matriz jacobiana
(d) = kMk (d)
Pero tomando el determinante en la condicion simplectica (7.51), se obtiene

f 2
MJM = kJk kMk kJk = kJk kMk = 1

de modo que el valor absoluto del determinante de M es uno (si la transformaci on canonica es real, el de-
terminante es 1). Esto muestra entonces que el elemento diferencial de volumen en el espacio de fase es un
invariante can
onico. Como corolario resulta que el volumen de una regi
on arbitraria en el espacio de fase
Z Z
Jn = . . . (d)

es un invariante can
onico. Esta integral de volumen es el miembro final de una secuencia de invariantes can
oni-
cos que constan de integrales sobre subespacios del espacio de fase de diferentes dimensiones. Tal secuencia es
conocida como integrales invariantes de Poincar e.

8.5. Relaci
on entre la condici
on simpl
ectica y las funciones generatrices
(opcional)
La relaci
on entre los corchetes de Poisson y el formalismo de las funciones generatrices se puede sintetizar
en el teorema de Caratheodory, el cual enuncia que la condici
on simplectica implica la existencia de funciones
generatrices.
Por simplicidad examinaremos un sistema con espacio de fase dos dimensional. La extensi on a espacios de
fase de dimension arbitraria es directa. Comenzamos con el conjunto de transformaciones de la forma

Q = Q (q, p) ; P = P (q, p) (8.16)

si suponemos que la primera de estas transformaciones es invertible de modo que p se puede escribir como
funci
on de q, Q entonces
p (q, Q) (8.17)
ENTRE LA CONDICION
8.5. RELACION SIMPLECTICA
Y LAS FUNCIONES GENERATRICES (OPCIONAL)

y si a su vez sustitumos esta expresi


on en la segunda ecuacion de transformaci
on, obtenemos P tambien en
funci
on de q, Q
P = P (q, (q, Q)) (q, Q) (8.18)
queremos ahora enlazar estas transformaciones con las funciones generatrices. Dado que las Ecs. (8.17, 8.18)
tienen como argumentos a q, Q es natural que estas transformaciones se construyan con funciones generatrices
de tipo 1. En algunos casos, cuando la primera de las Ecs. (8.16) no es invertible (como en la transformaci
on
identidad) podemos comenzar invirtiendo la segunda de las Ecs. (8.16) y reemplazando en la primera, con lo
cual llegamos a funciones generatrices del tipo 2.
Volviendo a nuestro caso, asumiendo que existen funciones generatrices de tipo 1, que pueden generar a
las Ecs. (8.17, 8.18) se escriben seg
un la prescripci
on dada por (7.12)
F1 (q, Q) F1 (q, Q)
p= ; P = (8.19)
q Q
si las ecuaciones (8.19) se cumplen (es decir, si es consistente nuestra suposicion de que la funci
on generatriz
es de tipo 1) entonces se debe cumplir que
   
F1 F1
= [p (q, Q)] = [P (q, Q)]
Q q q Q Q q

= (8.20)
Q q
donde hemos usado (8.19), (8.17), y (8.18). Recprocamente, si se cumple (8.20) debe existir una funci
on de
tipo 1 que satisfaga (8.19).
Para demostrar la validez de (8.20), escribiremos todas las cantidades en terminos de q, Q. Comenzamos
con la identidad
Q
=1
Q
sustituyendo la Ec. (8.17) en la primera de las Ecs. (8.16)
Q = Q (q, (q, Q))
la derivada parcial anterior se puede escribir como
Q Q
= =1 (8.21)
Q p Q
ahora evaluamos el corchete de Poisson
Q P P Q
[Q, P ] =1 (8.22)
q p q p
donde hemos usado las propiedades (8.3).
Las derivadas de P son derivadas de (ver Ec. 8.18) consideradas como funciones de q y Q (q, p) con lo
cual se tiene
P (q, Q (q, p)) Q
= = +
q q q Q q
Por lo tanto, el corchete de Poisson se escribe
 
Q Q Q Q
[Q, P ] = +
q Q p p q Q q
reorganizando terminos
 
Q Q Q Q Q
[Q, P ] =
Q q p p q p q
Q
[Q, P ] = =1 (8.23)
p q
128 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

Combinando (8.23) con (8.21) resulta


Q Q
= (8.24)
p Q p q

dado que la derivada parcial Q p esta evaluada a ambos lados para los mismos argumentos (variando Q y
manteniendo fijo q), se tiene que su valor a ambos lados de la igualdad es el mismo. Por otro lado esta derivada
es diferente de cero si asumimos que la primera de las Ecs. (8.16) es invertible. Por tanto la ecuacion (8.24) nos
lleva a la Ec. (8.20) que nos lleva a la existencia de una funci
on generatriz para la transformacion (8.16). Para
llegar a (8.20) hemos partido de la Ec. (8.22), que nos dice que [Q, P ] = 1, pero recordemos que esta propiedad
es equivalente a la condicion simplectica. Por tanto, la condici
on simplectica nos lleva a la existencia de una
funcion generatriz y viceversa. Los dos formalismos son entonces equivalentes.

8.6. Ecuaciones de movimiento en el formalismo de los corchetes de Pois-


son
Dado que los corchetes de Poisson son invariantes can onicos, las ecuaciones de movimiento que involucren
a estas cantidades van a conservar su forma ante transformaciones can onicas. Por ejemplo, veamos la ecuaci
on
de movimiento asociada a una funci on u de las variables canonicas q, p, t. Usando las ecuaciones de Hamilton,
la derivada temporal de esta funci
on se puede escribir como

du u u u u H u H u
= qi + p i + = +
dt qi pi t qi pi pi qi t

lo cual se escribe como


du u
= [u, H] + (8.25)
dt t
la derivaci
on de (8.25), tambien se puede realizar en notacion simplectica, la regla de la cadena la escribimos
como
^
du u u
= +
dt t
y usando las Ecs. de Hamilton y la definici
on de los corchetes de Poisson en forma simplectica Ecs. (6.25) y
(8.2) se tiene
^
du u H u u
= J + = [u, H] +
dt t t
La expresi on (8.25) se puede ver como una ecuacion de movimiento generalizada para una funcion arbitraria
u (q, p, t) en la formulacion de los corchetes de Poisson. Una escogencia muy natural es u = qi
o pi con lo cual
resulta

qi = [qi , H] ; p i = [pi , H]
= [, H] (8.26)

notese que estas ecuaciones dependen de que q/t = 0. Esto se puede ver del hecho de que u (q, p, t) /t
consiste en evaluar la raz
on de cambio de u manteniendo fijo q y p moviendo solo el tiempo, y esto es v alido
en particular cuando u = q. Se observa que esto es diferente al caso en el cual se toma q = q (t) en cuyo caso
q/t = dq/dt = q. Argumento similar se sigue para ver que p/t = 0. Usando la definici on simplectica de
los corchetes de Poisson (8.2) queda
^
u u u
[, u] = J =IJ =J (8.27)

8.7. CONSTANTES DE MOVIMIENTO 129

tomando u = H y reemplazando en (8.26), resulta

H
= J

que son las ecuaciones de Hamilton en forma simplectica. Vemos entonces que tomando la expresion general
(8.25), con u = q, p resultan las ecuaciones de movimiento para q, p que coinciden con las ecuaciones de
Hamilton como era de esperarse. Otra propiedad familiar resulta cuando se toma u = H en (8.25), lo cual nos
arroja
dH H
=
dt t
que coincide con (6.26). Notese que la ecuacion de movimiento (8.25) es invariante en forma ante una trans-
formaci
on canonica. La ecuacion es v
alida cualquiera que sea el conjunto de coordenadas can onicas que se use
para expresar a u y para evaluar el corchete de Poisson. No obstante, debe tenerse en cuenta que el Hamil-
toniano que se use debe ser apropiado para el conjunto de variables can onicas elegido, cuando se pasa a otro
conjunto de variables canonica debemos cambiar al Hamiltoniano transformado o Kamiltoniano.
Un comentario final, la ecuaci
on de movimiento (8.25) solo ser a v
alida si u solo es funci
on explcita de las
coordenadas q, p del sistema y del tiempo, es decir u no puede ser funci on explcita de una variable externa
(por ejemplo no podra ser funcion explcita de un campo electrico externo) toda la dependencia de u con
respecto al exterior debe estar en el par
ametro tiempo.

8.7. Constantes de movimiento


Otro caso de gran interes surge cuando u es una constante de movimiento i.e. du/dt = 0, con lo cual (8.25)
se reduce a
u
[H, u] = (8.28)
t
e inversamente, todas las funciones que obedezcan la ecuaci on de movimiento (8.28), son constantes de movi-
miento. Esta ecuacion nos provee de un metodo sistematico para encontrar constantes de movimiento. Adicio-
nalmente, si la constante de movimiento no involucra al tiempo explcitamente, la condici
on sobre u se reduce
a
[H, u] = 0 (8.29)
Si conocemos dos constantes de movimiento, la identidad de Jacobi nos da la posibilidad de obtener m as
constantes de movimiento. Si u, v son constantes de movimiento que no dependen explcitamente del tiempo,
podemos usar la identidad de Jacobi (8.12) para escribir

[u, [v, H]] + [v, [H, u]] + [H, [u, v]] = 0 (8.30)

los dos primeros miembros de la izquierda son cero y queda

[H, [u, v]] = 0

lo cual nos dice que [u, v] es una constante de movimiento. Cuando u, v dependen explcitamente del tiempo,
el corchete de Poisson entre ellos sigue siendo constante de movimiento, aunque la demostraci on es un tanto
mas elaborada. Al ser u y v constantes de movimiento se cumple para ambos la Ec. (8.28), al reemplazar dicha
ecuacion en la identidad de Jacobi (8.30) se obtiene
     
v u
u, + v, + [H, [u, v]] = 0
t t
     
v u
, u + v, = [H, [u, v]]
t t
130 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

usando la definici
on de los corchetes de Poisson obtenemos
             
v u v u v u v u
+ = [H, [u, v]]
qi t pi pi t qi qi pi t pi qi t
           
v u v u v u v u
+ = [H, [v, u]]
t qi pi t pi qi qi t pi pi t qi
           
v u v u v u v u
+ = [H, [v, u]]
t qi pi qi t pi pi t qi t pi qi

reagrupando terminos
   
v u u v
= [H, [v, u]]
t qi pi t qi pi
 
v u u v
= [H, [v, u]]
t qi pi qi pi

[v, u] = [H, [v, u]]
t
al comparar con (8.28) se obtiene que [v, u] = [u, v] es una constante de movimiento. Llegamos entonces al

Theorem 4 Teorema de Poisson: El corchete de Poisson de dos constantes de movimiento es tambien una
constante de movimiento.

En consecuencia, la aplicacion reiterada del teorema de Poisson nos puede proveer de un conjunto de cons-
tantes de movimiento. Desafortunadamente, este algoritmo nos lleva con frecuencia a constantes de movimiento
triviales o claramente dependientes de las anteriores. Sin embargo, el metodo debe ser tenido en cuenta para
multiples aplicaciones.
Vale la pena mencionar que la condici on 8.28 es necesaria y suficiente para que una cierta funci on de las
variables q, p del sistema y el tiempo sea constante de movimiento. Sin embargo, tal expresi on no nos da un
algoritmo para encontrar constantes de movimiento, m as bien es un metodo para chequear si una cantidad dada
es o no es una constante de movimiento del sistema. Esta forma de evaluaci on posee no obstante la ventaja
de que podemos verificar si una cantidad es o no es constante de movimiento sin resolver completamente la
evolucion del sistema. Finalmente, enfatizamos de nuevo que para que esta formulaci on sea valida, u no puede
ser funcion explcita de ninguna variable externa al sistema.

8.7.1. Ejemplo de constantes de movimiento evaluadas por corchetes de Poisson


Sea un sistema de dos grados de libertad descrito por el Hamiltoniano

H = q1 p1 q2 p2 aq12 + bq22

mostraremos que
p1 aq1
F1 = F2 = q1 q2
q2
son constantes de movimiento. Puesto que F1 y F2 no dependen explcitamente del tiempo, solo debemos
chequear que los corchetes de Poisson de estas cantidades con el Hamiltoniano se anulen
   
H F1 F1 H H F1 F1 H
[H, F1 ] = +
q1 p1 q1 p1 q2 p2 q2 p2
       
1 a (p1 aq1 )
[H, F1 ] = (p1 2aq1 ) q1 + (p2 + 2bq2 ) 0 (q2 )
q2 q2 q22
(p1 2aq1 ) aq1 (p1 aq1 )
[H, F1 ] = + =0
q2 q2 q2

8.8. TRANSFORMACIONES CANONICAS INFINITESIMALES EN EL FORMALISMO DE LOS CORCHETES D

por tanto F1 es constante de movimiento, veamos a F2

[H, F2 ] = [(p1 2aq1 ) 0 (q2 ) q1 ] + [(p2 + 2bq2 ) 0 (q1 ) (q2 )]


[H, F2 ] = q2 q1 + q1 q2 = 0

luego F2 tambien es constante de movimiento. Dado que tenemos dos constantes de movimiento, es inmediato
pensar que el teorema de Poisson podra proveernos de otras constantes de movimiento independientes. Para
ello debemos evaluar el corchete de Poisson entre estas constantes
   
F2 F1 F1 F2 F2 F1 F1 F2
[F2 , F1 ] = +
q1 p1 q1 p1 q2 p2 q2 p2
         
1 a (p1 aq1 )
[F2 , F1 ] = (q2 ) (0) + (q1 ) (0) 0
q2 q2 q22
[F2 , F1 ] = 1

se concluye que la unidad es una constante de movimiento, lo cual es cierto pero trivial. En este caso el
teorema de Poisson no es u til para generar constantes de movimiento independientes. Notese que en general
lo u
nico que afirma el teorema es que el corchete entre dos constantes de movimiento es otra constante de
movimiento, pero no nos dice si esa constante es no trivial o si es independiente de las dos anteriores. M
as
adelante veremos algunos ejemplos en donde el teorema de Poisson nos genera constantes de movimiento no
triviales e independientes de las anteriores.

8.8. Transformaciones canonicas infinitesimales en el formalismo de los


corchetes de Poisson
Las transformaciones can onicas infinitesimales (TCI) forman parte de un tipo especial de transformaciones
que son una funci on contnua de un par ametro y que comienzan con la transformaci on identidad para algun
valor inicial del par
ametro. Estas transformaciones adquieren particular interes ya que una transformaci on
canonica arbitraria se puede construr como una sucesi on de transformaciones infinitesimales. De nuevo el
caracter de invariante canonico de los corchetes de Poisson, hace que exista un especial interes en escribir las
TCI en este formalismo.
En las transformaciones can onicas infinitesimales, las nuevas variables difieren de las antiguas en cantidades
infinitesimales
= +
esta ecuacion solo me caracteriza una transformaci on infinitesimal arbitraria. Cuando esta transformaci on es
canonica, el cambio se especifica con el par
ametro infinitesimal y la funci
on generatriz de las transformaciones
infinitesimales G (ver Ec. 7.64)
G ()
= J (8.31)

tomando la Ec. (8.27)
u
[, u] = J (8.32)

esta expresi
on es v
alida independientemente del conjunto de variables can
onicas usadas para evaluar el corchete.
Haciendo u = G y reemplazando (8.32) en (8.31)

= [, G] (8.33)

con lo cual hemos logrado el proposito de escribir la TCI en terminos corchetes de Poisson, en donde el corchete
involucra a las variables can
onicas en cuestion, la funci
on generatriz de la TCI y el parametro infinitesimal de
132 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

evoluci
on. Consideremos el caso en el cual el par
ametro contnuo es el tiempo de modo que = dt. Tomemos
como funcion generadora el Hamiltoniano. Las ecuaciones de transformaci on para las TCI se obtienen de (8.33)

= [, H] dt = dt = d (8.34)

donde hemos usado las Ecs. de Hamilton en corchetes de Poisson Ecs. (8.26). Para ver el significado de (8.34)
recordemos el significado de y de d. La cantidad se refiere al cambio infinitesimal en las coordenadas
debido a una transformaci on can onica, recordemos que un cambio de coordenadas no se refiere a la evoluci on del
sistema. En contraste d se refiere al cambio de las coordenadas desde el tiempo t a sus valores en el tiempo
t + dt como producto de la evoluci on del sistema. En consecuencia, la igualdad entre estas dos cantidades
infinitesimales nos muestra que la TCI generada por el Hamiltoniano y usando el tiempo como par ametro
contnuo, cambia las coordenadas y momentos en la misma forma que lo hara la evoluci on del sistema. En
otras palabras, el movimiento del sistema Fsico en un intervalo de tiempo dt se puede describir a traves de
una transformacion can onica infinitesimal generada por el Hamiltoniano. Por otro lado, una transformaci on
canonica arbitraria se puede obtener por medio de TCIs sucesivas. Es decir, que el movimiento del sistema en
un intervalo finito de tiempo se obtiene con sucesivos corrimientos dt. Los valores de q, p en cierto tiempo se
pueden obtener a partir de sus valores iniciales por una transformaci on can onica que es funcion contnua del
tiempo. De acuerdo a este punto de vista, el movimiento de un sistema mec anico corresponde a una evoluci on
contnua de las transformaciones can onicas. Todo este razonamiento nos lleva a concluir que el Hamiltoniano
es el generador del movimiento del sistema con el tiempo.
Inversamente, debe existir una transformaci on can
onica que a partir de los valores de las variables q, p en un
tiempo t, nos lleve a sus valores iniciales. Encontrar esta transformaci on can onica es equivalente a resolver la
ecuacion de movimiento. Habamos sugerido previamente la posibilidad de obtener un Hamiltoniano con todas
las coordenadas cclicas que conduca a que todos los momentos eran constantes de movimiento. La presente
estrategia, si es posible, nos llevara a una transformaci on canonica en donde qi y pi seran todas constantes de
movimiento. Volveremos sobre estas consideraciones en el siguiente captulo para obtener soluciones formales
para sistemas mec anicos.
Lo anterior nos lleva a contemplar la posibilidad de ver a las transformaciones can onicas desde otro punto
de vista, as como a los efectos que esta produce. La noci on de transformaci on canonica se introdujo como un
cambio en las coordenadas (pero no en la configuraci on del sistema) para describir el mismo sistema usando
otro espacio de fase. En esta vision, cambiamos de las coordenadas (q, p) de un espacio de fase , a otro espacio
de fase con coordenadas (Q, P ). Si el estado de un sistema en un cierto tiempo est a descrito por un punto
A en el espacio de fase , tambien puede describirse equivalentemente a traves del punto transformado A del
espacio de fase (en el mismo instante de tiempo). Cualquier funci on del sistema de variables tendr a el mismo
valor para una configuraci on dada del sistema, bien sea que la describamos con el conjunto (q, p) o con (Q, P ).
Es decir, la funcion tendr a el mismo valor en A que en A (aunque diferente forma funcional). Este se llama
un punto de vista pasivo de la TC. Desde el punto de vista matem atico, esto corresponde a un mapeo desde
el espacio al espacio (con inversa). La Fig. 8.1 ilustra el concepto de TC desde el punto de vista pasivo.
Notese que con este enfoque, la transformaci on de coordenadas est a totalmente desligada de la evoluci on del
sistema.
La TC que genera el Hamiltoniano usando al tiempo como par ametro, sugiere otra interpretacion para esta
TC. Cuando movemos el par ametro tiempo desde t hasta t, esta TC cambia las coordenadas y momentos
desde sus valores en el tiempo t hasta los valores que estas tendran en el tiempo t + t. Esta transformaci on
canonica se puede interpretar consistentemente de la siguiente manera: Dicha TC nos relaciona las coordenadas
(q, p) de un punto en el espacio de fase (definido con las coordenadas q, p) con las coordenadas (Q, P ) de otro
punto en el mismo espacio de fase. Esto corresponde a un mapeo del espacio de fase en s mismo. Lo
anterior nos conduce a una interpretaci on activa de la TC como la generadora de movimiento del punto
en el espacio de fase de una posici on (q, p) a otra posicion (Q, P ). Por supuesto, la transformacion can onica
como tal no puede mover o cambiar la configuraci on del sistema. Lo que ocurre es que el cambio de coordenadas
producido por la TC emula el cambio din amico de las coordenadas producido por la evoluci on del sistema. En
otras palabras, el paso de (q, p) a (Q, P ) bajo una TC significa que estoy cambiando el sistema coordenado
que uso para describir al sistema, el mismo cambio interpretado en forma din amica se refiere al cambio que

8.8. TRANSFORMACIONES CANONICAS INFINITESIMALES EN EL FORMALISMO DE LOS CORCHETES D

Figura 8.1: Descripci


on de una transformaci
on can
onica (a) desde el punto de vista pasivo y (b) desde el punto
de vista activo.

el mismo sistema coordenado sufre por efecto de la evoluci on del sistema. El punto es que cuando las dos
transformaciones coinciden numericamente, puedo atribur la din amica del sistema (desde un punto de vista
pr
actico) a la transformacion canonica.
La interpretaci
on activa no es siempre util. Por ejemplo, la TC que nos lleva de las coordenadas cartesianas
a las coordenadas polares esfericas, es una TC de tipo pasivo, y una interpretaci on activa sera absurda.
Por ejemplo, los ejes de ambos espacios de fase no poseen las mismas unidades fsicas pues en coordenadas
cartesianas ambos ejes de coordenadas tienen unidades de longitud y los ejes de momentos tienen unidades
de masa por velocidad, en contraste se tiene que en coordenadas polares hay un eje angular adimensional
en la coordenada y el eje de p tiene unidades de momento angular (aunque s son iguales las dimensiones
en cuanto al n umero de coordenadas i.e. ejes independientes, es decir son iguales las dimensiones de los dos
espacios de fase como espacios vectoriales).
El punto de vista activo es particularmente u til en TCs que dependen en forma contnua de un solo
parametro1 . En la interpretaci
on activa, el efecto de la TC es el de mover el punto del sistema de manera
contnua trazando as una curva en el espacio de fase, a medida que el par ametro cambia en forma contnua.
1
N
otese que en transformaciones can onicas contnuas uniparametricas no es de esperarse que las unidades de las coordenadas y
momentos cambien con la transformaci on. A manera de ejemplo, asumamos por un momento que para un sistema unidimensional
partimos de variables (q, p) donde q tiene unidades de longitud y p de momento lineal, y terminamos con un sistema (Q, P ) donde
Q es adimensional y P tiene unidades de momento angular. Es claro que el cambio de unidades es discreto y no es de esperarse
que una TC que se puede generar por TCIs sucesivas me lleve a un cambio en las unidades de las coordenadas, a menos que se
presente el caso bastante atpico de una TC que vare de manera contnua las unidades de las variables. Por tanto las TC contnuas
uniparametricas permiten interpretar consistentemente el hecho de que la transformaci on siempre este en el mismo espacio de fase.
134 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

Cuando la TC es la generada por el Hamiltoniano usando al tiempo como el par ametro contnuo, la curva
sobre la cual se mueve el punto del sistema coincide con la trayectoria del sistema en el espacio de fase.

8.8.1. Cambio de una funci on del sistema bajo una transformaci


on can
onica en los en-
foques pasivo y activo
Nos preguntamos ahora por el cambio de una funci on del sistema U = U (q, p, t) bajo una TC. Veremos
que el cambio en esta funci on depende de si tomamos el punto de vista activo o pasivo.
Bajo el punto de vista pasivo, debemos tener en cuenta que si en un instante dado t0 la transformaci on
canonica se describe por Q0 = Q (q0 , p0 , t0 ) , P0 = P (q0 , p0 , t0 ) entonces el conjunto (q0 , p0 ) describe la misma
configuraci on del sistema que el conjunto (Q0 , P0 ). Ahora bien, el valor de una funci on del sistema solo puede
depender de la configuraci on de este. Por lo tanto, el cambio del conjunto coordenado (q0 , p0 ) al conjunto
(Q0 , P0 ) debe dejar inalterado el valor de una funci on del sistema, aunque la funci on puede cambiar de forma
o dependencia funcional con las nuevas variables. Podemos escribir entonces que U (q0 , p0 , t0 ) = U (Q0 , P0 , t0 ).
En otras palabras, el valor numerico de una funci on del sistema no puede depender del espacio de fase que
utilice para describir a dicha funci on.
En contraste, una visi on activa de la TC nos habla de una traslaci on del sistema del punto A al punto B,
de la posici on (qA , pA ) a la posici
on (qB , pB ) en el mismo espacio de fase. Desde este punto de vista, la funci on
U (q, p) no cambia su dependencia funcional con respecto a q, p ya que no estamos cambiando de espacio
de fase. En cambio, la funci on s cambia su valor como resultado del cambio en el valor de los argumentos
U (qA , pA ) 6= U (qB , pB ). Esto tiene que ver con el hecho de que en la visi on activa A y B me est an describiendo
diferentes configuraciones del sistema.
Usaremos el smbolo para denotar el cambio en el valor de una funci on bajo una TCI activa

u u (B) u (A) (8.35)

donde A y B estan infinitesimalmente cerca, de nuevo usando notaci


on matricial escribimos

u = u ( + ) u ()

expandiendo en serie de Taylor hasta primer orden en infinitesimales y usando (8.31) se obtiene
" ^ #
u
u = u () + + . . . u ()

^ ^
u u G
u = = J

recordemos que el uso de la Ec. (8.31) es lo que nos garantiza que la transformaci
on sea can
onica. Ahora
utilizamos la definici
on de corchetes de Poisson (8.2) para obtener:

u = [u, G] (8.36)

de nuevo la aplicaci
on mas inmediata consiste en usar (8.36) cuando u es una coordenada del espacio de fase,
teniendo en cuenta ademas la Ec. (8.33), resulta

= [, G] = (8.37)

Este resultado es obvio a partir de la definici


on del punto B con respecto al punto A, el cambio en las
coordenadas desde A hasta B es precisamente la diferencia infinitesimal entre las coordenadas viejas y nuevas.

8.8. TRANSFORMACIONES CANONICAS INFINITESIMALES EN EL FORMALISMO DE LOS CORCHETES D

8.8.2. Cambio del Hamiltoniano bajo una transformaci


on can
onica
Las consideraciones anteriores son mucho mas delicadas cuando estudiamos el cambio en el Hamiltoniano.
La raz
on estriba en el hecho de que el Hamiltoniano no es una funci on del sistema. Para ver la razon,
recordemos que el Hamiltoniano puede diferir tanto funcional como numericamente cuando pasamos de un
conjunto canonico a otro, la expresi
on
H (q, p, t) 6= K (Q, P, t)
nos indica que el Hamiltoniano puede cambiar tanto funcional como numericamente, incluso si los dos sistemas
canonicos describen la misma configuraci
on del sistema. Esto viola claramente nuestra definicion de funcion
del sistema. El Hamiltoniano se refiere mas bien a la funci
on que en un determinado espacio de fase define las
ecuaciones canonicas de movimiento. Cuando la transformaci on can
onica depende del tiempo, el significado
mismo de Hamiltoniano se transforma. De esta forma H (A) no se transforma en H (A ) 2 sino en K (A ), y
H (A) no tendr a necesariamente el mismo valor que K (A ). A manera de ejemplo, en cierto espacio de fase
el Hamiltoniano puede ser la energa del sistema y en otro espacio de face puede no serlo. En virtud de lo
anterior, designaremos por H a la diferencia en el valor del Hamiltoniano bajo las dos interpretaciones.

H = H (B) K A (8.38)

en los casos en que la funci on misma no cambia con la transformaci on canonica, las dos formas de cambio

descritas por (8.35) y (8.38) son identicas puesto que u (A) = u (A ) (recordemos que el valor numerico de las
funciones coincide en A y A en una interpretaci on pasiva). En general, K esta relacionado con H a traves de
la ecuaci
on
F
K=H+ (8.39)
t
Una vez que definimos la relaci on entre los Hamiltonianos en ambos espacios de fase a traves de la relaci on
(8.39), las funciones K y H ya se pueden tomar como funciones del sistema, es decir como funciones bien
definidas para una configuraci on dada del sistema. Por ejemplo H (A) = H (A ) ya que se trata de la misma
on del sistema definida en puntos A y A de diferentes espacios de fase pero que describen la misma
funci
configuracion del sistema. Para una TCI, la funci on generatriz esta dada por (7.61) en terminos de G. Dado
que en (7.61) solo G puede ser funci on explcita del tiempo, el valor del nuevo Hamiltoniano es
  G G
K A = H A + = H (A) +
t t
y el cambio en el Hamiltoniano definido en (8.38) es
G
H = H (B) H (A)
t
siguiendo un camino similar al que nos llev
o desde (8.35) hasta (8.36), vemos que H est
a dado por
G
H = [H, G]
t
tomando la ecuaci
on generalizada de movimiento (8.25) con u = G, resulta
 
G dG G
H =
t dt t
dG
H = (8.40)
dt
En particular, si G es una constante de movimiento, la Ec. (8.40) nos dice que G genera una TCI que no
cambia el valor del Hamiltoniano. Recprocamente, podemos ver que muchas constantes de movimiento
son funciones generadoras de aquellas TCI que dejan el Hamiltoniano invariante.
2
Usaremos la convencion de que u es la forma funcional que hace que u (A) = u (A ), es decir es la forma en que debe
transformar la forma funcional de u ante un cambio de espacio de fase a fin de que dicha cantidad defina una funci
on del sistema.
136 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

Nuevamente, la aseveraci on anterior nos muestra una conexi on entre propiedades de simetra y cantidades
conservadas. Esta conexi on se ve de manera mas simple para constantes de movimiento que no dependen
explcitamente del tiempo. El cambio en el Hamiltoniano bajo la transformaci on es simplemente el cambio en
el valor de este cuando el sistema se mueve de la configuraci on A a la configuraci
on B. Si el sistema es invariante
ante la operaci on que produce este cambio de configuraci on, entonces el Hamiltoniano no ser a afectado por tal
transformaci on. Para tomar un ejemplo, vemos que si un sistema es invariante ante una transformaci on que
lleva al sistema como un todo en una direcci on dada, el Hamiltoniano ser a invariante cuando el sistema como
un todo se lleva en esa direcci on (esta direccion no significa necesariamente traslaci on, puede ser por ejemplo
una rotaci on). La cantidad que genera a la correspondiente TCI se debe conservar.
N
otese que este escenario abarca muchas constantes de movimiento independientes y no solo los momentos
generalizados conservados. No obstante, no abarca todas las constantes de movimiento (recordemos que la Ec.
8.25 abarca formalmente todas las constantes de movimiento). La raz on estriba en que las transformaciones de
simetra m as generales son las que dejan invariantes las ecuaciones de movimiento, incluso si no dejan invariante
al Hamiltoniano3 , ya hemos visto en la secci on 5.3 que con el formalismo Lagrangiano la invarianza de las
ecuaciones de movimiento nos lleva a constantes de movimiento que no est an includas en escenarios donde el
Lagrangiano mismo es invariante. Lo esencial es tener en cuenta que ni el Lagrangiano ni el Hamiltoniano son
observables del sistema, y por tanto pueden ser modificados de una manera especial sin cambiar el contenido
fsico de este.
En todo caso, la relacion entre la constante de movimiento G y la invarianza del Hamiltoniano nos muestra
una vez m as el fuerte nexo entre simetras y cantidades conservadas. A manera de consistencia, debe verificarse
que los teoremas de conservaci on de los momentos generalizados son casos especiales de lo anterior. Si una
coordenada qj es cclica, es obvio que el Hamiltoniano es invariante ante una transformaci on infinitesimal que
involucre un desplazamiento de qj u nicamente. Por supuesto, es necesario asegurarse que dicha transformaci on
infinitesimal es de naturaleza can onica, de ser as, debe existir una funci on generatriz G que me genere la
hipotetica TCI a traves de las ecuaciones (7.62, 7.63), puede verificarse que la funci on

G (q, p) = pi (8.41)

genera una transformaci


on can
onica infinitesimal a traves de (7.62, 7.63) descrita por

qj = ij ; pi = 0 (8.42)

es decir pi es una funci


on generatriz de una transformaci on canonica infinitesimal que desplaza a qi u
nicamente.
Dado que solo qi se desplaza, es obvio que si dicha coordenada es cclica el Hamiltoniano queda invariante,
lo cual nos lleva a la conservaci
on de G seg un la Ec. (8.40), pero G en nuestro caso es precisamente pi como
se ve en (7.9). Por tanto, se observa que si qi es cclica llegamos a la conservacion de su momento conjugado
como se esperaba.
El hecho de que el desplazamiento infinitesimal de solamente la coordenada qj sea generada por su momento
conjugado, se puede escribir en un contexto mas general. Tomemos como generador de una TCI a la funci on

Gl = (J)l = Jlr r (8.43)

la ecuaciones de transformaci
on (7.64) aplicadas a (8.43) dan
Gl r
k = Jks = Jks Jlr = Jks Jlr rs = Jks Jls = Jks Jesl
s s
lo cual en virtud de la ortogonalidad de J resulta

k = kl

lo cual muestra claramente que una transformaci on que cambie solo a l es generada por su variable conjugada.
Si l es qi entonces G es pi . Si l es pi , G es entonces qi .
3 dF (q,p,t)
Notese que una transformaci
on que cambie al Hamiltoniano en la forma H = H + dt
, deja invariantes las ecuaciones de
movimiento pero no al Hamiltoniano.

8.8. TRANSFORMACIONES CANONICAS INFINITESIMALES EN EL FORMALISMO DE LOS CORCHETES D

8.8.3. El momento angular como generador de TCIs que generan rotaciones


Examinemos una vez m as el caso en el cual realizamos la rotaci
on de un sistema como un todo pero
ahora en el marco del formalismo de las TCIs. En primer lugar es importante enfatizar que el significado
fsico de la funcion generatriz G no puede depender del conjunto canonico empleado para describirla. Para ver
esto, observemos que en la Ec. (8.33) el cambio de una cierta variable can onica i es el mismo independiente
del sistema can onico que usemos para expresar G, ello en virtud de la invarianza can onica de los corchetes
de Poisson. Por lo anterior, podemos utilizar en particular las coordenadas cartesianas de las partculas del
sistema. Adicionalmente, y sin perdida de generalidad elegiremos al eje de rotaci on como nuestro eje z. Para
una rotaci on infinitesimal antihoraria en un
angulo d la matriz de rotaci
on a primer orden se escribe
   
cos d sin d 1 d

sin d cos d d 1

ahora tendremos en cuenta que en coordenadas cartesianas tanto las coordenadas (xi , yi , zi ) como los momentos
conjugados (pix , piy , piz ) forman vectores euclidianos, de modo que se comportan de la misma forma ante
rotaciones4 de modo que
    
xi 1 d xi
= xi = xi yi d ; yi = yi + xi d
yi d 1 yi
xi xi = yi d ; yi yi = xi d

dado que los momentos poseen las mismas transformaciones, basta con hacer reemplzazo de la forma xi pix
para obtener la trasnformaci
on de los momentos, las transformaciones infinitesimales quedan entonces

xi = yi d ; yi = xi d ; zi = 0
pix = piy d ; piy = pix d ; piz = 0 (8.44)

estrictamente, a
un no hemos demostrado que esta transformaci on es can
onica. Esto equivale a demostrar que
existe una funci
on generatriz G, tal que las Ecs. (7.62, 7.63) reproducen adecuadamente a las ecuaciones (8.44).
Podemos ver que una funci on generatriz adecuado para esta TCI es

G = xk pky yk pkx (8.45)

siendo d el par
ametro infinitesimal . Esto se puede ver explcitamente reemplazando (8.45) en las Ecs. (7.62,
7.63)

G G G
xi = d = yi d ; yi = d = xi d ; zi = d =0
pix piy piz
G G G
pix = d = piy d ; piy = d = pix d ; piz = d =0
xi yi zi

que reproduce correctamente las Ecs. (8.44). Es inmediato ver que la funci
on G dada por (8.45) corresponde
a la componente z del momento angular can onico total

G = Lz (ri pi )z (8.46)

y dado que el eje z se eligi


o en la direcci
on del eje de rotaci
on cuya orientaci
on es arbitraria, se concluye que
la funci
on generatriz G corresponde a la componente del momento angular can onico total a lo largo del eje de
rotaci
on. Denotando n al vector unitario a lo largo del eje de rotacion se tiene que

G=Ln (8.47)
4
Para m
as detalles ver secci
on 11.5
138 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

es importante notar que el momento angular can onico que hemos definido puede diferir del momento angular
mec anico, ya que si las fuerzas que act uan sobre el sistema se derivan de potenciales que dependen de la
velocidad, las cantidades pi no necesariamente corresponden con el momento lineal (aunque siguen siendo
vectores Euclidianos que fue nuestra u nica suposici
on). En consecuencia, la expresion (8.46) no corresponde
necesariamente al momento angular mec anico. Por lo tanto, nuestros resultados son m as generales que los
obtenidos en la secci on 5.1.2 en donde se supuso explcitamente potenciales independientes de la velocidad.
Podemos ver entonces que el momento conjugado asociado a una coordenada generalizada de rotaci on del
sistema como un todo alrededor de un eje n, es la componente del momento angular can onico total seg
un este
eje, incluso si el potencial depende de la velocidad. Este resultado se puede derivar tambien de las Ecs. (8.41,
8.42). En sntesis, as como el Hamiltoniano es un generador de desplazamiento del sistema en el tiempo, el
momento angular es un generador de las rotaciones espaciales del sistema.
Finalmente, la invarianza del Hamiltoniano ante la rotaci on del sistema como un todo est a asociada a la
conservacion de la funci on generatriz G como se ve en la Ec. (8.40), es decir a la conservaci
on del momento
angular can onico de acuerdo con (8.47). Una vez m as vemos como la invarianza del Hamiltoniano ante rota-
ciones alrededor de un eje conduce a la conservaci on del momento angular can onico total alrededor de dicho
eje.

8.9. Construcci
on de transformaciones can onicas finitas a partir de trans-
formaciones can
onicas infinitesimales
Ya se ha dicho que en una interpretaci on activa, una transformaci on can
onica que depende de un par ametro,
mueve el punto que describe la configuraci on del sistema formando una trayectoria en el espacio de fase. Una
transformacion can onica finita que depende de una par ametro contnuo , puede construrse como una sucesion
de TCIs a lo largo de la curva. Formalmente, la TC finita se obtiene integrando las TCIs. Como a cada punto
en la trayectoria le corresponde un valor particular del par ametro, comenzamos con la configuracion inicial del
sistema a la cual por convenci on le asignamos el par ametro = 0. Si u es alguna funcion de la configuracion
del sistema, u sera una funci on contnua de a lo largo de la trayectoria, con valor inicial u0 u (0). Por
simplicidad, asumiremos que u no es funci on explcita del tiempo. La TCI en una interpretaci on activa viene
dada por (8.36), donde viene dado por d
u = d [u, G] (8.48)
o a manera de ecuaci
on diferencial
du
= [u, G] (8.49)
d
Para entender porque aparece una derivada total (a pesar de la notaci on enganosa u en 8.48) recordemos que
u es un cambio que corresponde a una variaci on de todas las coordenadas y momentos como se ve en (8.35)
y naturalmente, tambien hay variaci on en ya que es justamente la variaci on en esta cantidad la que genera
el cambio de coordenadas y momentos. En principio, la integraci on de esta ecuacion diferencial me conduce
a u (), es decir al efecto que la TC finita tiene sobre u. Una soluci on formal se puede obtener haciendo una
expansion de Taylor de u () alrededor de las condiciones iniciales

du 2 d2 u 3 d3 u
u () = u (0) + + + + ...
d 0 2! d2 0 3! d3 0
la Ec. (8.49) conduce a
du
= [u, G]0
d 0
donde el subndice nos indica que el corchete de Poisson debe ser evaluado en el punto inicial = 0. Ahora
tomando [u, G] u como una funci on de la configuraci
on del sistema, se tiene
 
d2 u d du d du
= = [u, G] =
d2 d d d d
DE TRANSFORMACIONES CANONICAS
8.9. CONSTRUCCION FINITAS A PARTIR DE TRANSFORMACION

on u
y usando la Ec. (8.49) para la funci

d2 u du  
2
= = u , G = [[u, G] , G]
d d
el proceso se repite para las sucesivas derivadas con lo cual la expansi
on de Taylor queda
2 3
u () = u0 + [u, G]0 + [[u, G] , G]0 + [[[u, G] , G] , G]0 + . . . (8.50)
2! 3!
en particular, si u representa una variable can onica i , con u0 representando el valor inicial de la variable
i , la ecuaci
on (8.50) nos da la prescripci
on para calcular la transformaci
on can
onica finita generada por G.
Definimos el operador G b como
Gb [(. . .) , G] (8.51)
b act
donde G ua sobre las funciones u de la configuraci
on del sistema. Es decir
b [u, G]
Gu (8.52)

claramente  
G b Gu
b2 u = G b =G
b ([u, G]) [[u, G] , G]

b la expansi
y generalizando a todas las potencias de G, on (8.50) se escribe
1  2 1  3

b + b u + b u + . . .
u () = 1u0 + Gu G G
0 2! 0 3!
  2  3  0
b+ 1 b + 1 b + ... u
u () = 1 + G G G (8.53)
2! 3! 0

teniendo en cuenta que la sumatoria entre llaves tiene la estructura de la serie correspondiente a la funcion
exponencial, podemos escribir simb
olicamente esta transformacion de la forma

b
u () = eG u (8.54)
0

on generatriz para ex
Otra forma interesante de obtener la Ec. (8.54) se basa en la funci
 x n
ex = lm 1 +
n n
si extrapolamos esta expresi
on para la funci
on de operadores tendremos que
!n
b Gb
e = lm b
G
1+
n n

y la ecuaci
on (8.54) se puede reescribir como
!n
Gb
b
u () = lm 1+ u (8.55)
n n
0

en (8.55) se puede ver que el valor final para la funcion u () se puede obtener a partir de su valor inicial,
b b
aplicando sucesivamente (n veces) el operador 1 + G/n con n . En tal lmite, este operador solo difiere
infinitesimalmente de la identidad. Es decir la TC completa se est a generando como una aplicacion sucesiva
de TCIs.
Un caso muy importante surge cuando en la Ec. (8.54) tomamos el caso particular en el cual G = H y el
parametro contnuo es el tiempo, se obtiene

b
u (t) = etH u (8.56)
0
140 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

donde el operador Hamiltoniano se define en analoga con (8.51, 8.52)


b [(. . .) , H] ; Hu
H b [u, H]
b
la ecuacion (8.56) nos dice que la evolucion temporal de u se obtiene aplicando el operador etH raz on por la
cual a este se le denomina usualmente operador evoluci on temporal.
Notese que si el corchete de Poisson de u con el generador G de la transformaci b = 0), las
on se anula (i.e. Gu
Ecs. (8.50, 8.53) nos muestran que la transformaci on generada por G dejara invariante a la funci
on u. Cuando
G es el Hamiltoniano y el par ametro es el tiempo, esto es consistente con la Ec. (8.25), si recordamos que
hemos asumido que u nos es funci on explcita del tiempo.

8.9.1. Aplicaci
on del operador evoluci
on temporal en el movimiento uniformemente ace-
lerado
Un ejemplo sencillo de aplicaci
on del operador evoluci
on temporal definido en (8.56), se obtiene cuando
estudiamos el problema del movimiento unidimensional con aceleraci on constante a, cuyo Hamiltoniano se
escribe en la forma
p2
H= max
2m
sea u = x la funci
on que queremos conocer, los corchetes de Poisson nos dan
p 1
[x, H] =
; [[x, H] , H] = [p, H] = a (8.57)
m m
y dado que este u ltimo corchete es constante, los corchetes de mayor orden se anulan, de modo que la serie
definida en (8.50) se trunca y solo posee tres terminos. Usando entonces G H, t, y u x en (8.50)
as como los corchetes (8.57) se obtiene
p0 at2
x (t) = x0 + t+
m 2

8.9.2. Aplicaci
on del operador evoluci
on param
etrica para la generaci
on de rotaciones
Es importante tener presente que la ecuaci on general (8.54) nos da la evoluci on del sistema para un
parametro arbitrario que no es necesariamente el tiempo. Para ilustrar este hecho hagamos la asignaci on
G Lz que corresponde a una transformaci on can onica que produce una rotaci on alrededor de Z. Es natural
entonces tomar el par ametro en la forma siendo un angulo de rotaci on. La funci on u ser
a la coordenada
x de la partcula iesima. La evolucion de la coordenada xi con se obtiene haciendo los reemplazos en (8.54)
o en (8.50)
2 3
xi () = xi0 + [xi , Lz ]0 + [[xi , Lz ] , Lz ]0 + [[[xi , Lz ] , Lz ] , Lz ]0 + . . . (8.58)
2! 3!
Los corchetes de Poisson se pueden evaluar en forma directa o por sus propiedades usando los corchetes (8.3)
para dar
[xi , Lz ] = yi ; [yi , Lz ] = xi
y los corchetes sucesivos dan
[xi , Lz ] = yi ; [[xi , Lz ] , Lz ] = [yi , Lz ] = xi ; [[[xi , Lz ] , Lz ] , Lz ] = [xi , Lz ] = yi (8.59)
etc. los corchetes de Poisson evaluados en = 0 son los valores iniciales de las coordenadas. Reemplazando
(8.59) en (8.58) evaluado en = 0 obtenemos
2 3 4
xi () = xi0 yi0 xi0 + yi0 + xi0 ...
 2!  3!  4! 3 
2 4
xi () = xi0 1 + ... yi0 + ...
2! 4! 3!
xi () = xi0 cos yi0 sin
8.10. PROPIEDADES DE LOS CORCHETES DE POISSON DE LOS MOMENTOS ANGULARES 141

que corresponde justo a la transformaci on que genera una rotaci on alrededor de Z, se puede ver que la
transformacion de yi y zi tambien es la adecuada (la u
ltima no se transforma). Esto corresponde a una prueba
alternativa de que Lz es un generador de rotaciones alrededor de z y como z es arbitrario esto indica que el
generador L n produce una rotaci on alrededor de n. Este hecho nos inspira a encontrar las propiedades de
los corchetes de Poisson de los momentos angulares en forma m as sistem
atica.

8.10. Propiedades de los corchetes de Poisson de los momentos angulares


Las Ecs. (8.41) y (8.43) nos llevan a ver que los momentos pi conjugados a una coordenada qi pueden actuar
como generadores de traslaciones generalizadas en donde solo hay variaci on de la coordenada qi en el espacio
de fase. Con base en ello, podemos ver que el momento angular al estar asociado a una variable angular, podra
ser el generador de una traslaci on angular i.e. una rotaci
on. Lo cual esta respaldado por los resultados de la
secci
on 5.1. El hecho de que el momento angular can onico sea el generador de rotaciones rgidas del sistema
conduce a una serie de importantes propiedades de los corchetes de Poisson que involucran a estas cantidades.
La Ec. (8.36) que nos determina el cambio de una funci on del sistema u, ante una transformaci on canonica en
una vision activa, es tambien valida si dicha funci
on es la componente de un vector a lo largo de un eje fijo
en el espacio ordinario. Por lo tanto si F es una funci on vectorial de la configuraci
on del sistema, se tiene que

Fi = d [Fi , G]

es importante que la direcci on a lo largo de la cual se calcula la componente sea fija en el sentido de que no
debe cambiar con la TC. Si la direcci on como tal es funcion de las variables del sistema, la TC no solo cambia
el valor de la funci
on sino tambien su naturaleza, tal como ocurre con el Hamiltoniano. Con esta aclaraci on el
cambio de un vector F bajo una rotaci on del sistema alrededor de un eje fijo n, generada por L n se escribe
vectorialmente como
F = d [F, L n] (8.60)
la Ec. (8.60) es valida solo si los vectores unitarios ux , uy , uz que forman la base para escribir F, no son rotadas
por el generador L n.
Otra aclaraci on muy importante sobre el significado de la Ec. (8.60), el generador L n produce una
rotacion del sistema bajo la TCI, pero no necesariamente produce una rotaci on del vector F. Dicho generador
induce una rotaci on espacial de las variables del sistema pero no por ejemplo de alg un vector externo tal como
un campo magnetico externo o el vector que describe la aceleraci on de la gravedad. Surge naturalmente la
pregunta de cuales son las condiciones bajo las cuales L n genera una rotaci on espacial de F. Claramente,
este vector es rotado por el generador en cuesti on cuando F es una funci on de las variables del sistema (q, p)
u
nicamente y no involucra ninguna cantidad externa o vector que no sea afectado por la TCI. Bajo estas
condiciones una rotaci on espacial del sistema implica una rotaci on de F. Los vectores que cumplen estas
condiciones ser an denominados vectores del sistema. El cambio en un vector Euclidiano bajo rotaciones
infinitesimales alrededor de n, fue discutido en la secci on (5.1), Ec. (5.9)

dF = n d F

de tal modo que para un vector del sistema, una TCI generada por L n induce un cambio en dicho vector de
la forma5
F = d [F, L n] = n d F (8.61)
la Ec. (8.61) conduce a una importante identidad concerniente al corchete de Poisson entre L n y un vector
del sistema
[F, L n] = n F (8.62)
5
Un vector podra ser mixto i.e. funci
on de q y p del sistema pero tambien funci
on de variables externas. En tal caso es de
esperarse que dicho vector se transforme bajo la rotaci
on generada por la TCI pero no transformar a de la forma prescrita por la
Ec. (8.61).
142 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS

La condici
on (8.62) ya no hace ninguna referencia a una TC o incluso a una rotaci
on espacial. Es simplemente
una propiedad del corchete de Poisson entre un cierto tipo de vectores (del sistema) y una componente del
momento angular can onico en cierta direccion.
La relaci
on (8.62) se puede expresar en componentes usando el tensor de Levi Civita.

[Fi , Lj nj ] = ijk nj Fk

y dado que n es arbitrario, podemos elegir en particular que nj = 1 para un j especfico y cero para las otras
componentes, lo cual nos conduce a
[Fi , Lj ] = ijk Fk (8.63)
lo cual se puede escribir tambien de la forma

[Fl , Lm ] = Fn l, m, n en orden cclico (8.64)

otra relaci
on interesante es ver lo que ocurre con el producto F G entre dos vectores del sistema. Siendo
un escalar, este producto punto debe ser invariante bajo rotaciones6 . La identidad (8.62) nos muestra que
efectivamente, el corchete de Poisson entre este producto y L n se anula.

[F G, L n] = F [G, L n] + [F, L n] G = F (n G) + (n F) G
= F (n G) + F (G n)
[F G, L n] = 0 (8.65)

recordemos que la anulacion del corchete de Poisson de cierta cantidad con el generador de una transformaci on
nos conduce a la invarianza de esta cantidad bajo la transformaci on producida por el generador como se ve en
la Ec. (8.50). Haciendo F = G, se obtiene la propiedad esperada de que la magnitud de un vector se conserva
bajo rotaciones, ya que el corchete de Poisson de F2 se anulara para cualquier componente de L.
Naturalmente, todas las relaciones anteriores son validas en particular cuando F = L en (8.62). En tal caso
resulta
[L, L n] = n L [Li , Lj ] = ijk Lk (8.66)
adicionalmente, haciendo F = G = L en (8.65) resulta
 2 
L ,L n = 0 (8.67)

de las relaciones (8.66) y el teorema de Poisson vemos que si Lx y Ly son constantes de movimiento entonces
Lz tambien es una constante de movimiento. Por tanto, la invarianza de dos componentes del momento angular
canonico cartesiano nos lleva a la invarianza del vector L completo. Adicionalmente, aplicando las relaciones
(8.62) y (8.63) con F = p, es decir el momento can onico cartesiano, tenemos que

[p, L n] = n p ; [pi , Lj ] = ijk pk

si ahora asumimos que adem as de Lx , Ly la componente pz es tambien una constante de movimiento, entonces
adem as de Lz obtenemos otras dos constantes de movimiento via teorema de Poisson

[pz , Lx ] = py , [pz , Ly ] = px

de modo que tanto L como p se conservan. Este es un caso en el cual el teorema de Poisson es u til para
encontrar nuevas constantes de movimiento.
En contraste, examinemos un escenario en el cual asumimos que px , py , Lz son constantes de movimiento,
la aplicaci
on del teorema de Poisson nos da

[px , py ] = 0 ; [px , Lz ] = py ; [py , Lz ] = px


6
Esto se puede ver de F G = F G cos . F y G son invariantes ya que una rotaci on no cambia la magnitud de los vectores,
adem
as el
angulo relativo entre dos vectores tambien se conserva en una rotaci
on de modo que la invarianza es clara.
8.10. PROPIEDADES DE LOS CORCHETES DE POISSON DE LOS MOMENTOS ANGULARES 143

y el teorema de Poisson no nos genera en este caso nuevas constantes de movimiento.


Por otro lado, las propiedades (8.3), nos dicen que para cualquier par de momentos can onicos, el corchete
de Poisson entre ellos se anula. Pero de las relaciones (8.66) se observa que para ning
un par de componentes de
L, se anula el corchete entre ellas. Por tanto, a pesar de que describimos a L como el momento angular can onico
total en virtud de su definicion como ri pi (suma sobre ndices), no es posible escoger simultaneamente a
dos componentes de L como variables can onicas. Sin embargo, la Ec. (8.67) muestra que es posible escoger
simultaneamente a la magnitud de L, y a cualquiera de las componentes de L (pero solo una), como variables
canonicas.

8.10.1. Ejemplos de aplicaci


on
La relaci
on (8.62) se puede verificar explcitamente como se puede ver con el siguiente ejemplo: Partcula
libre descrita por coordenadas y momentos cartesianos. El vector momento cartesiano p, es claramente un
vector del sistema. Tomemos n = uz , evaluemos directamente el corchete de la izquierda en (8.62), lo haremos
componente a componente

[px , Lz ] = [px , xpy ypx ] = [px , xpy ] [px , ypx ] = x [px , py ] + [px , x] py y [px , px ] [px , y] px
[px , Lz ] = py

donde hemos usado las propiedades (8.10, 8.11) y las identidades (8.3). Similarmente

[py , xpy ypx ] = px ; [pz , xpy ypx ] = 0

de modo que al evaluar la expresi


on de la izquierda en (8.62) para este caso resulta

[p, L uz ] = py ux + px uy

estos corchetes nos dan las componentes de uz p, lo cual confirma la validez de la Ec. (8.62) para este
caso particular. Adicionalmente, para este problema el lector puede verificar explcitamente la validez de las
siguientes expresiones    
[p L, L n] = p2 , L n = L2 , L n = 0
que nos confirman que estas cantidades son escalares, es decir que no son afectadas por una rotaci on, en
concordancia con (8.65).
Supongamos que la partcula se somete a un campo magnetico externo uniforme. Tomemos el vector F = A
siendo A 12 (r B) donde B = Bux describe al campo magnetico. A representa fsicamente el potencial
vectorial asociado al campo magnetico B. El vector A depende de un vector interno y otro externo al sistema,
por tanto es de esperarse que en general se transforme bajo la TCI generada por L uz pero no necesariamente
de la forma prescrita por (8.62). La evaluacion explcita de los corchetes nos da
1 1 1 1
A = (r B) = (xux + yuy + zuz ) Bux = yBuz + zBuy
2 2 2 2 
1
[Fx , Lz ] = [Ax , Lz ] = [0, xpy ypx ] = 0 ; [Fy , Lz ] = [Ay , Lz ] = zB, xpy ypx = 0
2
 
1 1
[Fz , Lz ] = [Az , Lz ] = yB, xpy ypx = Bx
2 2
por tanto
1
[A, L uz ] = Bxuz
2
por otro lado, el vector uz A nos da 12 Bzux . Efectivamente, vemos que el vector A se transforma bajo una
rotaci
on del sistema pero no con la prescripcion dada por (8.62).
Captulo 9

Teora de Hamilton-Jacobi y variables


acci
on angulo

Ya hemos mencionado que las transformaciones can onicas pueden ser usadas como un procedimiento para
resolver las ecuaciones de movimiento, para lo cual se sugirieron dos estrategias, (a) Cuando el Hamiltoniano
se conserva, se puede obtener la soluci
on transformando a un nuevo conjunto de variables can onicas en donde
todas las coordenadas son cclicas, en cuyo caso las nuevas ecuaciones de movimiento de Hamilton resultan
triviales, y (b) encontrar una transformacion can onica que partiendo de las coordenadas q, p que describen la
configuracion del sistema en un tiempo t, nos lleve a un nuevo sistema coordenado constitudo u nicamente por
cantidades constantes. En particular, las constantes que constituyen el nuevo sistema de variables can onicas
se puede elegir como el conjunto q0 , p0 que coincide con los valores iniciales de las variables can onicas. Si
encontramos esta TC, la correspondiente transformaci on entre las antiguas y las nuevas coordenadas se puede
invertir para obtener
q = q (q0 , p0 , t) ; p = p (q0 , p0 , t)
lo cual nos da el valor de las coordenadas y momentos en funci on de los valores iniciales de estos y el tiempo.
Este procedimiento es el m as general y es aplicable (al menos formalmente) incluso si el Hamiltoniano es funci on
del tiempo. La teora de Hamilton Jacobi es un procedimiento sistem atico para encontrar la transformaci on
canonica que lleva de los valores q, p en un tiempo t, a los valores iniciales o a otros valores constantes que son
funciones de las condiciones iniciales.

9.1. Ecuaci
on de Hamilton Jacobi para la funci
on principal de Hamilton
Podemos asegurar que la nuevas variables can onicas son todas constantes si el Hamiltoniano transformado
K es identicamente nulo, ya que en tal caso las ecuaciones de Hamilton quedan
K K
= Q i = 0 ; = Pi = 0 (9.1)
Pi Qi
como ya se ha visto, el antiguo y el nuevo Hamiltoniano est
an relacionados a traves de la funci
on generatriz
F
K=H+ (9.2)
t
por tanto el nuevo Hamiltoniano ser
a nulo si F satisface la ecuaci
on
F
H (q, p, t) + =0 (9.3)
t
tomaremos a F como una funci on hecha en el captulo 71 . Por tanto,
on de tipo 2 de acuerdo con la clasificaci
F es funci
on de qi , Pi y el tiempo. Con el fin de escribir el Hamiltoniano como funci
on de las mismas variables
1
Recordemos que con una funci on tipo F2 es f
acil contruir una T.C. contnua, dado que una T.C. que difiere infinitesimalmente
de la identidad es inmediata para este tipo de funci
on generatriz.

144
DE HAMILTON JACOBI PARA LA FUNCION
9.1. ECUACION PRINCIPAL DE HAMILTON 145

que F , debemos usar las ecuaciones de transformaci


on (7.15)

F2
pi =
qi

de modo que la Ec. (9.3) se escribe


 
F2 F2 F2
H q1 . . . qn ; ,..., ;t + =0 (9.4)
q1 qn t

la ecuaci
on (9.4) conocida como ecuaci on de Hamilton Jacobi, es una ecuaci on diferencial parcial en n + 1
variables (n coordenadas y el tiempo), para la funci on generatriz que buscamos. Es costumbre denotar las
soluciones de F2 como S por razones que veremos m as adelante, y dicha funci on S se denomina funci on
principal de Hamilton.
La integraci
on de la Ecuacion de Hamilton Jacobi Ec. (9.4) solo nos provee la dependencia con las coor-
denadas q y el tiempo; no aparece ninguna informaci on sobre los nuevos momentos. En realidad, lo u nico
que sabemos es que todos los momentos deben ser constantes pero no hemos especificado que valores deben
tener. Volveremos sobre la determinaci on de los momentos m as adelante. Matem
aticamente, la Ec. (9.4) es
una ecuacion diferencial parcial de primer orden en n + 1 variables (q, t). Un tipo de soluci on posible de esta
ecuaci
on es
F2 S = S (q1 . . . qn ; 1 , . . . , n+1 ; t) (9.5)
donde i son n + 1 constantes de integraci on independientes. Estas soluciones se conocen como soluciones
completas de la ecuaci 2
on diferencial parcial . No obstante, una de las constantes de movimiento es irrelevante
debido a que en todas las ecuaciones en donde aparece F2 , solo aparece su derivada parcial con respecto a
alguna variable (y en particular en la Ec. 9.4). Por tanto si F2 es una solucion, F2 + tambien es soluci
on
de modo que una de las constantes de integraci on debe ser aditiva en S. Por tanto, la soluci
on puede remover
una constante sin ninguna perdida de generalidad de modo que podemos escribir

S = S (q1 . . . qn ; 1 , . . . , n ; t) (9.6)

donde ninguna de las constantes independientes n es solamente aditiva. Observese que (9.6) debe ser de la
on F2 i.e. S = S (q, P, t). La manera m
estructura de una funci as natural de llegar a esta estructura con (9.6),
es asumiendo que
Pi = i (9.7)
esta suposicion no contradice la aseveraci on original de que los nuevos momentos estan conectados con los
valores iniciales q (t0 ) y p (t0 ). Las n ecuaciones de transformaci
on (7.15) se escriben

S (q, , t)
pi = (9.8)
qi

cuando evaluamos estas n ecuaciones en t = t0 , las unicas incognitas son las s ya que q, p adquieren sus valores
iniciales. Por tanto las Ecs. (9.8) evaluadas en t = t0 , son n ecuaciones con n inc ognitas , que nos permiten al
menos formalmente, encontrar las en funci on de los valores iniciales de q, p. Las otras n ecuaciones asociadas
a F2 (ver Ecs. 7.15) se escriben
S (q, , t)
Qi = i = (9.9)
i
donde hemos tenido en cuenta que los nuevos momentos los hemos elegido como las s y que las nuevas
coordenadas tambien deben ser constantes que denotamos por i . Una vez conocidos los valores de las i a
2
Este no es el unico tipo de soluci
on posible, la soluci
on mas general incluye una o m as funciones arbitrarias en lugar de
constantes. Incluso exigiendo que dichas funciones sean constantes hay en general mas de una soluci
on del tipo (9.5). Sin embargo,
lo importante es que exista al menos una soluci on, pues la unicidad de la misma no es necesaria ya que la funci on principal de
Hamilton no representa un observable.
146 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

traves de las Ecs. (9.8), podemos reemplazar estos valores en (9.9) para obtener las i haciendo t = t0 en dichas
ecuaciones y apelando a las condiciones iniciales en q. Ahora bien, en las ecuaciones (9.9) podemos despejar
qj para obtener las coordenadas en funci on de , , t

qj = qj (, , t) (9.10)

lo cual resuelve la dinamica de las coordenadas generalizadas qj en funcion del tiempo y de las condiciones
iniciales. Despues de derivar en la Ec. (9.8) se pueden tomar las qi encontradas en (9.10) para sustiturlas en
(9.8), con lo cual se encuentra el valor de pi en funci
on de , , t

pi = pi (, , t) (9.11)

por tanto, las Ecs. (9.10, 9.11) constituyen las soluciones completas a las ecuaciones de Hamilton.
La funcion principal de Hamilton es en consecuencia generadora de una transformaci on canonica que nos
lleva a valores constantes de las coordenadas y momentos. Cuando se resuelve la ecuaci on de Hamilton Jacobi
(9.4), obtenemos al mismo tiempo una soluci on al problema mec anico. Matematicamente hemos establecido una
equivalencia entre las 2n ecuaciones can onicas de movimiento que son 2n ecuaciones diferenciales ordinarias de
primer orden, con la ecuaci on diferencial parcial de primer orden de Hamilton Jacobi. Esta clase de equivalencia
es muy com un en la teora de ecuaciones diferenciales de primer orden. Esencialmente la conexi on proviene del
hecho de que ambas formulaciones provienen del principio variacional de Hamilton modificado (recordemos
que la Ec. 9.2 proviene del principio de Hamilton modificado). Hasta cierto punto, la asignaci on de las i como
los nuevos momentos es arbitraria. Podramos haber elegido como momentos otro conjunto de constantes i ,
que son a su vez funciones independientes de las constantes de integraci on i

i = i (1 , . . . , n ) (9.12)

por medio de estas relaciones, la funci


on principal de Hamilton se puede escribir en funcion de q, , t, el resto
de la derivacion es an
alogo teniendo cuidado de reemplazar i i en (9.8) y (9.9). Es a veces conveniente
definir ciertos i como los nuevos momentos en lugar de las i que aparecen como constantes de integraci on
en (9.4).
Podemos obtener cierta informaci on fsica adicional sobre la funci
on principal de Hamilton tomando su
derivada total con el tiempo
dS (q, , t) S S
= qi +
dt qi t
dado que = 0. Usando las ecuaciones (9.8) y (9.4) se obtiene

dS
= pi qi H = L
dt
con lo cual se puede escribir Z
S= L dt + cte (9.13)

recordando que el principio de Hamilton es una aseveraci on sobre la integral definida de L en el tiempo, y que
a partir de el se obtiene la soluci
on del problema mec anico via ecuaciones de Lagrange, vemos que en este caso
la misma integral de acci on pero esta vez en forma indefinida, nos provee de otro metodo de soluci on. N
otese
que la Ec. (9.13) no posee utilidad pr actica puesto que para evaluar la integral en el tiempo se debe conocer
L en funcion de t lo cual equivale a conocer q (t) y q (t) es decir hay que saber la solucion.
Un caso interesante se da cuando el Hamiltoniano no depende explcitamente del tiempo y por tanto se
conserva. En este caso la Ec. (9.4) muestra que S/t no puede ser funci on explcita del tiempo con lo cual la
forma mas general de S se escribe como

S (q, , t) = W (q, ) kt (9.14)


DE HAMILTON JACOBI PARA LA FUNCION
9.1. ECUACION PRINCIPAL DE HAMILTON 147

donde W (q, ) es llamada la funci on caracterstica de Hamilton. Insertando (9.14) en (9.4) se observa
que la constante k debe coincidir con el valor del Hamiltoniano (que es precisamente constante). Recuerdese
que aun cuando el Hamiltoniano sea constante, no necesariamente corresponde a la energa del sistema. De
nuevo el significado fsico de W se puede revelar a traves de su derivada total

dW W
= qi
dt qi

Usando (9.8) y (9.14) se obtiene


Z Z
dW
= pi qi W = pi qi dt = pi dqi (9.15)
dt

que es precisamente la acci


on abreviada definida en (6.49) aunque en forma de integral indefinida.

9.1.1. Oscilador arm


onico unidimensional con el m
etodo de Hamilton Jacobi
Una vez m as, usaremos el oscilador arm
onico unidimensional para ejemplificar la tecnica de Hamilton
Jacobi. Partiendo del Hamiltoniano
r
1 2 2 2 2
 k
H= p +m q E ; =
2m m
de acuerdo con la Ecuaci
on fundamental de Hamilton Jacobi Ec. (9.4), debemos sustitur a p por S/q en el
Hamiltoniano (recordando que F2 se redefine como S) y plantear la ecuaci
on diferencial (9.4)
"  #
1 S 2 S
+ m2 2 q 2 + =0
2m q t

como este Hamiltoniano no depende explcitamente del tiempo, podemos escribir a S como (9.14) (donde
usaremos en vez de k). De esta forma se elimina la dependencia temporal de la ecuaci
on de Hamilton Jacobi
"  #
1 W 2 2 2 2
+m q = (9.16)
2m q

la constante corresponde a la energa del sistema lo cual se puede ver reemplazando (9.14) en (9.3)

S
H+ =0H =0
t
la ecuaci
on (9.16) se puede integrar con lo cual se obtiene
Z r
m 2 q 2
W = 2m dq 1 (9.17)
2
Z r
m 2 q 2
S = t + 2m dq 1 (9.18)
2

aunque la integral se puede resolver explcitamente, debemos recordar que S no aparece en las ecuaciones de
movimiento sino solo sus derivadas parciales. Resulta m as u
til en este caso, hacer primero las derivaciones
antes de integrar. La soluci
on para q se obtiene de las ecuaciones (9.9)
r Z
S m dq
= = t + q
2 2 2
1 m2q
148 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

que al ser integrado nos da " r #


1 m 2
t + = arcsin q
2
la coordenada q se puede despejar de aqu para obtener a q en funci on del tiempo y de las dos constantes y
= r
2
q= sin (t + ) (9.19)
m 2
que es la soluci
on que conocemos para el oscilador armonico. La soluci
on para el momento conjugado se obtiene
formalmente de las Ecs. (9.8) teniendo en cuenta (9.17) y (9.18)
S W p
p= = = 2m m2 2 q 2 (9.20)
q q
y sustituyendo (9.19) en (9.20) se obtiene
q  
p = 2m 1 sin2 (t + )

p = 2m cos (t + ) (9.21)

este resultado nos dice que p = mq como se esperaba. Finalmente, debemos determinar las constantes y a
traves de las condiciones iniciales q0 , p0 . El valor de se puede despejar f
acilmente evaluando las Ecs. (9.19)
y (9.21) en t = 0 y sumando sus cuadrados

2m = p20 + m2 2 q02

o por otro lado recordando que es el Hamiltoniano y la energa del sistema. La fase se obtiene de nuevo
evaluando (9.19) y (9.21) en t = 0 y haciendo el cociente
q0
tan = m
p0
En este caso vemos que la funcion principal de Hamilton S asumi o el papel de generador de una transformaci
on
canonica a una nueva coordenada que mide el angulo de fase, y a un nuevo momento que se puede identificar
como la energa total del sistema.
Ahora bien, si sustitumos la soluci
on (9.19) para q en la Ec. (9.18) obtenemos
Z Z  
1
S = t + 2 cos2 (t + ) dt = 2 cos2 (t + ) dt
2
se puede verificar que el integrando coincide con el Lagrangiano
1   
L = p2 m2 2 q 2 = cos2 (t + ) sin2 (t + )
2mZ  
2 1
L = 2 cos (t + )
2
y vemos que S efectivamente coincide con la integral indefinida del Lagrangiano con el tiempo, como lo prescribe
la Ec. (9.13). N
otese que tal identidad solo se pudo comprobar una vez que se conoce la soluci on.

9.1.2. Oscilador arm


onico bidimensional anisotr
opico
Para ilustrar problemas de m as de un grado de libertad, tomemos un oscilador arm onico bidimensional con
constante de restituci
on diferente en x y en y es decir kx 6= ky , el Hamiltoniano se escribe en la forma
r r
1 2 2 2 2 2 2 2 2
 kx ky
H=E= p + py + m x x + m y y ; x = ; y =
2m x m m
DE HAMILTON JACOBI PARA LA FUNCION
9.1. ECUACION PRINCIPAL DE HAMILTON 149

como el Hamiltoniano no depende del tiempo la funci


on principal de Hamilton queda

S (x, y, , y , t) = W (x, y, , y ) t

dado que las coordenadas y momentos e x e y se separan en forma de suma en el Hamiltoniano, es razonable
suponer que la funci
on caractersitca de Hamilton W se separa de forma similar

S (x, y, , y , t) = Fx (x, , y ) + Fy (y, , y ) t (9.22)

de modo que la ecuaci


on de Hamilton Jacobi queda en la forma
"   2 #
1 Fx 2 Fy
+ m2 x2 x2 + + m2 y2 y 2 =
2m x y
" 2 # " 2 #
1 Fy 1 Fx
+ m2 y2 y 2 = + m2 x2 x2 (9.23)
2m y 2m x

el termino de la izquierda solo depende de y y el de la derecha solo depende de x de modo que ambos deben
ser constantes. Igualemos cada termino a una constante que denotamos y
" 2 #
1 Fy
+ m2 y2 y 2 = y (9.24)
2m y
" 2 #
1 Fx
+ m2 x2 x2 = y (9.25)
2m x

la segunda ecuaci
on se puede reescribir como
"  #
1 Fx 2 2 2 2
+ m x x = x ; x y (9.26)
2m x

con lo cual las ecuaciones (9.24, 9.26) quedan m


as simetricas. Cada ecuaci
on tiene una soluci
on an
aloga a las
Ecs. (9.19, 9.21)
s
2x
x = sin ( x t + x ) ; p x = 2mx cos (x t + x )
mx2
s
2y p
y = sin ( y t + y ) ; p y = 2my cos (y t + y )
my2

vemos que de nuevo las s son las fases constantes y la energa es

E = = x + y

9.1.3. Oscilador arm


onico bidimensional isotr
opico
Si tomamos el oscilador bidimensional isotropico es decri con kx = ky podemos usar el resultado anterior y
resolverlo como caso particular. No obstante, resulta interesante resolver el problema utilizando coordenadas
esfericas, ya que en estas coordenadas el oscilador isotr
opico tiene una coordenada cclica
 
1 p2
H=E= p2r + 2 + m2 2 r 2
2m r
150 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

vemos que el Hamiltoniano es cclico en . Emulando el procedimiento en el caso anisotr


opico, asumimos que
la funci
on caractersitca W es separable

S (r, , , ) = Fr (r, , ) + F (, , ) t

con lo que la ecuaci


on de Hamilton Jacobi queda
"    #
1 Fr 2 1 F 2
+ 2 + m2 2 r 2 =
2m r r
   
Fr 2 F 2
r2 + + m2 2 r 4 = 2mr 2
r
   2
F 2 2 2 Fr
= 2mr r m2 2 r 4
r
el termino de la izquierda depende solo de y el de la derecha solo de r. Ambos deben ser iguales a una
constante 2 luego  
F
= F =

de las ecuaciones b
asicas para los generadores se tiene que
F
p = =

es decir es justamente el momento conjugado (constante) asociado a la variable cclica. La ecuaci
on para
Fr queda
 
Fr 2
2mr 2 r 2 m2 2 r 4 = 2
r
 
1 Fr 2 2
m 2 r 2 =
2m r 2mr 2
 2
1 Fr 2
+ + m 2 r 2 =
2m r 2mr 2

auq eu se puede resolver directamente para Fr es m as c


omodo escribir la soluci
on en coordenadas cartesianas
on kx = ky
para la condici
r
2
x = sin (t + ) ; p x = 2m cos (t + )
m 2
r
2
y = 2
sin t ; py = 2m cos t
m
y las utilizamos para encontrar las contrapartes polares
r q
2
r = sin2 t + sin2 (t + ) ; pr = mr
m 2
 
sin t
= arctan ; p = mr 2
sin (t + )

Hay algunos casos lmites de interes, el primero cuando = 0, en cuyo caso


r
4
r= 2
sin t ; pr = 2m cos t ; = ; p = 0
m 4
DE HAMILTON JACOBI PARA LA FUNCION
9.2. ECUACION CARACTERISTICA DE HAMILTON151

el movimiento en el plano x y sera una oscilaci


on a lo largo de una lnea diagonal que pasa por el origen.
Otro caso lmite ocurre cuando = /2, en tal caso
r
2
r = r0 = ; pr = 0 ; = t ; p = mr02
m 2
el movimiento en el plano x y trazar a un crculo centrado en el origen de radio r0 . Para valores de en el
intervalo (0, /2). La
orbita en el plano x y es una elipse centrada en el origen, aunque los semiejes mayor y
menor no van en general a lo largo de los ejes x e y. Estos son ejeplos de figuras de Lissajous.

9.2. Ecuacion de Hamilton Jacobi para la funci


on caracterstica de Ha-
milton
La raz
on principal que permite la f
acil integraci
on del oscilador arm
onico con el metodo de Hamilton Jacobi,
es el hecho de que la funci
on principal de Hamilton se puede separar de la forma prescrita en (9.14), lo cual a
su vez es posible siempre que el Hamiltoniano original no dependa explcitamente del tiempo, es decir cuando
este se conserva. Insertando (9.14) en (9.4) y haciendo k 1 se obtiene la ecuaci on de Hamilton-Jacobi
restringida  
W
H qi , = 1 (9.27)
qi
esta ecuaci on ya no depende del tiempo, adem as se observa que una de las constantes de integraci on (por
convenci on la elegimos como 1 ) corresponde con el valor (constante) del Hamiltoniano. En este caso la funci
on
caracterstica de Hamilton aparece como parte de la funci on generatriz S cuando H es constante. Sin embargo,
veremos que W puede ser por s sola una funcion generatriz de una transformaci on de contacto con propiedades
diferentes a las generadas por S. Consideremos una transformaci on can onica en la cual todos los nuevos
momentos son constantes de movimiento i , donde en particular 1 corresponde al valor del Hamiltoniano. Si
la funci
on generatriz de esta transformaci on la postulamos como W = W (q, P ), entonces esta funci on es de
tipo 2 de tal forma que las ecuaciones de transformaci on vienen dadas por
W (q, ) W (q, ) W (q, )
pi = ; Qi = = (9.28)
qi Pi i
estas ecuaciones se asemejan a sus an
alogos para S, Ecs. (9.8, 9.9), pero ahora la condici
on que determina a
W es que H sea uno de los momentos can onicos nuevos, que por convenci on denotamos como 1 3

H (pi , qi ) = 1 . (9.29)

Adicionalmente, aqu solo pedimos que las variables nuevas Qi sean cclicas pero no necesariamente que
sean constantes, pues solo exigimos que sean constantes los momentos conjugados Pi .Usando (9.28) en (9.29)
resulta  
W
H qi , = 1 (9.30)
qi
que coincide con la Ec. (9.27). De aqu tambien se ve que puesto que W no involucra al tiempo, el antiguo y el
nuevo Hamiltoniano coinciden i.e. K = 1 . De nuevo esto es una diferencia con respecto a la funcion generatriz
S, la cual cambia el valor del Hamiltoniano y lo vuelve nulo.
La funci
on caracterstica de Hamilton genera una TC que nos lleva a otro conjunto de variables en donde
todos los momentos son constantes, usando las Ecs. de Hamilton esto se traduce en
K
P i = = 0, Pi = i (9.31)
Qi
3
Notese que en (9.14) k es una constante de integraci
on pero no necesariamente es un momento. Cuando dicha constante se
convierte en un momento conjugado, la expresion para Qi definida en (9.28) diferir
a de la definida en (9.9).
152 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

es decir todas las coordenadas Qi son cclicas, de modo que la soluci


on del problema ya es trivial. Ahora
bien, dado que el nuevo Hamiltoniano solo depende de uno de los i puesto que K = 1 , y como las i son
independientes, tenemos entonces que de las otras ecuaciones de Hamilton
K 1
Q i = = = i1 (9.32)
i i
se obtienen entonces las soluciones
W
Qi = i1 t + i (9.33)
i
de modo que la u nica coordenada que no es una constante de movimiento es Q1 . Dado que 1 = K es el
momento conjugado a Q1 y Q1 es la u nica coordenada que depende del tiempo, vemos de nuevo un escenario
en el cual el Hamiltoniano y el tiempo act uan como si fueran variables can onicamente conjugadas.
La dependencia de W con las antiguas coordenadas q se determina con la Ec. Diferencial Parcial (9.27),
conocida como ecuaci on de Hamilton Jacobi restringida. En este caso hay n constantes de movimiento (con
respecto al caso anterior, no hay constante de integraci on para el tiempo), pero de nuevo una de ellas es una
constante meramente aditiva la cual se identifica de inmediato con 1 4 . De nuevo es natural asumir que las
n constantes de integraci on (incluyendo a 1 ) sean los nuevos momentos conjugados. Cuando se eval uan en
t = t0 , la primera mitad de las ecuaciones (9.28) nos relaciona las constantes con las condiciones iniciales.
Finalmente, las ecuaciones (9.31, 9.33) se pueden resolver para encontrar a qi en funci on de j , j , t es decir
su ecuaci on de movimiento. Retornando de nuevo a el primer conjunto de ecuaciones (9.28), ya conociendo las
j , j en terminos de las condiciones iniciales, los antiguos momentos quedan en funci on de qj , j , j , t, pero
como ya conocemos a q = q (j , j , t) tenemos que los momentos quedan en funci on de j , j , t y la soluci on
ya queda completa.
Vale la pena enfatizar que solo una de las n ecuaciones (9.33) involucra al tiempo. Teniendo en cuenta que
W es funci on de qj y j resulta de (9.33) que
t + 1 = f1 (q1 , . . . , qn ; 1 , . . . , n )
i = fi (q1 , . . . , qn ; 1 , . . . , n ) ; i>1
vemos que solo la ecuacion con i = 1 nos conecta explcitamente al tiempo. Por otro lado, las ecuaciones con
i > 1 solo relacionan a las qi s entre s, es decir son ecuaciones de trayectoria. Una de las qi s se puede
tomar como independiente y las otras coordenadas se pueden expresar en terminos de ella resolviendo solo las
ecuaciones que son independientes del tiempo. En consecuencia, el formalismo nos conduce directamente a las
ecuaciones de movimiento de la trayectoria (ya que no involucran al tiempo explcitamente). Por ejemplo en
el caso de fuerzas centrales veremos que este procedimiento nos genera la ecuaci on de r en funci
on de sin
pasar primero por las soluciones de r (t) y (t).
Como ya se mencion o, no es en general necesario elegir las i s como los nuevos momentos can onicos.
En ocasiones puede ser m as conveniente elegir otras constantes i que son funciones de las constantes de
integraci
on i
Pi i (1 , . . . , n ) ; i = 1, . . . , n (9.34)
naturalmente las i deben ser independientes entre s. En tal caso, las funci
on caracterstica de Hamilton
W tendr a como argumentos a las qi , i . El nuevo Hamiltoniano K = 1 (numericamente igual a H pero
funcionalmente diferente) se obtiene despejando 1 de (9.34) y sera funcion exclusivamente de las i . Las
ecuaciones de Hamilton son entonces
K K 1 (i )
P k = = 0 ; Q k = = vk
Qk k k
es obvio que las vk son constantes que dependen exclusivamente de las k . Las soluciones para las nuevas
variables can
onicas son
Pk = k ; Qk = vk t + k (9.35)
4
Sin embargo, a diferencia de la constante aditiva que apareca en (9.14), en este caso la constante tiene un significado fsico
pues es el valor numerico del Hamiltoniano.
9.3. PARALELISMO ENTRE EL FORMALISMO DE HAMILTON JACOBI Y EL FORMALISMO RESTRINGIDO

la forma de W no se puede encontrar hasta tener una soluci on completa de la ecuacion de Hamilton Jacobi
restringida.
Un comentario final, a priori la expresion K = cte conduce a las mismas ecuaciones de movimiento que
K = 0. Sin embargo, las ecuaciones (9.1) con K = 0 claramente conducen a soluciones diferentes que las Ecs.
(9.31, 9.32) con K = 1 = cte. Para comprender la diferencia debemos tener en cuenta que aunque las i son
constantes, ellas son tratadas como variables para efectos de obtener las ecuaciones de Hamilton como se ve en
las Ecs. (9.31, 9.32), es decir que aunque K es constante, dicha constante 1 es una propiedad del sistema
(en muchos casos la energa del sistema), si en cambio K es igual a una constante independiente del sistema,
entonces para todos los efectos sera equivalente a escoger K = 0.

9.3. Paralelismo entre el formalismo de Hamilton Jacobi y el formalismo


restringido de Hamilton Jacobi
Es u til hacer un esquema que nos muestre la estrategia de soluci on de las ecuaciones de movimiento basados
en la funci on principal de Hamilton S o en la funci on caracterstica de Hamilton W .
Estos metodos son aplicables cuando el Hamiltoniano
es una funci on general de q, p, t se conserva
H (q, p, t) H (q, p) = cte
La idea del metodo es encontrar una transformaci on can onica que nos lleve a nuevas cooordenadas de modo
que
todas las nuevas coordenadas y momentos Todos los momentos Pi sean constantes
Qi , Pi , sean constantes de movimiento
para satisfacer estos requerimientos es condici on suficiente que el nuevo Hamiltoniano K
sea identicamente zero Sea cclico en todas las nuevas coordenadas Qi
K=0 H = K (Pi ) = 1
bajo estas condiciones, las ecuaciones de Hamilton para Qi , Pi son
Q i = P
K
i
=0 Q i = P K
i
= vi
K
Pi = Qi = 0 Pi = Qi = 0 K

las soluciones son inmediatas


Q i = i Q i = vi t + i
Pi = i Pi = i
Que satisface los requerimientos inicialmente propuestos. En ambos metodos se han trivializado las ecua-
ciones de Hamilton de modo que la dificultad para resolver las ecuaciones de movimiento se ha trasladado a
la b
usqueda de la TC. Para ello se plantea la existencia de una funci on generatriz de tipo 2 que genera dicha
TC, en cada caso la funci on generatriz es
La funci on principal de Hamilton Funci on caracterstica de Hamilton
F2 (q, P, t) S (q, P, t) F2 (q, P ) W (q, P )
que satisface la ecuaci on diferencial
  parcial
H q, S q , t + S
t = 0 H q, W
q 1 = 0
una soluci on completa de cada ecuaci on parcial contiene
n constantes de integraci on no triviales n 1 constantes de integraci on no triviales que junto con 1
1 , . . . , n forman un conjunto de n constantes independientes
Como los Pi deben ser constantes, es natural escoger los Pi como n funciones independientes de las cons-
tantes de integraci on
Pi = i (1 , . . . , n ) Pi = i (1 , . . . , n )
las soluciones de la ecuaci on de Hamilton Jacobi tendr an como argumentos
S = S (qi , i , t) W = W (qi , i )
En particular podemos escoger i = i . Recordando que S y W son funciones generatrices tipo 2, sus
ecuaciones parciales asociadas son
S
pi = q i
pi = W qi
S W
Qi = i
= i Q i = i = v i (j ) t + i
154 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

La primera mitad de estas ecuaciones se satisface autom aticamante ya que han sido empleadas para cons-
truir la ecuaci
on de Hamilton Jacobi. La segunda mitad se puede resolver para qi en terminos de t y las 2n
constantes i ,i . Para terminar, se deben encontrar los valores especficos de las 2n constantes para lo cual se
requieren los dos conjuntos de ecuaciones evaluados en t = t0 y empleando las condiciones iniciales q0 , p0 .
Finalmente, cuando el Hamiltoniano no es funci on explcita del tiempo, ambos metodos son adecuados y
las funciones generatrices estan relacionadas a traves de la expresi
on

S (q, P, t) = W (q, P ) 1 t (9.36)

9.4. Separaci
on de variables en la ecuaci
on de Hamilton Jacobi
Cabe preguntarse cuando la ecuaci on de Hamilton Jacobi es de utilidad pr actica teniendo en cuenta que
en general las ecuaciones diferenciales parciales con multiples inc
ognitas son de difcil soluci
on. Veremos que
bajo ciertas condiciones, es posible hacer una separacion de variables en la ecuaci on de Hamilton Jacobi en
cuyo caso es posible siempre reducir el problema a cuadraturas. En realidad, salvo casos excepcionales, el
formalismo de Hamilton Jacobi solo es efectivo cuando dicha separaci on es realizable.
Una coordenada qj se dice separable en la ecuaci on de Hamilton Jacobi cuando la funci on principal de
Hamilton (o la funcion caracterstica), se pueden separar en dos partes aditivas, una que solo depende de la
coordenada qj (y de los i ) y otra que es totalmente independiente de qj . Por simplicidad pensemos que la
variable separable es q1 la funci
on principal de Hamilton se escribe como

S (q1 , . . . , qn ; 1 , . . . , n ; t) = S1 (q1 ; 1 , . . . , n ; t) + S (q2 , . . . , qn ; 1 , . . . , n ; t)

on de Hamilton Jacobi se puede separar en dos ecuaciones, una separadamente para S1 y otra para S .
y la ecuaci
Notese que la condici
on de separabilidad ha sido impuesta a la soluci on de la ecuaci
on y no al Hamiltoniano.
Adicionalmente decimos que la ecuaci on de Hamilton Jacobi (HJ) es totalmente separable (o simplemente
separable) cuando todas las coordenadas en el problema son separables, de modo que la funci on principal se
escribe como
Xn
S= Si (qi ; 1 , . . . , n ; t) (9.37)
i=1

esta hip
otesis de separaci
on es consistente siempre que la introducir (9.37) en (9.4), se obtengan n ecuaciones
de la forma  
Sj Sj
Hj qj ; ; 1 , . . . , n ; t + =0 (9.38)
qj t
es notable que si el Hamiltoniano no depende explcitamente del tiempo, podemos tratar al tiempo como
variable separable y el paso de la funci
on principal a la funci on caracterstica de Hamilton constituye entonces
un ejemplo de la forma en que trabaja la separaci on de variables. En este caso podemos parametrizar la funci on
principal de Hamilton en la forma
S (q, , t) = S0 (, t) + W (q, )
al introducir esta soluci
on en la ecuaci
on de HJ, teniendo en cuenta que el Hamiltoniano no depende explci-
tamente del tiempo resulta  
W S0
H q, + =0
q t
el primer termino solo depende de las qi en tanto que el segundo depende solamente de t. Por tanto, ambos
terminos deben ser constantes con valores opuestos
 
W S0
H q, = 1 ; = 1 S0 = 1 t
q t
S (q, , t) = 1 t + W (q, )
9.5. COORDENADAS IGNORABLES Y SEPARABILIDAD 155

en concordancia con (9.36). Naturalmente podemos sumar una constante al valor de S0 pero esto no tiene
ninguna relevancia. Lo importante es encontrar una soluci on para S, pues recordemos que la unicidad no se
requiere para la funci
on generatriz.
Si ademas de que el Hamiltoniano es independiente del tiempo ocurre que todas las variables son separables,
podemos parametrizar cada Si de la forma

Si (qi ; 1 , . . . , n ; t) = Wi (qi ; 1 , . . . , n ) i t (9.39)

ahora bien, si la ecuaci


on de HJ es realmente separable, la suposici on de separabilidad de S debe conducirnos
a ecuaciones de la forma (9.38), que junto con la forma especfica de la hip otesis de separaci
on (9.39) nos
dara un conjunto de n ecuaciones restringidas de HJ.
 
Wj
Hj qj ; ; 1 , . . . , n = j (9.40)
qj

no hay suma sobre ndices en las ecuaciones (9.38)-(9.40).


Es de anotar que las funciones Hi pueden ser o no Hamiltonianos, esto est a relacionado con el hecho de
que el concepto de separabilidad no involucra al Hamiltoniano sino a las soluciones de la ecuaci on de HJ.
Similarmente, las constantes de separaci on i puede ser o no ser una energa, (aunque sus dimensiones son
siempre de energa), o alguna otra cantidad dependiendo de la naturaleza de qi .
Las constantes i se denominan constantes de separaci on. Cada una de las ecuaciones (9.40) involucra
solo una coordenada qj y la correspondiente derivada parcial de Wj con respecto a qj . En consecuencia, resultan
un conjunto de ecuaciones diferenciales ordinarias de primer orden. Dado que en principio podemos resolver
para despejar Wj /qj para luego integrar sobre qj , se deduce que el problema est a reducido a cuadraturas.
En la pr actica ocurre que con frecuencia cada Hi solo contiene uno o unos pocos s. Adicionalmente,
existen escenarios en donde solo r variables son separables y las restantes n r variables no pueden separarse.
En tal caso, solo podemos reducir a cuadraturas la ecuacion de movimiento de las r variables separables como
veremos m as adelante.
Finalmente salvo casos excepcionales, casi todas las aplicaciones u tiles del formalismo de HJ involucran
Hamiltonianos independientes del tiempo en donde t es una coordenada separable para S (y cclica para
W ). En consecuencia, la discusion subsecuente sobre separabilidad se limitar a a Hamiltonianos constantes y
se utilizar
a solamente la funci
on caracterstica W .

9.5. Coordenadas ignorables y separabilidad


Podemos demostrar facilmente que una coordenada cclica es separable. Por simplicidad, tomemos a q1
como la coordenada cclica, su momento conjugado es una constante de movimiento que denotaremos como
1 . La ecuaci
on de Hamilton Jacobi restringida queda
 
W W
H q2 , . . . , qn ; 1 ; ,..., = 1 (9.41)
q2 qn

si proponemos una soluci


on de la forma

W = W1 (q1 , ) + W (q2 , . . . , qn ; ) (9.42)

introduciendo (9.42) en (9.41) queda claro que en la Ec. (9.41) solo queda la parte aditiva W , en tanto que
W1 es la soluci
on de la ecuaci
on
W W1
p1 = 1 = = (9.43)
q1 q1
1 es por tanto la constante de separaci
on, la soluci
on obvia para W1 (excepto por una constante aditiva) es

W1 = 1 q1 (9.44)
156 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

con lo cual W estar


a dado por
W = W + 1 q1 (9.45)
hay una gran semejanza entre la Ec. (9.45) y la forma que S asume cuando el Hamiltoniano es independiente del
tiempo Ec. (9.36). Esto no es sorprendente ya que nuevamente, es como suponer que la variable cclica tiempo
asociada al momento conjugado constante H conduzca a una ecuaci on del tipo (9.45) con 1 H = 1
y con q1 t.
Si un n
umero s de las n coordenadas son no cclicas y ademas suponemos que S es totalmente separable,
podemos extender el resultado anterior. El Hamiltoniano viene dado por

H = H (q1 , . . . , qs ; 1 , . . . , n )

y la funci
on caracterstica se escribe como
s
X n
X
W (q1 , . . . , qs ; 1 , . . . , n ) = Wi (qi ; 1 , . . . , n ) + qi i
i=1 i=s+1

y hay s ecuaciones de HJ para solucionar


 
Wi
Hi qi ; ; 1 , . . . , n = i ; i = 1, ..., s
qi

y dado que estas son ecuaciones diferenciales ordinarias de primer orden en la variable independiente qi , se
pueden reducir inmediatamente a cuadraturas, y la solucion completa para W se puede obtener.

9.6. Condiciones m
as generales para la separabilidad
En general, una coordenada qj se puede separar si qj y su momento conjugado pj se pueden aislar en el
on f (qj , pj ) que no contiene a ninguna otra variable. Si usamos una soluci
Hamiltoniano en alguna funci on de
ensayo de la forma
W = Wj (qj , ) + W (qi , )
donde qi representa el conjunto de todos los qs excepto qj . Supongamos ahora que el ansatz de separaci
on
anterior nos conduce a que la ecuaci
on restringida de HJ tenga la forma
  
W Wj
H qi ; ; f qj , = 1 (9.46)
qi qj

esta ecuaci
on se puede invertir (al menos formalmente) para despejar a f
   
Wj W
f qj , = g qi , , 1 (9.47)
qj qi

ahora bien, el lado izquierdo depende exclusivamente de qj en tanto que el lado derecho solo depende de las
otras variables q. Por tanto la Ec. (9.47) solo puede ser cierta si ambos lados son iguales a la misma constante
por lo tanto    
Wj W
f qj , = j ; g qi , = j
qj qi
con lo cual se ha logrado la separaci on de la variable qj .
Vale la pena resaltar que la separabilidad depende no solo del problema fsico sino tambien del sistema de
coordenadas generalizadas usado. Por ejemplo el problema de un cuerpo bajo una fuerza central es separable
en coordenadas polares pero no en cartesianas. En algunos casos la ecuaci on de HJ no se puede separar
completamente como es el caso en el problema de los tres cuerpos. En contraste, para algunos problemas
fsicos es posible separar la ecuacion de HJ en m as de un sistema coordenado. En general solo es posible
9.7. FUERZAS CENTRALES EN EL FORMALISMO DE HAMILTON JACOBI 157

encontrar una soluci on cerrada para la ecuaci on de HJ cuando las variables son completamente separables.
En consecuencia, se han estudiado con profundidad diversos metodos para encontrar los sistemas coordenados
apropiados para cada problema.
En general no hay un criterio simple para indicar que sistemas coordenados conducen a soluciones de
Hamilton Jacobi separables para un problema especfico. Sin embargo, en el caso de sistemas ortogonales de
coordenadas, las llamadas condiciones de Staeckel resultan muy u tiles. Estas son condiciones necesarias y
suficientes para la separabilidad bajo ciertas circunstancias. Dichas condiciones son las siguientes:

1. El Hamiltoniano se conserva.
2. El Lagrangiano es solo una funci on cuadratica de las velocidades generalizadas de tal forma que el
Hamiltoniano tiene la estructura dada por la Ec. (6.20) con L0 (q, t) = V (q)
1
H= (e a) T1 (p a) V (q)
pe
2
3. El sistema coordenado es un sistema ortogonal, esto trae como consecuencia que la matriz T sea diagonal
y por lo tanto tambien lo es su inversa
 1
T1 ij = ij (no suma)
Tii

4. El vector a tiene elementos ai que solo dependen de su coordenada correspondiente i.e. ai = ai (qi )
5. La funci
on potencial V (q) es separable en la forma
Vi (qi )
V (q) = (9.48)
Tii

6. Existe una matriz de dimensi


on n n con elementos ij = ij (qi ) de tal forma que
 1
1 1j
= (no suma)
Tjj

Si se cumplen las condiciones de Staeckel, la funci


on caracterstica de Hamilton ser
a completamente sepa-
rable. X
W (q) = Wi (qi )
i
y cada Wi satisface las ecuaciones
 2
Wi
ai = 2Vi (qi ) + 2ij j
qi
siendo las j constantes de integracion y solo hay suma sobre j. La u ltima condici
on resulta a priori muy
complicada. Sin embargo veremos m as adelante que en la pr
actica ocurre a menudo que solo es necesario probar
la existencia de la matriz , sin que sea necesario encontrar su forma explcita. Esto facilita enormemente
aplicar las condiciones de Staeckel.

9.7. Fuerzas centrales en el formalismo de Hamilton Jacobi


9.7.1. Problema bidimensional
Consideremos el problema de una partcula sometida a una fuerza central descrita por el potencial V (r).
En virtud de la conservaci
on del momento angular, se puede observar que el movimiento debe realizarse en un
plano. El Hamiltoniano para este sistema bidimensional se escribe como
 
1 2 p2
H= pr + 2 + V (r) (9.49)
2m r
158 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

dado que la coordenada angular es cclica, podemos escribir la funci


on caracterstica de Hamilton en la forma

W = W1 (r) + (9.50)

donde
= p l (9.51)
es el momento conjugado a i.e. la magnitud del momento angular. La ecuaci
on de Hamilton Jacobi restringida
(9.27) queda de la forma
"  #
1 W 2 (W/)2
+ + V (r) = 1
2m r r2
 
dW1 2 2
+ 2 + 2mV (r) = 2m1 (9.52)
dr r

recordemos que 1 se identifica con el valor numerico del Hamiltoniano y en este caso, de la energa total
del sistema. La Ec. (9.52) es una ecuaci
on diferencial ordinaria para W1 (r) que se puede reducir en forma
inmediata a cuadraturas s
 
dW1 2
= 2m [1 V (r)] 2
dr r
y la funci
on W dada por (9.50) queda en la forma
s
Z 2

W = + 2m [1 V (r)] 2 dr
r

con esta expresi


on las Ecs. (9.33) toman la forma
Z
W m dr
t + 1 = = q (9.53)
1 2
2m [1 V (r)] r2
Z
W dr
2 = = q (9.54)
2
r 2 2m [1 V (r)] r2

La ecuaci
on (9.53) nos da r = r (t) y en general, las constantes 1 y se pueden relacionar con las cantidades
conservadas energa y momento angular (en el problema de una partcula sometida a una fuerza central, es
mas comun conocer la energa y el momento angular como condiciones iniciales, en lugar de las tradicionales
condiciones iniciales de posicion y momento). Como ya se mencion o, las restantes ecuaciones de Qi que no
involucran explcitamente al tiempo, proporcionan la ecuaci on de la orbita. En este caso solo hay una ecuacion
remanente para la orbita Ec. (9.54). En general resulta u
til realizar el cambio de variable u = 1/r en (9.54)
con lo que la ecuacion de la
orbita queda en la forma
Z
du
= 2 q (9.55)
2m 2
2 (1 V ) u

2 estar
a relacionado con el
angulo inicial medido en un sistema de ejes apropiado.

9.7.2. La din
amica de las fuerzas centrales como problema tridimensional
En la anterior secci
on asumimos desde el principio que el movimiento se ejecutaba en un plano en virtud de
la conservaci
on del momento angular. Resulta ilustrativo trabajar el mismo problema pero asumiendo que el
movimiento es en general en tres dimensiones para llegar posteriormente a la conclusion de que el movimiento
9.7. FUERZAS CENTRALES EN EL FORMALISMO DE HAMILTON JACOBI 159

es bidimensional. Comencemos entonces con el Hamiltoniano asociado a una fuerza central en coordenadas
esfericas
!
2 p 2
1 p
H= p2r + 2 + 2 2 + V (r) (9.56)
2m r r sin
asumiendo separaci
on de variables, la funci
on caracterstica de Hamilton Jacobi queda de la forma

W = Wr (r) + W () + W () (9.57)

y dado que la coordenada es cclica en el Hamiltoniano (9.56) tenemos que

W = (9.58)

donde es una constante de integraci on y coincide con el momento conjugado a como se puede ver teniendo
en cuenta las Ecs. (9.43) y (9.44). Usando la forma de W dada por las Ecs. (9.57, 9.58) la ecuaci
on de Hamilton
Jacobi queda de la forma
  "  #
Wr 2 1 W 2 2
+ 2 + + 2mV (r) = 2mE (9.59)
r r sin2

donde hemos escrito la constante de integraci on 1 como la energa que es el valor numerico de nuestro
Hamiltoniano. Notese que toda dependencia de ha sido separada en el termino entre parentesis cuadrados,
es decir cumple con la estructura de la Ec. (9.46). Esto nos implica que esta funci
on de se puede igualar a
una constante seg
un el razonamiento hecho en la secci on 9.6, por ejemplo despejando el termino mencionado
queda " #
  2
W 2 2 2 2 Wr
+ = 2mr [E V (r)] r
sin2 r
el miembro izquierdo depende solo de y el derecho solo de r luego ambos deben igualarse a la misma constante
 2
W 2
+ 2 = 2 (9.60)

sin
 2
2 2 Wr
2mr [E V (r)] r = 2 (9.61)
r

y obtenemos dos ecuaciones diferenciales ordinarias para y r que ya me reducen el problema a cuadraturas.
Notese que la ecuaci
on diferencial para r tambien se puede encontrar reemplazando (9.60) en (9.59) quedando
 2
Wr 2
+ = 2m [E V (r)] (9.62)
r r2

esta ecuacion es claramente equivalente a (9.61). El u nico aspecto que falta determinar es la asociaci on de las
constantes E, , con cantidades fsicas. La cantidad E es la energa del sistema. Por otro lado, es el
momento conjugado a la variable , y sabemos que el momento conjugado a una variable angular corresponde
a la componente del momento angular del sistema a lo largo del eje de rotaci on que rotara al sistema como
un todo en una cantidad d, este eje sera claramente el eje z y por tanto corresponde a la componente
polar del momento angular Lz .
No es tan sencillo identificar el significado Fsico de por multiples razones. En primer lugar, esta cantidad
aparece como una constante de separaci on y no como el momento conjugado a (de por s veremos m as adelante
que no lo es), por otro lado una variaci on en no define un u nico eje de rotacion, ya que a diferencia de
cuya variacion ocurre siempre sobre el plano XY , la variaci on en se da en el plano definido por el eje Z y
el vector instantaneo de posicion, este plano claramente cambia cuando vara la direcci on del vector posicion.
160 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

Finalmente, no puede tomar cualquier valor (0 ) con lo cual se dificulta su interpretaci


on como
angulo
de rotacion. Para encontrar el significado fsico de , calculemos primero los momentos conjugados a cada
variable angular recurriendo al correspondiente Lagrangiano en tres dimensiones para coordenadas polares de
la partcula sometida al potencial V (r) i.e.
1  2 
L (r, , ) = m r + r 2 2 + r 2 2 sin2 V (r)
2
los momentos conjugados a las variables angulares quedan

L (r, , )
p = = mr 2 (9.63)

L (r, , )
p = = mr 2 sin2 (9.64)

on entre y con estos momentos5 . Ya hemos mencionado que es el momento conjugado


y veamos la relaci
a la variable

W
= p = (9.65)

Para relacionar con los momentos conjugados, podemos reescribir (9.60) en la forma

p2
p2 + = 2 (9.66)
sin2
de tal manera que el Hamiltoniano (9.56), se puede reescribir como
 
1 2
H= p2r + 2 + V (r) (9.67)
2m r

y comparando (9.67) con el Hamiltoniano (9.49) y usando (9.51) resulta

= p (asociado a dos dimensiones) l (9.68)

lo cual ya nos da el significado fsico de como el m odulo del momento angular del sistema. Notese que en
tres dimensiones la conservaci on del modulo del momento angular no est a asociado a una variable cclica como
6
s ocurre en dos dimensiones , pues no es variable cclica en tres dimensiones y por tanto p no es constante
de movimiento como se puede apreciar de (9.66), de esta ecuaci on tambien se observa que l se escribe en
terminos de los momentos asociados a ambos angulos.
Vemos entonces que la conservaci on de las constantes E, , representan fsicamente la conservaci on de
la energa, de la componente polar del momento angular y del m odulo del momento angular respectivamente.
En este ejemplo, vemos que el metodo de Hamilton Jacobi resulta particularmente poderoso para extraer las
constantes de movimiento as como las ecuaciones de r = r (t) y de la orbita. Adicionalmente, el formalismo
de Hamilton Jacobi para este problema es separable en otras coordenadas como las parab olicas y elpticas, y
las constantes aparecen en forma apropiada para cada sistema coordenado.
Este problema tambien provee un escenario natural para emplear las condiciones de Staeckel de modo que
encontremos el potencial m as general V para una partcula que haga que las soluciones de la ecuaci on sean
totalmente separables en coordenadas esfericas. La matriz de las condiciones de Staeckel solo depende del
sistema coordenado y no del potencial. Como acabamos de demostrar que la ecuaci on de Hamilton Jacobi
es separable para al menos un potencial en coordenadas esfericas, las condiciones de Staeckel me dicen que
5
A priori estaramos tentados a interpretar a p = mr 2 como el m
odulo del momento angular total, pero en tres dimensiones
no es la velocidad angular con que la partcula se mueve sobre el plano. En particular, n
otese que no es cclica y por tanto p
no es constante de movimiento.
6
El modulo del momento angular en tres dimensiones aparece como una constante de separaci on .
ANGULO
9.8. VARIABLES ACCION PARA SISTEMAS CON UN GRADO DE LIBERTAD 161

dicha matriz tiene que existir, y observamos por otro lado que no requerimos de la forma especfica de
para encontrar las condiciones de separabilidad, solo requerimos de su existencia. Adicionalmente, el arreglo
rectangular columna a es nulo y sabemos que el sistema de coordenadas esfericas es ortogonal, de modo que
las condiciones de Staeckel se reducen a aplicar (9.48), para encontrar la forma separable m as general del
potencial. Para ello encontramos primero los elementos (diagonales) de la matriz de energa cinetica

Trr = m ; T = mr 2 ; T = mr 2 sin2

aplicando (9.48) la estructura m


as general del potencial separable es de la forma

Vr (r) V () V () V () V ()
V (q) = + + = Vr (r) + + 2 2
Trr T T r2 r sin
se puede comprobar la separabilidad de este potencial por sustituci
on directa en la ecuaci
on de HJ.

9.8. Variables acci


on
angulo para sistemas con un grado de libertad
En multiples ramas de la Fsica es de interes el estudio de movimientos peri odicos. En muchos casos no
estamos interesados en los detalles de la
orbita sino en la determinaci
on de las frecuencias del movimiento. Una
variaci
on del formalismo de Hamilton-Jacobi nos permite hallar el periodo de estos movimientos sin resolver
completamente la ecuaci on de movimiento. Con esta tecnica, no definimos los momentos nuevos como las
on i sino como ciertas funciones de las i que contienen informaci
constantes de integraci on sobre un ciclo
completo de movimiento, estos nuevos momentos se denotan por Ji y se denominan variables de acci on.

Figura 9.1: Trayectoria en el espacio de fase de un sistema unidimensional (a) para periodicidad tipo libraci
on
y (b) para periodicidad tipo rotaci
on.

Consideraremos en primera instancia el caso de un solo grado de libertad. Asumiremos adem


as que el
Hamiltoniano es constante
H (q, p) = 1
podemos resolver para el momento y obtener

p = p (q, 1 ) (9.69)

la Ecuaci
on (9.69) se puede considerar como una ecuaci on de trayectoria en el espacio de fase. Cuando el
movimiento es periodico se habla de una orbita en el espacio de fase. Definiremos dos tipos de periodicidad de
acuerdo con las caractersticas de la
orbita en el espacio de fase:
162 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

1. En el primer tipo la orbita es cerrada en el espacio de fase como se ve en la figura 9.1(a). De


modo que el punto que define la din amica en el espacio de fase, regresa sobre la misma trayectoria en
forma periodica. Tanto q como p son funciones peri odicas en el tiempo con la misma frecuencia. Un
movimiento peri odico de esta naturaleza se puede encontrar cuando la posici on inicial yace entre dos
ceros de la energa cinetica, este movimiento se conoce con el termino astron
omico de libracion y tiene
como principal exponente al oscilador arm onico unidimensional.

2. En el segundo tipo de orbita, la trayectoria en el espacio de fase es tal que p es una funci
on peri
odica de
q, con periodo q0 , como se ilustra en la figura 9.1(b). Equivalentemente este tipo de movimiento implica
que cuando la coordenada se incrementa en q0 , el sistema permanece b asicamente inalterado. El ejemplo
mas familiar es el cuerpo rgido que rota sobre un eje fijo, siendo q el angulo de rotaci
on. Cuando se
incrementa q en 2, no se produce ning un cambio esencial en el estado del sistema. En realidad para
este tipo de periodicidad la coordenada de posici on est
a siempre asociada a un angulo de rotacion de
tal modo que el movimiento peri odico asociado se denomina simplemente rotaci on, en constraste con
la libraci
on. En este caso los valores de q ya no est an acotados sino que pueden crecer indefinidamente.

Figura 9.2: Trayectorias en el espacio de fase de un oscilador arm onico unidimensional para diferentes con-
diciones iniciales. Cuando Emgl, obtenemos una orbita cerrada i.e periodicidad tipo libraci
on. Para el caso
E=mgl tenemos bifurcaci on. Finalmente, cuando Emgl, tenemos periodicidad de rotaci on.

Hay sistemas fsicos que pueden exhibir cualquiera de estos dos tipos de movimiento peri odico. Un ejemplo
sencillo es el pendulo simple siendo q el angulo de deflexi on respecto a la vertical. Tomando el cero de potencial
en el punto de suspensi on de la varilla sin masa, la energa es constante y coincide con el Hamiltoniano quedando

p2
E= mgl cos
2ml2
siendo l, la longitud de la varilla. Despejando p , obtenemos la ecuaci
on para el camino que describe el punto
del sistema en el espacio de fase en la forma descrita por (9.69)
p
p = 2ml2 (E + mgl cos ) (9.70)
ANGULO
9.8. VARIABLES ACCION PARA SISTEMAS CON UN GRADO DE LIBERTAD 163

si E es menor que mgl sabemos por consideraciones de energa que el movimiento es acotado en , de modo
que || < max el valor de la cota superior se obtiene cuando p = 0 y corresponde al valor
E
cos max =
mgl
en este caso la energa es siempre negativa. Claramente el pendulo oscila entre max y max lo cual nos da
un movimiento peri odico tipo libraci
on (ver figura 9.2). N
otese ademas que el doble signo en (9.70) es necesario
para que la orbita sea cerrada, es decir no define una funci
on. Por otro lado, si E > mgl, la energa es suficiente
para que el pendulo pueda girar completamente de modo que puede tomar cualquier valor y no est a acotado,
este sera un movimiento peri odico tipo rotacion (ver figura 9.2). El lmite E = mgl se ilustra tambien en la
Fig. 9.2, y corresponde a un pendulo que llega a = con energa cinetica cero es decir con p = 0. Este es un
punto de equilibrio inestable en el cual se puede quedar indefinidamente, pero si hay la menor perturbaci on
el pendulo toma uno de dos caminos dr asticamente diferentes (giro en cualquiera de los sentidos). El punto
= , p = 0 es un punto de silla para el Hamiltoniano H = E (p , ), y en dicho punto se intersectan dos
caminos del espacio de fase con energa constante. Este fen omeno se conoce como bifurcaci on.
Ignorando por el momento la posibilidad de la bifurcaci on, tendremos movimiento de libraci on o de rotaci on
dependiendo de las condiciones iniciales. Para cualquiera de estos movimientos peri odicos es u
til introducir
una nueva variable J, designada para reemplazar a 1 como el nuevo momento del sistema. Es decir el nuevo
momento ya no ser a el Hamiltoniano sino la variable accion J definida por
I
J = p dq (9.71)

la integraci
on se realiza en un ciclo completo de libraci
on o rotaci
on seg
un el caso. Observese que este termino
se asemeja a la acci on abreviada definida en (6.49) lo cual justifica su nombre de variable de acci on. Las
dimensiones de J siempre ser an en consecuencia unidades de momento angular. Teniendo en cuenta (9.69) y
(9.71) se observa que J es funci on exclusivamente de 1 i.e. del Hamiltoniano

J = J (1 ) 1 H = H (J)

de modo que la funci


on caracterstica de Hamilton puede escribirse como

W = W (q, J) (9.72)

La coordenada generalizada conjugada a J se denomina variable angular w, y se define usando el segundo


conjunto de ecuaciones de transformaci
on (9.28)

W (q, J)
w= (9.73)
J
las ecuaciones de Hamilton para el conjunto can
onico w, J nos dan
H (J)
w = = v (J) (9.74)
J
n on de Hamilton para J es trivial. v es una constante que es funci
otese que la otra ecuaci on de J u
nicamente,
la Ec. (9.74) tiene como soluci
on inmediata
w = vt + (9.75)
y w es funci on lineal del tiempo lo cual es l
ogico ya que este es un caso particular de la Ec. (9.35) con w
haciendo el papel de la nueva coordenada Q.
La soluci
on formal del problema se puede obtener despejando q en terminos de w, J a partir de (9.73), y
luego reemplazando w por la expresi on en (9.75). Lo cual nos da q como funci
on del tiempo y de las constantes
J, v, que a su vez se pueden obtener de las condiciones iniciales. Sin embargo, este procedimiento no posee
ninguna ventaja significativa con respecto a otras elecciones de los nuevos momentos. El verdadero poder de
164 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

la formulacion en variables acci


on
angulo radica en la interpretaci
on Fsica de las constantes v (J). Para ver
su significado primero consideremos el cambio en w cuando q hace un ciclo completo de libraci on o rotaci
on,
este cambio esta dado por I
w
w = dq (9.76)
q
usando (9.73) queda7 I
2W
w = dq
q J
dado que J es constante a lo largo de todo el ciclo, la derivada con respecto a J se puede sacar fuera del signo
integral I I
d W d
w = dq = p dq = 1
dJ q dJ
el u
ltimo paso viene de la definici
on de J (9.71). Esta ecuaci on establece que w cambia en la unidad (w es
adimensional) cuando q se mueve a lo largo de un ciclo. Si ahora asumimos que el movimiento es peri odico en
8
el tiempo , entonces este cambio tambien se puede evaluar de (9.75)
w = w ( ) w (0) = v = 1
donde denota el periodo para un ciclo completo de q en cualquiera de los dos tipos de periodicidad. De
aqu resulta entonces que v es el inverso del periodo, es decir la frecuencia asociada al movimiento peri
odico de
q. Por lo tanto el formalismo de las variables acci on
angulo nos permite evaluar la frecuencia del movimiento
peri
odico sin resolver completamente el movimiento del sistema. Si sabemos a priori que cierto sistema
de un grado de libertad es periodico en cualquiera de las dos formas, la frecuencia se puede determinar una vez
que H se escribe en terminos de J y aplicando (9.74). La identificaci on de v (J) como una frecuencia y la Ec.
(9.75) nos refuerza el hecho de que a la variable w se le denomine variable angular. De la misma forma se puede
ver que si w tiene dimensiones de angulo (adimensional) el momento conjugado J debe tener dimensiones de
momento angular.

9.8.1. El oscilador arm


onico unidimensional en variables acci
on
angulo
Como ejemplo de aplicacion de este formalismo veamos el oscilador arm onico unidimensional. Retomando
el Hamiltoniano del oscilador arm
onico denotandolo por
1 
= p 2 + m2 2 q 2 (9.77)
2m
Para calcular la acci
on debemos despejar el momento p en funci on de la coordenada q, lo cual nos da
p
p = 2m m2 2 q 2
que coincide con la Ec. (9.20). Podemos ahora calcular la variable de acci
on en la forma
I I  p 
J = p dq = 2m m2 2 q 2 dq

siendo la energa total (conservada) y 2 = k/m. N otese que el signo positivo vale para la mitad del ciclo
(en el que se incrementa q) y el negativo para la otra mitad (en el que decrece la variable q). Por simetra esto
se puede escribir como dos veces la integral sobre un semiciclo definido con el radical positivo
I p
J =2 2m m2 2 q 2 dq
semiciclo
7
N
otese que en (9.76) no aparece dependencia explcita del tiempo como a priori se ve en (9.75). La razon es que cuando w se
escribe en terminos de q queda en la forma w = w (q, J) segun se puede ver de las Ecs. (9.72, 9.73). Adem as J es constante a lo
largo del ciclo por construcci
on.
8
N
otese que hasta este punto no se ha utilizado la periodicidad en el tiempo, solo el hecho de que la trayectoria en el espacio
de fase sea cerrada o que p = p (q) sea peri
odica en q, pero podra ocurrir que cada ciclo en el espacio de fase tomara un tiempo
distinto en ejecutarse.
ANGULO
9.9. VARIABLES ACCION PARA SISTEMAS COMPLETAMENTE SEPARABLES11 165

Usando el cambio de variable r


2
q= sin
m 2
este cambio de variable permite definir claramente los lmites de integraci
on requeridos para el semiciclo de la
franja superior del plano de fase, y la integral se convierte en
Z
2 2
J =2 cos2 d = (9.78)
0

despejando i.e. el Hamiltoniano resulta


J
H (J) = (9.79)
2
con lo cual la frecuencia de oscilaci
on se obtiene aplicando (9.74)
r
H 1 k
v= = = (9.80)
J 2 2 m
en concordancia con la frecuencia obtenida por otros metodos. Es interesante escribir las soluciones para las
Ecs. (9.19, 9.21) en funci
on de J y w, a pesar de que no se requieren para encontrar las frecuencias. Teniendo
en cuenta las Ecs. (9.80, 9.75) vemos que t + es equivalente a 2w redefiniendo adecuadamente la constante
de integraci
on. De modo que las soluciones de (9.19, 9.21) en funci on de J y w quedan de la forma
r r
J mJ
q= sin 2w ; p = cos 2w (9.81)
m
Las Ecs. (9.81) definen la transformaci
on canonica que nos lleva del sistema can
onico (q, p) al sistema
canonico (w, J). Vale la pena enfatizar que la forma explcita de la TC no fue necesaria para calcular la
frecuencia del movimiento.

9.9. Variables acci angulo para sistemas completamente separables9


on
Cuando tenemos un n umero arbitrario de grados de libertad, el formalismo de Hamilton Jacobi es parti-
cularmente relevante cuando existe uno o mas conjuntos coordenados en los cuales la ecuaci on de Hamilton
Jacobi es completamente separable. Si adem as existe algun tipo de periodicidad an
aloga a la discutida en la
secci
on anterior, entonces tendremos que la variante del formalismo de Hamilton Jacobi conocida como el for-
malismo de las variables acci
on
angulo, puede ser particularmente ventajosa. Tomaremos adem as la suposicion
simplificadora de que H es constante de modo que podemos usar el formalismo de la funci on caracterstica de
Hamilton. La separabilidad completa nos lleva a que las ecuaciones de la transformaci on canonica tengan la
forma
Wi (qi ; 1 , . . . , n )
pi = (9.82)
qi
lo cual nos da cada pi en funci
on de su coordenada conjugada qi y las n constantes de integraci
on

pi = pi (qi ; 1 , . . . , n ) (9.83)

la Ec. (9.83) es el equivalente de (9.69), pero aplicado ahora a varios grados de libertad. La Ec. (9.83) representa
la ecuacion de orbita de la proyecci on del punto del sistema sobre el plano (qi , pi ) en el espacio de fase (i es
un ndice fijo en este caso). Es u til definir variables acci
on
angulo cuando las ecuaciones de orbita para todos
los planos (qi , pi ), describen
orbitas cerradas (libraciones) o funciones peri
odicas de qi (rotaciones).
Es de anotar que las condiciones anteriores no significan que necesariamente las variables qi , pi sean fun-
ciones periodicas del tiempo, es decir que repitan su valor para intervalos de tiempo regulares. Incluso cuando
9
En lo que sigue del captulo no adoptaremos la convenci
on de suma de ndices repetidos a menos que se indique lo contrario.
166 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

cada conjunto (qi , pi ) es peri odico en este sentido, el movimiento completo no es necesariamente peri odico.
Para tomar un ejemplo concreto, el oscilador arm onico con tres grados de libertad puede tener una frecuencia
diferente sobre cada coordenada cartesiana, el movimiento solo ser a peri
odico si las tres frecuencias son conme-
surables entre s, es decir si los cocientes entre las frecuencias son racionales; de no ser as, se describen figuras
de Lissajous que no son curvas cerradas10 . Tal movimiento se denomina movimiento peri odico m ultiple. Una
de las ventajas de la formulaci on de Hamilton Jacobi en variables acci on angulo, es que permite evaluar todas
las frecuencias de un movimiento peri odico multiple sin resolver completamente el problema del movimiento.
En analoga con (9.71) las variables de acci on Ji se definen en terminos de integrales de lnea sobre periodos
completos de la orbita en el plano (qi , pi ). I
Ji = pi dqi (9.84)

notese que la separabilidad manifestada en la ecuaci on (9.83) es indispensable para que cada Ji sea una

constante, ya que si cada pi depende de varios q s, esta integral depender a de todos los q s excepto de qi . Si
una coordenada es cclica, su momento conjugado es constante de modo que la trayectoria u orbita en el espacio
de fase (qi , pi ) es una lnea recta horizontal, que no parece ser la naturaleza de un movimiento peri odico. En
realidad el movimiento se puede considerar un caso lmite de movimiento peri odico de rotaci on, en el cual
se le puede asignar un periodo arbitrario a qi . Dado que una coordenada de rotaci on es invariablemente un
angulo, si la coordenada cclica es angular, entonces tendr
a un periodo natural de 2. En consecuencia, es
natural (aunque no obligatorio) evaluar la integral en la definici on de la variable de accion correspondiente
a una coordenada angular cclica entre 0 y 2. Por tanto, para toda variable cclica qi su variable de acci on
asociada se definir a como
Ji = 2pi (9.85)
usando la Ec. (9.82) en la definici
on de Ji Ec. (9.84) se tiene
I
Wi (qi ; 1 , . . . , n )
Ji = dqi (9.86)
qi

como ya mencionamos, gracias a la completa separabilidad en las coordenadas, cada Ji es solo funci on de
las constantes de integraci
on i que aparecen al integrar la ecuaci on de Hamilton Jacobi y es por tanto
constante. Por otro lado, debido a la independencia de los pares (qi , pi ), se tiene que adem as las J s son n

funciones independientes de las s de modo que forman un conjunto adecuado de constantes para definir los
nuevos momentos. Al expresar los s en terminos de los J s, podemos redefinir los argumentos en la funci on
caracterstica
n
X
W = W (q1 , . . . , qn ; J1 , . . . , Jn ) = Wj (qj ; J1 , . . . , Jn )
j=1

en tanto que el Hamiltoniano sera funci


on exclusiva de las J

H = 1 = H (J1 , . . . , Jn ) (9.87)

al igual que en el caso de un grado de libertad, podemos definir variables angulares conjugadas wi a traves de
la funci
on caracterstica W teniendo en cuenta que esta u
ltima es una funcion generatriz de tipo 2
n
X Wj (qj ; J1 , . . . , Jn )
W
wi = = (9.88)
Ji Ji
j=1

esta ecuaci
on muestra que las wi son en general funciones de todas las qj y todas las Jj .

wi = wi (q1 , . . . , qn ; J1 , . . . , Jn ) (9.89)
10
Vale decir que este ejemplo es en el espacio real y no en el espacio de fase. Pero el razonamiento para el movimiento en el
espacio de fase es identico.
ANGULO
9.9. VARIABLES ACCION PARA SISTEMAS COMPLETAMENTE SEPARABLES12 167

De nuevo, la mitad de las ecuaciones de Hamilton conducen a


H (J1 , . . . , Jn )
w i = = vi (J1 , . . . , Jn ) (9.90)
Ji
y de nuevo la otra mitad de las ecuaciones de Hamilton son triviales. Las vi son todas constantes puesto que
son funciones exclusivas de las Ji . Por lo tanto, las ecuaciones de Hamilton anteriores se pueden integrar para
obtener wi como funciones lineales del tiempo

wi = vi t + i (9.91)

en general cada wi se incrementa de forma diferente a los otros.


En este caso se puede ver que las vi son las frecuencias asociadas al movimiento peri odico m
ultiple, pero el
argumento para llegar a esta aseveraci on es m as sutil que en el caso de un grado de libertad. Las ecuaciones
de transformaci on que conducen al conjunto can onico (w, J) implica que cada qj y pj es una funci on de las
constantes Ji y las variables wi . El objetivo ahora es encontrar la funci on matem atica de los qi en terminos
de los wi , para lo cual examinamos el cambio de cada wi cuando cada una de las variables qj ha ejecutado
un numero entero de ciclos mj de libraci on o rotacion. Este es un procedimiento puramente matem atico ya
que en este caso no estamos ejecutando un movimiento del sistema en el tiempo. Es como si congel aramos el
tiempo y cada qi fuera movido independientemente a traves de un cierto n umero de ciclos de su movimiento.
Esto es an alogo al concepto de desplazamiento virtual desarrollado para el principio de DAlembert, de modo
que los cambios infinitesimales en las wi cuando cambian las qi infinitesimalmente, son tambien de naturaleza
virtual por lo cual usamos la notacion wi
" n
#
X wi X 2W X 2 X
wi = dqj = dqj = Wk (qk ; J1 , . . . , Jn ) dqj
qj Ji qj Ji qj
j j j k=1

donde hemos usado (9.88). La derivada con respecto a qj se anula excepto para Wj y usando (9.82) y (9.83)
se obtiene
X
wi = pj (qj ; J1 , . . . , Jn ) dqj (9.92)
Ji
j

la Ec. (9.92) representa a wi como una suma de contribuciones independientes cada una asociada al movi-
miento virtual de un qj . El cambio total en wi se puede escribir entonces
X I
wi = pj (qj , J) dqj (9.93)
Ji
j mj

el operador diferencial con respecto a Ji se puede mantener por fuera de la integral ya que en el proceso de
integraci on de las qi el conjunto de las Ji permanece inalterado. El smbolo mj indica que cada
on i.e. de variaci
una de las n integrales se realiza sobre un cierto n umero de ciclos, siendo mj el numero de ciclos que ejecuta
la coordenada qj . Por otro lado, en virtud de la definici on de variables acci
on
angulo Ec. (9.84) cada una de
estas integrales es mj Jj . Adicionalmente, dado que cada Ji es independiente, se sigue que

wi = mi (9.94)

si alg
un qj no se barre en un numero entero de ciclos en la correspondiente integracion, habr
a un remanente
debido a la fracci o de modo que wi no tendr
on del ciclo que no se complet a un valor entero. Si tratamos a
los wi y los mi como arreglos vectoriales podemos escribir la relaci
on anterior de la forma

w = m (9.95)

en estas instancias conviene reafirmar la importancia de la naturaleza virtual del movimiento de rotacion
o libraci
on en cada plano qi , pi . N
otese que en (9.92) wi se representa como una suma de contribuciones
168 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

independientes gracias a la virtualidad del movimiento de cada qj ; pues de lo contrario, el par ametro tiempo
hace que estos ciclos se recorran en forma correlacionada. M as importante a un, en el movimiento real si las
frecuencias en cada plano qi ,pi no son conmesurables, no existir
a un valor finito del tiempo para el cual se hayan
ejecutado ciclos completos en cada plano. Es decir para un movimiento real con frecuencias no conmesurables,
no hay un valor del tiempo para el cual las Ecs. (9.94, 9.95) sean v alidas.
Finalmente, es importante insistir en que hasta el momento no se ha utilizado periodicidad en el tiempo,
a enfatizado por el caracter virtual de los wi .
lo cual est

9.9.1. Movimientos peri


odicos m
ultiples de libraci
on
Supongamos que cada movimiento separado es de tipo libraci on de modo que para cada qj , pj vuelve a
su valor inicial cuando se completa un ciclo. El resultado dado por la Ec. (9.95) puede ser expresado de la
siguiente forma: sea el arreglo vectorial de dimensi on 2n de las qi , pi , que es en general funcion de w de
tal manera que un cambio no trivial en el cual = 0, debe corresponder a un cambio w = m, que es un
arreglo vectorial de componentes enteras13 . Dado que el numero de ciclos para cada coordenada se puede elegir
arbitrariamente, tomemos mk = ki , de modo que completamos un ciclo en las variables qi , pi dejando a las
otras variables sin transformar, es decir que todas las componentes qk , pk con k 6= i permanecen sin cambiar
en tanto que las componentes qi , pi vuelven a sus valores originales luego de completar un ciclo, esto nos da
como resultado que = 0. Por tanto, en el caso m as general las componentes de tienen que ser funciones
odicas de cada wi con periodo unidad; esto es, las q s y las p s son funciones peri
peri odicas multiples de las
14
w s con periodos unidad . Una funci on periodica multiple como esta puede ser siempre representada por una
expansion de Fourier, la cual para un cierto qk se escribe como

X
X (k)
qk = ... aj1 ,...,jn exp [2i (j1 w1 + . . . + jn wn )] (9.96)
j1 = jn =

donde los jm son enteros. Naturalmente podemos tratar al conjunto de las j s y las w s como arreglos vectoriales
para escribir esta relaci
on en forma mucho m
as compacta
X (k)
qk = aj exp [2i (j w)] (9.97)
j

an
alogamente, la Ec. (9.91) tambien se puede escribir en forma vectorial
w = vt + (9.98)
y la dependencia temporal de qk se escribe de la forma
X (k)
qk (t) = aj exp [2ij (vt + )] (9.99)
j

observese que en general qk (t) no es necesariamente una funci on peri


odica en el tiempo; pues la expansi on
de Fourier solo ha requerido la periodicidad en cada coordenada wi por aparte y cada una de ellas crece a
diferente ritmo, no es necesario ni siquiera que haya periodicidad temporal para completar cada ciclo en un
qi , pi dado. Incluso si asumimos periodicidad temporal para cada qi , pi , la periodicidad en qk (t) ocurrira solo
si los vi son todos conmesurables entre s, es decir m ultiplos racionales unos de otros. Por lo tanto, en el caso
m as general qk se considera una funcion cuasi peri odica del tiempo. Finalmente, debe recordarse que los
(k)
coeficientes aj pueden encontrarse usando el procedimiento est andar para encontrar coeficientes de Fourier.
Ellos estan dados por integrales multiples sobre la celda unitaria en el espacio w
Z 1 Z 1
(k)
aj = ... qk (w) exp [2i (j w)] dw
0 0
13
Estrictamente es funci
on de w y J, pero J es constante durante el proceso de completar uno o m as ciclos.
14
N
otese que para llegar a esta conclusi
on, fue necesario que cada plano qi , pi se barriera independientemente, es decir fue im-
portante que el movimiento fuera virtual.
ANGULO
9.9. VARIABLES ACCION PARA SISTEMAS COMPLETAMENTE SEPARABLES15 169

dw define el elemento de volumen en el espacio n dimensional de las wi . Un procedimiento an


alogo se puede
hacer para pk (t).

9.9.2. Movimientos cuasi peri


odicos m
ultiples de rotaci
on
Cuando el movimiento peri odico es del tipo rotacion en un ciclo completo del par de variables separables
(qi , pi ), la coordenada qk no retorna a su valor original sino que se incrementa en una cantidad q0k , tal
coordenada de rotaci on no es en s multiplemente periodica. Sin embargo, cuando se realiza un numero entero
de ciclos mk vemos que la variable wk ha aumentado en mk unidades. En consecuencia, la funci on qk wk q0k
s retorna a su valor inicial para cualquier n umero entero de ciclos y a semejanza del caso de la libraci
on, es
una funci on periodica m
ultiple de todos los w s con periodo unidad. Por tanto, podemos expandir la funci on
en una serie de Fourier m ultiple analoga a (9.96), y encontrar la dependencia temporal usando (9.91)
X (k)
qk wk q0k = aj exp [2i (j w)]
j
X (k)
qk = q0k (vk t + k ) + aj exp [2ij (vt + )]
j

por lo tanto es siempre posible generar una funci


on peri
odica m
ultiple a partir de una coordenada de rotaci
on, la
cual puede ser manipulada exactamente de la misma forma que una coordenada de libraci on. En consecuencia,
para simplificar la discusi
on nos restringiremos a trabajar con el movimiento peri odico tipo libraci
on.

9.9.3. Determinaci
on de las frecuencias para movimiento peri
odico m
ultiple tipo libra-
ci
on
En el movimiento peri odico m ultiple tipo libracion, los momentos separables pk son funciones peri odicas
m
ultiples de las w s, y pueden ser expandidos en una serie de Fourier m ultiple similar a la presentada en (9.96).
De esto se deduce que cualquier funci on de varios de los pares de variables (qi , pi ), tambien seran funciones
peri
odicas m ultiples de los w s. De modo que se pueden escribir como
X X
f (q, p) = bj exp [2ij w] = bj exp [2ij (vt + )] (9.100)
j j

por ejemplo, cuando las coordenadas cartesianas de las partculas en el sistema no son en s las coordenadas
de separaci
on, ellas a
un se pueden escribir como funciones del tiempo en la forma de las Ecs. (9.100).
Cuando asumimos periodicidad temporal en cada plano qi , pi ; las Ecs. (9.96, 9.99), representan el tipo mas
general de movimiento peri odico multiple del tipo libraci
on. Sin embargo, no todos los sistemas con este tipo
de movimiento poseen todas las caracterstica mostradas en (9.96, 9.99). Por ejemplo, en una amplia gama de
problemas de aplicacion de las variables acci
on angulo las Ecs. (9.88, 9.89) se simplifican a

Wi
wi = (qi ; J1 , . . . , Jn ) ; wi = wi (qi ; J1 , . . . , Jn ) (9.101)
Ji
de modo que cada coordenada qi de separaci on es funci
on unicamente de su wi asociado. Cuando esto ocurre,
qk es una funci
on peri
odica solo de wk , y la serie de Fourier multiple se reduce a una serie de Fourier sencilla

X
X
(k) (k)
qk = aj exp [2i (jwk )] = aj exp [(2i) j (vk t + k )] (9.102)
j= j=

En el lenguaje de los sistemas de osciladores acoplados, se puede decir que estas q s son las coordenadas
normales del sistema. Sin embargo, incluso cuando el movimiento de las q s se pueda simplificar as, ocurre
con frecuencia que las funciones de todas las q s, tales como las coordenadas cartesianas, continuan siendo
funciones peri
odicas multiples de las w s y deben ser representadas como en la Ec. (9.100). Aunque haya
170 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

periodicidad temporal en qk , pk solo habra periodicidad temporal de tales funciones si las varias frecuencias
vk son conmesurables. Una vez m as, el movimiento de un oscilador arm
onico bidimensional anisotr opico es un
buen ejemplo para ilustrar estas consideraciones.
Supongamos que en un conjunto particular de coordenadas cartesianas, el Hamiltoniano viene dado por
1  2  
H= px + 4 2 m2 vx2 x2 + p2y + 4 2 m2 vy2 y 2
2m
estas coordenadas cartesianas son entonces coordenadas de separaci on adecuadas y cada una exhibe movi-
miento armonico simple con frecuencias vx y vy respectivamente. Luego, las soluciones para x, y son formas
particularmente simples de expansiones sencillas de Fourier de la forma (9.102). Supongamos ahora que las
an rotadas /4 alrededor del eje z. Las componentes del movimiento a lo largo de los ejes x , y
coordenadas est
seran 16

1
x = [x0 cos 2 (vx t + x ) + y0 cos 2 (vy t + y )]
2
1
y = [y0 cos 2 (vy t + y ) x0 cos 2 (vx t + x )] (9.103)
2
si el cociente vx /vy es racional, estas dos expresiones ser an conmesurables y corresponder an a figuras de
Lissajous cerradas. Pero si el cociente no es racional, la figura es tal que el punto en el espacio de fase nunca
vuelve exactamente sobre el mismo trazo y las Ecs. (9.103) nos dan un ejemplo simple de expansiones de
Fourier de periodicidad m ultiple de la forma (9.102).
Incluso cuando qk es una funci on peri
odica multiple de todas las w s, intuitivamente parece existir una
relaci
on entre qk y su wk asociado (y por tanto con la frecuencia vk ). Despues de todo es de anotar que el
argumento que nos llev o a la Ec. (9.94), nos dice que cuando qk completa un ciclo (moviendo solo a qk ), wk
se incrementa en la unidad en tanto que las otras w s retornan a sus valores iniciales. Un argumento riguroso
para esta relaci
on fue desarrollado por J. Vinti en 1961.
Supongamos que un cierto intervalo de tiempo T contiene a mk ciclos completos de qk mas una fracci on
de un ciclo. En general el tiempo requerido para cada ciclo sucesivo puede ser diferente, puesto que qk no es
necesariamente una funci on periodica en el tiempo. Vinti demostr o, sobre la base de un teorema de la teora
de numeros, que cuando T crece indefinidamente
mk
lm = vk
T T
de modo que la frecuencia promedio del movimiento de qk est a siempre dada por vk , incluso cuando el movi-
miento completo es m as complicado que una funci odica con frecuencia vk .
on peri
Es notable el hecho de que la ecuaci on (9.86) nos dice que cuando qi hace un recorrido virtual de un ciclo
completo (es decir cuando wi se incrementa en la unidad) la funci on caracterstica se incrementa en Ji . Con
una estrategia similar a la que se sigue para el movimiento periodico de rotacion, se tiene que la funci
on
X
W = W wk Jk (9.104)
k

permanece invariante cuando cada wk se incrementa en la unidad, con las otras variables de acci on perma-
neciendo constantes17 . La ecuacion (9.104) representa entonces una funci on periodica multiple que se puede
expandir en terminos de las wi (o las frecuencias vi y el tiempo), por una serie de la forma (9.100). Puesto que
las ecuaciones de transformacion para las variables angulares vienen dadas por
W
wk =
Jk
16
La clave es que x = x (vx ) , y = y (vy ) en tanto que x = x (vx , vy ) y y = y (vx , vy ).
17
W es una funci on generatriz de tipo 1 y se obtiene a partir de W que es de tipo 2 teniendo en cuenta que F1 (q, Q, t) =
F2 (q, P, t) Qk Pk , con Qk wk y Pk Jk .
ANGULO
9.9. VARIABLES ACCION PARA SISTEMAS COMPLETAMENTE SEPARABLES18 171

se puede reconocer que la ecuaci on (9.104) define una transformaci on de Legendre desde la base (q, J) hacia la
base (q, w). Recordando que W es una funci on generatriz tipo 2 y usando las Ecs. (7.10, 7.14) tenemos que si
W (q, J) es de tipo F2 entonces W (q, w) es la funcion correspondiente de tipo F1 . Por tanto, ambas transforman
de las variables (q, p) a las variables (w, J). Sin embargo aunque W genera la misma transformaci on que W ,
no es una soluci on de la ecuacion de Hamilton Jacobi, ya que el formalismo de Hamilton Jacobi est a dise
nado
para funciones tipo 2.
Hemos visto que asumiendo periodicidad temporal para cada plano (qi , pi ), la conmesurabilidad es un
criterio esencial para distinguir entre un sistema peri odico m
ultiple o un sistema periodico simple. Cuando las
frecuencias todas son conmesurables entre s, la configuraci on se repite despues de un tiempo suficientemente
largo y sera periodico simple. Matem aticamente la conmesurabilidad entre pares de frecuencias se manifiesta
en las siguientes ecuaciones
ji vi = jk vk (no suma) (9.105)
siendo jk enteros positivos. Basta con probar que un cierto vi es conmesurable con los dem as para demostrar
que todos son conmesurables entre s, en cuyo caso se habla de una sistema completamente conmesurable.
Pero si solo m de las n frecuencias satisface (9.105), el sistema se dice mconmesurable. Por ejemplo si tenemos
las frecuencias

v1 = 3M Hz, v2 = 5M Hz, v3 = 7M Hz, v4 = 2 2M Hz

v5 = 3 2 M Hz, v6 = 3M Hz, v7 = 7M Hz
Los tres primeros son 3-conmesurados y los dos siguientes son doble conmesurados. Hay una relaci on interesante
entre conmesurabilidad y las coordenadas en las cuales las Ecuaciones de Hamilton Jacobi son separables. Puede
demostrarse que el camino que recorre el punto en el espacio de configuraciones o de fase para un sistema no
conmesurable llena completamente una regi on limitada del correspondiente espacio (es decir para cualquier
punto de esta region, la curva pasa por dicho punto en alg un instante de tiempo). Esto se ve en las figuras de
Lissajous para frecuencias inconmesurables.
Supongamos que el sistema es tal que en cualquiera de las coordenadas de separaci on el movimiento
es simplemente peri odico y que por tanto es independiente del movimiento en las otras coordenadas. En
consecuencia, el camino que traza el punto del sistema como un todo tiene que estar limitado por las superficies
de qi y pi constantes que marcan los lmites del movimiento oscilatorio de las variables de separaci on (esto es
extendible al movimiento peri odico rotacional si restringimos el valor del
angulo entre 0 y 2). Estas superficies
por tanto definen un volumen en el espacio que est a densamente lleno por la orbita del punto del sistema. De
esto se sigue que las variables de separaci
on en un sistema no conmesurado tienen que ser u nicas; la ecuaci
on
de Hamilton Jacobi no puede ser separable en dos sistemas coordenados diferentes (excepto por variaciones
triviales tales como cambios de escala). La posibilidad de separar el movimiento de un sistema en m as de un
sistema coordenado es usualmente una evidencia de conmesurabilidad.

9.9.4. Variables acci


on
angulo para sistemas degenerados
Un ejemplo particularmente simple de conmesurabilidad lo da el caso de la degeneraci on, que ocurre
cuando dos o mas de las frecuencias son iguales. Si dos de las constantes el asticas en el oscilador arm onico
tridimensional son iguales, sus frecuencias asociadas son iguales y hay una degeneracion simple. Si el oscilador
es isotr
opico, el sistema es completamente degenerado.
Cuando hay degeneraci on presente, las frecuencias fundamentales ya no son todas independientes, y el
movimiento periodico del sistema se puede describir por menos de las n frecuencias, mas precisamente las
m condiciones de degeneraci on nos dejan con una sola frecuencia independiente y las restantes m 1 son
dependientes de modo que el n umero de frecuencias se puede reducir a nm+1. Veamos un metodo sistem atico
de reducir las frecuencias usando una transformaci on puntual de las variables acci
on
angulo. Si tenemos m
condiciones de degeneraci on sobre las frecuencias vi podemos escribir
n
X
jki vi = 0, k = 1, ..., m. (9.106)
i=1
172 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

on desde (w, J) hasta (w , J )


donde las jki son enteros positivos o negativos. Haremos ahora una transformaci
definida por una funci on generatriz del tipo descrito en (7.19), con g = 0. En nuestro caso tenemos las
asignaciones
qi wi ; pi Ji ; Qi wi ; Pi Ji (9.107)
definiendo la funci
on  Pn
fk (w1 , . . . , wn ) = i=1 jki wi si k = 1, . . . , m
(9.108)
wk si k = m + 1, . . . , n
reemplazando (9.108) en (7.19) teniendo en cuenta las asignaciones (9.107) y el hecho de que en (7.19) hay
convenci
on de suma sobre ndices repetidos, se obtiene una funcion tipo F2 de la forma
n m n
! n

 X
X X X
F2 w, J = fk (w1 , . . . , wn ) Jk = jki wi Jk + Jk wk
k=1 k=1 i=1 k=m+1

de modo que
m X
n n
 X X
F2 w, J = Jk jki wi + Jk wk (9.109)
k=1 i=1 k=m+1

las coordenadas nuevas se encuentran con las ecuaciones de transformacion (7.15) y las asignaciones (9.107)

Xm Xn n
X
F2 (w, J )
wk = = Jp jpi wi + Jp wp
Jk Jk
p=1 i=1 p=m+1

con lo cual resulta


n
X
wk = jki wi ; k = 1, ..., m
i=1
wk = wk ; k = m + 1, ..., n (9.110)

y las nuevas frecuencias son


n
X
vk = w k = jki vi = 0 ; k = 1, ..., m
i=1
vk = w k = vk ; k = m + 1, ..., n (9.111)

donde hemos tenido en cuenta (9.106). En el nuevo sistema coordenado tenemos m frecuencias nulas y nos
hemos quedado con un conjunto de n m + 1 frecuencias: las n m frecuencias independientes no nulas, mas
una frecuencia nula. Dado que el sistema es peri odico multiple en las wk coordenadas con periodo unidad,
estas variables tambien son del tipo acci angulo. La forma funcional de las J con respecto a las J se obtiene
on
utilizando la ecuaci
on (7.22) con las asignaciones (9.107)
  Xn
f fk
J = J Ji = J
w wi k
k=1
( m
" n #) ( n
)
X X X wk
Ji = Jk jkl wl + Jk
wi wi
k=1 l=1 k=m+1

donde hemos usado (9.108). Las correspondientes constantes asociadas a las variables de acci
on Ji son las
soluciones de las n ecuaciones de transformaci
on
m
X n
X
Ji = Jk jki + Jk ki ; i = 1, . . . , n (9.112)
k=1 k=m+1
ANGULO
9.10. COMENTARIOS FINALES SOBRE LAS VARIABLES ACCION 173

las frecuencias nulas corresponden a factores constantes en la expansi


on de Fourier. Estos factores constantes
tambien aparecen en la expansi on original (9.99), siempre que los ndices ji satisfagan una condicion de
degeneracion.
Dado que las frecuencias se calculan como

H
vi =
Ji

el Hamiltoniano tiene que ser independiente de las variables de acci on Ji asociadas a las frecuencias nulas.
En particular, si el sistema es completamente degenerado existir an n 1 condiciones de degeneraci on del tipo
(9.106), y el Hamiltoniano depender
a de solo una de las Ji .
Dado que las J son n cantidades constantes independientes, las constantes originales de integraci
on pueden
ser expresadas en terminos de los J , y por tanto W puede expresarse como W = W (q, J ). Con estos
argumentos W genera una transformaci on a un nuevo conjunto can onico en donde las J son los nuevos
momentos can onicos. Pero en virtud de la transformaci on puntual generada por F2 en (9.109), sabemos que
w es el conjugado de J . Se sigue entonces que las nuevas coordenadas generadas por W (q, J ) tienen que ser

el conjunto de variables angulares w , con ecuaciones de transformacion dadas por

W
wi = (9.113)
Ji

en conclusion, la funci
on caracterstica W sirve tambien como generatriz de la transformaci
on desde (q, p)

hasta (w , J ).

9.10. Comentarios finales sobre las variables acci


on
angulo
Hemos visto que para sistemas que poseen movimientos tipo libraci on o rotaci
on en el espacio de fase, existe
un formalismo adecuado para estudiar las frecuencias del movimiento sin resolver completamente las ecuaciones
de movimiento. El formalismo de las variables accion angulo es una variante de la tecnica de Hamilton Jacobi
en la cual los nuevos momentos no se eligen como las constantes de integraci on sino como ciertas cantidades
constantes que contienen informaci on sobre la
orbita de libraci
on o rotacion, y que son en todo caso funci on
exclusiva de las constantes de integracion. Cuando asumimos que el movimiento es peri odico en el tiempo
este formalismo nos permite extraer de forma sencilla las frecuencias m ultiples sin resolver completamente
las ecuaciones de movimiento. No obstante, debe tenerse claro que en el formalismo no hay ning un criterio
que nos asegure que el movimiento es de tipo libraci on o rotacion, ni mucho menos que sea peri odico en el
tiempo. Estas son hipotesis de trabajo que deben estar sustentandas por argumentos alternativos te oricos y/o
experimentales. Vale destacar sin embargo, que si los movimientos son de tipo rotaci on o libraci
on pero no son
peri
odicos en el tiempo, el formalismo permite extraer la frecuencia promedio tomada sobre muchos ciclos.

9.11. El problema de Kepler en variables acci


on
angulo
Para exhibir todas las propiedades de la soluci on usaremos las tres dimensiones en coordenadas esfericas
tal como en la secci on 9.7. Lo primero que debemos determinar es el tipo de periodicidad en los planos
(, p ) , (, p ) y (r, pr ). Para ello despejamos a cada momento generalizado en funcion de su coordenada de
las ecuaciones (9.62, 9.65, 9.66, 9.68) con lo cual obtenemos

p = (9.114)
2
p2 = 2 2 (9.115)
sin
2
p2r = 2m [E V (r)] (9.116)
r2
174 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

como es variable angular cclica se le puede asociar la acci on J = 2 de acuerdo con (9.85), y asumir
que es una rotaci on eligiendo por conveniencia el periodo 2 (recuerdese que para variable cclica el periodo
de rotaci on es arbitrario). A primera vista, la Ec. (9.115) parece mostrar que la trayectoria en el plano de fase
(, p ) es peri
odica. No obstante, es necesario tener cierta informaci on del movimiento para saber si est a en
un intervalo acotado que se recorre de ida y vuelta en un intervalo finito de tiempo (o si tiene periodo tipo
rotaci on donde el periodo en se recorra en un intervalo finito de tiempo). Algo similar ocurre con el plano
(, p ) y con el plano (r, pr ). En el movimiento real estos planos definir an trayectorias periodicas solo si la
energa del sistema es negativa, pues de lo contrario la orbita no ser a cerrada ni acotada (para m as detalles,
ver Cap. 10). Por ejemplo cuando la trayectoria es abierta, no barre el intervalo completo entre 0 y 2 y
el intervalo acotado solo se recorre de ida, no hay en consecuencia movimiento de rotaci on ni de libracion
en el plano (, p ). Por otro lado, cuando la trayectoria es cerrada y acotada se puede ver que y r son
acotados (van y vuelven dentro de un intervalo finito de tiempo) de modo que su movimiento es de libraci on.
En contraste aumenta indefinidamente y su movimiento es de rotaci on. La discusi
on anterior refuerza el
hecho de que el car acter peri
odico en el espacio de fase y/o en el tiempo son una Hip otesis de trabajo para
iniciar el tratamiento con variables acci on angulo, pero no hay nada en este formalismo que nos garantice tal
periodicidad, la cual debe ser extrada por otros argumentos.
Construyamos entonces las variables de acci on asociadas a cada coordenada, para ello usamos los valores
de los momentos conjugados a , , r de las Ecs. (9.114, 9.115, 9.116), y usando un potencial de la forma
V = k/r
I I
W
J = d = d = 2 (9.117)

s
I I
W 2
J = d = 2
d (9.118)
sin2
s
I I 2
W 2mk
Jr = dr = 2mE + 2 dr (9.119)
r r r

la primera integral es trivial y est


a asociada con el hecho de que la variable asociada es cclica. Para calcular la
segunda integral es conveniente introducir el angulo polar del momento angular total que denotaremos por i .
Recordando que representa la componente polar del momento angular (ver Sec. 9.7.2), el angulo i viene
dado claramente por
Lz
cos i = = (9.120)
L
en terminos de cos i , la integral (9.118) queda
s
I
2
1
J = 1 d
2 sin2
I p
J = 1 cos2 i csc2 d

podemos asumir sin perdida de generalidad que el plano del movimiento para por el origen de coordenadas.
Para analizar los lmites de integraci
on debemos calcular los
angulos mnimo y maximo 0 y 1 entre un vector
de posicion de la partcula y el eje z. Teniendo en cuenta que i es el
angulo entre el momento angular L y
el eje Z, y que L es perpendicular a cualquier vector de posici on dentro del plano de movimiento, es facil ver
que el menor y el mayor valor de se obtienen cuando el momento angular, el eje Z y el vector de posici on
19
son coplanares de modo que 0 = (/2) i , 1 = 0 = /2 + i . De lo anterior, se deduce que el circuito
completo del angulo consiste en ir desde (/2) i , hasta (/2) + i y volver, donde sin 0 = cos i . La
19
Hay dos sentidos diferentes del vector de posici
on que cumplen estas condiciones y cada sentido define los
angulos 0 y 1 .
ANGULO
9.11. EL PROBLEMA DE KEPLER EN VARIABLES ACCION 175

integral circuital se puede escribir como 4 veces la integral entre 0 y 0 que despues de algunas manipulaciones
queda20
Z 0 p
J = 4 csc sin2 i cos2 d
0
ahora bien, dado que no hay direcci on preferencial para el eje z en el problema, siempre es posible escoger el
sentido de dicho eje de tal forma que el angulo entre el eje z y el momento angular este en el intervalo [0, /2].
Esto equivale a escoger cos i y sin i como positivos. La sustituci on
cos = sin i sin
convierte la integral en
Z /2
2 cos2 d
J = 4 sin i
0 1 sin2 i sin2
la sustituci
on adicional
u = tan
deja a la integral en la forma
Z Z  
2 du 1 cos2 i
J = 4 sin i = 4 du
0 (1 + u ) (1 + u2 cos2 i )
2
0 1 + u2 1 + u2 cos2 i
esta integral ya se puede evaluar directamente y se obtiene
J = 2 (1 cos i ) = 2 ( ) (9.121)
sustituyendo , en terminos de J , J la expresi
on para Jr resulta
s
I I
W 2mk (J + J )2
Jr = dr = 2mE + dr
r r 4 2 r 2
despues de realizar esta integraci on, las ecuaciones se pueden resolver para la energa E = H en terminos de
los J, N otese que en general H = H (Jr , J + J ) esto indica inmediatamente que H/J = H/J de modo
que las frecuencias en los angulos estan degeneradas. Este resultado no depende de la ley del inverso
cuadrado sino solo del hecho de que la fuerza sea central, y de que la orbita sea acotada, en cuyo caso
el movimiento ser a al menos simplemente degenerado. Esta degeneraci on es consecuencia del hecho de que el
movimiento se hace en un plano perpendicular al momento angular. El movimiento en este plano indica que
y est an relacionados de tal manera que cuando completa un periodo entre 0 y 2, recorre un ciclo
completo entre los lmites 1 y 2 ida y vuelta siendo 1,2 = (/2) i , de modo que las frecuencias en y
son necesariamente iguales.
Para realizar la integraci on en Jr primero tengamos en cuenta que el movimiento es acotado solo para
energas negativas y dado que el integrando es igual a pr = mr, los lmites del movimiento estan comprendidos
entre las races r1 y r2 de la expresi on que esta dentro del radical que forman los puntos de retorno en r. Si
r1 , r2 son los lmites inferior y superior respectivamente, un ciclo completo incluye ir desde r1 hasta r2 y volver,
en la ida (vuelta) pr es positivo (negativo) y por tanto la raz cuadrada debe ser positiva (negativa). Goldstein
2a y 3a edici on, hace la integraci on por variables compleja (pag 469 de la tercera), el resultado es
r
2m
Jr = (J + J ) + k
E
n
otese que Jr solo es real para energas negativas, en concordancia con el hecho de que las trayectorias deben
tener energa negativa para ser acotadas. Despejando la energa i.e. el Hamiltoniano se tiene
2 2 mk2
E=H= (9.122)
(Jr + J + J )2
20
0 es el
angulo mnimo pero no necesariamente el
angulo inicial.
176 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION
ANGULO

se ve que para fuerzas atractivas inversas al cuadrado de la distancia, la degeneraci on es a


un mayor de lo
predicho para fuerzas centrales en general. En este caso los tres periodos coinciden y el movimiento es comple-
tamente degenerado, lo cual nos dice que la orbita es cerrada cuando la energa es negativa. Con una orbita
cerrada el movimiento es simplemente peri odico y en este caso, completamente degenerado. Si la fuerza central
contiene un termino proporcional a r 3 (por ejemplo una correcci on relativista de primer orden), la
orbita ya
no es cerrada sino que tiene la forma de una elipse que precesa. Una de las degeneraciones se remueve en este
caso, pero el movimiento es aun simplemente degenerado ya que la fuerza a un es central.
Volviendo al caso de Kepler, la frecuencia viene dada por

H H H 4 2 mk2
v= = = =
Jr J J (Jr + J + J )2

la suma de los J s se puede escribir en terminos de la energa a partir de (9.122), y el periodo resulta
r
m
= k (9.123)
2E 3

esta f
ormula para el periodo esta de acuerdo con la tercera ley de Kepler si tenemos en cuenta que el semieje
mayor a es igual a k/2E (ver Cap. 10).
La degeneracion completa nos indica que existe un conjunto de variables acci angulo (w , J ) en las cuales
on
H solo depende de un J y solo una de las frecuencias es no nula. Para encontrar la transformacion can onica
que nos lleva de las variables acci angulo aqu encontradas a las (w , J ) usamos los resultados de la secci
on on
(9.9.4). Expresemos las condiciones de degeneraci on en la forma

v v = 0 ; v vr = 0

escrib
amoslo como
v + v + 0 vr = 0 ; v + 0 v vr = 0
comparando con (9.106) se tiene que

j11 = 1, j12 = 1, j13 = 0


j21 = 1, j22 = 0, j23 = 1

y reemplazando los elementos de jki en (9.109)


2 X
3 3
" 2 #
X X X
F2 = Jk jki wi + Jk wk = Jk (jk1 w1 + jk2 w2 + jk3 w3 ) + J3 w3
k=1 i=1 k=3 k=1
F2 = J1 (j11 w1 + j12 w2 + j13 w3 ) + J2 (j21 w1 + j22 w2 + j23 w3 ) + J3 w3
F2 = J1 (w + w ) + J2 (w wr ) + J3 wr

las nuevas variables angulares se obtienen de (9.110)


3
X
w1 = j1i wi = j11 w1 + j12 w2 + j13 w3 = w + w
i=1

procediendo de manera similar para las otras variables, las nuevas variables angulares vienen dadas por

w1 = w w ; w2 = w wr ; w3 = wr

aplicando (9.112) resulta


J = J1 ; J = J2 J1 ; Jr = J3 J2
ANGULO
9.11. EL PROBLEMA DE KEPLER EN VARIABLES ACCION 177

que al invertirlas nos da las nuevas J en funci


on de las antiguas J s

J1 = J ; J2 = J + J ; J3 = J + J + Jr (9.124)

y reemplazando estas expresiones en (9.122) resulta

 2 2 mk2
H J3 = E = (9.125)
J32

como se predijo, el Hamiltoniano es funcion de una sola J en esta base de variables debido a la completa
degeneraci
on del sistema. Si realizamos un analisis detallado de las variables angulares w veremos que estas
tambien conducen a constantes de movimiento. Esto se puede ver m as f
acilmente si trabajamos el problema
bidimensionalmente desde el principio (ver seci
on 10.15).
Captulo 10

Fuerzas centrales

Discutiremos a continuacion, el problema de la interacci on entre dos masas puntuales que se mueven
bajo la influencia de una fuerza que va a lo largo de la lnea que las une. Este es un problema que posee
muchas aplicaciones tanto en Fsica Cl
asica como en Fsica Moderna. Siguiendo el espritu de las formulaciones
aqu presentadas, primeros nos concentraremos en las primeras integrales que se pueden hallar sin resolver el
problema completo, para luego analizar algunos potenciales especficos.

10.1. Reducci
on al problema equivalente de una partcula

Figura 10.1: Variables de posici


on fundamentales en el problema de dos cuerpos.

Consideremos un sistema monogenico de dos masas puntuales m1 y m2 como lo indica la Fig. 10.1, donde las
u
nicas fuerzas que act uan sobre ellas son las debidas al potencial mutuo U . La isotropa del espacio nos sugiere
que si las masas no poseen alguna propiedad vectorial, la interacci on entre ellas debe ir dirigida a lo largo de
la lnea que las une, esto indica que el potencial debe ser funci on del valor absoluto de la coordenada relativa
r2 r1 r. Este sistema tiene seis grados de libertad y por tanto requiere de seis coordenadas generalizadas.
Quiz as el sistema de coordenadas generalizadas m as conveniente lo constituye las coordenadas de posici on del
centro de masa R, y las coordenadas que determinan al vector relativo r. Estas coordenadas se pueden escribir
en terminos de las coordenadas de posici on de las partculas r1 y r2

m1 r1 + m2 r2
r r2 r1 ; R
m1 + m2

178
AL PROBLEMA EQUIVALENTE DE UNA PARTICULA
10.1. REDUCCION 179

estas ecuaciones se pueden invertir para obtener


m2
r1 = R r
m1 + m2
m1
r2 = R+ r (10.1)
m1 + m2
tambien son u on de las partculas relativas al centro de masa r1 y r2
tiles las coordenadas de posici

r1 = R + r1 ; r2 = R + r2 (10.2)

con lo cual
m2
r1 = r
m1 + m2
m1
r2 = r (10.3)
m1 + m2
En esta secci
on consideraremos una situacion algo m as general en donde el potencial puede depender tambien
de las derivadas temporales del vector relativo r. El Lagrangiano del sistema se puede escribir como
 
L = T R, r U (r, r , ..)

es bien sabido que la energa cinetica de un sistema de partculas se puede escribir como la energa cinetica
del centro de masa mas la energa cinetica con respecto al centro de masa (ver Ec. 1.31)
 
T R, r = 1 m1 r 21 + 1 m2 r 22 = 1 m1 r 2 1
2
1 + m2 r 2 +
1 2
MR (10.4)
2 2 2 2 2
donde M m1 + m2 . Usando (10.3) se puede escribir la energa cinetica en terminos de las coordenadas
generalizadas elegidas i.e. las componentes de R y r

1 m1 m2 2 1 2
T = r + M R
2 M 2
el Lagrangiano queda de la forma
1 2 1 m1 m2 2
L = MR + r U (r, r , ..)
2 2 M
se puede ver que las coordenadas de R son todas cclicas. Si elegimos como coordenadas generalizadas las tres
componentes cartesianas de R, vemos que los tres momentos lineales (que seran los momentos can onicos)
son constantes y por tanto, R = cte, de modo que el centro de masa est a en reposo o movimiento rectilneo
uniforme1
R = R0 + Rt (10.5)
si nuestro sistema original de referencia es inercial, entonces el sistema con origen en el centro de masa tambien
lo es. Podemos entonces ver el movimiento a partir del centro de masa en cuyo caso el Lagrangiano queda
1
L = r2 U (r, r , ..) (10.6)
2
donde hemos definido
m1 m2
(10.7)
M
como la masa reducida del sistema. El Lagrangiano (10.6) es el equivalente al Lagrangiano que se obtendra
si tuvieramos una partcula de masa sometida a una fuerza que apunta siempre hacia un punto fijo (fuerza
1
Desde el punto de vista Newtoniano esto se puede ver por el hecho de que el sistema esta aislado, de modo que el centro de
masa no puede estar acelerado. En terminos de simetras, se dice que el sistema tiene invarianza traslacional que conduce a la
conservaci
on del momento lineal.
180 CAPITULO 10. FUERZAS CENTRALES

central), y a una distancia r del centro de fuerza. Por lo tanto el problema de dos cuerpos sometidos a fuerzas
centrales mutuas, se puede reducir a un problema de una sola partcula que interact
ua con un centro de fuerzas.
No debemos olvidar sin embargo, que la partcula para la cual vamos a resolver el problema NO existe,
no hay ninguna partcula de masa y las trayectorias que encontraremos son las trayectorias de esta partcula
imaginaria. Para encontrar la trayectoria de las partculas originales con respecto al sistema inercial original,
es necesario devolverse tomando las Ecs. (10.1, 10.5) junto con las soluciones que encontremos para r. No
obstante, si ocurre que m1 << m2 entonces tanto la trayectoria como la masa imaginarias van a ser muy
semejantes a la trayectoria y masa real de m1 .

10.2. Ecuaciones de movimiento y primeras integrales


Nos concentraremos de aqu en adelante en el problema de una sola partcula sometida a un potencial
que solo depende de r y no de sus derivadas temporales, de modo que la fuerza va en la direcci on de r. Es
natural tomar el origen en el punto de convergencia de las fuerzas. Dado que en tal sistema de referencia
la energa potencial solo depende de la distancia al origen, el problema exhibe simetra esferica, por lo tanto
cualquier rotacion sobre cualquier eje fijo que pase por el origen no tiene efecto en la soluci
on. Por lo tanto debe
haber alg un
angulo que representa la rotaci on sobre el eje en cuestion que debe ser cclico. Estas propiedades
de simetra llevan a una simplificacion significativa del problema.
La simetra esferica del Lagrangiano (invarianza ante rotaciones arbitrarias) nos lleva a la conservaci on del
momento angular como vimos en la secci on 5.4.3 aplicando el teorema de Noether2

L=rp

Naturalmente los vectores r y p forman el plano instant aneo de movimiento. Si el vector L es constante,
esto significa que todos los planos instant aneos de movimiento pertenecen a un mismo plano. En sntesis, el
movimiento es bidimensional, adem as el sentido de giro dictaminado por las condiciones iniciales no se puede
invertir ya que esto implicara que L invirtiera su sentido. Un caso particular resulta cuando L es nulo, esto
solo se logra si r es paralelo a p, en cuyo caso el movimiento es lineal y la recta que contiene a la trayectoria
pasa por el centro de fuerzas (aunque no necesariamente la partcula pasar a por el centro de fuerzas).
Por comodidad podemos asumir que el movimiento yace en el plano XY de modo que L es paralelo al eje
Z. La conservaci on de L nos provee de tres constantes de movimiento, al restringir el movimiento a un plano
hemos usado dos de ellas (los dos grados de libertad necesarios para definir el vector unitario en la direcci on
de L), la tercera deber a aparecer como la magnitud de L. El momento angular se puede calcular usando los
vectores unitarios radial y transversal de las coordenadas polares

L = r p = mr v = mrur (vr ur + v u ) = mrv ur u


L = mr 2 uz (10.8)

Trabajaremos entonces en coordenadas polares planas para las cuales el Lagrangiano se escribe
1  
L = m r 2 + r 2 2 V (r)
2
como se previ
o, existe una coordenada angular cclica . El momento conjugado a esta variable es constante y
corresponde a la magnitud del momento angular
L
p = = mr 2


n
otese que esta cantidad contiene la informaci y por tanto del
on sobre el sentido de giro (dada por el signo de )
sentido de L, como se observa en la Ec. (10.8), es decir nos dice si L apunta en forma paralela o antiparalela
2
Recuerdese que desde el punto de vista Newtoniano, esto se puede ver teniendo en cuenta que para fuerzas centrales r es
paralelo a F de modo que el torque r F es nulo y por tanto se conserva el vector momento angular.
10.2. ECUACIONES DE MOVIMIENTO Y PRIMERAS INTEGRALES 181

al eje Z. Una de las primeras integrales de movimiento es entonces


d  2 
p = mr = 0 (10.9)
dt
y se puede integrar en forma inmediata
mr 2 = l (10.10)
siendo l la magnitud del momento angular. Podemos extraer mas informaci
on u
til a partir de (10.9), de la cual
se deduce  
d 1 2
r =0 (10.11)
dt 2
veamos la interpretacion del termino entre parentesis, el diferencial de
area que barre el radio vector en un
tiempo dt es
1
dA = r (rd)
2
y la velocidad de
area, es decir el
area que barre el radio vector por unidad de tiempo es
dA 1 d 1
= r2 = r 2
dt 2 dt 2
pero de acuerdo con (10.11) se llega a que
 
d dA dA
=0 = cte
dt dt dt
de modo que la velocidad de area es constante y se obtiene la segunda ley de Kepler, el radio vector barre
reas iguales en tiempos iguales. El valor de la velocidad de
a area se puede encontrar f
acilmente a partir del
valor del momento angular l. Debe observarse sin embargo que esta es una propiedad de las fuerzas centrales
en general y no solo para fuerzas proporcionales al inverso al cuadrado.
La ecuaci
on de Lagrange para la coordenada no cclica r es
d V
mr 2 +
(mr) =0
dt r
recordando que la fuerza viene dada por V que en este caso es (V /r) ur se tiene que

r mr 2 = f (r)
m

teniendo en cuenta la primera integral dada por (10.10) podemos eliminar de la anterior ecuaci
on

l2
m
r = f (r) (10.12)
mr 3
con lo cual se obtiene una ecuaci on diferencial ordinaria solo en la variable r. Aunque esto reduce formalmente
el problema a cuadraturas, resulta m as ventajoso obtener otra integral de movimiento teniendo en cuenta que
la funci
on energa (o el Hamiltoniano) re une las condiciones para ser la energa del sistema y adem as no es
funci
on explcita del tiempo lo cual nos lleva a la conservaci
on de la energa del sistema (esto tambien se puede
ver por el hecho de que las fuerzas centrales son conservativas). Esta ley de conservaci on se escribe
 
1  1   1 r 2 l2
E = m vr2 + v2 = m r 2 + r 2 2 + V (r) = m r 2 + 2 4 + V (r) (10.13)
2 2 2 m r
1 2 1 l2
E = mr + + V (r) (10.14)
2 2 mr 2
donde hemos tenido en cuenta de nuevo (10.10). N otese que la Ec. (10.14) es de primer orden en tanto que
(10.12) es de segundo orden, es decir formalmente hemos hecho un primer proceso de integraci
on. Este primer
182 CAPITULO 10. FUERZAS CENTRALES

proceso de integracion se puede ver de manera m


as transparente usando las Ecs. (10.9, 10.12). La Ec. (10.12)
se puede reescribir como  
d 1 l2
mr= V +
dr 2 mr 2
multiplicando a ambos lados por r  
d 1 l2
mr r = r V + (10.15)
dr 2 mr 2
el miembro de la izquierda se escribe como
 
d 1 2
mr r = mr
dt 2
para el miembro de la derecha se tiene en cuenta que la derivada total respecto al tiempo de una funci
on g que
solo depende de r, se escribe como dg (r) /dt = (dg/dr) r.
De modo que
    
d 1 l2 d 1 l2
V + = r V +
dt 2 mr 2 dr 2 mr 2
con lo cual la Ec. (10.15) queda
   
d 1 2 d 1 l2
mr = V +
dt 2 dt 2 mr 2
1 2 1 l2
mr + V + = cte E (10.16)
2 2 mr 2
y la Ec. (10.16) coincide con (10.14). Se observa que el u
ltimo paso es un proceso de integraci
on que me redujo
la ecuaci
on diferencial de segundo orden a una de primer orden. El procedimiento anterior nos muestra tambien
la ventaja de conocer constantes de movimiento por argumentos de simetra, ya que permite obtener primeras
integrales de movimiento sin tener que realizar explcitamente el primer proceso de integracion.
Dado que originalmente tenemos dos variables r y y ecuaciones diferenciales de segundo orden, se requieren
cuatro integraciones para resolver las Ecs. de movimiento de las cuales hemos obtenido dos. Como se puede
ver las primeras integrales obtenidas han convertido las ecuaciones de Lagrange en dos ecuaciones de primer
orden que requieren de dos integraciones Ecs. (10.10, 10.14). N otese que la Ec. (10.14) tiene una apariencia
muy similar a una ecuaci on unidimensional con potencial conservativo
1
E= mx 2 + V (x)
2

excepto por el termino l2 / 2mr 2 . Esto nos induce a definir un potencial efectivo de la forma

1 l2
Vef f V (r) + (10.17)
2 mr 2
con lo cual la Ec. (10.14) se reescribe como
1
E = mr 2 + Vef f (r) (10.18)
2
con lo cual el analogo unidimensional se hace perfecto. Esto nos permitir
a realizar curvas de energa potencial
efectiva versus r e interpretar el movimiento de manera an aloga al caso unidimensional, aunque con algunas
diferencias que ya indicaremos m as adelante.
Ya hemos visto varios metodos para obtener las integrales de movimiento, el m as sencillo a partir del
procedimiento que hemos seguido es el de resolver para r en la Ec. (10.18)
r
2
r = [E Vef f (r)] (10.19)
m
DE ORBITAS
10.3. EL PROBLEMA UNIDIMENSIONAL EQUIVALENTE Y LA CLASIFICACION 183

con lo cual
dr
dt = q
2
m [E Vef f (r)]
teniendo en cuenta los valores iniciales r (t0 ) = r0 se escribe
Z r
dr
t t0 = q (10.20)
r0 2
m [E Vef f (r)]

la Ec. (10.20) nos da t en funci


on de r y de las constantes de integraci
on E, l, r0 , recordemos que l est
a contenido
en el potencial efectivo. Este puede invertirse al menos formalmente para obtener r en funci on del tiempo y
las constantes. Una vez encontrada la soluci on para r (t) se puede sustitur en (10.10) para obtener la solucion
en
l
= (10.21)
mr 2 (t)
l dt
d = (10.22)
mr 2 (t)
tomando a 0 como el valor inicial de , la integraci
on nos da
Z t
l dt
0 = (10.23)
m t0 r 2 (t)
finalmente, si estamos interesados en la ecuaci
on de la trayectoria, esta se puede obtener haciendo el cociente
de (10.21) sobre (10.19)
d/dt d l
= = q  (10.24)
dr/dt dr mr 2 2
(E V )
m ef f

formalmente las Ecs. (10.20, 10.23) nos proveen de las dos integrales restantes necesarias para determinar las
ecuaciones de movimiento3 . Dado que se requieren cuatro integrales tambien se requieren cuatro constantes de
movimiento, las cuales pueden ser r0 , 0 , r0 , 0 , sin embargo un conjunto mas conveniente para la mayora de
aplicaciones es E, l, r0 , 0 . En todo caso un set se puede convertir en el otro. En los problemas que analizaremos
sera mas conveniente usar E y l. En mec anica cu antica, los valores iniciales de las coordenadas y sus derivadas
pierden su significado, pero E, l son todava u tiles en este formalismo y de por s muchas de las diferencias
entre los comportamientos cl asicos y cu
anticos estriban en el comportamiento de estas dos cantidades. Por
este motivo, para cuantizar una teora es conveniente que este escrita en terminos de la energa y el momento
angular del sistema

10.3. El problema unidimensional equivalente y la clasificaci


on de
orbitas
Ya hemos visto que la definici
on de un nuevo potencial efectivo (10.17) conduce a que una de las primeras
integrales asociada a la conservaci
on de la energa, tenga un an
alogo unidimensional ya que queda escrito de
la forma
1
E = mr 2 + Vef f (r) (10.25)
2
Donde el potencial efectivo Vef f corresponde al potencial real m
as un termino adicional en la forma

1 l2 1
Vef f V (r) + Vcent ; Vcent = mv2 (10.26)
2 mr 2 2
Vcent se conoce como potencial centrfugo. Este nombre se debe a que si este termino correspondiera a un
potencial real, correspondera a una fuerza central repulsiva (ya que es positivo). No obstante, debe tenerse
3
La integral (10.24) no es independiente y se obtiene a partir de las anteriores.
184 CAPITULO 10. FUERZAS CENTRALES

claro que este termino no da cuenta de una interacci on real, es decir no es un verdadero potencial, realmente
corresponde a una porci on de la energa cinetica de la partcula (la correspondiente a la velocidad transversal)
como puede verse en la secci on anterior Ecs. (10.13, 10.14). Este termino centrfugo depende de l y por tanto
depende en general de las condiciones iniciales, un cambio en el momento angular corresponder a a un cambio
en el potencial centrfugo, observese que el potencial real unidimensional es independiente de las condiciones
iniciales lo cual constituye una de las principales diferencias con el potencial efectivo. Sin embargo, mientras
el sistema no interact ue con otros cuerpos el momento angular ser a una constante y por lo tanto el potencial
efectivo no cambiar a.
Veamos ahora que observables se pueden determinar con base en las primeras integrales, la velocidad por
ejemplo se puede obtener en magnitud y direcci on, su magnitud se obtiene de la conservaci on de la energa
r
1 2 2
E = mv + V (r) v = [E V (r)] (10.27)
2 m
en este caso solo interviene el potencial real ya que el efectivo lo que hace es tomar una porci
on de la energa
cinetica la cual aqu se escribe completa. La componente radial de la velocidad se puede obtener de (10.19)4 .
Con la rapidez y la velocidad radial es suficiente para obtener el vector velocidad. Otra manera de hacerlo es
obtener a traves de l en la Ec. (10.10), y r con la ecuaci
on (10.19).
Las siguientes relaciones se siguen de las Ecs. (10.25, 10.26)
1 2 1
E Vef f = mr = mvr2 (10.28)
2 2
1 1 
E V (r) = mv 2 = m vr2 + v2 (10.29)
2 2
1 2 2 1
Vef f V = mr = mv2 (10.30)
2 2
Las Ecs. (10.28, 10.29, 10.30) nos inspiran a hacer gr aficas de la energa total, el potencial efectivo, y el
potencial real en funcion de r. Naturalmente, la curva de E corresponde a una recta horizontal en virtud de su
conservaci
on. De las mencionadas ecuaciones vemos que las regiones accesibles, es decir los valores permitidos
para r deben cumplir que E Vef f (r) puesto E Vef f es la cantidad no negativa 12 mr 2 , esta cantidad a lo
mas puede ser cero lo cual ocurre en los puntos de retorno5 ri , en donde se anula la velocidad radial. De la
misma manera, la regi on accesible debe cumplir que E V (r) ya que E V (r) es la energa cinetica completa
para un valor dado de r. Finalmente, en la regi on permitida se debe cumplir que Vef f (r) V (r) puesto que
Vef f V es la energa cinetica transversal. Estas curvas proveen entonces la rapidez de la partcula as como
sus componentes radial y transversal para una distancia dada r, con una energa y momento angular dados.
Con esta informaci on se puede pintar la orbita en forma aproximada.

10.4. An
alisis de curvas de potencial efectivo
Vamos a ilustrar el an
alisis de curvas de potencial efectivo a traves de algunos ejemplos

10.4.1. Potencial efectivo para interacci


on kepleriana
Tomemos primero el ejemplo de una fuerza atractiva proporcional al inverso al cuadrado de la distancia al
centro de fuerzas
k k k l2
f (r) = 2 ur ; V (r) = ; Vef f (r) = +
r r r 2mr 2
4
N
otese que esto es equivalente a tomar (10.27), descomponiendo la velocidad en sus terminos radial y transversal y absorbiendo
el termino transversal en el potencial para definir el potencial efectivo que aparece en (10.19).
5
Hay que tener cuidado con la interpretaci on de los puntos de retorno en problemas bidimensionales como este. En el caso
unidimensional significaba un verdadero volver sobre los pasos de la partcula. En el caso bidimensional se devuelven los valores
de r, pero sigue avanzando en el mismo sentido de giro. De modo que corresponde a un retorno en el valor de la coordenada pero
no en el movimiento.

10.4. ANALISIS DE CURVAS DE POTENCIAL EFECTIVO 185

Figura 10.2: (a) Gr aficas del potencial centrfugo (lnea punteada superior), potencial real (gr
afica punteada
inferior) y potencial efectivo (grafica contnua), como funciones de r, para un potencial Kepleriano. Las lneas
horizontales representan diversos valores de la energa total de la partcula. (b) Grafica del potencial efectivo
y de la energa total para el caso de energa total positiva.

este potencial efectivo se ilustra en la figura 10.2a, y con lneas punteadas se grafican los terminos V (r)
y el termino centrfugo, el termino centrfugo domina para r 0 en tanto que el potencial real domina
cuando r . Existe un mnimo local que nos permitir a tener equilibrio estable (orbitas acotadas) en ciertas
circunstancias.
Si la partcula tiene una energa positiva E1 , esta tendr
a una distancia mnima de aproximaci on r1 al centro
de fuerza de acuerdo con el diagrama 10.2b (valores menores de r implicaran que la energa cinetica radial fuera
negativa lo cual no es posible), pero no posee un valor m aximo para r de modo que la orbita no esta acotada.
Una partcula que viene desde el infinito se tropieza con la barrera efectiva repulsiva para ser repelida y
vuelve hacia el infinito. Esta situaci on se ilustra en la Fig. 10.4a. Notese que esta barrera repulsiva efectiva
no es causada solamente por la interacci on real sino que es generada por la conjugaci on entre la interaccion
real y las condiciones iniciales. Efectivamente, si redirigimos la partcula (cambiamos la direcci on de v0 ) de
manera que apunte desde el infinito directamente hacia el centro atractor, la trayectoria sera una lnea
recta que en principio puede pasar por el centro atractor. Este cambio en las condiciones iniciales (en v0 )
corresponde a un cambio en el potencial centrfugo, mostrando que esta barrera efectiva est a relacionada con
las condiciones iniciales y no solamente con la interacci 6
on . Por otro lado, en el an
alisis anterior con la condici
on
inicial r0 > r1 , hemos supuesto que r disminuir a hasta rebotar en la barrera efectiva para volver a aumentar
ahora indefinidamente. No obstante, el perfil de la curva no nos prohbe que en principio la partcula empiece
a aumentar su coordenada r desde el principio aumentando indefinidamente sin acercarse nunca a la barrera
de potencial, efectivamente esta sera la situaci on si r0 > 0 como se puede ver de la Fig. 10.4a, si invertimos el
sentido de la velocidad inicial. Nuevamente las condiciones iniciales son las que nos permiten dicernir cual es
la situaci
on que est a ocurriendo7 . De lo anterior, vemos que dependiendo de las condiciones iniciales es posible
6
Naturalmente, puede verse que la interacci on juega un papel en la creaci on de la barrera efectiva, ya que si la interaccion
estuviera ausente, la trayectoria sera una lnea recta para cualquier direcci on inicial v0 y la distancia mnima de acercamiento
sera diferente al caso en que la interacci
on est
a presente y la trayectoria se curva. De otro lado, se puede ver del hecho de que el
potencial efectivo es la suma de el potencial real (interaccion) y la energa cinetica transversal (condiciones iniciales).
7
Recordemos que en principio se requieren cuatro condiciones iniciales para determinar la din amica del sistema, y en la curva de
potencial hay solo dos, la energa y el momento angular. Usualmente las dos condiciones restantes que permiten un mejor an alisis
186 CAPITULO 10. FUERZAS CENTRALES

Figura 10.3: (a) Grafica del potencial efectivo kepleriano y de la energa total para el caso de energa total
negativa donde E3 es mayor que el valor del mnimo del potencial efectivo. (b) Gr afica del potencial efectivo
kepleriano y la energa total para el caso de energa total negativa donde E4 coincide con el valor del mnimo
del potencial.

que la partcula no acceda a toda la regi on permitida por la curva de potencial efectivo.
Ahora bien, para el caso de una energa E2 = 0, la historia es muy parecida al caso de energa positiva
excepto que en el infinito la partcula no poseer a energa cinetica (la energa cinetica en el infinito es preci-
samente la energa total ya que todos los potenciales se van para cero). En contraste, cuando la energa es
positiva la partcula posee energa cinetica incluso en el infinito.
La Fig. 10.3a, muestra que para cualquier valor E3 < 0 que sea mayor que el mnimo de Vef f 8 , la
coordenada r est a acotada entre dos puntos de retorno r1 y r2 que ser an los valores m aximo y mnimo de
la distancia al centro atractor, conocidas como distancias apsidales. Esto no significa que las orbitas sean
necesariamente cerradas, solo nos demuestra que est an acotadas por la regi on definida entre los crculos de
radios r1 y r2 , donde los puntos de retorno siempre est an sobre una de las circunferencias. La forma generica
de la
orbita esperada se muestra en la figura 10.4b.
La Fig. 10.3b ilustra la situaci on en la cual la energa E4 es igual al mnimo de Vef f de modo que solo hay
un valor accesible de r donde r = 0, en cuyo caso la trayectoria es circular. Definiendo una fuerza efectiva
de la forma
Vef f l2
fef f (r) = =f+ (10.31)
r mr 3
el requerimiento de orbita circular es claramente la anulaci on de la fuerza efectiva. Es el equivalente a pararse
en el sistema no inercial atado a la partcula para ver la anulaci on entre la fuerza real y la fuerza centrfuga
de caracter ficticio.
Por otro lado, recordemos que el cambio en l cambia el perfil de Vef f aunque esto no cambia la clasificaci on
general de los tipos de orbitas (a menos que l se vuelva nulo). Es decir para valores negativos de la energa
seguimos teniendo orbitas acotadas, y para energas no negativas las orbitas continuan siendo no acotadas sin
importar el valor del momento angular (siempre que sea no nulo), aunque por supuesto el perfil especfico del
potencial efectivo y la forma especfica de la orbita cambian con el momento angular. Sin embargo, cuando
el momento angular se vuelve nulo la clasificaci on de las orbitas s cambia, ya que el potencial centrfugo se
anula y la trayectoria es una lnea recta.
Mas adelante veremos que en el caso de la ley de inverso cuadrado atractivo, las energas positivas conducen
a orbitas hiperb olicas, energa cero conduce a orbitas parab olicas y energa negativa a elipses. Para otros
potenciales las orbitas pueden no tener estas formas tan simples. Pero a un se puede hacer la misma divisi on
son los valores iniciales de r y de r.

8
Si E < Vef f no hay regiones accesibles ya que conduce a energa cinetica radial negativa.

10.4. ANALISIS DE CURVAS DE POTENCIAL EFECTIVO 187

Figura 10.4: (a) Ilustraci


on del tipo de
orbita no acotada que corresponde a una energa total no negativa en un
potencial kepleriano. r1 es la menor distancia de aproximaci on al centro de fuerzas. (b) Ilustraci
on del tipo de
orbita acotada entre dos valores de r que corresponde a una energa total negativa. De momento no podemos

garantizar que esta orbita sea cerrada.

cualitativa de abiertas (no acotadas), acotadas y circulares, para cualquier potencial atractivo que cumpla las
siguientes condiciones (a) el potencial real decae mas lentamente que 1/r 2 cuando r y (b) diverge mas
lentamente que 1/r 2 cuando r 0. La primera condici on asegura que el potencial real predomina sobre el
termino centrfugo para valores grandes de r, en tanto que la segunda condici on asegura que para peque nos
valores de r predomina el termino centrfugo; en sntesis estas condiciones nos garantizan que el potencial en
cuesti
on tendr a un comportamiento asint otico similar al del potencial de la forma V (r) = k/r.
Si las anteriores condiciones no se cumplen la clasificaci on cualitativa arriba dada ya no es valida. Sin
embargo, todava se puede extraer informacion con base en el potencial efectivo. Como veremos en los siguientes
ejemplos

10.4.2. Potencial efectivo equivalente para dos cuerpos no interactuantes


La gran simplicidad de este problema nos permitir a reforzar el significado fsico del potencial centrfugo.
Sean dos cuerpos no interactuantes que se mueven con velocidades paralelas y opuestas como se ve en la Fig.
10.5a. Las lneas paralelas que forman las trayectorias de las partculas est
an separadas una distancia b usual-
mente denominada par ametro de impacto. Veamos como son las ecuaciones para la partcula equivalente a
este problema de dos cuerpos. Denotaremos por v0 la velocidad relativa la cual viene dada por
v0 = r = r 2 r 1 = v2 v1
claramente v0 es constante ya que v1 y v2 lo son. La energa total del sistema relativa al centro de masa es
1 2 1
E= v0 + V (r) = v02
2 2
puesto que V (r) = 0. El potencial efectivo est
a dado por
l2 l2
Vef f = + V (r) =
2r 2 2r 2
188 CAPITULO 10. FUERZAS CENTRALES

Figura 10.5: Ilustraci


on del comportamiento de la coordenada r para el caso de dos partculas no interactuan-
tes. (b) Ilustraci
on de la barrera de potencial efectivo que nos indica el valor de la mnima distancia de
aproximaci on. (c) Grafica de potencial efectivo para la partcula equivalente al problema de dos cuerpos no
interactuantes.

podemos evaluar l en forma directa pero es m


as f
acil usando la relaci
on
1 l2 1
E = r 2 + = v02 (10.32)
2 2r 2 2
es claro que cuando los dos cuerpos alcanza su distancia mnima de aproximacion r = b y r = 0 puesto que r
es un mnimo local en este punto, esto se ilustra en la Fig. 10.5b. Por tanto
l2 1
2
= v02 l = bv0 (10.33)
2b 2
con lo cual el potencial efectivo tendr
a la forma
1 b2
Vef f = v02 2
2 r
de modo que el gr afico del potencial efectivo es el indicado en la Fig. 10.5c. La regi
on permitida es aquella en
la cual E Vef f . El gr
afico 10.5a muestra que inicialmente r es muy grande y cuando las partculas se acercan
r disminuye y de acuerdo con la Fig. 10.5c, la parte radial de la energa cinetica disminuye9 y llega a anularse
en el punto de retorno donde la velocidad ser a puramente tangencial. Denotemos el punto de retorno como rt ,
en este punto se tiene que E = Vef f (rt ) lo cual nos da
1 2 1 2 b2
v = v0 2 rt = b
2 0 2 rt
es decir r = b es el punto de retorno. Esto se puede ver examinando las gr aficas 10.5a,b ya que r disminuye
hasta llegar al punto en que r = b, y a partir de all vuelve a aumentar. En nuestra gr afica unidimensional
10.5c, esto se puede interpretar diciendo que la partcula equivalente rebota en la barrera de potencial
efectivo.
Este ejemplo es muy enf atico en su mensaje, el potencial efectivo (que aqu coincide con el potencial
centrfugo) no est
a de ninguna manera relacionado con interacci on, ya que estas partculas no interactuan entre
s. La barrera de potencial efectiva (centrfuga) se forma debido exclusivamente a las condiciones iniciales del
problema. Efectivamente, si el choque fuera frontal i.e. b = 0, el potencial efectivo se anulara y se desvanecera
la barrera de potencial efectiva, lo cual se refleja en el hecho de que dos partculas no interactuantes que se
aproximan frontalmente, puede acercarse una a otra en forma indefinida.
9
Naturalmente, la energa cinetica total es constante de modo que la parte transversal de la energa cinetica debe estar aumen-
tando.

10.4. ANALISIS DE CURVAS DE POTENCIAL EFECTIVO 189

10.4.3. Potencial atractivo proporcional al inverso del cubo de la distancia

Figura 10.6: Graficas del potencial centrfugo (lnea punteada superior), potencial real (gr
afica punteada infe-
afica contnua), como funciones de r, para un potencial de la forma V = a/r 3 .
rior) y potencial efectivo (gr

Tomemos como ejemplo un potencial atractivo de la forma

a 3a
V (r) = f = (10.34)
r3 r4

el potencial efectivo junto con el potencial real y el termino centrfugo, se grafican en la figura 10.6. Este
potencial solo tiene un maximo local y tiende a cero por la derecha cuando r , tambien tiende a cuando
r 0. Para una energa E positiva menor que el m aximo local, hay dos tipos de movimiento dependiendo del
valor inicial de r. Si r0 es menor que r1 el movimiento ser a acotado entre 0 y r1 ; ademas la energa cinetica
tendera a infinito a medida que se acerca al centro atractor. Si r0 es mayor que r2 el movimiento es no acotado y
su distancia mnima de acercamiento es r2 , la partcula no podr a nunca acceder al pozo de potencial, debido
a que existe entre r1 y r2 una barrera de potencial. El intervalo r1 < r < r2 es claramente inaccesible.
Para el caso E 0 la
orbita estar
a acotada entre r = 0 y un punto de retorno, la energa tiende a infinito
cuando r 0. Cuando E es mayor que el m aximo del potencial todas las regiones son permitidas.
Resulta interesante el caso en el cual E coincide con el valor del m
aximo del potencial, llamemos rm al valor
de r en el cual ocurre el m aximo. Si r0 > rm y r0 < 0 la coordenada r disminuir a acercandose a rm , en este
proceso disminuye la energa cinetica radial hasta anularse cuando r = rm , y la partcula queda atrapada en
una trayectoria circular de radio rm . N otese sin embargo que si la energa es ligeramente mayor o ligeramente
menor a este valor del maximo de potencial, la naturaleza del movimiento cambia dr asticamente, de modo que
tenemos una orbita circular inestable. De otra parte, si r0 > rm y r0 > 0 la partcula se aleja indefinidamente
del valor rm y nunca retorna. Un an alisis similar se puede hacer para la condicion inicial r0 < rm .
190 CAPITULO 10. FUERZAS CENTRALES

Figura 10.7: (a) Gr


afica del potencial efectivo correspondiente a una fuerza restauradora lineal para momento
angular nulo. (b) Gr
aficas de potencial centrfugo, potencial real y potencial efectivo para una fuerza restaura-
dora lineal con momento angular no nulo.

10.4.4. Potencial efectivo para fuerza restauradora lineal


Otro caso interesante es el de una fuerza restauradora lineal (oscilador arm
onico isotr
opico)
1
f = kr ; V = kr 2
2
para momento angular cero, correspondiente a movimiento a lo largo de una lnea recta, Vef f = V y la situaci on
es como la que se ilustra en la Fig. 10.7a. Para cualquier valor positivo de la energa el movimiento est a acotado
y como se sabe, es arm onico simple. Si l 6= 0, surge un potencial centrfugo y las caractersticas del movimiento
se ilustran en la Fig. 10.7b. El movimiento es siempre acotado para todas las energas fsicamente posibles y
no pasa por el centro de fuerzas. En este caso particular es facil ver que la
orbita es elptica, ya que si f = kr,
las componentes x, y de las fuerzas son
fx = kx ; fy = ky
el movimiento consta de la composici on de dos movimientos arm onicos simples de la misma frecuencia cada
uno perpendicular al otro. Esto conduce en general a orbitas elpticas.
Un ejemplo bien conocido es el del pendulo esferico de peque nas oscilaciones. Las famosas figuras de
Lissajous se obtienen como la composici on de dos movimientos arm onicos simples perpendiculares entre s,
y son cerradas cuando los cocientes entre las frecuencias son n umeros racionales. Para dos oscilaciones con
la misma frecuencia, la figura es una lnea recta cuando las oscilaciones est an en fase, un crculo cuando su
diferencia de fase es /2, y una forma elptica en los demas casos. En consecuencia, el movimiento bajo una
fuerza central restauradora lineal nos provee las figuras de Lissajous m as sencillas.

10.5. El teorema del virial


Algunas propiedades de las fuerzas centrales se pueden derivar como un caso particular del teorema del
virial, el cual es de car
acter estadstico ya que se refiere a los promedios temporales de varias cantidades
mecanicas.
Consideremos un sistema de masas puntuales con vectores de posici on ri y fuerzas aplicadas Fi (incluyendo
fuerzas de ligadura y fuerzas internas). Las ecuaciones fundamentales de movimiento son
p i = Fi
10.5. EL TEOREMA DEL VIRIAL 191

ahora nos concentraremos en la cantidad X


G= pi ri
i
donde la suma es sobre todas las partculas del sistema. Fi incluye a las fuerzas internas y externas sobre la
partcula i. La derivada total en el tiempo de esta cantidad es
dG X X X X X X
= r i pi + p i ri = mi r i r i + Fi ri = mi r 2i + Fi ri
dt
i i i i i
dG X
= 2T + Fi ri
dt
i

calculemos ahora el promedio temporal de esta cantidad tomado sobre un intervalo [0, ], lo cual se obtiene
integrando en dicho intervalo y dividiendo por
Z   X
1 dG dG
= 2T + Fi ri
0 dt dt
i
X 1
2T + Fi ri = [G ( ) G (0)]

i

hay dos situaciones interesantes para las cuales el termino de la derecha se anula. (a) Cuando el movimiento
es peri
odico de tal modo que todas las coordenadas y velocidades se repiten despues de cierto tiempo, en tal
caso el termino de la derecha se anula si elegimos a como el periodo del movimiento. (b) Las coordenadas y
velocidades de todas las partculas permanecen finitas para todo tiempo, el sistema esta entonces acotado y el
valor de G tambien. En este caso el termino de la derecha tiende a cero para tiempos suficientemente largos.
En cualquiera de estas situaciones se tiene
1X
T = Fi ri (10.35)
2
i

La ecuacion (10.35) se conoce como el teorema del virial, y el lado derecho se conoce como el virial de
Clausius. Con frecuencia es conveniente separar las fuerzas externas e internas de cada partcula para escribir
cada contribuci
on en forma separada. Si asumimos que se cumple el principio de acci on y reaccion el teorema
queda ( )
1 X (e) X
T = Fi ri + Fij rij (10.36)
2 pares
i

una de las aplicaciones mas interesantes del teorema del virial es la derivaci
on de la ecuaci
on de estado de un
gas para el cual se obtiene (ver Alonso y Finn)
1X
pV = N kT + Fij rij
3 pares

notese que la contribuci


on del termino de fuerzas internas puede ser negativo (positivo) para fuerzas atractivas
(repulsivas). Naturalmente, el termino es cero para un gas ideal.
Adicionalmente, si la fuerza aplicada es la suma entre fuerzas no friccionales y fuerzas friccionales pro-
porcionales a la velocidad, entonces el virial solo depende de las primeras, no hay contribuci on de las fuerzas
friccionales viscosas. No obstante, es necesario que se le inyecte energa al sistema para mantener el movimien-
to ya que si las fuerzas viscosas detienen el movimiento todos los promedios temporales tienden a cero para
tiempos suficientemente grandes.
Si las fuerzas son derivables de un potencial, el teorema del virial (10.35) queda de la forma
1X
T = V ri (10.37)
2
i
192 CAPITULO 10. FUERZAS CENTRALES

si usamos una ley de potencial de la forma


V (r) = ar n+1
de manera que la fuerza va como r n , se tiene que
 
V V
V r = ur (rur ) = r = (n + 1) V
r r

de modo que la Ec. (10.37) para una partcula queda


n+1
T = V
2
este mismo resultado se puede obtener aplicando el teorema de Euler Ec. (5.16) para un potencial homogeneo
en r de grado n + 1 (lo cual es mas general). Para el caso particular de una fuerza con ley de inverso al
cuadrado, usamos n = 2 y resulta
1
T = V (10.38)
2

10.6. Ecuaci
on de la
orbita y potenciales integrables
Ya hemos escrito la ecuacion de la orbita Ec. (10.24). Una forma alternativa que nos provee de cierta
informaci
on interesante, se obtiene reescribiendo la Ec. (10.10) de la siguiente forma

mr 2
dt = d
l
esta ecuaci
on permitira relacionar la derivada temporal de una funci on arbitraria F con su derivada con
respecto a . Para nuestros propositos nos interesa tambien la segunda derivada
dF dF l dF
=  2 =
dt mr
d mr 2 d
l

     
d2 F d dF d l dF d l dF
= = = 
dt2 dt dt dt mr 2 d mr 2
d mr 2 d
l
 
d2 F l d l dF
=
dt2 mr 2 d mr 2 d

y como F es arbitrario, hemos encontrado una relaci on entre las derivadas en y en t


 
d (. . .) l d (. . .) d2 l d l d (. . .)
= ; = (10.39)
dt mr 2 d dt2 mr 2 d mr 2 d

esta ecuacion se puede sustituir bien sea en la Ec. (10.12) o en (10.19). La sustituci on en (10.12) nos da una
ecuacion de segundo orden, en tanto que la sustituci on en (10.19) nos da una ecuaci on de primer orden en el
tiempo. Aunque las ecuaciones de segundo orden son en general m as difciles de resolver, aplicaremos primero
la Ec. (10.39) a la Ec. (10.12) ya que esta ecuaci
on diferencial tambien nos dar a un informacion util. Aplicando
las relaciones (10.39) en la Ec. (10.12) se obtiene
 
l d l dr l2
m 2 = f (r) (10.40)
mr d mr 2 d mr 3
usando la identidad
1 dr d (1/r)
2
=
r d d
DE LA ORBITA
10.6. ECUACION Y POTENCIALES INTEGRABLES 193

en la Ec. (10.40) se obtiene


       
l d l d (1/r) l2 1 3 l2 1 2 d2 (1/r) l2 1 3
= f (r) + = f (r)
r 2 d m d m r m r d 2 m r

de lo cual se ve conveniente el cambio de variable u = 1/r, resultando


   
l2 u2 d2 u 1
2
+ u = f (10.41)
m d u
 2   
d u m 1 d 1
+u = 2 2 V (10.42)
d 2 l u dr u

y teniendo en cuenta
d dr d 1 d
= = 2
du du dr u dr
la Ec. (10.42) se puede escribir en funci
on del potencial
 2   
d u m d 1
2
+u = 2 V (10.43)
d l du u

empleando cualquiera de las Ecs. (10.41, 10.43) podemos hallar la orbita con base en la fuerza o el potencial de
interaccion. Es tambien interesante el caso inverso, es decir dada la orbita (determinada experimentalmente)
encontrar el potencial de interacci on. Por el momento, deseamos demostrar a partir de (10.43) que la orbita es
simetrica respecto a los puntos de retorno del movimiento. Notemos que si la orbita es simetrica ser a posible
reflejarla respecto a la direcci
on del
angulo de retorno sin producir ninguna variaci on. Si se eligen las coorde-
nadas de tal modo que el punto de retorno corresponda a = 0, la reflexi on podr a hacerse matem aticamente
sustituyendo por . La ecuaci on diferencial (10.43) que describe la orbita es evidentemente invariante ante
dicha sustitucion, ya que aparece la segunda derivada en pero no la primera derivada. Veamos ahora si
las condiciones iniciales son tambien invariantes, para verlo ser a mas util escribir las condiciones iniciales en
terminos de derivadas en en lugar de derivadas temporales

du d (1/r) 1 dr 1 dr dt r
= = = = =0
d t=0 d t=0 r 2 d t=0 r 2 dt d t=0 2 t=0
r

donde hemos tenido en cuenta que r0 = 0 ya que empezamos a una distancia apsidal. Por otro lado, tambien
por nuestras hipotesis de trabajo t = 0 corresponde a = 0 por tanto las condiciones iniciales quedan
 
du
u = u ( = 0) , = 0, para = 0
d 0

y estas condiciones iniciales tampoco se ven afectadas por la transformaci on de inversi


on angular. Por lo tanto,
la ecuaci
on de la orbita es la misma tanto si la expresamos en terminos de , como si la expresamos en funci on
de , siempre que se mida con respecto a una lnea apsidal. Esto nos lleva a la conclusi on de que la orbita
es invariante ante una reflexi on respecto a los vectores apsidales. Esto implica que se puede construr
la
orbita completa si se conoce la porcion de la orbita comprendida entre dos puntos de retorno cualesquiera.
La reflexi
on de la porcion dada respecto a uno de los vectores apsidales produce un trozo adicional de la orbita
y se puede repetir este proceso indefinidamente hasta completar el resto de la orbita como se ilustra en la Fig.
10.8.
Retornaremos ahora a la ecuaci on de orbita en la forma (10.24) pero escribiendola de nuevo en terminos
del potencial real V (r)
l dr
d = r h i
2 l2
mr 2 m E V (r) 2mr 2
194 CAPITULO 10. FUERZAS CENTRALES

Figura 10.8: Construcci on de la orbita a partir de una seccion orbital entre dos lneas apsidales (curva 1
contnua). La curva 2 se form o por imagen especular de la curva 1 con respecto al apside r2 en tanto que la
lnea 3 se form
o por reflexi
on de la curva 1 con respecto al a
pside r1 .

la cual se puede reescribir apropiadamente como


Z r
dr
= q + 0 (10.44a)
2mE
r0 r 2
l2
2mV
l2
1
r2

de nuevo haciendo un cambio de variable u = 1/r


Z u
du
= 0 q (10.45)
2mE 2mV
u0
l2
l2
u2

la integraci
on detallada de esta expresi
on no es en general sencilla. En realidad solo ciertos tipos de potenciales
han sido estudiados en forma detallada. Los m as importantes son los potenciales de la forma

V = kr n+1 (10.46)

para los cuales la ecuaci


on (10.45) queda
Z u
du
= 0 q (10.47)
2mE 2mk n1
u0
l2
l2
u u2

la cual es integrable en terminos de funciones sencillas solo en algunos casos. Las soluciones se pueden escribir
en terminos de funciones trigonometricas en los casos en que

n = 1, 2, 3

en tanto que para las potencias


n = 5, 3, 0, 4, 5, 7
las soluciones se pueden expresar en terminos de funciones elpticas. Estos son todos los casos para potencias
enteras en los cuales las soluciones se pueden escribir en terminos de funciones sencillas. Algunos exponentes
fraccionarios tambien se pueden escribir en terminos de funciones elpticas y muchos otros en terminos de
funciones hipergeometricas. Las funciones trigonometricas y elpticas son casos especiales de las funciones
integrales hipergeometricas. Un analisis mas detallado se puede ver en Goldstein segunda edici on.
PARA ORBITAS
10.7. CONDICION CIRCULARES ESTABLES E INESTABLES 195

10.7. Condici
on para
orbitas circulares estables e inestables
A
un es posible extraer informaci on adicional del problema unidimensional equivalente as como de la
ecuacion de la trayectoria. En particular, se puede deducir un teorema relacionado con los tipos de fuerzas
centrales atractivas que nos llevan a
orbitas cerradas, es decir
orbitas en las cuales la partcula trace de nuevo
los mismos pasos.
Ya hemos descrito un tipo de orbita cerrada: la
orbita circular centrada en el centro de fuerzas. Para un
valor dado de l (es decir para un perfil dado del potencial efectivo), este movimiento se d a si la energa total
E de la partcula coincide con un mnimo o m aximo local del potencial efectivo, y el radio r0 del crculo
estar
a dado por el valor de r para el cual se encuentra dicho mnimo o m aximo. Recordemos que el requisito
de que Vef f tenga un extremo coincide con el requisito de que la fuerza efectiva dada por (10.31) se anule
para el valor r0 donde se ubica el extremo por lo tanto

l2
f (r0 ) = (10.48)
mr03

esto nos dice que la fuerza (real) debe ser atractiva al menos a la distancia r0 , con el fin de lograr una
orbita
circular. Adicionalmente, la energa de la partcula se obtiene de las Ecs. (10.25, 10.26) simplemente teniendo
en cuenta que la energa cinetica radial es cero ya que r0 debe ser nulo.

l2
E = V (r0 ) + (10.49)
2mr02

las Ecs. (10.48) y (10.49) implican que para toda fuerza central atractiva se puede obtener una
orbita circular
de radio arbitrario r0 dado, si el momento angular viene dado por (10.48) y la energa viene dada por (10.49).

Figura 10.9: (a) Para este potencial efectivo el movimiento es acotado para energas alrededor de E. (b) Para
este potencial un ligero aumento en la energa conduce a movimiento no acotado, una ligera disminuci on de
la energa conduce a movimiento no acotado si r (t = 0) > r0 .

Si el potencial presenta un mnimo local y elevamos la energa ligeramente, la orbita ya no ser


a circular
pero estara acotada entre dos crculos de radios cercanos al de la orbita original, de modo que la trayectoria
no se desva significativamente de la original (aunque podra dejar de ser cerrada). Tomando la terminologa
del caso unidimensional decimos que esta orbita circular es estable. Por el contrario si estamos en un maximo
local, el m
as leve aumento (o disminuci on) de la energa puede llevar a
orbitas totalmente diferentes aunque
podran todava ser acotadas como se ve en la Fig. 10.9a, pero en algunos casos como el de la figura 10.9b
el movimiento se vuelve no acotado. El hecho importante es que un ligero cambio en la energa (y por tanto
en las condiciones iniciales) conduce a trayectorias totalmente distintas por lo cual decimos que la orbita
circular es inestable. Dado que la estabilidad (inestabilidad) est a dictaminada por la condici on de mnimo
(maximo), del potencial efectivo, podemos en consecuencia traducirlo algebr aicamente en segunda derivada
196 CAPITULO 10. FUERZAS CENTRALES

positiva (negativa) que corresponde a un perfil c oncavo hacia arriba (abajo) en el punto donde se encuentra el
extremo. El criterio de estabilidad se escribe entonces como

2 Vef f 2 V 3l2 f 3l2 df 3l2
= + = + > 0 >
r 2 r=r0 r 2 r=r0 mr04 r=r0 r r=r0 mr04 dr r=r0 mr04

df 3l2
<
dr r=r0 mr 4 0

usando (10.48) resulta:


df 3f (r0 )
< (10.50)
dr r=r0 r0
y teniendo en cuenta que el cociente r0 /f (r0 ) es negativo lo cual se puede verificar de (10.48), obtenemos
 
df
r0 df f
> 3 dr  > 3
f (r0 ) dr r=r0 r
r=r0

d ln f
> 3 (10.51)
d ln r r=r0

si la fuerza est
a gobernada por una ley de potencias de r de la forma

f = kr n ; k > 0 (10.52)

sacando logaritmo resulta

ln f = ln (k) + ln r n = ln (1) + ln k + n ln r = i + ln k + n ln r d ln f = n d ln r
d ln f
= n (10.53)
d ln r
combinando (10.53) con (10.51), la condici
on de estabilidad (10.51) resulta

n > 3

Una ley de fuerza atractiva que vare mas lentamente que 1/r 3 puede por tanto sostener
orbitas circulares
estables para todos los valores de r0 .

10.8.
Orbitas circulares perturbadas a primer orden
Ya hemos visto que si la
orbita circular es estable un ligero aumento en la energa conduce a una peque
na
variaci
on de r alrededor de r0 . Usaremos la identidad
   
d 1 dr d dr 1 1
V = V (r) = f (r) = 2 f
du u du dr du u u

Escribamos la Ec. (10.43) en la forma


 2     
d u m d 1 m 1
+ u = J (u) ; J (u) 2 V = 2 2f (10.54)
d 2 l du u l u u

La condici orbita circular dada por (10.48), para un radio r0 = u1


on de 0 queda en la forma
   
1 l2 3 m 1 m l2
f = u0 2 2 f = 2 2 u30
u0 m l u0 u0 l u0 m

10.8. ORBITAS CIRCULARES PERTURBADAS A PRIMER ORDEN 197

y usando la expresi
on de J (u) en (10.54), resulta

J (u0 ) = u0 (10.55)

y la energa debe cumplir la condici


on (10.49). Ahora bien, bajo la condicion de estabilidad, con una energa
ligeramente superior a la dada por (10.49) obtendremos un movimiento acotado en el que para todo tiempo la
variable u solo difiere ligeramente de u0 . En consecuencia, la expansi
on de Taylor de J (u) alrededor de u0
dJ h i
J (u) = u0 + (u u0 ) + O (u u0 )2 (10.56)
du0
se podra tomar a primer orden. Denotando x u u0 y reemplazando esta expansi on a primer orden en
(10.54) resulta
 2   2 
d u dJ d (u u0 ) dJ
+ u = u 0 + (u u 0 ) + (u u0 ) = (u u0 )
d 2 du0 d 2 du0
 2   
d x dJ d2 x dJ
+x = x 2 +x 1 =0
d 2 du0 d du0
la ecuaci
on se puede escribir en la forma
 
d2 x dJ
+ 2x = 0 ; 2
1 (10.57)
d 2 du0

es claro que 2 es una cantidad real, adicionalmente la condici on de estabilidad para x exige que 2 sea
definido positivo10 . Para encontrar la relaci
on de 2 con la interacci
on y las condiciones iniciales debemos
evaluar dJ/du0 . De la definici
on de J (u) en (10.54) resulta
     
dJ 2m 1 m d 1 2J m d 1
= 2 3f 2 2 f = 2 2 f
du l u u l u du u u l u du u

y aplicando las condiciones de circularidad (10.48, 10.55), se tiene que


 
dJ 2J (u0 ) m df m df
= 2 2 = 2 + u0 2 3
du0 u0 l u0 du0 l u0 du0
dJ u0 df
= 2 + (10.58)
du0 f0 du0

reemplazando (10.58) en la segunda de las Ecs. (10.57), 2 queda en la forma



2 u0 df u0 dr df u0 1 df 1 df
= 3 =3 =3+ =3+
f0 du0 f0 du dr r=r0 f0 u20 dr r=r0 f0 u0 dr r=r0

r df d ln f
2 = 3 + =3+ (10.59)
f dr r=r0d ln r r=r0

n on de estabilidad (i.e. de positividad de 2 ) coincide con la condici


otese que la condici on de estabilidad dada
2
por la Ec. (10.51). Con definida positiva y tomando un origen adecuado para , la ecuaci on diferencial
(10.57) tendr
a como solucion

r df d ln f
x u u0 = a cos ; 2 = 3 + = 3 +
f dr r=r0 d ln r r=r0
10
on estable con 2 negativo es posible ya que en este caso x = Ae|| + Be|| y si A = 0, x
Se podra pensar que una soluci
permanece acotado. No obstante podemos ver que cuando se tiene que x 0. Fsicamente, esto significa que la energa
E inicial ha disminudo al valor E0 de la energa que corresponde a la condici
on de circularidad. Pero las fuerzas centrales son
conservativas de modo que esto solo es posible si se introduce una fuerza disipativa adicional.
198 CAPITULO 10. FUERZAS CENTRALES

En resumen, hemos demostrado que para peque nas variaciones con respecto a la condici
on de circularidad
estable, la partcula ejecuta un movimiento arm
onico simple en u ( 1/r) alrededor de u0

u = u0 + a cos (10.60)

donde a es la amplitud del movimiento, la cual depende de la desviaci on de la energa con respecto al valor de
esta cuando la orbita es circular, es un valor que surge de la expansion de Taylor de la fuerza f (r) alrededor
de la orbita circular de radio r0 y esta dado por la Ec. (10.59). Por otro lado, la ecuaci on (10.60) muestra que
cuando el radio vector de la partcula ha barrido completamente el plano (i.e. ha barrido un intervalo entre 0
y 2), u ha ejecutado oscilaciones. Si es un n umero racional, de tal forma que = n/m con n y m enteros,
entonces despues de m revoluciones del radio vector la orbita comenzara a repetirse11 , es decir obtenemos una
orbita cerrada a primer orden .
12

Para cada valor de r0 que cumpla la desigualdad (10.50) o (10.51), es posible construr una orbita circular
estable de radio r0 si el momento angular y la energa adquieren los valores prescritos por las Ecs. (10.48,
10.49). La pregunta natural es para que formas funcionales de la fuerza, las orbitas ligeramente perturbadas
con respecto a la circular son cerradas a primer orden?. Es claro que la condici on de que sea racional es
necesaria, pero se requiere un ingrediente adicional: el valor de debe ser el mismo para todos los valores de
r0 para los cuales se pueden construr orbitas circulares estables. De no ser as, puesto que solo puede tomar
valores discretos (por ser racional), el n umero de periodos de oscilacion cambiara discontnuamente con r0 , y
las orbitas no podran ser cerradas en la discontinuidad. Con 2 constante para todo el rango de r0 , podemos
sin ambig uedad quitar la evaluaci on en r0 de la expresion de la derecha en la Ec. (10.59)

r df d ln f
2 = 3 + =3+ (10.61)
f dr d ln r

con lo cual resulta una ecuaci


on diferencial para f en terminos de la variable r, siempre que tengamos en cuenta
que solo es valida en el rango de r en donde las orbitas circulares estables son posibles. Tenemos entonces

d ln f dF
= 2 3
d ln r dr
on para F en terminos de r es inmediata
la soluci
 
F = 2 3 r + C ln f = 2 3 ln r + C

ahora tendremos en cuenta que C es una constante que en general puede ser compleja. Definiremos entonces
C ln (k) con lo cual queda
2
ln f = ln r 3 + ln (k)
h 2
i
ln f = ln kr 3

de aqu resulta
2 3
f (r) = kr ; k>0 (10.62)
donde la condicion k > 0 proviene del hecho ya discutido de que la condici on de circularidad requiere de una
fuerza atractiva como se ve en la Ec. (10.48). Todas las leyes de fuerza de la forma (10.62) con racional,
conducen a ecuaciones de orbitas que son cerradas a primer orden, es decir cuando las condiciones iniciales solo
difieren ligeramente de aquellas que conducen a una orbita circular. Aparecen dentro del espectro de fuerzas
permitidas las leyes de fuerza mas familares: ley del inverso cuadrado ( = 1) y ley de Hooke ( = 2). Tambien
aparecen por supuesto un infinito espectro de otras leyes de fuerza.
11
Naturalmente, para obtener el mnimo de revoluciones necesarias para repetir la orbita, se requiere que n y m sean primos
entre s.
12
Esta orbita tal vez no es exactamente cerrada ya que aqu solo estamos en aproximaci
on de primer orden, en seguida veremos
un criterio para tener orbitas exactamente cerradas.

10.9. ORBITAS CIRCULARES PERTURBADAS A ORDEN SUPERIOR AL PRIMERO Y CONDICIONES PARA

10.9.
Orbitas circulares perturbadas a orden superior al primero y con-
diciones para orbitas cerradas (teorema de Bertrand)
Ahora supongamos que las condiciones iniciales se mueven en una forma no necesariamente ligera, pero de
tal forma que la orbita sigue estando acotada. El problema se puede resolver tomando un termino adicional en
la expansi on de Taylor y resolviendo la ecuacion de
orbita resultante (primer termino anarm onico) J. Bertrand
resolvio el problema en 1873 y encontr o que para desviaciones a segundo orden en la circularidad, las orbitas
son cerradas para todo movimiento acotado solo si 2 = 1 o 4. Estos valores corresponden a la ley de inverso
cuadrado y la ley de Hooke respectivamente. Por supuesto, a un es posible que a orden m as alto estas
orbitas
puedan ser abiertas. Por fortuna, dado que solo quedan dos leyes de interacci on, estas se pueden examinar
en todo detalle y se puede demostrar que ambas conducen a orbitas cerradas de manera exacta (de hecho lo
demostraremos para la ley del inverso al cuadrado), siempre que la orbita sea acotada. Estas son entonces las
u
nicas leyes de fuerza que conducen a orbitas cerradas para cualquier orbita acotada, es decir para condiciones
iniciales arbitrarias en E y l salvo por la condici on de que estos valores conduzcan a orbita acotada. De
aqu resulta el teorema de Bertrand

Theorem 5 Las u nicas fuerzas centrales (atractivas) que producen orbitas cerradas para toda trayectoria
acotada de una partcula, son la ley del inverso cuadrado y la ley de Hooke.

Este resultado es muy notable ya que las apreciaciones astron omicas muestran que muchos cuerpos celestes
se mueven en orbitas cerradas al menos a primer orden. Esto nos conduce a leyes de la forma (10.62). Sin
embargo, si pensamos que la orbita debe ser cerrada cuando solo interact uan dos cuerpos y las peque nas
desviaciones se atribuyen a la interacci on con otros cuerpos quedamos con solo dos leyes posibles. La ley
de Hooke es descartable ya que implicara que la interacci on aumenta con la distancia haciendo imposible
despreciar la interacci
on con muchos cuerpos. Nos queda entonces que la ley de gravitaci on debe ser de la
forma 1/r 2 .
En el formalismo de Hamilton Jacobi vimos una forma alterna de ver el movimiento orbital cerrado: El
movimiento orbital en el plano se puede ver como la composici on de dos movimientos oscilatorios peri odicos
uno en r y el otro en . En el caso de la ley inverso cuadrado y de Hooke, ambos movimientos tienen el mismo
periodo y tenemos entonces una degeneraci on que como vimos, tiene una fuerte relaci on con la naturaleza del
potencial.
Un comentario final, el teorema de Bertrand no prohibe la existencia de orbitas cerradas para otras leyes de
fuerzas. Lo que el teorema prohibe para otras leyes de fuerzas es que toda trayectoria acotada sea cerrada, pero
es posible que ciertas trayectorias acotadas con condiciones iniciales muy especficas nos lleven a trayectorias
cerradas. De hecho hemos demostrado que toda fuerza central atractiva puede generar orbitas circulares para
cualquier valor del radio del crculo, siempre que los valores de E y l se ajusten de una manera muy especfica.

10.10. El problema de Kepler: Ley del inverso al cuadrado (atractiva)


Examinemos brevemente el problema inverso13 : dada la trayectoria, encontrar la ley de fuerzas que gobierna
la din
amica de la partcula. Vale recordar que Newton emple o las leyes de Kepler para deducir la ley de
gravitaci
on universal, es decir abord
o el problema de manera inversa. Es logico pensar que esta interacci
on sea
de naturaleza central, en virtud de la isotropa del espacio. Emplearemos las leyes de Kepler que describen el
movimiento planetario:

1. Todo planeta se mueve con una trayectoria elptica, en uno de cuyos focos se encuentra el Sol

2. El radio vector que une el Sol y el planeta recorre


areas iguales en tiempos iguales
13
Este problema inverso se conoce usualmente como problema de dispersi
on o scattering como veremos m
as adelante.
200 CAPITULO 10. FUERZAS CENTRALES

3. La relaci
on
r3
T2
es identica para todos los planetas, si esta relaci
on se le llama k, entonces esta ley se puede escribir como

r3
k= (10.63)
T2

Tomaremos por simplicidad una trayectoria circular (elipse con distancia focal cero) con rapidez constante.
El movimiento lunar es un buen ejemplo de esta trayectoria, la fuerza centrpeta es de la siguiente forma

v2
F = mac = m (10.64)
r
como la velocidad tangencial constante es de la forma

2r
v= (10.65)
T
entonces 
m 4 2 r 2 4 2 mr
F = =
rT 2 T2
Aplicando la tercera ley de Kepler Ec. (10.63), es decir

r3
T2 =
k
resulta
4 2 km
F =
r2
lo cual nos lleva a una ley proporcional al inverso cuadrado de la distancia que ademas involucra como constante
de proporcionalidad a la masa (inercial) de la partcula. Es natural adem as asumir que esta fuerza depende
de dos constantes de acople asociadas con cada cuerpo y que llamaremos masas gravitacionales, llegando a la
llamada ley de gravitaci on universal
Gm1 m2
F =
r2
Por otro lado, la segunda ley de Kepler fortalece la idea de que la fuerza es de naturaleza central, ya que vimos
que esta ley se cumple para cualquier fuerza central (ver secci on 10.2).
Newton calculo la relaci
on entre la aceleraci
on de la gravedad en la tierra g y la aceleraci
on centrpeta ac de
la Luna. Aplicando la ley de gravitaci on universal (asumiendo que la masa inercial y la masa gravitacional son
identicas) podemos calcular la fuerza FR que la tierra hace sobre una masa m1 en su superficie, as como la
fuerza centrpeta Fr que la tierra hace sobre la luna.

G 6 m1 mT G 6 mL mT
FR = =6 m1 g ; Fr = =6 mL ac
R2 r2
siendo R el radio de la tierra y r la distancia de la tierra a la luna; mT y mL son las masas de la tierra y la
luna. De esta relaci
on se obtiene
g r2
= 2 (10.66)
ac R
Cavendish realizo la corroboraci
on de esta igualdad. Veamos algunos datos tpicos

r = 3,84 108 m ; T = 2,36 106 s.


PARA LA ORBITA
10.11. SOLUCION EN EL PROBLEMA DE KEPLER 201

siendo T un periodo lunar. Aplicando estos valores a las Ecs. (10.64, 10.65) se tiene

v2 4 2 r
ac = =
r T2
g
ac = 2,72 103 ; (60)2
ac

en tanto que los cocientes entre r 2 y R2 son


2
3,84 108
= 3634 (60)2
(6,37 106 )2
este an
alisis le da consistencia a la ley del inverso al cuadrado.

10.11. Soluci
on para la
orbita en el problema de Kepler
Habiendo establecido que la atracci
on gravitacional es inversamente proporcional al cuadrado de la distancia
en el caso de trayectoria circular, tomaremos esta ley de fuerza como hip otesis de trabajo para obtener las
posibles trayectorias para diversas condiciones iniciales y contrastar con las observaciones astron omicas. La
fuerza y el potencial vienen dados por
k k
f = 2 ; V = (10.67)
r r
como ya vimos, existen varias maneras de integrar la ecuaci on de movimiento. La mas simple, consiste en
sustituir (10.67) en (10.41). Con lo cual se obtiene

d2 u mf u1 mk
2
+u = 2 2 = 2
d l u l
mk
usando el cambio de variable y = u l2
, la ecuaci
on diferencial queda

d2 y
+y =0
d 2
cuya soluci
on mas general se puede escribir de la forma
 mk 
y = B cos u 2
= B cos
l
mk 
u = 2
+ B cos
l
donde B y son las constantes de integraci
on. Escribiendo la soluci
on en funci
on de r

1 mk   l2
= 2 1 + cos ; B (10.68)
r l mk
Otra alternativa consiste en hacer las asignaciones n 2 y k k en las ecuaciones (10.46, 10.47) 14
Z
du
= q (10.69)
2mE 2mku 2
l2 + l2 u

tomaremos la integral como indefinida y a cambio absorbe las constantes de integracion que surjan, de modo
que no necesariamente coincide con el valor inicial de . Puesto que absorbe a la constante 0 y a los
lmites de integraci on (10.47) se sigue que depender
on en la ecuaci a tanto de 0 como de r0 .
14
Aunque este camino es m
as largo, tiene la ventaja de que la constante queda directamente en terminos de la energa y el
momento angular
202 CAPITULO 10. FUERZAS CENTRALES

La integral indefinida tiene la estructura siguiente


Z  
du 1 + 2u
p = arc cos (10.70)
+ u + u2 q
q 2 4 (10.71)

la integral (10.69) se resuelve a traves de (10.70) con las siguientes sustituciones


 2  
2mE 2mk 2mk 2El2
= 2 , = 2 ; = 1 ; q = 1+ (10.72)
l l l2 mk2

donde el valor de q se obtuvo de


 2
     2 2 2 2
2 2mk
2mE 2mk 2 2 m k El
q 4 = 4 (1) = +2
l2
l 2 l 2 l4 mk2
 2  2      
2mk 2mk 2El2 2mk 2 2El2
q = + = 1 +
l2 l2 mk2 l2 mk2

sustituyendo (10.72) en la integral (10.69) se tiene


i
 2mk
h 2ul2
2mk
2u l2
1 2mk
l2
= arc cos r  
= arc cos
r

2mk 2
 2El2 2mk
 2El 2
l 2 1 + mk 2 l2
1+ mk 2

l2 u
1

= arc cos q mk
2El2
1 + mk2

y resolviendo para u 1/r la ecuaci on de la trayectoria queda


r
 l2 u  l2 u
mk 1 2El2
cos = q 1+ 2
cos = 1
2El2
1 + mk2 mk mk
r " r #
l2 u 2El2  mk 2El 2 
= 1+ 1+ cos u = 2 1 + 1 + cos
mk mk2 l mk2
" r #
1 mk 2El2

= 2 1+ 1+ cos (10.73)
r l mk2

se puede ver que esta ecuaci on coincide con (10.68) excepto que aparece en (10.73) como funci on de E y l
tal como se anticip o. La Ec. (10.73) nos permite identificar a como uno de los angulos correspondientes a
la inversi on del movimiento de la orbita, ya que si tomamos = 0 vemos que esta ecuaci on queda invariante
ante la transformaci on especular . Esto nos indica seg un la discusi on 10.6 que =
on de la secci
corresponde al lugar geometrico de un apside, de hecho la Ec. (10.73) nos indica que es un peri apside. Notemos
que de las cuatro constantes de integraci
on solo aparecen tres (E, l, ), esto se debe a que la cuarta constante
(0 o r0 ) ubica la posici
on inicial de la partcula, la cual es claramente irrelevante en la ecuaci orbita15 .
on de la
Sin embargo, esta cuarta constante deber a aparecer cuando se solucione el problema de r y en funci on del
tiempo. En particular, si queremos resolver la primera integral de movimiento asociada a la conservaci on del
momento angular Ec. (10.10), tenemos que conocer el valor inicial de i.e. 0 .
15
No obstante, si la
orbita es abierta, esta informaci
on ser
a necesaria para trazar la
orbita real, pues en tal caso se necesita el
punto de partida. Para trayectoria cerrada el punto de partida no es relevante para trazar la trayectoria completa.
PARA LA ORBITA
10.11. SOLUCION EN EL PROBLEMA DE KEPLER 203

>1 E>0 l 6= 0 hiperbola


=1 E=0 l 6= 0 parabola
<1 E<0 l 6= 0 elipse
2
=0 E = mk
2l2
l 6= 0 circunferencia

Cuadro 10.1: Tipos de c onicas que se obtienen con diferentes valores de la excentricidad. La segunda columna
nos da el valor de la energa para el cual se obtienen estas c
onicas. El momento angular se asume diferente de
cero.

Teniendo en cuenta que la ecuaci


on general de una c
onica con foco en el origen es de la forma
1  
= C 1 + cos
r
siendo la excentricidad de la secci
on c
onica, se tiene por comparaci on con (10.73) que la
orbita siempre
corresponde a una seccion c
onica con foco en el centro de fuerzas y excentricidad
r
2El2
= 1+ (10.74)
mk2
como se sabe de la teora de secciones c
onicas, el tipo de c
onica depende del valor de la excentricidad seg un la
tabla 10.1
Los valores de la tabla 10.1 corresponden a todos los casos posibles con l 6= 0. Cuando el momento angular
es nulo la Ec. (10.73) ya no es v alida, y recalculando se observa f acilmente que la trayectoria consiste en
una lnea recta, que corresponde al caso en el cual la velocidad inicial es tal que el par ametro de impacto
con el centro de fuerza es cero. La clasificacion anterior coincide con la clasificaci on general de trayectorias
acotadas y no acotadas que se hizo en la secci on 10.4.1, basados en el analisis de la curva de energa potencial
efectiva. N
otese que siempre que garanticemos que l 6= 0, el tipo de c onica solo depende de la energa, aunque
la trayectoria detallada depende de E y l.
Veamos ahora como se relaciona la condici on de circularidad con la estudiada en la secci on 10.7. Aplicando
el teorema del virial (10.38) y teniendo en cuenta que en la orbita circular E, T y V son constantes

1 V V
E =T +V = V +V = =
2 2 2
por lo tanto
k
E= (10.75)
2r0
pero recordando la condici
on de circularidad (10.48), que equivale a la anulaci
on de la fuerza efectiva podemos
escribir
k l2 l2
f (r0 ) = 2 = 3 r0 = (10.76)
r0 mr0 mk
que al reemplazar en (10.75) resulta
mk2
E= (10.77)
2l2
esta expresi
on coincide con la que se obtendra haciendo = 0 (condici
on de circularidad) en la Ec. (10.74).
Un breve calculo nos muestra que esta expresi on tambien coincide con la que se obtuvo en (10.49) para la
condici
on de circularidad con un potencial central arbitrario. Partiendo de (10.77) y usando (10.76) se tiene
que
 
mk2 mk2 mk l2 mk 2 k l2 l2
E = 2 + 2 = k 2 + = + = V (r0 ) +
l 2l l 2m l2 r0 2mr02 2mr02
204 CAPITULO 10. FUERZAS CENTRALES

que coincide con (10.49). Para el caso de orbitas elpticas, se puede demostrar que el eje mayor solo depende
de la energa, hecho fundamental en la teora at
omica de Bohr. Adem as la suma de las distancias apsidales r1
y r2 es la longitud del eje mayor. Como en los puntos ri que determinan las apsides la velocidad radial es por
definici
on nula, la conservaci
on de la energa nos dice que
1 k l2
E = V (ri ) + mv2 = + ; i = 1, 2
2 ri 2mri2
por tanto, las distancias apsidales corresponden a las races de la siguiente ecuaci
on
l2 k
E + = 0
2mri2 ri
k l2
ri2 + ri = 0
E 2mE
en una ecuacion cuadr atica, la suma de las races es el cociente entre el coeficiente del termino lineal sobre el
coeficiente del termino cuadratico cambiado de signo. Por lo tanto el semieje mayor viene dado por
r1 + r2 k
a= = (10.78)
2 2E
y el semieje mayor solo depende de la energa como se anticip o. En el lmite de circularidad la Ec. (10.78)
coincide con (10.75). Despejando la energa en (10.78) y reemplazando en (10.74), se obtiene la excentricidad
de la elipse en funci
on del semieje mayor r
l2
= 1 (10.79)
mka
la cual se puede despejar en la forma
l2 
= a 1 2 (10.80)
mk
con lo cual la ecuaci
on de la
orbita (10.68) cuando esta es elptica se puede reescribir en la forma

a 1 2
r= (10.81)
1 + cos ( )
de la Ec. (10.81) se encuentra que las dos distancias apsidales (correspondientes a igual a cero y ) son
iguales a a (1 ) lo cual es consistente con las propiedades de la elipse.

10.12. Movimiento en el tiempo en el problema de Kepler


La relacion entre las coordenadas y el tiempo es mucho m as complicada de obtener que la ecuaci on de la
rbita. Las Ecs. (10.20, 10.23) nos dan en principio la relaci
o on entre la distancia radial y el tiempo y la posici
on
angular y el tiempo, que para el potencial (10.67) toman la forma
Z r Z r
dr dr
t = q = r   (10.82)
r0 2 r0
(E V ) 2 k l2
m E + r 2mr 2
m ef f

Z t
l dt
= 0 + 2
(10.83)
m t0 r (t)
sin embargo, la expresi
on (10.83) tiene la desventaja de requerir la integracion previa de (10.82) y la inversi
on
de la relaci
on obtenida para encontrar r (t). Por esta raz on, es m as f
acil encontrar la relaci
on entre y el
tiempo usando la Ec. (10.10) de conservaci on del momento angular.

d mr 2
mr 2 = l dt = d (10.84)
dt l
10.12. MOVIMIENTO EN EL TIEMPO EN EL PROBLEMA DE KEPLER 205

combinando esta ecuaci


on con la ecuaci
on de
orbita (10.68) resulta
h i2
l2 1
m mk 1+ cos( ) ml4 d
dt = d dt =
l lm2 k2 [1 + cos ( )]2
Z
l3 d
t= (10.85)
mk2 0 [1 + cos ( )]2
aunque esta integral se puede escribir en forma cerrada, la forma funcional es muy compleja y su inversi
on
para obtener las coordenadas en funcion del tiempo es un problema colosal.

10.12.1. Dependencia temporal en el caso parab


olico
Ilustraremos entonces un caso m as simple reduciendo nuestra atenci
on al movimiento parab olico ( = 1). Es
usual medir el
angulo polar a partir del radio vector en el punto de mayor acercamiento conocido como perihe-
lio o periapsis. Este convenio implica hacer nulo en la ecuaci on de
orbita (10.68). Correspondientemente
el tiempo se comienza a medir a partir del paso por el perihelio. Usando la identidad


1 + cos = 2 cos2
2
la ecuaci
on (10.85) aplicada a una secci olica ( = 1) con = 0 nos da
on parab
Z Z Z
l3 d l3 d l3
t = 2 =   2 = sec4 d
mk2 0 [1 + cos ]
2
mk 0 2 cos2 2
4mk 0 2
2
Z  
l3
t = 2
1 + tan2 sec2 d
4mk 0 2 2
1
usando el cambio de variable x = tan (/2), dx = 2 sec2 2 d
Z x Z tan(/2)
l3 2
 l3 
t= 1+x dx = 1 + x2 dx
2mk2 0 2mk2 0

que se puede integrar para obtener  


l3 1 3
t= tan + tan
2mk2 2 3 2
a
un la inversi
on de esta ecuaci
on implica resolver una c
ubica para tan (/2), para luego hallar el arcotangente
respectivo. La distancia radial en ese instante se encuentra mediante la ecuaci
on orbital.

10.12.2. Dependencia temporal para el movimiento elptico


Para el movimiento elptico la integraci
on se realiza de manera m as conveniente mediante una variable
auxiliar conocida como anomala exc entrica, definida por la relaci
on

r = a (1 cos ) (10.86)

al comparar con la Ec. (10.81) para la


orbita, queda claro que tambien cubre el intervalo entre 0 y 2 cuando
recorre una revoluci
on completa, adem as = 0 en el perihelio al igual que (por convenio), as mismo en
el afelio = = . A partir de las Ecs. (10.78, 10.79) podemos expresar a E y l en funci on de a, , y k

k l2 
E= ; 2 = 1 l2 = mka 1 2
2a mka
206 CAPITULO 10. FUERZAS CENTRALES

estos reemplazos tienen la ventaja de que a y son variables m as geometricas y por tanto m as observables
astronomicamente. Reemplazando estas expresiones en la Ec. (10.82) para movimiento elptico resulta
Z r Z r
dr dr
t = r   = r  
r0 mka(1 )2 r0 a(12 )
2 k k 2k r2
m 2a + r 2mr 2 mr 2
2a + r 2
r Z r
m r dr
t = q (10.87)
2k r0 2)
r2
r 2a a(1
2

por convenci
on r0 es la distancia al perihelio. La introducci
on de la anomala excentrica (10.86)

r = a (1 cos ) ; dr = a sin d

reduce la integral (10.87) a una forma m as simple:


r Z
m a (1 cos ) (a sin d)
t = q
2k 0 2 2)
a (1 cos ) [a(12acos )] a(12
r Z
m a2 (1 cos ) sin d
t = q
2k 0 2 +2 cos2 ) 2)
a (1 cos ) a (12 cos2a a(1
2
r Z
ma4 (1 cos ) sin d
t = pap
2k 0 2 2 (1 cos ) (1 2 cos + 2 cos2 ) (1 2 )
r Z
2ma4 (1 cos ) sin d
t = p
2ka 0 2 2 cos 1 + 2 cos 2 cos2 1 + 2
r Z r Z
ma3 (1 cos ) sin d ma3 (1 cos ) sin d
t = p = p
k 0 2 2 cos2 k 0 sin2
r Z
ma3
t= (1 cos ) d (10.88)
k 0
primero podemos observar que esta ecuaci on nos permite obtener una expresion para el periodo del movi-
miento elptico, si extendemos las integral a todo el dominio de entre 0 y 2
r
3/2 m
= 2a (10.89)
k
este resultado tambien se puede obtener a traves de las propiedades de la elipse. Ya hemos visto que la
conservaci
on del momento angular conduce a que la velocidad aerolar es constante y viene dada por
dA 1 l
= r 2 =
dt 2 2m
si integramos sobre un periodo completo, se obtiene el
area total, la cual para una elipse viene dada por ab,
siendo b el semieje menor. Z
dA l
dt = AT = = ab (10.90)
0 dt 2m
el semieje menor viene dado por p
b = a 1 2 (10.91)
por otro lado, la relaci
on (10.79) nos permite escribir el semieje menor en la forma
r
al2
b=
mk
10.12. MOVIMIENTO EN EL TIEMPO EN EL PROBLEMA DE KEPLER 207

y sustituyendo esta expresi


on en (10.90) resulta
r r
l al2 3/2 m
= a = 2a
2m mk k
en consistencia con (10.89). Estas expresiones coinciden con la tercera ley de Kepler, la cual se puede enunciar
de la siguiente manera: los cuadrados de los periodos de los distintos planetas son proporcionales a los cubos
de sus ejes mayores. No obstante, esta ley es solo aproximadamente cierta dado que debemos recordar que el
movimiento de un planeta alrededor del sol, es un problema de dos cuerpos y la masa que aparece aqu equivale
a la masa reducida del sistema
m1 m2
=
m1 + m2
por convencion tomaremos a m1 como la masa de un planeta y a m2 como la masa del sol. La fuerza gravitatoria
de atracci
on se escribe
Gm1 m2 k
f = 2
= 2 ; k Gm1 m2
r r
y la Ec. (10.89) queda de la forma
r s
m1 m2
m1 +m2
= 2a3/2 = 2a3/2
k Gm1 m2
2a3/2 2a3/2
= p =
G (m1 + m2 ) Gm2

notese que la constante de proporcionalidad es diferente para cada planeta, pero si despreciamos la masa del
planeta respecto a la del sol, la constante ser
a la misma para todos los planetas. En las orbitas del
atomo de
Bohr esta constante de proporcionalidad es la misma ya que todos los electrones poseen la misma masa y carga
(es decir igual valor de la masa reducida y de k).
Volviendo al problema general de la posici on en el tiempo para una orbita elptica, escribamos (10.88)
introduciendo la frecuencia de revolucion en la forma
r
2 k
= =
ma3
donde hemos usado (10.89). La integral de (10.88) se calcula f
acilmente y se obtiene

t = sin (10.92)

esta relaci
on es conocida como ecuaci on de Kepler. La cantidad t barre el dominio entre 0 y 2 junto con y
, en el curso de una revolucion completa, raz on por la cual tambien se le llama una anomala, mas exactamente
anomala media.
Para hallar la posici on en la
orbita en un tiempo t, se debera en primer lugar invertir la ecuaci on de
Kepler (10.92) de tal manera que se obtiene la anomala excentrica en funci on del tiempo. Esta ultima se
reemplaza entonces en (10.86) que es la ecuaci on que define la anomala excentrica, con ello obtenemos r (t).
Por otro lado, el angulo polar se puede expresar en funci on de por comparaci on de (10.86) con la ecuaci
on
orbita elptica (10.81), donde tomaremos por simplicidad = 0
de la

a 1 2 1 2
= a (1 cos ) 1 + cos =
1 + cos 1 cos
1 2 1 2
1 (1 cos ) ( + cos )
cos = = =
(1 cos ) (1 cos ) (1 cos )
de modo que esta ecuaci
on se puede escribir como
cos
cos = (10.93)
1 cos
208 CAPITULO 10. FUERZAS CENTRALES

tenemos a partir de (10.93) que


cos 1 cos cos +
1 cos = 1 =
1 cos 1 cos
(1 cos ) + (1 cos ) (1 cos ) (1 + )
1 cos = =
1 cos 1 cos
similarmente
cos 1 cos + cos
1 + cos = 1 + =
1 cos 1 cos
(1 + cos ) (1 + cos ) (1 + cos ) (1 )
1 + cos = =
1 cos 1 cos
por tanto
1 cos (1 cos ) (1 + )
=
1 + cos (1 + cos ) (1 )
y usando la identidad
1 cos
= tan2
1 + cos 2
tenemos que
(1 + )
tan2 = tan2
2 (1 ) 2
quedando finalmente r
1+
tan = tan (10.94)
2 1 2
la ecuaci
on (10.94) nos da como funci
on de . Para encontrar en funci
on del tiempo, es necesario invertir
la ecuaci
on de Kepler (10.92). La soluci
on de esta ecuaci
on ha sido tema de amplio estudio (ver Goldstein
second ed).

10.13. Vector de Laplace-Runge-Lenz


A continuacion veremos que en el problema de Kepler existe un vector conservado adem
as del momento
angular. La segunda ley de Newton para fuerzas centrales se puede escribir como
r
p = f (r) ur = f (r) (10.95)
r
teniendo en cuenta (10.95), desarrollemos la cantidad
h ri f (r) mf (r)
p L = f (r) (r p) = r (r mr) = [r (r r )]
r r r
mf (r)  
p L = r (r r ) r 2 r (10.96)
r
donde hemos usado la identidad
a (b c) = (a c) b (a b) c
podemos simplificar la ecuaci
on (10.96) teniendo en cuenta la identidad
1 d 1 d
r r = (r r) = (rr) = r r
2 dt 2 dt
o visto de otra forma
r r = rur r = rur (vr ur + v u ) = rvr = r r
10.13. VECTOR DE LAPLACE-RUNGE-LENZ 209

de modo que  
mf (r)  2
 2 rr r
p L = r r = mf (r) [rr r r ] = mf (r) r
r (r r)
r r2 r
Teniendo en cuenta esta identidad y el hecho de que L es constante se tiene que
 
d r rr d r
(p L) = p L = mf (r) r 2 2 = mf (r) r 2
dt r r dt r
d dur
(p L) = mf (r) r 2 (10.97)
dt dt
hasta aqu podemos llegar para una expresi
on general de la fuerza central. Ahora tomando una fuerza atractiva
proporcional al inverso al cuadrado de la distancia f (r) = k/r 2 , la integraci
on resulta inmediata, ya que la
Ec. (10.97) se convierte en

d d d
(p L) = (mkur ) (p L mkur ) = 0
dt dt dt
que nos dice que en el problema de Kepler hay un vector conservado A definido por

A p L mkur (10.98)

conocido como vector de Laplace Runge Lenz. Dado que L = luz , la definici
on de A nos muestra que

AL=0 (10.99)

esta ortogonalidad implica que A es un vector fijo que yace en el plano de movimiento. Si llamamos el
angulo
que hace r con el vector fijo A, el producto escalar de estos dos vectores ser
a

A r = Ar cos = (p L) r mkr (10.100)

permutando terminos en el producto mixto

r (p L) = L (r p) = l2

con lo que la Ec. (10.100) queda en la forma

Ar cos = l2 mkr (A cos + mk) r = l2

o alternativamente  
1 mk A
= 2 1+ cos (10.101)
r l mk
vemos entonces que el vector de L-R-L proporciona otra manera de llegar a la ecuaci
on de la orbita en el
problema de Kepler. Comparando (10.101) con la ecuacion de la
orbita en la forma (10.68), se ve que el
modulo de A viene dado por
A = mk (10.102)
es claro por otra parte que = 0 en la Ec. (10.101) corresponde a la direcci on del peri
apside r ( = 0) rm .
Recordando adem as que por definici on es el
angulo entre A y r (seg un la Ec. 10.100), vemos que = 0
indica que A es paralelo a rm . Por tanto, A tiene la direcci on del radio vector que corresponde al periapsis o
perihelio de la orbita.
Hemos identificado en consecuencia dos vectores y un escalar que se conservan (L, A, E) para un total
de siete cantidades conservadas. Por otro lado, el sistema requiere de seis constantes de movimiento que
corresponden por ejemplo a las tres componentes de la posici on inicial y a las tres componentes de la velocidad
inicial de la partcula. N
otese por otro lado, que todas las constantes que aparecen en el conjunto (L, A, E) son
funciones algebraicas de r y p que describen la orbita en su conjunto (orientaci on en el espacio, excentricidad
210 CAPITULO 10. FUERZAS CENTRALES

etc.), ninguna de las siete cantidades se refiere a la localizaci


on de la partcula en el instante inicial. Como
una de las constantes de movimiento debe referirse a esta informaci on, por ejemplo en forma del tiempo de
paso T de la partcula por el perihelio, solo podra haber cinco cantidades de movimiento independientes en
el conjunto (L, A, E) que describan el tama no, forma y orientacion de la orbita. Es necesario entonces que
existan dos relaciones entre las cantidades L, A y E. La primera viene dada por la relaci on de ortogonalidad
entre L y A, Ec. (10.99). La otra se deduce de la Ec. (10.102) cuando se escribe la excentricidad en terminos
de E y l, Ec. (10.74)
r
2El2
A = mk 1 + A2 = m2 k2 + 2mEl2 (10.103)
mk2
confirmando que solo hay cinco cantidades independientes entre las siete descritas por el conjunto (L, A, E).
Dado que el momento angular y la energa proveen cuatro cantidades independientes, el vector de L-R-L
nos da una m as. Es entonces natural preguntarse si para una fuerza central arbitraria existe una cantidad
conservada an aloga al vector de L-R-L que junto con L y E nos sirvan para definir la orbita. Parece ser que
s se pueden construr cantidades de este tipo pero en general no son funciones muy simples del movimiento (D.
M. Fradkin, Progress of Theoretical Physics 37, 798, mayo 1967). Las constantes de movimiento relacionadas
con la orbita definen la forma funcional r (), hemos visto que en general las fuerzas centrales conducen a
orbitas no cerradas, como se ve en el teorema de Bertrand. Es una caracterstica general de las
orbitas no
cerradas el hecho de que la curva llegar a a pasar por un punto (r, ) arbitrario que este entre las cotas de los
puntos de retorno de r. Podemos verlo heursticamente teniendo en cuenta que si la orbita no es cerrada, al
variar a lo largo de todo un ciclo la partcula no deber a recorrer de nuevo sus pasos sobre ninguna orbita
anterior. En consecuencia la orbita es tal que r es funcion multiforme de (m odulo 2), en realidad es una
funci on infinitiforme de . La cantidad conservada adicional a L y a E que define la orbita debera entonces
contener una funci on infinitiforme del movimiento de la partcula. Solo en el caso de orbitas cerradas o m as
generalmente cuando el movimiento sea degenerado, como en el problema de Kepler, se puede esperar que la
cantidad conservada adicional sea una funci on sencilla de r y p tal como el vector de L-R-L.
Es interesante ver el aporte geometrico de cada constante de movimiento, dos grados de libertad de L
determinan el plano de movimiento, Los valores de E y l determinan el tama no y forma de la elipse, finalmente
el vector de L-R-L determina la orientaci on de la elipse en el plano de movimiento. N otese que una elipse solo
requiere un par ametro angular para ser orientada dentro de un plano, lo cual coincide con el hecho de que el
vector L-R-L solo contribuye con un par ametro16 .
A la luz del teorema de Bertrand, es de esperarse que en el caso de una ley de fuerza central tipo Hooke,
encontremos una cantidad conservada semejante al vector de L-R-L, puesto que en este caso las orbitas tambien
son degeneradas. Tal cantidad existe pero la manera m as natural de definirla es con un tensor de segundo rango.
De esta forma la existencia de una constante de movimiento adicional a E, L y relacionada con la orbita que
sea funci on algebraica simple del movimiento, es suficiente para indicar que el movimiento es degenerado y
que las orbitas acotadas son cerradas.

10.14. Parametrizaci
on de las
orbitas keplerianas en el espacio
Aunque matem aticamente es posible determinar la orbita en el espacio usando cantidades como E, L y
A. Es m as conveniente parametrizar la orbita con cantidades m as geometricas. Hemos visto que en el espacio
tridimensional que es un problema de tres grados de libertad, se requieren seis condiciones iniciales (por ejemplo
qi , qi para las tres coordenadas generalizadas), para resolver completamente la din amica. Ya hemos observado
que para el problema de fuerzas centrales es m as conveniente tomar las seis constantes de modo que cinco
de ellas sean funciones de las coordenadas y momentos que describen la orbita en el espacio y solo la u
ltima
16
Estrictamente un plano requiere para su determinaci on un vector normal a el y un punto por donde pasa, igualmente la
ubicacion de la elipse dentro del plano requiere adem
as de su forma, tamano y orientaci
on, conocer dos puntos por donde pasa o un
punto por donde pasa con su velocidad. Aqu son indispensables la posici on y velocidad inicial. N
otese sin embargo, que cambiar
la posici
on inicial con las mismas cinco constantes de movimiento, implica que la elipse sufre una traslacion paralela con lo cual es
obvio que las caractersticas del movimiento son identicas.
DE LAS ORBITAS
10.14. PARAMETRIZACION KEPLERIANAS EN EL ESPACIO 211

Figura 10.10: Parametrizaci


on de la
orbita elptica en el espacio para el problema de Kepler.

se refiere a la posici on de la partcula en la orbita en un instante dado (ver secci on 10.13). Para el caso de
la orbita elptica, las cinco constantes que determinan la orbita se pueden tomar de la siguiente forma: dos
constantes tpicamente angulares determinan la orientaci on del plano de movimiento, un par ametro para la
escala de la elipse (por ejemplo el semieje mayor), otro para la forma de la elipse (digamos la excentricidad
o el eje menor), y finalmente un par ametro que especifique la orientaci on de la elipse dentro del plano de la
orbita.

Veamos de forma especfica la manera de determinar la orbita con cinco par ametros de esta naturaleza y
un sexto par ametro que me introduce la dependencia temporal. La Fig. 10.10, muestra un sistema xyz donde
el origen se eligio en el centro de fuerzas, de modo que el plano de movimiento pasa por dicho origen. En el
proceso de determinaci on de la
orbita seguiremos los siguientes pasos: (a) determinaci on del plano de la
orbita,
(b) determinaci on de la escala y forma de la elipse, (c) determinaci on de la orientacion de la elipse en el plano
de movimiento y el sentido en que la partcula recorre la elipse. Estos pasos nos determinan completamente la
orbita, de modo que para determinar la din
amica completa solo se necesita un paso adicional (d) determinaci on
de la dependencia de la posici on de la partcula en la
orbita con el par ametro tiempo.
Para realizar el paso (a), observemos que el vector unitario n especifica el plano de movimiento, podramos
en consecuencia pensar en utilizar los angulos que definen a este vector unitario como los parametros que
definen la orientaci on de este plano. Resulta no obstante, m as practico definir la direcci
on de este plano en la
forma siguiente: La intersecci on del plano xy con el plano orbital se llama lnea de nodos. Si determinamos
la direcci
on de la lnea de nodos, lo que nos falta para determinar el plano orbital es el angulo diedro entre el
plano xy y el plano de movimiento. Para determinar la direcci on de la lnea de nodos, notemos que en dicha
lnea hay dos puntos que corresponden a la intersecci on de la orbita elptica con el plano xy. El punto en el
cual la partcula pasa del hemisferio inferior o hemisferio sur (z < 0) al hemisferio superior o hemisferio norte
(z > 0) se denomina nodo ascendente. La parte punteada de la orbita en la Fig. 10.10 corresponde a la
porcion que est a en el hemisferio sur. La recta ON es un segmento de la lnea de nodos que va del origen al
nodo ascendente. La direcci on de ON en el plano xy (y por tanto la direcci on de la lnea de nodos) puede
determinarse con el angulo que este segmento hace con el eje x conocido como longitud del nodo ascendente
y denotado por . Una vez determinada la direcci on de la lnea nodal a traves de , vemos f acilmente que el
angulo diedro entre el plano de movimiento y el plano xy corresponde justamente a i i.e. el
angulo entre n y
212 CAPITULO 10. FUERZAS CENTRALES

el eje z que usualmente se denomina inclinaci on de la orbita.


El paso (b) se realiza de manera inmediata si conocemos dos de los siguientes tres par ametros: semieje me-
nor, semieje mayor y excentricidad. Usualmente se toman los dos u ltimos, de modo que tpicamente obtenemos
la escala de la elipse con el semieje mayor y la forma de esta con la excentricidad.
Ahora para el paso (c) determinamos la orientaci on de la elipse en el plano de movimiento. Es natural
tomar como referente la orientaci on del peri
apside, la cual se puede obtener a traves del angulo N OC siendo
C el punto de la orbita que corresponde al peri
apside, este angulo se denota por y se denomina argumento
del perihelio (incluso para orbitas no relacionadas con el sol). Este es el angulo entre la lnea nodal (con su
sentido determinado por el nodo ascendente), y la lnea del peri apside. Notese que la determinacion del nodo
ascendente ya nos determina el sentido en el cual la partcula recorre la elipse.
Finalmente, para el paso (d) de determinar la dependencia de la posici on de la partcula con el par
ametro
tiempo, podemos determinar por ejemplo la posici on angular inicial de la partcula, digamos con respecto al
periapside. Sin embargo, un par ametro m as utilizado es el tiempo T para el cual la partcula pasa por el
periapside. Es decir el tiempo que le toma a la partcula en ir desde su posici on inicial en t = 0 hasta el
periapside.
En sntesis, la din
amica completa de movimiento se determina con los siguientes par ametros

i , , a, , , T (10.104)

los dos primeros par ametros definen la orientaci


on del plano por medio de la orientaci
on de la lnea de nodos
(), y el angulo diedro i entre el plano orbital y el plano xy. El semieje mayor a define la escala de la
elipse, y la excentricidad define la forma de esta. El angulo determina la direccion de la elipse en el
plano de movimiento tomando como referente la lnea del peri apside. El sentido del movimiento lo determina
la localizaci
on del nodo ascendente. Finalmente, el par ametro T define la dependencia de la posici on de la
partcula en la
orbita en funci
on del tiempo.

10.15. Problema de Kepler en variables acci


on
angulo (revisado)
En la secci
on 9.11 vimos la reducci
on a cuadraturas del problema de Kepler con el formalismo de variables
acci
on
angulo, comenzando con un problema tridimensional en coordenadas esfericas. Para entonces solo nos
interesaba indicar la soluci
on formal. En esta secci on nos ocuparemos de mostrar algunos detalles adicionales
que se pueden observar para el problema de Kepler en variables acci on
angulo, aprovechando adem as el
conocimiento adicional que hemos obtenido en este captulo. Por simplicidad usaremos desde el principio el
hecho de que el movimiento corresponde a una orbita bidimensional cerrada. La integral de J se puede calcular
teniendo en cuenta que cuando la definici on de las coordenadas generalizadas no involucra explcitamente al
tiempo, se tiene que
pi qi = 2L2 = 2T
la energa cinetica se puede expresar en coordenadas esfericas (r, , ) o en coordenadas polares planas (r, ),
si tenemos en cuenta la naturaleza bidimensional del movimiento

2T = pr r + p + p = pr r + p (10.105)

es claro que p = l es el m
odulo del momento angular. La definici
on de J queda
I I I
J p d = p d p d

y dado que las frecuencias de y son iguales, y varian en 2 cuando realiza un ciclo completo de
libraci
on, de modo que las integrales se simplifican en la forma

J = 2 (p p ) = 2 ( )
ANGULO
10.15. PROBLEMA DE KEPLER EN VARIABLES ACCION (REVISADO) 213

que concuerda con la Ec. (9.121). Ahora bien, para calcular Jr resulta u til tener en cuenta la completa
degeneraci
on entre las frecuencias en r, y . La completa degeneracion nos permitio escribir el Hamiltoniano
en funci
on de un solo J como se ve en las Ecs. (9.124, 9.125), aqu omitiremos la notaci on primada de estas
ecuaciones. La dependencia de H con este J u nico se puede obtener de (10.105). El teorema del virial aplicado
al problema de Kepler Ec. (10.38), nos dice que

V = 2T

de modo que el Hamiltoniano se escribe como

H = E = T + V = T (10.106)

de modo que integrando la Ec. (10.105) en el tiempo sobre un periodo se tiene que

2T
= Jr + J + J = J3 (10.107)
v3

donde v3 es la frecuencia degenerada del movimiento. Combinando las Ecs. (10.106, 10.107) y teniendo en
cuenta (9.90) resulta
2 v3 1 dH
= =
J3 H H dJ3
esta ecuaci
on diferencial tiene soluci
on inmediata
D
H= (10.108)
J32

D es una contante que no puede contener ning un J y por tanto solo depende de m y k. Podemos clacular D
usando una trayectoria circular de radio r0 para la cual Jr = 0, J3 = 2p, por medio del teorema del virial
puede verse que en esta caso el Hamiltoniano queda
k
H=E= (10.109)
2r0
Para potenciales keplerianos la condici
on de circularidad descrita por la Ec. (10.48) se puede escribir en la
forma
k p2 J3
2 = 3 = 2 3 (10.110)
r0 mr0 4 mr0
eliminando r0 entre las Ecs. (10.109, 10.110) resulta

2 2 mk2
H=
J32

aunque esta relacion la hemos encontrado para orbitas circulares, la Ec. (10.108), nos dice que tambien debe
ser v
alido para cualquier orbita cerrada kepleriana. Esta relaci on coincide adem as con (9.125). Vemos que
hemos evaluado H (J) sin calcular las integrales cicuitales, usando la degeneraci on completa de las frecuencias
de movimiento.
El tratamiento del problema de Kepler en variables acci on angulo nos permitir a escribir las cinco constantes
que determinan la orbita en una parametrizaci on diferente a la establecida en la secci on 10.14, Ec. (10.104).
Para nuestro caso, tres constantes est
an asociadas a las variables de acci
on J1 , J2 , J3 , en tanto que las otras dos
constantes estaran asociadas a w1 y w2 ya que sus frecuencias correspondientes son nulas. En consecuencia,
debe ser posible relacionar las cinco primeras constantes en (10.104) con las cinco constantes J1 , J2 , J3 , w1 , w2
generadas por las variables accion
angulo (la variable temporal se deja intacta). Combinando las Ecs. (9.124,
9.121) se observa que
J2 = 2 2l (10.111)
214 CAPITULO 10. FUERZAS CENTRALES

y usando la Ec. (9.120) se tiene que


J1
cos i =
J2
ahora bien, puesto que el semieje mayor solo es funci on de la energa seg
un (10.78), este vendr
a dado directa-
mente en funcion de J3
k J2
a= = 23
2E 4 mk
la ecuaci
on (10.79) para la excentricidad se puede escribir en funcion de J2
r s  2
J22 J2
= 1 2 = 1
4 mka J3

falta la identificaci
on de w1 y w2 con los elementos clasicos de
orbita (10.104). Es claro que w1 y w2 deben
contener a y las cuales no est
an contenidas en los J s. Veremos que para una elecci on adecuada de las
constantes de integracion aditivas w1 y w2 ser
an proporcionales a y .
Veamos el caso de w1 , la ecuaci
on (9.113) define a w1 en terminos de la funci
on generatriz W

W
w1 =
J1
podemos combinar las consideraciones que nos llevaron a las ecuaciones (9.15, 9.57) para escribir
Z Z Z
W = p d + p d + pr dr (10.112)

Cuando calculamos Jr vimos que el termino radial pr del momento no contiene a J1 sino solo a J3 por intermedio
de E as como a la combiancion J + J = J2 , de manera que en la derivada con respecto a J1 solo interviene
las dos primeras integrales. Usando (9.117) se tiene
J1
p = = (10.113)
2
aplicando las Ecs. (10.111, 10.113) en la Ec. (9.60) resulta
s s
 2 2 2
W 1 J2
+ 2 = 2 p = 2 2 = J22 12
sin sin 2 sin

para relacionar w1 con el nodo ascendente debe tomarse el signo negativo de la raz cuadrada, ya que cuando
la partcula pasa por el nodo ascendente est a disminuyendo de mod que el momento angular asociado
sera negativo. Observese que cuando calculamos J no tuvimos que preocuparnos por la elecci on del signo, ya
que al efectuar un ciclo completo los dos signos aparecen cada uno en un semiciclo. La variable angular w1
esta dada por
Z Z
J1 d cos i d
w1 = + 2
p = + 2

2 2 2 2
sin J2 J1 csc 2 2 2 sin 1 cos2 i csc2
Z
cot i csc2 i d
2w1 = + p =
1 cot2 i cot2
realizamos el cambio de variable

sin u = cot i cot ; cos u du = cot i csc2 d (10.114)

con lo cual obtenemos


2w1 = u
ANGULO
10.15. PROBLEMA DE KEPLER EN VARIABLES ACCION (REVISADO) 215

Figura 10.11: Variables angulares para el posicionamiento de la


orbita que aparecen en el problema de Kepler,
cuando se usa el formalismo de variables accion angulo.

el angulo es el acimut de la proyecci on sobre el plano xy con respecto al eje x. La Ec. (10.114), nos da la
relacion entre u y el
angulo . Es posible encontrar la interpretaci on de u aplicando trigonometra esferica al
tri
angulo esferico definido por la lnea de nodos, el radio vector y la proyecci
on del radio vector sobre el plano
xy. Resulta m as simple sin embargo, realizar algunas manipulaciones con la trigonometra plana. En la Fig.
10.11 la recta ON define la lnea de nodos, OR es la posici on del radio vector en un instante dado y OP es
la proyeccion del radio vector sobre el plano xy. Definiremos a como el angulo azimutal i.e. entre el eje x
y la proyeccion OP . Vamos a demostrar que u es el angulo entre la proyecci on de radio vector y la lnea de
nodos i.e. entre OP y ON . Para ello imaginemos un palno normal al plano xy y a la lnea de nodos y que
corte al radio vector a una distancia del origen O igual a la unidad. Los puntos de intersecci on ABC con la
tres rectas que concurren en el origen definen junto con el origen cuatro tri angulos rect
angulos. Puesto que
por construcci on OB tiene longitud unidad se tiene que

BC = cos AC = cos cot i

por otro lado


OC = sin AC = sin sin u
de lo cual se concluye que
sin u = cot i cot
que coincide con la Ec. (10.114) con lo cual vemos que u en dicha ecuaci on es el
angulo indicado en la Fig.
10.11. Es clara tambien de dicha figura que u = de lo cual se obtiene

2w1 = (10.115)

un procedimiento similar se puede realizar para encontrar la interpretaci on fsica de w2 . De las integrales que
aparecen en (10.112), las correspondientes a y r contienen a J2 y por tanto intervienen en el c alculo de w2 .
A partir de W/J2 se puede calcular la integral asociada a con una sustituci on trigonometrica similar a la
utilizada para calcular w1 . La integral asociada a r se puede calcular de varias formas, la m as directa es usando
la ecuacion de la
orbita que da r en terminos del
angulo polar en el plano orbital. Eligiendo adecuadamente el
lmite inferior de integraci
on que es arbitrario se puede encontrar que 2w2 est a dado por la diferencia entre
dos angulos que est an en el plano de la
orbita, uno de ellos es el
angulo entre el radio vector y la lnea de
216 CAPITULO 10. FUERZAS CENTRALES

nodos y el otro es el
angulo entre la lnea de nodos y la lnea del peri
apside (ver Figs. 10.10 y 10.11), con lo
cual se obtiene
2w2 = (10.116)

donde es el argumento del perihelio como se aprecia en la Fig. 10.10.


Si bien el metodo de las variables acci
on angulo no es el m
as ventajoso para trabajar el problema de Kepler,
veremos que las variables acci on
angulo constituyen una parametrizaci on muy adecuada para el tratamiento
de la teora canonica de perturbaciones en elproblema de Kepler. En el lenguaje de la mec anica celeste, a la
variables accion angulo en el problema de Kepler se les conoce como variable de Delauney si bien en algunas
convenciones las variables de Delauney difieren de las acci on
angulo por constantes multiplicativas.
????????????????????
????????????????????

10.16. Dispersi
on en un campo de fuerzas centrales
Historicamente las fuerzas centrales surgen para estudiar el movimiento planetario, no obstante hay muchos
escenarios en donde dichas fuerzas son importantes, un ejemplo notable lo constituye el atomo de Bohr. No
obstante, si pretendemos trabajar fsica microsc opica las correcciones cu anticas pueden ser importantes. Sin
embargo, el lenguaje as como muchos aspectos fenomenol ogicos suelen ser similares en mec anica clasica y en
mec anica cuantica.
En general, si conocemos la forma de la interaccion es posible predecir la forma de la orbita y su dependencia
con el par ametro tiempo. Sin embargo, es usual en la b usqueda de nueva fsica realizar experimentos de
dispersion que consisten en enviar proyectiles a un blanco que interact ua con estos y observar la deflexi on en
la trayectoria de los proyectiles, en este caso lo que se pretende es determinar experimentalmente la forma de
la
orbita para deducir la forma (desconocida) de la interacci on.
Motivados por la anterior discusi on, en esta secci
on trabajaremos la desviaci on de un haz de partculas
por un centro de fuerzas en la formulaci on de un cuerpo, lo cual significa las siguientes simplificaciones: (a) el
centro dispersor es fijo en el espacio de modo que no hace parte de la din amica del sistema, equivalente a que
su masa sea infinita, y (b) se desprecia la interaccion entre las partculas del haz, de modo que cada partcula
incidente solo interactua con el centro dispersor. Consideremos por simplicidad que todas las partculas del haz
poseen las misma masa y energa, estos proyectiles pueden ser electrones, n ucleos, planetas, etc. En general,
consideraremos que este haz uniforme es tal que las partculas vienen de regiones muy lejanas al centro de
fuerzas de modo que su interacci on con el centro de fuerzas se considera despreciable en el tiempo inicial (que
se suele tomar como t ). En consecuencia, las trayectorias incidentes son lneas rectas. Una vez que las
partculas pasan por las vecindades del centro de fuerza (denominada regi on de dispersion o de colision), se
alejan de dicho centro y sus trayectorias vuelven a ser lneas rectas cuando las partculas estan suficientemente
lejos del centro dispersor (usualmente decimos que esto ocurre en t ), pero la direcci on de las partculas
salientes no coincide con la direcci on de las partculas incidentes. La desviaci on de las partculas contiene
informaci on valiosa sobre la naturaleza de la interacci
on.
El haz incidente se caracteriza a traves de su intensidad, es decir, n umero de partculas por unidad de
area por unidad de tiempo que atraviesan una superficie normal a la direcci
on de propagaci on del haz (a esta
cantidad tambien se le conoce con el nombre de densidad de flujo). Debido al cambio de direcci on del haz
cuando ha pasado por el centro de fuerzas, diremos que el haz se ha dispersado o desviado como se puede ver
en la Fig. 10.12. Una cantidad fsicamente u til para estudiar el fenomeno de la dispersi on es la secci
on eficaz
de dispersion en un direccion dada (denotada por () d)

n
umero de partculas dispersadas por unidad de
tiempo en un a ngulo s
olido d
() d = (10.117)
intensidad incidente
donde d es un elemento diferencial de
angulo s
olido en la direcci
on . La cantidad () suele tambien
EN UN CAMPO DE FUERZAS CENTRALES
10.16. DISPERSION 217

Figura 10.12: Dispersi


on de un haz de partculas por un centro de fuerzas repulsivo.

denominarse secci
on eficaz diferencial de dispersi
on. Escribiendo el
angulo s
olido explcitamente resulta

() d = () sin d d (10.118)

Si la fuerza es central debe haber una simetra total con respecto al eje del haz incidente, lo cual nos conduce
a que la seccion eficaz diferencial debe ser independiente del angulo azimutal (i.e. el angulo de rotaci
on
alrededor del eje de simetra). Por esta raz
on se puede hacer una integraci on parcial del
angulo solido. Como
no depende de es decir posee simetra azimuthal, tenemos que la integraci on en se puede realizar para
obtener
Z 2

() d = () sin d d () d = () sin d d
0
= 2 () sin d
() d (10.119)

de modo que podemos definir el diferencial de


angulo s
olido en la forma
= 2 sin d
d (10.120)

es el angulo que hacen la direcci on desviada e incidente y se denomina angulo de dispersi


on. El termino
secci
on eficaz se debe a que () tiene dimensiones de area. Cuando tenemos una fuerza central y por tanto
simetra azimutal, podemos trabajar con el angulo solido d dado por (10.120) que corresponde al anillo
sombreado sobre la superficie esferica en la Fig. (10.12), en lugar del angulo solido d = sin d d. De
aqu en adelante, volveremos a la notaci on d sobreentendiendo que nos referimos al angulo s
olido dado en
(10.120).
Es importante mencionar que lo que se puede medir experimentalmente es la integral de la Ec. (10.118) o
de la Ec. (10.119) sobre una cierta porci on finita de
angulo s
olido, ya que en la realidad solo podemos calcular
angulos de dispersi
on y contar las partculas que se dispersan dentro de cierto rango finito de esos angulos de
dispersion.
Tomaremos el origen de nuestro sistema coordenado en el centro dispersor, el eje X ir a paralelo a la
velocidad del haz incidente y en el mismo sentido del haz. El angulo de una determinada posicion r se mide
con respecto al eje X positivo de modo que para las partculas incidentes (cuando t ) se tiene que
r y = . Para una partcula dada, asumiendo que conocemos su plano de movimiento y teniendo en
cuenta que su posici on inicial est
a dada por r y = , tenemos que las constantes de la orbita y por
tanto la dispersion, est
an determinadas por E y l. Conviene expresar el momento angular en funci on de la
energa y de una cantidad s denominada par ametro de impacto que es la distancia entre las rectas paralelas a
la velocidad del proyectil, que pasan por el proyectil y el centro de fuerza respectivamente (ver Fig. 10.12). Si
v0 es la rapidez incidente de la partcula se tiene que
s  
1
l = rp sin ( ) = r sin mv0 = mv0 s = s 2m mv02 = s 2mE (10.121)
2
218 CAPITULO 10. FUERZAS CENTRALES

donde es el angulo entre el vector posici


on incidente y la lnea paralela a la direccion de incidencia que pasa
por el centro dispersor. En esta expresi on hemos tenido en cuenta que la partcula incidente est a muy lejos
del centro de fuerza, de modo que su energa es puramente cinetica. Una vez fijados E y s queda determinado
unvocamente el angulo de dispersion 17 . Las partculas cuyo par ametro de impacto est a entre s y s + ds
deben cruzar la superficie del anillo con radio interno s y radio externo s + ds ilustrado en la Fig. 10.12, el
area de este anillo es 2s |ds|. Ahora bien, el n
umero de partculas por unidad de tiempo que pasan por dicho
anillo es igual a la intensidad incidente I multiplicada por el area del anillo es decir

dN
= 2Is |ds| (10.122)
dt anillo ds

por otro lado, el numero de partculas por unidad de tiempo que se dispersan en el
angulo s
olido d (regi
on
sombreada sobre la superficie esferica en la Fig 10.12) se puede calcular teniendo en cuenta la definici on
(10.117), de la cual se ve que corresponde simplemente a I () d, teniendo en cuenta (10.119) el numero
de partculas por unidad de tiempo que se dispersa en un angulo solido d es

dN
= 2 () I sin |d| (10.123)
dt angulo solido d

Supondremos de momento que partculas con diferente par ametro de impacto no pueden llegar al mismo angulo
de dispersi
on. En tal caso, el numero de partculas dispersadas por el
angulo s
olido d comprendido entre y
+ d deber a ser igual al n
umero de partculas incidentes con parametro de impacto comprendido entre los
valores s y s + ds. Por tanto en este caso las cantidades definidas en (10.122, 10.123) son iguales y se obtiene

2Is |ds| = 2 () I sin |d| (10.124)

los valores absolutos se introducen para asegurar que el n


umero de partculas sea positivo, ya que a menudo s
y varan en sentidos opuestos. Si consideramos a s como funci
on de la energa y el
angulo de dispersi
on

s = s (, E)

y despejando () en (10.124), la dependencia entre la seccion eficaz diferencial y vendr


a dada por

s ds
() = (10.125)
sin d

a partir de la ecuacion de orbita general (10.44a) se puede obtener directamente una expresi on formal para el
angulo de dispersi
on. Consideraremos por simplicidad una fuerza totalmente repulsiva. Teniendo en cuenta que
la orbita debe ser simetrica respecto a la direcci
on del peri
apside (recordemos que la orbita es simetrica ante
reflexi
on con respecto a las apsides, ver discusi
on de la Ec. 10.43), el
angulo del peri
apside con la direccion
incidente es igual al angulo entre el peri
apside y la direcci
on de dispersi
on (ver Fig. 10.13). En consecuencia,
el
angulo de dispersion viene dado por
= 2 (10.126)
El
angulo se puede obtener de (10.44a) tomando el lmite r0 cuando 0 (direcci on incidente).
Por otro lado, es claro que = cuando r = rm distancia de mayor acercamiento18 . Integrando la
orbita
(10.44a) desde la posici
on incidente hasta el peri
apside con estas consideraciones se tiene
Z rm
dr
= q +
r2 2mE 2mV 1
l 2 l 2 r 2

17
En este punto la mec
anica cuantica si difiere de la cl
asica ya que en la primera no se pueden definir trayectorias sino probabi-
lidades de desviacion en distintas direcciones.
18
Conviene recordar que = (t) es la posicion angular de la partcula en cualquier instante de tiempo, medida desde el eje X
positivo. En cambio es el angulo de dispersi on de la partcula el cual es u
nico para cada partcula que se dispersa.
EN UN CAMPO DE FUERZAS CENTRALES
10.16. DISPERSION 219

Figura 10.13: Ilustraci


on del
angulo entre la direcci
on incidente y la lnea del peri
apside para una dispersi
on
central repulsiva. La simetra de reflexi
on conduce a que este
angulo coincide con el formado por la direcci on
de dispersi
on y el peri
apside.

quedando finalmente
Z
dr
= q (10.127)
2mE 2mV 1
rm r2 l2
l2
r2

y expresando l en funci
on de s Ec. (10.121) queda
Z Z
dr s dr
= q = r 
2mE 2mV s2
rm r2 2mEs2
2mEs2
s2 r 2
rm
r2 1 V
s2
E r2
Z
s dr
= r h i (10.128)
rm V (r)
r r2 1 E s2

de aqu se puede encontrar una expresi


on formal para calcular reemplazando (10.128) en (10.126)
Z
s dr
(s) = 2 r h i (10.129)
rm
r r 2 1 V E(r) s2

o en terminos de u 1/r con du = dr/r 2 = u2 dr


Z 0 Z 0
s dr s u2 dr
(s) = 2 r nh i o =2 rh i
um 1 1 V (1/u) um V (1/u)
u u2
1 E s2 u2 1 E s2 u2
Z 
um s u2 dr
(s) = 2 q
0 V (1/u)
1 E s2 u2

Z um
s du
(s) = 2 q (10.130)
0 V (1/u)
1 E s2 u2

las Ecs. (10.129, 10.130) rara vez se utilizan excepto para el c alculo numerico del
angulo de dispersi
on. Sin
embargo, cuando se dispone de una funci on analtica para la
orbita es frecuente que se pueda encontrar a
en funci
on de s por simple inspecci
on.
220 CAPITULO 10. FUERZAS CENTRALES

10.16.1. Dispersi
on de Rutherford
Es de enfatizar que fue un experimento de dispersi on el que condujo a Rutherford a modelar la distribuci on
de cargas electricas en los atomos. En un experimento cl asico realizado por Rutherford Geiger y Marsden en
1909, se dipersaron partculas alfa (n ucleos de Helio) por una l amina de oro de 104 cm de espesor. El trata-
miento de este problema exige consideraciones estadsticas ya que se trata de muchos proyectiles (partculas
alfa) incidiendo sobre un enorme conjunto de blancos ( atomos de oro) que en primera aproximaci on se pueden
considerar inm oviles. Aqu consideraremos una versi on muy simplificada con un solo blanco inm ovil y un haz
bien colimado, es decir todas las partculas en la misma direcci on. Adicionalmente, despreciamos la interacci on
de las partculas del haz entre s y de las partculas del haz con la nube electr
onica que rodea al n
ucleo inmovil.
Nuestra version simplificada estudia entonces la repulsi on causada por un centro dispersor coulombiano
on entre cargas electricas). El campo de fuerzas dispersor es creado por una carga fija Ze 19 al
(repulsi
ejercerse sobre partculas incidentes de carga Z e, la fuerza viene dada por

ZZ e2
f (r) = ur
r2
es decir una fuerza repulsiva de la forma k/r 2 . Los resultados obtenidos para el problema de Kepler se pueden
usar teniendo en cuenta que k = ZZ e2 en la Ec. (10.67)
Ya que la energa potencial es positiva, la energa total E tambien lo es, y la
orbita ser
a una hiperbola con
excentricidad dada por la Ec. (10.74)
s s  
2El2 2Es 2
= 1+ = 1+ >1 (10.131)
m (ZZ e2 )2 ZZ e2

donde hemos tenido en cuenta la Ec. (10.121). Tomemos = en (10.68) y escribamos la ecuaci on de la
orbita

1 mk m ZZ e2
= 2 [1 + cos ( )] = [1 cos ]
r l l2
y la ecuaci
on de la orbita queda
1 mZZ e2
= ( cos 1) (10.132)
r l2
vemos que al tomar = en (10.68), el peri apside corresponder a a = 0. Por otro lado, la Ec. (10.132)
requiere que cos 1 sea no negativo, el hecho de que > 1 garantiza que existen valores de para los cuales
se cumple esta condici on. No obstante, tal condici on excluye ciertos valores de . Adicionalmente, dado que
el peri
apside esta definiendo el
angulo cero, la direcci
on de la asntota de incidencia (o dispersi
on) queda
determinada por el valor de en el lmite r en (10.132)
1
cos = (10.133)

n
otese que los valores permitidos de yacen justamente en el intervalo (, ) como se puede observar de la
Fig. 10.13 o teniendo en cuenta que si reemplazamos cos = cos () = 1/ en (10.132) se anula el termino
de la derecha lo cual viene de la condici
on r . De acuerdo con la Ec. (10.126)
 
1
cos = cos = sin = = csc 2 1 = csc2 1
2 2 2 2 2

cot2 = 2 1
2
y usando (10.131)
2Es
cot =
2 ZZ e2
19
Se define e como la carga negativa del electr
on de modo que Ze se refiere a una carga positiva. Z se refiere al n
umero at
omico.
EN UN CAMPO DE FUERZAS CENTRALES
10.16. DISPERSION 221

la relaci
on funcional entre el par
ametro de impacto y el
angulo de dispersi
on es

ZZ e2
s= cot (10.134)
2E 2
y utilizando (10.125) se encuentra que () es
   
ZZ e2 1 d ZZ e2
() = cot cot
2E 2 sin d 2E 2
"  2
#
ZZ e2 1 1
2
() = cot
 csc
2E 2
2 sin 2 cos 2 2 2
 2  2
1 ZZ e2 cos 2 csc2 2 1 ZZ e2 csc2 2
() =  =
4 2E sin 2 sin 2 cos 2 4 2E sin2 2

finalmente  2
1 ZZ e2
() = csc4 (10.135)
4 2E 2
La Ec. (10.135) corresponde a la llamada dispersi on de Rutherford quien la dedujo para la dispersi on de
partculas por n
ucleos at
omicos. Es notable el hecho de que en mec
anica cu
antica en el lmite no relativista,
la secci
on eficaz coincide con este resultado cl
asico.

10.16.2. Caractersticas generales de la secci


on eficaz
En Fsica at
omica tiene tambien importancia el concepto de secci
on eficaz total de dispersi
on T definido
por Z Z
T = () d = 2 () sin d (10.136)
4 0
el ultimo paso solo se puede realizar si hay simetra azimutal, lo cual efectivamente ocurre si la fuerza es
central. Sin embargo si intentamos calcular la secci on eficaz total para la dispersi
on coulombiana de Rutherford,
sustituyendo (10.135) en (10.136) obtenemos un resultado divergente. Es f acil ver la raz
on por la cual esto es
as, la secci
on eficaz total es el numero de partculas que por unidad de intensidad incidente se dispersan en
todas direcciones. Ocurre que la interacci on coulombiana es de alcance infinito, las desviaciones muy peque nas
solo tienen lugar para partculas con par ametro de impacto muy grande. Por tanto todas las partculas de un
haz incidente de secci on lateral infinita se desviaran en mayor o menor medida y por tanto deben inclurse en la
secci on eficaz total de dispersion. En consecuencia, la infinitud de la secci on eficaz total en mec anica clasica no
es exclusiva del potencial coulombiano y se extiende a todos los potenciales de alcance infinito independiente
de lo grandes que sean20 . Solo si el potencial presenta un corte de modo que se anula mas all a de cierta
distancia, ser a finita esta seccion eficaz total. Este es el caso del campo coulombiano de un n ucleo, el cual
presenta un corte debido al apantallamiento de la nube electr onica.
En la dispersi on de Rutherford, el angulo de dispersi on es una funci on mon otona suave del par ametro
de impacto s, esto se puede apreciar en la Ec. (10.134), en la cual se ve que al disminuir s desde el infinito
hacia cero el angulo crece mon otonamente a partir de cero, alcanzando el valor de cuando s = 0 lo cual
corresponde a colisi on frontal con el centro de fuerzas que naturalmente obliga a la partcula a recular en la
direci on contraria a la incidencia. No obstante, existen otros potenciales cl asicos cuyo comportamiento requiere
reevaluar la expresi on (10.125), por ejemplo para un potencial repulsivo como el de la figura 10.14a, tal que
el potencial es finito incluso en r 0 y tal que la energa de la partcula es mayor al potencial para todo
valor de r, es f acil ver que la curva de versus s se puede comportar de la forma indicada en la figura 10.14b.
Para p arametros de impacto muy grandes, la partcula permanece todo el tiempo muy lejos del centro de
fuerzas de tal modo que su angulo de dispersi on es muy peque no. Si s = 0 la partcula se dirige en lnea recta
20
En cuantica, todos los potenciales que tienden a cero a grandes distancias m apidamente que 1/r 2 producen un secci
as r on
eficaz total de dispersi
on finita.
222 CAPITULO 10. FUERZAS CENTRALES

Figura 10.14: (a) perfil de un potencial repulsivo que permanece finito en el centro de fuerza. (b) Gr
afica
de s vs para el anterior potencial donde se observa que a cada valor permitido de le corresponde dos
par
ametros de impacto diferentes (excepto para = m ).

directamente al centro de fuerzas y dado que su energa es superior al m aximo valor del potencial, pasar
aa
traves del centro de fuerzas sin deviarse de su curso. Por esta raz on el
angulo de dispersi
on se anula en los
dos extremos de s. Para alg un valor del parametro de impacto el angulo de dispersi
on pasara por un maximo
M . La Fig. 10.14b muestra que para < M existen dos valores de s que corresponden al mismo angulo de
dispersion. Cada uno de ellos contribuye a la secci
on eficaz de dispersi on seg
un un
angulo y por tanto la Ec.
(10.125) se debe modificar en la forma

X si ds
() = (10.137)
sin d i
i

donde el subndice i distingue los distintos valores de s que dan el mismo valor de . A manera de ejemplo,
pensemos que la curva de vs s es tal que = 0 en s = 0, y que adem as posee dos m aximos locales
1 , 3 (1 > 3 ) y un mnimo local 2 tal que s1 < s2 < s3 . En este caso, hay angulos para los cuales hay
cuatro parametros de impacto asociados (2 < < 3 ), otros tienen dos par ametros s asociados (3 < <
1 y < 2 ), cuando = 2 o = 3 hay tres par ametros de impacto asociados, y finalmente cuando
= 1 solo hay uno.
Volviendo al caso descrito por la Fig. 10.14b, resulta de especial interes la secci on eficaz correspondiente al
angulo m
aximo M . Puesto que para este angulo se anula la derivada de con respecto a s, se ve de la Ec.
(10.137) que la seccion eficaz debe diverger cuando M . Pero para todos los valores mayores la secci on
eficaz es nula (para el caso de la Fig. 10.14b, solo hay un m aximo local de modo que ninguna partcula se
dispersa con una angulo mayor a M ). Este fen omeno de la subida infinita de la secci on eficaz seguida de una
desaparicion brusca, es muy semejante a lo que ocurre en la optica geometrica de la dispersi on de la luz solar
por las gotas de lluvia. En virtud de esta semejanza, a este fen omeno se le denomina dispersi on en arco iris.
Cuando el scattering es debido a fuerzas atractivas, pueden surgir otras complicaciones. Por ejemplo, dado
que la partcula es atrada hacia el centro de fuerzas, el angulo entre la direccion incidente y la direcci
on del
periapsis puede ser mayor que /2, con lo cual a traves de la Ec. (10.126) obtenemos un angulo de dispersi
on
negativo. Esto no supone mucho problema en virtud de que lo que importa para medir () es el valor absoluto
de . No obstante, el valor de dicho angulo de acuerdo con la Ec. (10.129) o (10.130), puede ser mayor que
2, lo cual significa que fsicamente la partcula podra dar una o m as vueltas alrededor del centro de fuerzas,
antes de ser lanzada hacia su direcci on asint
otica de dispersion.
Veamos un ejemplo de como puede ocurrir esto fsicamente. En la gr afica 10.15a, se pintan una serie de
potenciales efectivos para un potencial intermolecular (real) tpico. Cada curva pertenece al mismo tipo de
interacci
on pero con una barrera centrfuga diferente, lo cual corresponde a un valor distinto del momento
angular l y por tanto tambien del par ametro de impacto s. Lo m as caracterstico de esta clase de potenciales
intermoleculares reales es que son atractivos a grandes distancias decayendo a un ritmo mayor a 1/r 2 , y
repulsivos con magnitud de fuerza r apidamente creciente a cortas distancias21 . Dado que a grandes distancias
21
Estas son las caractersticas que a grandes rasgos se esperan para que la materia no implosione y al mismo tiempo pueda
formar condensados.
EN UN CAMPO DE FUERZAS CENTRALES
10.16. DISPERSION 223

Figura 10.15: (a) Potenciales efectivos asociados a un potencial intermolecular real tpico, cada valor del
par
ametro de impacto conduce a un potencial efectivo diferente. (b) Gr afica del
angulo de desviaci
on en
funci
on de s, para el potencial anterior con dos valores diferentes de la energa.

el potencial real (atractivo) decae m apido que 1/r 2 la barrera centrfuga que se forma cuando s 6= 0
as r
dominar a a grandes distancias y para valores peque nos de s se formar a un m aximo local, a medida que el
parametro de impacto aumenta la curva tiende a aplanarse y para alg un valor del parametro de impacto
s2 , solo hay un punto de inflexi
on en Vef f para cierto valor de la energa E2 . Finalmente, para par ametros de
impacto a un mayores no aparecen extremos locales ni puntos de inflexi on en el potencial.
Consideremos una partcula con par ametro de impacto s1 y energa E1 correspondiente a la energa en el
maximo local. Recordemos que la distancia entre Vef f y E1 es la energa cinetica radial. Por tanto, cuando
la partcula llega a una distancia r1 del centro de fuerzas la velocidad radial se anula. Recordemos adem as
que cuando la energa coincide con un m aximo local tenemos una orbita circular inestable. En ausencia de
perturbaciones la partcula de energa E1 y parametro de impacto s1 quedar a realizando una orbita circular
de radio r1 de forma indefinida. Si la energa es un poco mayor que E1 la orbita ya no es circular pero su
velocidad radial sera muy peque na en las vecindades de r1 , y la partcula puede permanecer en esta vecindad
un largo tiempo realizando varios giros. En contraste, la velocidad angular no est a afectada por la existencia
de un m aximo y para un valor dado de r viene dada por (10.121)
r
l s1 2E
= 2 = 2
mr1 r1 m

por tanto durante el tiempo en el que la partcula atraviesa la regi on del m aximo, su velocidad angular
vendra dada aproximadamente por este valor y puede hacer que dicha partcula ejecute varios giros. En tales
casos, se dice que la dispersi
on cl
asica exhibe una orbitalizaci
on o espiralaci
on.
Claramente para energas mayores que E2 (en donde se presenta el punto de inflexi on para un s2 dado),
no es posible un movimiento orbital. All se puede presentar no obstante otro fen omeno interesante, y es
que la combinaci on de componentes atractivas y repulsivas del potencial efectivo puede incluso conducir a
deflexi
on nula para alg un valor finito del par
ametro de impacto. Por otro lado, a valores grandes de energa
con peque nos par
ametros de impacto, los efectos de dispersi on dominantes corresponden a repulsi on fuerte a
on de Rutherford22 .
cortas distancias, y el scattering se asemeja cualitativamente a la dispersi
Dado que la partcula se puede deflectar en un angulo mayor a , pero el angulo medido en el laboratorio
est
a entre 0 y , es u til en este caso diferenciar el
angulo de deflexi
on , que es el que se calcula con las
22
Esto es de esperarse ya que a mayor energa con bajo par
ametro de impacto, la partcula puede penetrar la nube electr
onica
y acercarse mucho al n
ucleo. En realidad la dispersi
on de Rutherford se da gracias a este efecto.
224 CAPITULO 10. FUERZAS CENTRALES

expresiones de la derecha en las Ecs. (10.129)


o (10.130) y el
angulo de dispersi
on que se observa . Para un
dado el valor se calcula con la expresi
on

= 2m m entero positivo

el signo y el valor de m se escogen para que quede en el rango entre 0 y . La suma expresada por (10.137)
cubre entonces todos los valores de que conducen al mismo . En la Fig. 10.15b, se hace una grafica de vs
s para el potencial de la figura 10.15a, para dos energas diferentes. La orbitacion que se produce en E = E1
se muestra como una singularidad en la curva en s = s1 ya que el sistema da infinitas vueltas. Para E > E2 no
hay orbitaci on pero hay un efecto arco iris en = (aunque la secci on eficaz no se anula para angulos
mayores). N otese que se anula (y por tanto tambien ) para s = s3 lo cual significa a partir de (10.125)
que la seccion eficaz se vuelve infinita en la direcci
on adelante debido a que el factor sin = sin se anula.
Similarmente, la secci on eficaz puede diverger en la direcci
on hacia atr
as (i.e. para = ) si ocurre que

ds
s
d

permanece finito en = . Estos infinitos en la dispersi on adelante atras se conocen como dispersi on gloria,
de nuevo por su an alogo al correspondiente fenomeno en optica metereol ogica. El efecto
optico es familiar para
los viajeros de avi
on que pueden ver un anillo de luz que envuelve la sombra del avi on proyectada sobre una
nube subyacente.
Aunque las correcciones cu anticas son en general importantes, a veces dichas correcciones son peque nas
como ocurre con la dispersi on a bajas energas en retculos cristalinos de iones. Incluso en ocasiones se recurre
a metodos semiclasicos en los cuales es necesario el conocimiento de la orbita clasica.

10.17. Transformacion del problema de la dispersi


on entre coordenadas
de laboratorio y centro de masa

Figura 10.16: (a) Dispersion de dos partculas vista por el sistema de referencia del laboratorio. (b) Dispersi
on
de dos partculas vista por el sistema de referencia del centro de masa.

Hasta el momento, hemos supuesto que el centro de fuerzas es fijo y por lo tanto trabajamos el problema
de un cuerpo. En la realidad, lo que tenemos es un cuerpo mucho m as masivo que el otro que en todo caso
debe recular. Por otro lado, podemos estar interesados en la colisi
on de dos partculas con masas similares o
casos en que el blanco es movil. Todo ello conduce al hecho de que el problema de la colisi
on es un problema
de dos cuerpos. Aunque ya hemos demostrado que este problema se puede reducir al problema de un cuerpo
con masa reducida , no podemos simplemente reemplazar los dos cuerpos por este cuerpo equivalente. La
dificultad radica en que el
angulo de dispersion se mide realmente en el laboratorio y corresponde al
angulo
DEL PROBLEMA DE LA DISPERSION
10.17. TRANSFORMACION ENTRE COORDENADAS DE LABORATO

entre las direcciones inicial y final de la partcula dispersada en las coordenadas de laboratorio23 . Por otro
lado, el
angulo calculado a partir del problema equivalente de un cuerpo es el angulo entre las direcciones
inicial y final del vector relativo entre las dos partculas en las coordenadas del centro de masa. Los valores de
y solo son iguales si la partcula que estaba en reposo permanece estacionaria en el proceso. Dado que en
la realidad la partcula inicialmente en reposo se pone en movimiento gracias a la interacci on con el proyectil,
los dos angulos seran diferentes como se ve en la figura 10.16a. En consecuencia, el problema equivalente de
un cuerpo no nos da directamente el angulo de dispersi on que mide el laboratorio24 .

10.17.1. Relaci
on entre el
angulo de dispersi
on medido por el laboratorio y el medido
por el centro de masa
Para encontrar la relaci on entre y debemos primero examinar como ocurre la dispersi on para un
sistema de referencia que se mueve con el centro de masa (que claramente tambien es inercial). En este sistema
de referencia el momento total es cero siempre, as que las dos partculas siempre se mueven con momentos
opuestos. Antes de la dispersi on las dos partculas se acercan mutuamente y luego de la dispersion se alejan
una de otra.
En la Fig. 10.1, podemos ver que el vector relativo entre las partculas pasa por el centro de masa, as mismo
los vectores r, r1 ,r2 son todos colineales para todo tiempo. Esto significa que desde el punto de vista del centro
de masa, no solo los momentos son antiparalelos sino que las direcciones incidentes de las dos partculas yacen
sobre la misma recta, al igual que las direcciones salientes o reflejadas. De aqu se concluye que los angulos de
dispersi
on de las dos partculas son identicos ya que son opuestos por el vertice. Por otro lado, vemos que el
angulo de dispersi
on de ri sera el mismo que el angulo de deflexi
on de r ya que son colineales todo el tiempo.
Por tanto el angulo de deflexi on de las partculas visto por el CM es el angulo que se muestra en la Fig.
10.16a. La dispersi on vista por el centro de masa se ilustra en la Fig. 10.16b.
Ahora bien, la relaci on entre y se obtendr a entonces haciendo la transformacion entre el sistema centro
de masa y laboratorio. Esta transformaci on ya fue considerada en la secci
on (10.1). Derivando en el tiempo la
Ec. (10.2) se obtiene
v1 = V + v1 (10.138)

estas relaciones son validas para todo tiempo. Por conveniencia, haremos un ligero cambio en la terminologa:
r1 , v1 son la posici
on y velocidad de la partcula incidente m1 despu es de la dispersi on en el sistema de

laboratorio (L). r1 , v1 son la posici
on y velocidad de la partcula incidente m1 despu es de la dispersi on
en el sistema del centro de masa (CM). R y V no sufren modificaci on en su significado antes y despues de la
colision.
La Fig. 10.17 muestra la relaci
on vectorial (10.138) evaluada despu es de la dispersi
on, en cuyo tiempo v1

y v1 hacen los angulos y respectivamente con el vector V que yace a lo largo de la direcci on inicial. Dado
que el blanco est a inicialmente estacionario en el laboratorio, la velocidad incidente v0 del proyectil m1 en
dicho sistema, coincide con la velocidad relativa inicial de las partculas. Por conservacion del momento lineal
total la velocidad constante del centro de masa es

(m1 + m2 ) V = m1 v0

V = v0 (10.139)
m2

La Ec. (10.139) muestra que v0 es paralelo a V. En consecuencia, si tomamos como eje X el eje de incidencia
de la partcula, la velocidad del centro de masa V es paralela a este eje y los
angulos y se miden como
indica la figura 10.17, la cual tambien muestra la relaci
on (10.138). Adicionalmente, la figura 10.17 muestra
23
Este
angulo no debe ser confundido con que es la coordenada angular del vector relativo r entre las partculas.
24
Recordemos que las trayectorias que hemos obtenido para un cuerpo bajo fuerzas centrales, tampoco son las orbitas que vera
un sistema de referencia inercial, y solo coinciden razonablemente cuando uno de los cuerpos esta en reposo y es muy masivo
respecto al otro.
226 CAPITULO 10. FUERZAS CENTRALES

on entre los vectores v1 , v1 y V despues de la colisi


Figura 10.17: Relaci on.

tambien que

v1 sin = v1 sin (10.140)


v1 cos = v1 cos +V (10.141)

el cociente entre estas ecuaciones nos da la relaci


on entre y que busc
abamos
sin V v0
tan = , = (10.142)
cos + v1 m2 v1

donde hemos usado tambien (10.139). Se puede obtener una expresi on alternativa cuando se expresa v1 en
terminos de otras velocidades a traves de la ley del coseno aplicada al tri
angulo de la Fig. 10.17.

v12 = v12 + V 2 2v1 V cos ( ) = v12 + V 2 + 2v1 V cos (10.143)


despejando cos en (10.141) y usando las Ecs. (10.143, 10.142) se obtiene

v cos + V cos + V /v1


cos = p 2 1 =r  2
v1 + V 2 + 2v1 V cos
1 + vV + 2 vV cos
1 1

cos +
cos = p (10.144)
1 + 2 cos + 2
vemos que las relaciones entre y expresadas en (10.142) y (10.144) involucran el factor que depende de
las rapideces inicial de la partcula 1 vista por (L) y final de la misma partcula pero vista por (CM). Conviene
por tanto, caracterizar adecuadamente a este factor.

10.17.2. Caracterizaci
on del factor de la colisi
on
on de centro de masa, la velocidad v1 de la partcula 1 en el CM despues de la colisi
Por la definici on,
est
a conectada con la rapidez relativa v despues de la colisi
on. Esta relaci
on se obtiene utilizando la Ec. (10.3)
y deriv
andola respecto al tiempo
m2
v1 = v v1 = v
m1 + m2 m1
con lo cual se puede escribir tambien como
m1 v0
= (10.145)
m2 v
DEL PROBLEMA DE LA DISPERSION
10.17. TRANSFORMACION ENTRE COORDENADAS DE LABORATO

es necesario recalcar que v es la rapidez relativa despu es de la colisi


on. Cuando la colision es el
astica, la
energa cinetica total de las dos partculas permanece inalterada con lo cual v = v0 y resulta
m1
elast = (10.146)
m2
y es independiente de las energas y rapideces. Si la colision es inel
astica, la energa cinetica total de las dos
partculas cambia despues de la colisi
on (por ejemplo algo de la energa cinetica se convierte en energa de
excitacion interna del blanco). El cambio de energa cinetica resultante de la colisi
on se expresa como

v 2 1 v 2 1
+ MV 2 = 0 + MV 2 + Q
2 2 2 2
donde hemos tenido en cuenta que la velocidad del centro de masa permanece constante de modo que

v 2 v 2
= 0 +Q (10.147)
2 2
notese que si usamos la condici
on el astica Q = 0 obtenemos v = v0 como ya se menciono. El valor Q del choque
25
astico es usualmente negativo , aunque el convenio de signos se toma de manera que sea consistente con
inel
el que se usa para las reacciones at omicas y nucleares. Multiplicando por 2/ esta ecuacion resulta
!
2 2 2 2 Q 2 2 Q
v = v0 + Q = v0 + 1 2 v0 = v0 1 + 1 2 (10.148)
2 v0 2 v0

teniendo en cuenta que la energa del sistema en el sistema de laboratorio es (1/2) m1 v02 se tiene que
   
1 2 1 2 m2 m2
v = m1 v0 = E
2 0 2 m1 + m2 m1 + m2

y la Ec. (10.148) queda    


2 m1 + m2 Q
v = v02 1+
m2 E
Por tanto, el cociente entre las rapideces relativas antes y despues del choque se puede escribir como
s  
v m1 + m2 Q
= 1+ (10.149)
v0 m2 E

siendo E el valor de la energa de la partcula incidente (en el sistema de laboratorio). Reemplazando (10.149)
en (10.145), se tiene que el factor para dispersi on inel
astica, vendr
a dado por
m1
inelast = r   (10.150)
m1 +m2 Q
m2 1+ m2 E

Las Ecs. (10.142, 10.144) muestran que los valores de y son en general diferentes si 6= 0.

10.17.3. Secci
on eficaz en t
erminos de los dos
angulos de dispersi
on
Los valores de la secci
on eficaz diferencial dependen de cual de los dos angulos se tome como variable
independiente para . Para obtener la relaci on entre ellas, observemos que en un experimento particular el
numero de partculas dispersadas por unidad de tiempo a traves de un elemento de
angulo s
olido dado, debe
25
En todo caso, es posible observar un incremento en la energa cinetica a expensas de una disminuci
on de la energa interna de
los cuerpos que colisionan.
228 CAPITULO 10. FUERZAS CENTRALES

ser el mismo sin importar si medimos el fen


omeno como funci on de o como funci
on de . Esta cantidad
expresada para el
angulo viene dada por (10.123) y al ser igual para ambos
angulos se obtiene

2I () sin |d| = 2I () sin |d|

donde () , () son las secciones eficaces diferenciales expresadas en funci on de cada


angulo de dispersi
on,
ambos medidos en el sistema de laboratorio. Esta relaci on se puede escribir en la forma

sin d d (cos )

() = () = ()
sin d d (cos )
La derivada se puede evaluar por medio de la Ec. (10.144) y se obtiene f
acilmente
cos +
cos = p
1 + 2 cos + 2
p 
1 + 2 cos + 2 2 2 1/2
d (cos ) 2 (cos + ) 1 + 2 cos +
=
d (cos ) (1 + 2 cos + 2 )
p p 1/2
d (cos ) 1 + 2 cos + 2 1 + 2 cos + 2 (cos + ) 1 + 2 cos + 2
= p
d (cos ) 1 + 2 cos + 2 (1 + 2 cos + 2 )

d (cos ) 1 + 2 cos + 2 (cos + )
=
d (cos ) (1 + 2 cos + 2 )3/2
d (cos ) 1 + cos
=
d (cos ) (1 + 2 cos + 2 )3/2
on eficaz () queda finalmente
de lo cual la secci
3/2
1 + 2 cos + 2
() = () (10.151)
1 + cos
es importante enfatizar que () no es la secci on eficaz que medira un observador en el sistema del centro
de masa. Tanto () como () son secciones eficaces medidas en el laboratorio, pero est an expresadas en
termino de coordenadas angulares diferentes. Un observador fijo en el centro de masa vera una densidad de
flujo de partculas incidentes diferente de la que se mide en el sistema de laboratorio y habra que inclur esa
transformaci on de la densidad de flujo si por alguna razon quisieramos relacionar las secciones eficaces medidas
en uno y otro sistema.
La relaci
on entre los dos angulos de dispersion es particularmente simple en el caso en el cual tenemos una
colisi
on el
astica donde las partculas tienen masas iguales, en este caso = 1 y seg un (10.144) se tiene
r
1 + cos
cos = = cos
2 2
de modo que

= ( = 1) (10.152)
2
en consecuencia, en el caso de dispersi
on el
astica con masas iguales no podra haber
angulos de dispersion
mayores que /2 en el sistema de laboratorio; toda la dispersion tiene lugar en el hemisferio de adelante.
Correspondientemente, la secci
on eficaz de dispersi
on vendr
a dada en funci
on de segun la Ec. (10.151) en
la forma
(2 + 2 cos )3/2 23/2 (1 + cos )3/2
() = () = ()
1 + cos "1 + cos
h i  1/2 #

= () 23/2 (1 + cos )1/2 = () 23/2 2 cos2
2
DEL PROBLEMA DE LA DISPERSION
10.17. TRANSFORMACION ENTRE COORDENADAS DE LABORATO

que combinada con (10.152) nos da



() = 4 cos () ; , ( = 1)
2
incluso si tenemos dispersi on is
otropa seg
un , en la cual () es una constante independiente de , la secci on
eficaz en funcion de vara como el coseno de este angulo.
De acuerdo con la discusi on anterior, incluso en los choques elasticos en los que la energa cinetica total
permanece constante, una colisi on con blanco fijo trae como consecuencia que el proyectil cede parte de
su energa cinetica al blanco. Es decir, la colisi
on frena a la partcula incidente. Para obtener el grado de
frenamiento podemos emplear la Ec. (10.143) expresando v1 y V en funci on de v0 a traves de las Ecs. (10.142,
10.139), respectivamente
 2  2   
v0 v0 v0 v0
v12 = + +2 cos
m2 m2 m2 m2
 2
v0  
v12 = 1 + 2 + 2 cos
m2

el cociente entre las rapideces v1 y v0 queda


 
v12 2 
2 = 1 + 2 cos + 2 (10.153)
v0 m2

si el choque es elastico, se tiene que = m1 /m2 con lo cual la Ec. (10.153) se puede simplificar en la forma
   2
1 2
2 m1 v1 m1 m2 / (m1 + m2 ) 2  2
 m2  
1 2
= 1 + 2 cos + = 1 + 2 cos + 2
2 m1 v0
m2 (m1 /m2 ) (m1 + m2 )
2
E1 1  
=   1 + 2 cos + 2
E0 1+ m 1
m2

quedando finalmente
E1 1 + 2 cos + 2
= (choque el
astico)
E0 (1 + )2
siendo E0 (E1 ) la energa cinetica inicial (final) del proyectil en el sistema de laboratorio. La relaci
on se
simplifica a
un m
as en el caso de masas iguales

E1 1 + cos 2 cos2
= = 2
= cos2
E0 2 2
donde hemos utilizado (10.152). Por lo tanto, para el angulo de dispersi on maximo ( = , = /2), el
proyectil pierde toda su energa y queda detenido en el sistema de referencia del laboratorio.
Esta transferencia de energa cinetica por dispersion es el principio basico utilizado en los reactores de
neutrones termicos. Los neutrones r apidos producidos por fision colisionan el
asticamente en forma sucesiva
con un moderador hasta que su energa cinetica se convierte a energas termicas, a las cuales es mas posible
que originen fisiones a que sean capturados. Es obvio que los elementos ligeros son los mejores moderadores,
idealmente el hidr ogeno (con el cual = 1). Sin embargo, por otras razones tecnicas, el hidr ogeno solo es
pr
actico en los reactores nucleares cuando es parte de una mezcla o compuesto (como el agua). Se utilizan
mas como moderadores el deuterio y el carbono 12. El hidr ogeno que forma parte de la parafina, el agua o los
pl
asticos s se usa como moderador.
Estos c alculos de transformacion del laboratorio al centro de masa y la cesi on de energa cinetica se han
realizado en un contexto cl asico. Incluso c
alculos an
alogos se presentan en textos elementales para choques de
contacto tales como los que ocurren entre bolas de billar. Lo interesante es que a pesar de su simplicidad
230 CAPITULO 10. FUERZAS CENTRALES

estos c
alculos son de muy amplio uso ya que usan principios fundamentales como la conservaci on del momento
lineal y la energa. Mientras se usen los principios de conservaci on y el factor Q, los detalles de la colisi
on
son irrelevantes, en realidad la regi on de interaccion se considera como una caja negra y lo que medimos
son los estados asint oticos inicial y final. No interesa mucho que los fenomenos ocurridos en esta caja negra
sean cuanticos o clasicos. Como ya mencionamos, las f ormulas obtenidas en este captulo sirven para analizar
fenomenos de naturaleza cu antica tales como la dispersion neutron prot
on, siempre que las energas sean lo
suficientemente bajas para ignorar los efectos relativistas.
Captulo 11

Interludio matem atico: Matrices, vectores


y tensores cartesianos

En el presente captulo desarrollaremos desde un punto de vista pr actico el


algebra basica de los vectores y
n
matrices en el espacio cartesiano R . Enfatizaremos en la relaci on que hay entre matrices y transformaciones
lineales. Se asume cierta familiaridad del lector con el
algebra lineal ya que el proposito de este captulo es el de
dar un compendio de propiedades requeridas para los captulos subsiguientes. Debe mencionarse sin embargo,
que adem as de las propiedades matem aticas de los vectores y matrices se estudiar an aspectos de un interes
m as fsico como son la interpretacion pasiva y activa de las matrices, la clasificaci
on de escalares y vectores
por sus propiedades bajo paridad, y la caracterizaci on de los tensores cartesianos.

11.1. Propiedades b
asicas de las matrices
Asumiremos que un vector cartesiano (en el espacio Rn ) se puede representar como un arreglo de la forma

x1

x ... (11.1)
xn

una transformacion de x a otro vector x se denomina una transformaci on lineal si dicha transformaci
on es de
la forma
xi = aij xj ; i, j = 1, . . . , n (11.2)
donde aij son coeficientes constantes y se usa convenci on de suma sobre ndices repetidos. Consideremos el
caso de dos transformaciones lineales sucesivas de la forma (11.2). Adicionalmente, definiremos vectores x que
son generales (no necesariamente vectores posicion). Hagamos primero la transformaci on de x a x realizada
por el operador B

x = Bx xk = bkj xj (11.3)
on de x a x realizada por el operador A
seguida por una transformaci

x = Ax xi = aik xk (11.4)

on entre xi y las xj se pueden combinar las dos ecuaciones para obtener


para obtener la relaci

x = ABx x = Cx C = AB (11.5)
xi = aik bkj xj xi = cij xj (11.6)
cij aik bkj (11.7)

231
232CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

vemos que podemos definir unos nuevos elementos cij que forman un nuevo arreglo matricial que se obtiene
de los elementos A y B con el algoritmo descrito en (11.7). Naturalmente la composicion de transformaciones
lineales A y B nos define otra transformacion lineal C. Es f
acil ver que el algoritmo (11.7) nos dice que la
composicion (multiplicaci
on) de operadores no es conmutativa

(AB)ij = cij = aik bkj ; (BA)ij = dij = bik akj


AB 6= BA

lo cual se puede comprobar con unos simples casos particulares. Esto implica que el resultado de aplicar dos
operadores lineales sucesivos depende en general del orden de aplicaci
on de tales operadores. Puede compro-
barse sin embargo que esta multiplicaci
on es asociativa

(AB) C = A (BC)

la operaci
on descrita por la Ec. (11.2) se puede escribir en arreglo matricial emulando el algoritmo (11.7) en
donde los vectores se escriben como matrices de una columna en la forma de la Ec. (11.1)

x1 x1 a11 a12 a13
x = Ax ; x x2 ; x x2 ; A a21 a22 a23
x3 x3 a31 a32 a33


x i = (Ax)i xi = aij xj

la suma de dos matrices se define como la matriz que se obtiene al sumar los elementos de cada una, claramente
esta operaci
on s es conmutativa
(A + B)ij = aij + bij = cij = (C)ij
on inversa de A que nos lleva de regreso desde x hacia x
un proceso importante es la composici

x = Ax ; A1 x = x A1 Ax = x (11.8)

como x es un vector arbitrario se concluye que

A1 A = 1 (11.9)

donde 1 es el operador identidad que deja al vector (o al sistema coordenado) inalterado. Por otro lado,
multiplicando la segunda de las Ecs. (11.8) por A a la izquierda

AA1 x = Ax AA1 x = x

y teniendo en cuenta que x tambien es arbitrario se tiene que

AA1 = 1 (11.10)

de modo que la matriz inversa de A debe cumplir

A1 A = AA1 = 1 (11.11)

designemos a los elementos de la inversa como a


ij . La segunda de las Ecs. (11.8) se escribe como

ij xj
xi = a (11.12)

que debe ser consistente con la primera de las Ecs. (11.8)

xk = aki xi (11.13)

y sustituyendo xi de (11.12) en (11.13)


xk = aki a
ij xj

11.1. PROPIEDADES BASICAS DE LAS MATRICES 233

y puesto que las componentes de x son independientes, esta ecuaci


on solo es correcta si la suma se reduce
identicamente a xk i.e.
aki a
ij = kj (11.14)
la delta de Kronecker efectivamente es la u nica representaci
on de los elementos de la matriz identidad como
se puede ver del algoritmo (11.7). Podemos llegar tambien a (11.14) directamente a partir de (11.10) usando
el algoritmo (11.7). Si partimos de (11.9) llegamos a la relaci
on

ij ajk = ik
a

se puede ver adem as que la inversa del producto de dos matrices es la inversa del producto aplicado en orden
contrario. Por definici
on de inverso se tiene que

ABx = x (AB)1 x = x (11.15)

multiplicando por A1 a la izquierda de la primera ecuaci


on (11.15) y posteriormente por B1 resulta
1
A1 ABx = A1 x Bx = A1 x B Bx = B1 A1 x
x = B1 A1 x

comparando esta ecuaci on con la segunda de las Ecs. (11.15) teniendo en cuenta que estas deben ser v
alidas
para x y x arbitrarios, resulta
(AB)1 = B1 A1 (11.16)
es importante tener en cuenta tambien que la matriz identidad deja inalterada a otra matriz cuando se hace
el producto entre ellas
A1 = 1A = A
finalmente, definiremos la traspuesta de una matriz como aquella matriz que se obtiene intercambiando filas
e se define entonces por
por columnas y viceversa en la matriz A, esta matriz simbolizada por A
 
e
A eaij = aji
ij

es obvio que la traspuesta de la traspuesta es la misma matriz



] 
Ae =A (11.17)

es facil demostrar que la traspuesta del producto de dos matrices es el producto de las matrices traspuestas
en orden contrario      
eA
B e = B e e
A ^
= bki ajk = ajk bki = (AB)ji = (AB) ij
ij ik kj

y como esto vale para un elemento arbitrario i, j se tiene que

^=B
(AB) eA
e (11.18)

es muy f
acil verificar que la traspuesta de una suma es la suma de las traspuestas

^
(A e +B
+ B) = A e

Si una matriz coincide con su traspuesta


e
aij = aji A = A

se dice que la matriz es sim


etrica. Si la matriz coincide con menos la traspuesta
e
aij = aji A = A
234CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

entonces tenemos una matriz antisim etrica. Claramente, los elementos diagonales de una matriz antisimetrica
son nulos.
Para el caso particular de tres dimensiones, las matrices antisimetricas reales pueden parametrizarse vec-
torialmente. En virtud de las propiedades anteriores, una matriz antisimetrica real se puede parametrizar en
la forma
0 a3 a2
Aa = a3 0 a1 (11.19)
a2 a1 0
esta matriz tiene solo tres grados de libertad independientes, de modo que es razonable construr una arreglo
vectorial de la forma
a1
vA a2 (11.20)
a3
Ahora bien, si aplicamos la matriz a un vector arbitrario x obtenemos

0 a3 a2 x1 a3 x2 a2 x3
Aa x = a3 0 a1 x2 = a1 x3 a3 x1 (11.21)
a2 a1 0 x3 a2 x1 a1 x2

las componentes del nuevo vector claramente son identicas a las obtenidas a traves del siguiente producto cruz

Aa x = x vA (11.22)

De modo que a cualquier producto cruz se le puede asociar una matriz antisimetrica, esto se aplica con
frecuencia a cantidades como el torque y el momento angular. N otese que siempre es posible descomponer una
matriz en una componente simetrica y otra antisimetrica de la siguiente forma
1 e
 1 e

A = As + Aa ; As A+A ; Aa AA
2 2
n
otese adem
as que la traspuesta de la matriz tambien es combinaci
on de estas componentes
e = As Aa
A

11.1.1. Determinantes y trazas


Otra propiedad importante de las matrices es el determinante denotado por |A| el cual es un n umero
real o complejo asociado a la matriz, su construccion est
a motivada por el estudio de las ecuaciones lineales
simultaneas. Supondremos que el lector est
a familiarizado con el algoritmo de expansi
on por cofactores para el
c
alculo de los determinantes. Hablamos de matrices singulares cuando su determinante es nulo, de lo contrario
hablamos de matrices no singulares. Es esencial que una matriz sea no singular para que exista su inversa
puesto que dicha inversa depende de |A|1 . El determinante de la traspuesta de la matriz coincide con el
determinante de la matriz
e
A = |A| (11.23)

y para la matriz conjugada se tiene


|A | = |A| (11.24)
Adicionalmente, se puede demostrar que el determinante del producto, es el producto de los determinantes

|AB| = |A| |B| (11.25)

y dado que el determinante de la identidad es 1 se tiene que



1 = |1| = AA1 = |A| A1

11.1. PROPIEDADES BASICAS DE LAS MATRICES 235

de modo que
1
A = |A|1 (11.26)

por otro lado si cualquier fila o columna de una matriz se multiplica por un escalar , el determinante queda
multiplicado por tal escalar. Por ejemplo en tres dimensiones

a11 a12 a13 a11 a12 a13 a11 a12 a13

a21 a22 a23 = a21 a22 a23 = a21 a22 a23 (11.27)

a31 a32 a33 a31 a32 a33 a31 a32 a33

de modo que si multiplicamos un escalar por una matriz n n, el nuevo determinante es

|A| = n |A| (11.28)

como caso particular


|A| = (1)n |A| (11.29)

otra propiedad importante es la traza de la matriz, definida como la suma de sus elementos diagonales

T rA = aii (11.30)

donde enfatizamos en la suma sobre ndices repetidos. Demostraremos que

T r [AB] = T r [BA] (11.31)

lo cual se puede ver f


acilmente en la forma

T r [AB] = (AB)ii = aik bki = bki aik = (BA)kk = T r [BA]

Una propiedad muy importante de la traza es que es un invariante cclico, es decir


h i h i
T r A(1) A(2) . . . A(n2) A(n1) A(n) = T r A(n) A(1) A(2) . . . A(n2) A(n1)
h i
= T r A(n1) A(n) A(1) A(2) . . . A(n2) (11.32)

y as sucesivamente. Para demostrarlo, basta con definir

B A(1) A(2) . . . A(n1)

de modo que
h i h i h i h i
T r A(1) A(2) . . . A(n2) A(n1) A(n) = T r BA(n) = T r A(n) B = T r A(n) A(1) A(2) . . . A(n2) A(n1)

y teniendo en cuenta que los ndices (1) , (2) , ... son mudos, vemos que cualquier cambio cclico es posible. Vale
la pena tener en cuenta que la propiedad (11.31) no significa que para calcular la traza se puedan conmutar las
matrices, por ejemplo para tres o m as matrices la traza no es la misma para cualquier orden de las matrices,
solo cambios cclicos son posibles. En tal sentido debemos interpretar (11.31) como un cambio cclico de dos
matrices y no como una conmutaci on.
Veremos m as adelante que las trazas y los determinantes son invariantes ante un cambio de base.
236CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

11.1.2. Matrices rectangulares


Una matriz rectangular es un arreglo de n
umeros constitudo por m filas y n columnas. En ese caso se dice
que la matriz es de dimensi
on m n. Los elementos de esta matriz seran de la forma

(A)ik = aik ; i = 1, . . . , m ; k = 1, . . . , n

la traspuesta de esta matriz sera de dimensi on n m. Un arreglo vectorial columna (de aqu en adelante lo
llamaremos simplemente vector aunque no necesariamente sea un vector en todo el sentido de la palabra) es
una matriz rectangular de dimensi on m 1, su traspuesta es una matriz de dimensi on 1 m.
Ahora bien, sera deseable extrapolar el algoritmo (11.7) para realizar productos de matrices rectangulares

cij aik bkj

Se observa que la extrapolacion del producto matricial entre dos matrices rectangulares C = AB solo se puede
definir consistentemente si el n
umero de columnas de A es el mismo que el n umero de filas de B.

AB = C si A Amn y B Bnd Cmd

En particular el producto de un vector columna (matriz m 1) con una matriz m m en la forma xA no


se puede definir. Sin embargo, el producto entre la traspuesta del vector anterior (vector fila) y la matriz A
en la forma x eA se puede definir. Similarmente no se puede definir Ae x pero si se puede definir Ax. De las
anteriores consideraciones las cantidades Ax y xeA corresponden a un nuevo vector columna y un nuevo vector
fila respectivamente.
A partir de las dimensiones para las matrices rectangulares

e nm y Bnd B
Amn A e dn

el producto AB est a definido. Sin embargo, se puede notar que sus traspuestas solo se pueden multiplicar
e A.
en el orden opuesto, i.e. en el orden B e De por s es simple demostrar que al igual que con las matrices
cuadradas el traspuesto del producto es el producto del traspuesto en orden inverso, Ec. (11.18). Aplicando
esta propiedad se puede ver que
] =x
(Ax) eAe ; (e ]
xA) = Axe

donde hemos tenido en cuenta que la traspuesta de la traspuesta es la matriz original.

11.2. Interpretaci
on activa y pasiva de las transformaciones lineales: cam-
bios de base
Es usual describir un vector dado en dos sistemas coordenados diferentes, digamos X1 X2 X3 y X1 X2 X3 .
Asumiremos que ambos sistemas tienen un origen com un, de modo que uno de ellos se obtiene por rotaci on
del otro. Cada sistema coordenado tiene un conjunto ortonormal de vectores {u1 , u2 , u3 } y {u1 , u2 , u3 }.
La matriz de transformacion A puede ser considerada como un operador que actuando sobre el sistema
coordenado no primado lo transforma en el sistema coordenado primado. Simb olicamente esta operaci on se
escribe como:
(r) = Ar (11.33)
el parentesis indica que el vector r como tal NO ha sido transformado, simplemente sus componentes se est an
escribiendo en un nuevo sistema coordenado. De modo que la matriz A opera sobre las componentes del
vector en el sistema no primado para dar las componentes del mismo vector en el sistema primado. Esta
operacion se conoce como un cambio de base, puesto que A act ua solo sobre el sistema coordenado dejando
al vector inalterado. En tres dimensiones la transformaci on de coordenadas es simplemente una rotaci on de
los ejes coordenados. Usualmente estaremos interesados en transformaciones lineales que nos lleven de un
sistema coordenado ortonormal a otro sistema coordenado tambien ortonormal, este tipo de transformaciones
ACTIVA Y PASIVA DE LAS TRANSFORMACIONES LINEALES: CAMBIOS DE BAS
11.2. INTERPRETACION

se denominan transformaciones ortogonales, las cuales caracterizaremos matem aticamente en la secci


on
11.4. Sin embargo, la discusi
on que estamos desarrollando no requiere estrictamente que las transformaciones
sean ortogonales, la u
nica condici
on indispensable como veremos m as adelante es que la transformacion sea
invertible.
Por otro lado, es de anotar que sin cambiar el andamiaje matem atico construdo hasta ahora, podemos
reinterpretar al operador A como actuando sobre el vector r para producir un nuevo vector r donde las
componentes de ambos se calculan en el mismo sistema coordenado. Esto lo representamos por
r = Ar (11.34)
esta notaci on sin parentesis indica que el vector como tal ha sido transformado, con ambos vectores r y r
descritos por el mismo sistema coordenado. Por tanto, en el caso particular de rotaci on en dos dimensiones
en lugar de rotar el sistema coordenado en el sentido antihorario, estaramos girando el vector posici on en
sentido horario manteniendo fijos los ejes. Los angulos de rotacion en ambos casos poseen naturalmente la
misma magnitud pero signo opuesto. Vale destacar que en la transformaci on (11.34) las componentes del
nuevo vector estar an relacionadas con las del vector original por las mismas transformaciones que en las Ecs.
(11.33) aunque la interpretaci on geometrica sea distinta.
Para entender la diferencia, es esencial comprender que la definici on completa de un operador requiere
conocer no solo que operaci on realiza, sino sobre que objetos act
ua, en este sentido matem atico estricto los
dos operadores (cambio de base y cambio del vector) son en realidad diferentes aunque posean la misma
representaci on matricial. N otese en particular que el sentido de la rotaci on cuando se interpreta como cambio
en el vector, es inverso con respecto al caso en que se interpreta como rotaci on del sistema coordenado.
No obstante visto desde un punto de vista pr actico, dado que las operaciones matem aticas son las mismas,
es posible y a veces conveniente cambiar de una interpretaci on a otra segun las necesidades. Por ejemplo, en
el caso de la especificaci on de la orientaci on de un cuerpo rgido relativo a S0 la interpretaci on del operador
como transformando el sistema coordenado es la mas conveniente. Por otro lado la interpretaci on del operador
como agente que cambia al vector tiene muchas aplicaciones. Por tanto, tomaremos una u otra interpretaci on
a lo largo del texto.
Esta dualidad en la interpretaci on o m as bien en el rol de los operadores est a presente en otro tipo
de transformaciones de coordenadas mas generales que las transformaciones ortogonales. En ocasiones se
interpreta su rol como el de cambiar el sistema coordenado expresando cierta cantidad o funci on en terminos
del nuevo sistema coordenado pero sin alterarla. En otras ocasiones se puede considerar como actuando sobre
la cantidad o funci on en s misma cambiando a nuevas cantidades en el mismo sistema coordenado. Cuando
la transformaci on es del tipo de un cambio de base i.e. solo sobre el sistema coordenado hablamos de un rol
pasivo de la transformaci on. Por otro lado cuando al operador se le otorga el rol de cambiar a un vector u
otra cantidad fsica, hablamos de un rol activo de la transformaci on. Ya nos habamos encontrado con esta
dualidad en el captulo sobre transformaciones can onicas y en realidad es aplicable en muchos campos de la
Fsica.
Es importante el hecho de que las propiedades matem aticas de las transformaciones activas y pasivas son
identicas, de modo que en la mayor parte de lo que sigue, no haremos distinci on entre (r) y r en las operaciones
subsecuentes, a menos que se especifique lo contrario (como es el caso de la secci on 11.2.1).

11.2.1. Transformaciones de similaridad


Veremos que las interpretaciones activa y pasiva de un operador se pueden combinar para encontrar la
manera en la cual la representaci
on de un operador activo se transforma cuando se realiza un cambio de base.
Pensemos que tenemos una matriz activa A que act ua sobre un vector F (matriz columna) para transformarlo
en el vector G. Tenemos entonces la transformacion
G = AF (11.35)
ahora pensemos que el sistema coordenado original ser
a transformado a otro a traves de una matriz ortogonal
B. El cambio de base se expresa como
(G) = BG (11.36)
238CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

on (G) para indicar que representa al mismo vector pero en un sistema coordenado
donde revivimos la notaci
diferente. Combinando (11.35) y (11.36) se obtiene

BG = BAF (G) = (BA) F

n
otese que en la u
ltima igualdad los dos vectores G y F estan expresados en bases diferentes. Es deseable
que ambos queden escritos en la nueva base (por ejemplo dos vectores solo se pueden sumar componente a
componente si ambos estan expresados en la misma base). Esto se logra introduciendo un operador identidad
en la forma
 
(G) = (BA) B1 B F (G) = BAB1 (BF)

(G) = BAB1 (F) (11.37)

Si comparamos (11.35) con (11.37) teniendo en cuenta que los vectores primados son identicos a los vecto-
res sin primar salvo que estan escritos en bases diferentes, llegamos a la siguiente conclusi
on: La matriz de
transformacion A (en la base original) me produce la misma transformaci on que la matriz de transformacion
BAB1 en la nueva base. En otras palabras, A y BAB1 son representaciones diferentes del mismo operador,
donde se ve que la representaci
on depende de la base que usemos para construirla. En consecuencia podemos
definir
A = BAB1 (11.38)

una transformaci on de esta forma (entre A y A ) se denomina una transformaci on de similaridad. A las

matrices A y A se les denomina matrices equivalentes, lo cual es l ogico si recordamos la interpretaci on
activa de A y pasiva de B que nos llev
o a observar que A representa en la nueva base al mismo operador
activo que representa la matriz A en la base antigua. Otra raz on para llamar equivalentes a estas matrices
es tener en cuenta que la transformaci on de similaridad forma una relaci on de equivalencia entre A y A
(reflexiva, simetrica y transitiva). Se deja como ejercicio al lector demostrar que la similaridad es una relaci
on
de equivalencia.
Puede demostrarse que tanto el determinante como la traza de una matriz A son invariantes ante una trans-
formacion de similaridad. Esto es de gran importancia porque significa que estas cantidades est an asociadas a
un operador lineal de manera unvoca, sin importar la base en que se exprese tal operador.
Veamos la invarianza del determinante

A = BAB1 = |B| |A| B1 = |B| |A| |B|1

A = |A|

donde hemos usado (11.25) y (11.26).


La invarianza de la traza se demuestra f
acilmente en forma explcita
n
X X X X X
    

T r A = T r BAB 1
= BAB1 ii
= bik aklbli = bli bik akl = kl akl = akk = T rA
i=1 ikl ikl kl k

una forma mas inmediata de verlo es teniendo en cuenta que la traza es un invariante cclico (ver Ec. 11.32),
de modo que
     
T r A = T r BAB1 = T r B1 BA = T rA

notese que las propiedades de las transformaciones de similaridad aqu mostradas, no dependen de que la
matriz B para el cambio de base sea ortogonal. Lo u nico que se pide es que esta matriz sea no singular para
que exista la inversa. En realidad la definici
on de transformaci
on de similaridad no se restringe al caso en el cual
la matriz B sea ortogonal, aunque el uso de estas transformaciones nos facilitar a realizar una interpretacion
geometrica, ya que una transformaci on ortogonal transforma una base ortonormal en otra base ortonormal.
11.3. PROBLEMA DE VALORES PROPIOS 239

11.3. Problema de valores propios


Sea A una matriz n n y x un vector columna n 1. Para una matriz especfica A definimos la ecuaci
on
Ax = x (11.39)
como la ecuacion de valores propios asociada a dicha matriz. La idea es solucionar para los posibles valores de
y vectores asociados x. Los valores son en general complejos y se conocen como valores propios en tanto
que los vectores x asociados se denominan vectores propios. La operaci on en (11.39) nos muestra que la
ecuaci
on de valores propios consiste en la b
usqueda de vectores para los cuales el operador A nos alarga o nos
acorta el vector en cuesti
on eventualmente cambiando su sentido pero siempre conservando su direcci on.
El valor propio sera entonces el factor de contracci
on o dilataci
on y en caso de ser negativo invertira el
sentido del vector original1 .
La ecuaci
on de valores propios o autovalores, se puede escribir de la forma
(A 1) x = 0 (11.40)
en forma expandida en tres dimensiones se puede escribir
(a11 ) x1 + a12 x2 + a13 x3 = 0
a21 x1 + (a22 ) x2 + a23 x3 = 0
a31 x1 + a32 x2 + (a33 ) x3 = 0 (11.41)
los argumentos que siguen son v alidos para matrices de dimensi
on arbitraria finita, pero por comodidad los
escribiremos en tres dimensiones. Este conjunto de ecuaciones homogeneas para x1 , x2 , x3 solo tiene soluci
on
no trivial si el determinante del sistema es nulo de modo que

a11 a12 a13

|A 1| = a21 a22 a23 = 0 (11.42)
a31 a32 a33
condici on que se conoce como ecuaci on secular o caracterstica de la matriz. Los valores de para los
cuales se satisface esta ecuaci on son los autovalores o valores propios asociados a la matriz. Es de anotar
que a un en el caso en el cual existen soluciones no triviales, el conjunto de ecuaciones homogeneas (11.41)
no nos da valores definidos para las tres (o para las n) componentes sino solo cocientes entre estas. Este
hecho se puede entender por argumentos algebraicos o geometricos. Desde el punto de vista algebr aico, esto
esta relacionado con el hecho de que el producto del autovector x con un escalar tambien sera autovector,
lo cual se puede ver inmediatamente de (11.40)2 . Geometricamente, esto implica que solo la direcci on del
autovector est a determinada pero su magnitud (e incluso sentido) permanecen indeterminados, lo cual se ve
particularmente claro en tres dimensiones. Dado que A representa una transformaci on lineal es claro que si A
conserva la direccion del vector x i.e. Ax = x tambien conservar
a la direcci
on del vector x para arbitrario.
Al expandir el determinante (11.42) se observa que en general la soluci on de la ecuacion secular se reduce
a encontrar las races de un polinomio de grado n. Sabemos pues que hay un n umero m aximo de n de estas
races y que tales races pueden ser complejas. En general, podemos construr a lo m as n vectores linealmente
independientes xk cada uno asociado a un valor propio k . Denotaremos la componente iesima del kesimo
vector en la forma xik podemos realizar un arreglo matricial con estos vectores, coloc andolos como vectores
columna en forma adyacente. En tres dimensiones tal arreglo matricial queda en la forma

x11 x12 x13
X (x1 x2 x3 ) = x21 x22 x23 (11.43)
x31 x32 x33
1
La razon para colocar todos estos terminos entre comillas, es que tal interpretaci on geometrica solo es clara para vectores
reales. Si bien la analoga para vectores complejos no est
a excenta de utilidad.
2
Alternativamente, esto se puede ver del hecho de que la ecuaci on secular solo tiene soluci
on no trivial cuando una o mas de las
ecuaciones es linealmente dependiente con las dem as. En tal caso hay mas inc
ognitas que ecuaciones y tenemos entonces infinitas
soluciones.
240CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

las Ecs. (11.40) se escriben para cada valor propio k y su respectivo vector propio xk en la forma

(A k 1) xk = 0 Axk = k xk no suma sobre k (11.44)

escribiendo las Ecs. (11.44) en componentes resulta (para n dimensiones)


n
X
aij xjk = k xik
j=1
Xn n
X
aij xjk = xij jk k (11.45)
j=1 j=1

en las dos ecuaciones anteriores no hay suma sobre el ndice repetido k. Recordemos que xjk es la componente
jesima del vector xk . Ahora bien, la cantidad jk k jk se puede asociar a una matriz diagonal que en
tres dimensiones se escribe
1 0 0
0 2 0 (11.46)
0 0 3
matricialmente la Ec. (11.45) se escribe como

AX = X

si multiplicamos por X1 a la izquierda se obtiene

X1 AX = (11.47)

esta operacion es una transformaci on de similaridad operando sobre A. N otese que adem as la matriz X
que se construye con los vectores propios es la matriz de transformaci on (mas estrictamente la matriz de
transformaci on es X1 ), dicha matriz X1 diagonaliza a A a traves de la transformacion de similaridad y los
elementos de la diagonal corresponden a los valores propios (k asociado al vector columna xk en la matriz
X en la Ec. 11.43). Cuando existen valores propios degenerados es decir un subconjunto de ellos posee el mismo
valor, no es siempre posible diagonalizar la matriz A. La raz
on es que si todos los vectores propios que forman
la matriz X no son linealmente independientes, su determinante es cero y no es posible encontrar X1 .
Por otro lado, en el caso en que la diagonalizaci
on es posible, el determinante y la traza de A se pueden
calcular teniendo en cuenta que tales cantidades son invariantes ante una transformaci on de similaridad, por
lo tanto
 
det A = det X1 AX = det = 1 2 . . . n (11.48)
 1 
T rA = T r X AX = T r = 1 + 2 + . . . + n (11.49)

de modo que el determinante y la traza de una matriz diagonalizable son simplemente el producto y la suma
de sus valores propios respectivamente.

11.4. Propiedades b
asicas de las matrices ortogonales
Del conjunto de transformaciones lineales

xi = aij xj , i = 1, 2, 3 (11.50)

existe un conjunto particularmente interesante para la Fsica: el conjunto m as general de transformaciones


lineales que deja invariante la norma de los vectores con componentes reales. Si un vector arbitrario r se
escribe en la forma r = xi ui siendo xi valores reales, entonces las transformaciones lineales (activas o pasivas)
de la forma (11.50) que mantengan invariante la norma de vectores reales, deben cumplir la condici on

xi xi = xi xi (11.51)

11.4. PROPIEDADES BASICAS DE LAS MATRICES ORTOGONALES 241

usando (11.50) esta ecuaci


on se reescribe como

xi xi = (aij xj ) (aik xk )
jk xj xk = aij aik xj xk

donde hemos tenido en cuenta que los ndices repetidos son mudos. Como las coordenadas xk , xj son arbitrarias
entonces la relacion anterior es cierta si y solo si

aij aik = jk ; j, k = 1, 2, 3 (11.52)

el lector puede demostrar que esta condici


on tiene la siguiente forma alternativa

aji aki = jk ; j, k = 1, 2, 3 (11.53)

A cualquier transformaci on lineal de la forma (11.50) que cumpla las condiciones (11.52) (o su forma
alternativa las Ecs. 11.53) se le denomina una transformaci on ortogonal. Las Ecs. (11.52) se conocen como
condiciones de ortogonalidad.
Consideremos las condiciones de ortogonalidad (11.52) y escrib amoslas en notaci
on matricial
 
aij aik = jk e
aji aik = jk AA e = 1jk
jk

tenemos que
e = 1 AAA
AA e 1 e = A1
= 1A1 A1
con lo cual se llega a la relaci
on
A e = AA
e = A1 AA e =1 (11.54)
Inversamente se puede demostrar que la condicion anterior nos conduce a las condiciones de ortogonalidad. De
modo que para las matrices ortogonales la inversa debe coincidir con la traspuesta. N otese que la condici
on
AAe = 1, nos lleva a que la condici
on de ortogonalidad se puede escribir como

aki aji = kj (11.55)

que mnemotecnicamente se puede ver como un producto punto entre los arreglos vectoriales formados por las
filas de la matriz A (ver Ec. 12.13 en pag 276 y comentarios). Por tanto, en una matriz ortogonal el producto
punto entre filas o entre columnas debe ser cero.
De la condicion (11.54) se puede ver que el inverso de una matriz ortogonal es tambien una matriz ortogonal.
En el caso de las rotaciones (que son operaciones que claramente conservan la norma de los vectores) esto es
de esperarse ya que geometricamente sabemos que si realizamos una rotaci on, existe la rotaci
on inversa que
me devuelve a la configuraci on original.
En lo que concierne al determinante de una matriz ortogonal, vemos que al combinar (11.23) (11.25) y
(11.54) se obtiene que

e e
AA = 1 = A |A|
|A|2 = 1 ; |A| = 1

vemos entonces que el determinante de una matriz ortogonal es m as o menos uno. Por razones que veremos m as
adelante, las transformaciones ortogonales de determinante +1 se denominan propias y las de determinante
1 se denominan impropias.
De otra parte, existe otra forma geometrica de caracterizar a las matrices ortogonales reales en un enfoque
pasivo. Este es el conjunto mas general de matrices reales que me convierte una base ortonormal real en otra
base ortonormal real, esto se demostrar a como caso especial de un contexto m as general en la secci
on 11.8.
Esta caracterstica es muy importante ya que usualmente estamos interesados en pasar de un conjunto de
242CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

ejes ortogonales a otro conjunto de ejes tambien ortogonales y adicionalmente conservar la unitariedad de los
vectores base.
Cuando el autovalor es complejo, entonces en general su correspondiente vector propio tambien tendr
a com-
ponentes complejas. Cuando los vectores son complejos, la magnitud al cuadrado de estos se calcula usualmente
de la forma
kxk2 = |xi | |xi | = xi xi (11.56)
y la condici
on de invarianza de esta norma no coincide con la condici
on de invarianza (11.51). Examinemos en
detalle algunos aspectos de las invarianzas expresadas por (11.51) y (11.56).

11.4.1. Matrices ortogonales y norma de vectores complejos (opcional)


Las matrices ortogonales han sido originalmente construdas para mantener invariante la norma de vectores
con componentes reales, dicha norma se define usualmente en la forma descrita por la Ec. (11.51)
xi xi = xi xi (11.57)

debemos tener presente que en la demostraci on no se usa en ning


un momento el caracter real de los xi ni
tampoco de las componentes de la matriz aij . En conclusion, aunque la motivaci
on original involucra solo
n
umeros reales los resultados nos muestran que podemos hacer un enunciado mas general

Theorem 6 Sea xT = (x1 , .., xn ) un arreglo vectorial con componentes complejas. El conjunto de transforma-
ciones lineales m
as general que deja invariante la cantidad xi xi es el conjunto de matrices complejas A que
cumplen la condici e = A1 .
on A

El punto es que en la mayora de los casos, la norma de vectores complejos no se define como xi xi sino en la
forma xi xi como ya se discuti
o. No obstante, existe una importante excepci on, en relatividad especial cuando
usamos el espacio de Minkowski con eje temporal imaginario, definimos los vectores complejos (x1 , x2 , x3 , ict)
y su modulo cuadrado se define como xi xi = x21 + x22 + x23 c2 t2 .
Veamos ahora como act uan la matrices ortogonales sobre el m odulo cuadrado de un vector complejo cuando
tal modulo se define en la forma xi xi , siguiendo el algoritmo para multiplicaci
on de matrices rectangulares se
tiene que
kxk2 = xe x ; x x e
donde hemos definido la conjugada transpuesta del vector como el adjunto del vector simbolizado x . Escri-
bimos entonces
kxk2 = x x
usando la propiedad (11.54) se tiene que si x = Ax siendo A una matriz ortogonal, la norma de x se escribe
como 2 
x = xe x = (Ax)
] Ax = x e Ax = x
e A e A1 Ax = x e (A )1 Ax
Ahora bien si la matriz es ortogonal real se tiene que A = A y se obtiene la invarianza de la norma usual
para vectores complejos de modo que se llega al siguiente

Theorem 7 Bajo una transformaci on ortogonal real, la magnitud al cuadrado de vectores complejos definida
en la forma xi xi permanece invariante.

Sin embargo, las matrices ortogonales reales no son el conjunto m


as general de matrices que dejan invariante
la norma de vectores complejos. M as adelante caracterizaremos al conjunto m
as general de matrices (complejas)
que dejan invariante la norma de n umeros complejos, este conjunto se denomina matrices unitarias y contiene
a las matrices ortogonales reales como subconjunto propio.
Por otro lado multiplicando la Ec. (11.39) por su conjugada transpuesta, podemos escribir

] (Ax) = (x)
(Ax) g (x)

xe x = x
e x

11.4. PROPIEDADES BASICAS DE LAS MATRICES ORTOGONALES 243

y si imponemos la invarianza de la norma del vector complejo ante la transformaci


on se tiene que

kk2 = 1 (11.58)

en conclusi
on, todos los valores propios de una matriz que preserva la norma usual de los vectores complejos
tienen norma unidad3 .

11.4.2. Transformaciones ortogonales propias e impropias

Figura 11.1: Conversion de un sistema coordenado dextr ogiro en uno levogiro. En la figura de la derecha el eje
X va hacia adentro del papel. N ogiro se tiene que ux uy = uz en tanto que en
otese que en el sistema dextr
el sistema lev
ogiro se tiene que ux uy = uz

Previamente hemos encontrado que las matrices ortogonales solo pueden tener determinante 1. A con-
tinuaci
on mostraremos que una matriz ortogonal que describe a una transformacion contnua, no puede ser
descrita por una matriz de determinante 1. Consideremos la matriz ortogonal m
as simple con determinante
1 que es menos la identidad
S = 133

esta transformaci on tiene la propiedad de cambiar el signo de cada una de las componentes de los ejes coor-
denados (si la transformaci on es pasiva). Esta operacion nos convierte un sistema coordenado dextr ogiro (de
mano derecha) en uno lev ogiro (de mano izquierda) como se aprecia en la Fig. 11.1, esta operaci
on se denomina
inversi on de los ejes coordenados4 . Una forma de realizar esta operaci on es rotar alrededor de un cierto eje
en 180 , para luego realizar una reflexion con respecto al plano definido por dicho eje y que pasa por el origen
de coordenadas. Si tomamos por ejemplo el eje Z para la operaci on de girar 180 , vemos que esta operaci on
debe realizar la transformaci on x, y, z x, y, z; la cual se puede obtener aplicando sobre el vector columna
(x, y, z) la siguiente matriz

1 0 0
on 180 alrededor de Z = 0 1 0
rotaci
0 0 1

3
N
otese que en este caso la suposici
on de que la matriz sea real no es necesaria, de modo que las matrices complejas m as
generales que preservan la norma de los vectores complejos (matrices unitarias) tambien poseen valores propios con norma unidad.
4
En el sistema dextrogiro ux uy = uz en tanto que en el lev
ogiro ux uy = uz y lo mismo pasa con todos los productos
cruz fundamentales. Esto implica que el algoritmo del producto cruz en el sistema lev ogiro cambia todos los signos respecto al
algoritmo del dextrogiro.
244CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

la matriz de reflexi
on debe convertir z z y dejar inalteradas las otras coordenadas

1 0 0
on respecto al plano XY = 0 1
ref lexi 0
0 0 1
la composici
on de las dos operaciones (tomada en cualquier orden) nos da la matriz de inversi
on que cambia
de signo todas las coordenadas
1 0 0
on = 0 1 0
Inversi
0 0 1
la naturaleza discreta de esta operaci on nos dice que una inversi on de un sistema dextr ogiro a uno levogiro
no puede ser realizado por ning un cambio contnuo en la orientaci on de los ejes coordenados. Por lo tanto,
una inversion no puede corresponder a una transformaci on contnua (por ejemplo, una rotaci on contnua de
los ejes coordenados o el desplazamiento fsico de un cuerpo rgido). Ahora bien, teniendo en cuenta que toda
matriz ortogonal de determinante 1 se puede escribir como el producto de S con una matriz ortogonal de
determinante +1 (e.g. una rotaci on mas una inversion), la argumentaci on anterior ser
a valida para todas las
matrices ortogonales de determinante 1. En consecuencia, las transformaciones ortogonales que representan
a cualquier transformaci on contnua deben ser de determinante +1. Otra forma de ver esto es teniendo en
cuenta que la matriz que representa a una transformaci on contnua, debe evolucionar en forma contnua desde
la identidad la cual tiene determinante +1, el cambio repentino a un determinante 1 no se puede lograr con
una transformacion contnua de los elementos de la matriz.
En virtud de lo anterior, las matrices ortogonales se dividen en dos grandes grupos: Las transformacio-
nes propias (determinante +1) e impropias (determinante 1). Las primeras generan transformaciones
contnuas, en tanto que las otras representan una transformaci on contnua combinada con una transformaci on
discreta de inversion. Un estudio sistem
atico de las propiedades de transformaci on de los vectores bajo la ope-
racion de inversi
on (tambien conocida como transformaci on de paridad) nos lleva a clasificar a los vectores y
escalares de acuerdo con tales propiedades de transformaci on como veremos a continuaci on.

11.5. Clasificaci
on de vectores y escalares por sus propiedades de paridad

Tomemos una matriz antisimetrica Aa y construyamos una matriz equivalente Aa por medio de una
transformaci
on de similaridad
Aa = BAa B1 (11.59)
nos restringiremos a transformaciones de similaridad con matrices ortogonales reales B. En una transformacion

de similaridad ortogonal se conserva la antisimetra i.e. Aa tambien es antisimetrica, lo cual se puede ver
transponiendo la Ec. (11.59)
g
e a = B e aB
1 A e
e =B
eAe aB
e = BAa B1 = Aa
A
En el caso de tres dimensiones, recordemos que los argumentos que nos llevaron a las Ecs. (11.20-11.22) nos
indicaron que a toda matriz Aa real antisimetrica y de dimensi
on 3 3 se le puede asociar un arreglo vectorial
vA . Esto implica que la matriz Aa tambien se puede escribir en la parametrizacion (11.19), y denotamos los

nuevos elementos como a1 , a2 , a3 . Un examen explcito de la transformacion de similaridad (11.59) en tres
dimensiones, muestra que los nuevos elementos ai transforman como
ai = |B| bij aj (11.60)
esto a su vez se puede interpretar como la propiedad de transformacion para el arreglo vectorial vA asociado a
la matriz Aa . El arreglo vectorial vA transforma bajo una transformaci
on de similaridad ortogonal en la forma

vA = |B| BvA (11.61)
DE VECTORES Y ESCALARES POR SUS PROPIEDADES DE PARIDAD
11.5. CLASIFICACION 245

si comparamos este comportamiento con el del vector posici


on bajo transformaciones ortogonales
r = Br
notamos que la transformaci on de vA es similar a la del vector posici
on excepto por el factor |B|. Para transfor-
maciones propias (i.e. |B| = +1) ambas transformaciones son identicas. En contraste, ambas transformaciones
poseen un signo diferente bajo transformaciones ortogonales impropias. Recordando adem as que una trans-
formaci on impropia consiste en una transformaci on propia junto con una inversi on, se deduce que el vector
vA difiere en un signo (con respecto al vector posici on) cuando se hace una transformaci on de inversion. El
vector posicion r invierte su signo bajo inversi
on en tanto que vA permanece inalterado ante una operaci on de
inversi
on. Esto induce a definir dos tipos de vectores
1. Vectores polares: aquellos que bajo el operador de inversion, invierten el signo de sus componentes. El
vector posici
on (con origen fijo) es un prototipo para estos vectores.
2. Vectores axiales o pseudovectores: aquellos que permanecen inalterados ante una operaci on de inversi
on,
el vector vA asociado a una matriz antisimetrica es el prototipo para esta clase de vectores.
Un ejemplo muy com
un de vector axial es aquel que proviene del producto cruz de dos vectores polares
VA = V1 V2
lo cual se puede ver teniendo en cuenta que bajo inversi on de los ejes coordenados, cada vector V1 y V2
invierte su signo (por ser polares). Ejemplos comunes son el momento angular y el torque
L = rp ; = rF
similarmente el producto cruz de un vector axial por uno polar es un vector polar. De lo anterior y teniendo
en cuenta la fuerza de Lorentz
F = q (v B)
se ve que el campo magnetico debe ser un vector axial, ya que F y v son vectores polares. Este hecho es
consistente con la ley de Biot Savart que nos describe la integral de un vector axial diferencial ya que es el
producto cruz de dos vectores polares (de la forma dl b r/r 2 ), la integracion es entonces un vector axial.
Una manera de establecer sistem aticamente esta clasificaci on es a traves del operador paridad P b definido
como aquel que invierte todas las coordenadas xi xi . Una forma u til de obtener un escalar es a traves del
producto punto, por ejemplo el producto punto rr no cambia su signo bajo paridad ya que cada vector cambia
su signo. En general, el producto punto entre dos vectores polares no cambia su signo bajo paridad y ser an
el prototipo de los verdaderos escalares. Por otro lado, el producto punto de un vector polar con uno axial
invierte su signo bajo paridad, es decir, difiere del comportamiento de un verdadero escalar y se le denomina
un pseudoescalar. Si S es un escalar, SA un pseudoescalar, VP un vector polar y VA un vector axial, se
obtiene
b
PS = S ; PSb A = SA ; PV b P = VP ; PV b A = VA ; P b (SVP ) = VP
b (SA VA ) = VA ; P
P b (VA VP ) = (VA VP ) ; Pb (VA VA ) = (VA VA )
b (VP VP ) = (VP VP ) ; P
P b (SA SP ) = SA SP ; Pb (SVP ) = SVP ; P b (SVA ) = SVA

desde un punto de vista pasivo se puede ver porque un vector polar invierte su signo bajo inversi
on. El vector
permanece inalterado en tanto que los ejes coordenados se invierten, de modo que las componentes en el nuevo
sistema coordenado aparecen invertidas. Que ocurre con un vector axial? ocurre que un vector axial lleva
consigo una convencion de quiralidad. Bajo inversi
on, un sistema coordenado dextr ogiro se convierte en uno
levogiro, si tomamos el producto cruz de dos vectores polares
(1) (2) (2) (1)
VAi = VP j VP k VP j VP k ; i, j, k en orden cclico
el orden cclico requerido en esta ecuaci
on implica un cambio similar desde la regla de la mano derecha hacia la
regla de la mano izquierda. Por lo tanto, incluso en una interpretacion pasiva, hay un cambio real de direcci
on
de este producto cruz bajo inversi on.
246CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

11.6. Transformaciones ortogonales propias


La anterior discusion nos motiva a restringir nuestro estudio a las transformaciones ortogonales propias
dado que estaremos interesados en transformacioes contnuas. La propiedad de ortogonalidad usada en la forma
(11.54) nos lleva a la propiedad
e =1A
(A 1) A e

tomando el determinante a ambos lados



e e
|(A 1)| A = 1 A

e
y como A = |A| = 1, y la matriz identidad es simetrica se tiene que

 ^ 
e = |1 A| |(A 1)| = | (A 1)|
|(A 1)| = 1 A

y aplicando la propiedad (11.29) para matrices de dimensi


on impar

|(A 1)| = |A 1|
|(A 1)| = 0 (11.62)

y comparando con la ecuaci on general de valores propios (11.40) se observa que = 1 es una soluci on para tal
ecuacion. En conclusi
on, para una matriz ortogonal propia de dimensi on impar, uno de los valores propios de
la matriz es = +1. Es importante enfatizar que esta conclusi on solo es v
alida para matrices de dimensi on
impar en virtud del uso de la Ec. (11.29). Para n par, b asicamente se llega a una identidad trivial y no a
(11.62). Adicionalmente si la matriz A es real, se tiene que si es soluci
on de la ecuaci
on secular, tambien lo

sera .

11.6.1. Matrices ortogonales reales propias en tres dimensiones


Para el caso especfico de tres dimensiones, es posible obtener m as propiedades sobre los valores propios.
Dado que la dimension es impar, tenemos al menos un valor propio igual a la unidad. Por convenci on designemos
3 = +1 de modo que queremos obtener informaci on sobre 1 y 2 . Ya hemos demostrado que el determinante
de una matriz es invariante ante una transformaci on de similaridad. Por lo tanto, el determinante de A coincide
con el de la matriz en virtud de la relacion (11.47) por lo tanto para matrices ortogonales propias se tiene
que5
|A| = 1 2 3 = 1 2 = 1 (11.63)
y recordando que los valores propios son de modulo unidad para las matrices unitarias y en particular para las
matrices ortogonales reales (ver Ec. 11.58 y su discusi
on), tenemos

k1 k = k2 k = 3 = +1 (11.64)

todo complejo unitario se escribe de la forma ei . Teniendo en cuenta las Ecs. (11.63) y (11.64) podemos
escribir

1 = ei1 ; 2 = ei2 ; 3 = 1
1 2 = 1 = ei1 ei2 1 = 2

finalmente, la estructura de valores propios se escribe como

1 = ei ; 2 = ei ; 3 = 1 (11.65)
5
Esto es valido siempre que la matriz sea diagonalizable. Se puede demostrar que este es el caso para las matrices ortogonales
pero no lo trataremos aqu.
11.7. MATRIZ ADJUNTA 247

Vemos que 1 es el complejo conjugado de 2 lo cual es consistente con el hecho de que si la matriz A es
real, es soluci
on de la ecuaci
on secular, siempre que lo sea. Esto a su vez implica que 1 y 2 son ambos
complejos o ambos reales. Son reales cuando = 0, y complejos en otros casos. Tenemos entonces tres
posibles estructuras

1. Cuando = 0, todos los autovalores son +1. La matriz de transformaci


on es la identidad, este caso es
la soluci
on trivial

2. Cuando = , 1 = 2 = 1, y 3 = 1. Esta transformaci on se puede considerar como una inversi


on
en dos ejes coordenados manteniendo el tercero inalterado, como se puede ver si usamos estos valores de
i en la matriz (11.46) y la aplicamos a un vector arbitrario. Igualmente se puede ver como una rotaci
on
de con respecto al tercer eje.

3. 6= 0, , en este caso 1 y 2 son complejos y 1 = 2 .

11.7. Matriz adjunta


Para definir la norma de un vector complejo en forma matricial podemos escribir

kxk2 = xi xi kxk2 = x
e x

n
otese que hemos tenido que escribir a la izquierda el vector traspuesto (es decir vector fila) a fin de que la
operaci
on este definida seg
un la discusi
on en la secci e se obtiene al conjugar
on (11.1.2). La matriz rectangular x
y trasponer la matriz rectangular x, vamos a definir a x e como la adjunta de la matriz x y la denotamos con
un obelisco
x x
e (11.66)
vamos a definir ahora una funci
on compleja de los vectores columna x e y en la forma

(x, y) x y

esta operaci
on cumple con las propiedades de un producto interno i.e.

(x, y) = (y, x) ; (x,y + z) = (x, y) + (x, z) ; (x, x) = kxk2 (11.67)

vemos que si hacemos x = y se obtiene la norma al cuadrado del vector x. Adicionalmente, si los vectores
son reales esta operacion me genera el producto punto. En general, diremos que un vector x es unitario o
normallizado si (x, x) = kxk2 = 1, y dos vectores x e y ser
an ortogonales si (x, y) = 0.
Por otra parte, si transformamos el vector x a traves de cierta matriz

x Mx (11.68)

y realizamos el producto escalar o producto interno


 
C = x y = x , y

nos preguntamos ahora como debe transformar el vector y (sin alterar al vector x) de modo que este producto
interno permanezca intacto, es decir de modo que
  
x y = x y x , y = x, y (11.69)

siendo y la correspondiente transformaci


on en y denotemos entonces

y = By (11.70)
248CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

a la matriz B la llamamos la matriz adjunta de M. Reemplazando (11.68) y (11.70) en (11.69) resulta



^ y = x (By) x
(Mx) y = x (By) (Mx) f y = x (By)
e M

y definiendo a la conjugada traspuesta de la matriz M en forma an


aloga a la Ec. (11.66)

f
M M (11.71)

obtenemos
x M y = x By
dado que esto es v
alido para todo x e y, se concluye que

B = M

donde el smbolo M indica la conjugada traspuesta de la matriz M concepto que se extiende naturalmente
de la definici
on an
aloga para vectores columna. La matriz adjunta de M es entonces su conjugada traspuesta.
En notacion de producto interno escribimos
 
(Mx, y) = x, M y (11.72)

Veremos que varias propiedades interesantes de transformaci


on se traducen en propiedades de la matriz adjunta.
Es f
acil ver las siguientes propiedades
 

M = M ; (AB) = B A ; M = |M|

a continuaci
on veremos algunas matrices especiales relacionadas con la adjunta de una matriz.

11.8. Matrices unitarias y cambios de base (opcional)


Nos preguntamos ahora por el conjunto m as general de matrices que al transformar a ambos vectores deja
invariante el producto interno i.e.
 
(x, y) = x , y x y = x y con x = Ux ; y = Uy

resulta entonces que


x y = (Ux) (Uy) = x U Uy
al ser v
alido para todo x y para todo y resulta

U U = 1 (11.73)

U es entonces la inversa a izquierda de la matriz U pero recordando que para matrices cuadradas la inversa
a izquierda es igual a la inversa a la derecha resulta

U = U1 (11.74)

En particular, si x = y observamos que estas transformaciones dejan invariante la norma del vector x. Por
lo tanto la propiedad (11.74) define al conjunto mas general de transformaciones lineales que preservan el
producto interno y en particular la norma de los vectores. A las matrices que cumplen esta propiedad se les
denomina matrices unitarias. Cuando los elementos matriciales son complejos, la magnitud de los vectores
(que en general tendran tambien componentes complejas), no ser a invariante bajo una transformaci on con
matrices ortogonales. Las matrices unitarias son matrices complejas que mantienen invariante la norma de
vectores complejos. Los valores propios de las matrices unitarias poseen modulo unidad como se demostr o en
(11.58) pues debemos recordar que la unica condici
on que se uso para llegar a (11.58) fue la preservaci
on de
11.8. MATRICES UNITARIAS Y CAMBIOS DE BASE (OPCIONAL) 249

la norma de los vectores (reales o complejos) ante la transformacion asociada a la matriz (real o compleja). El
determinante se obtiene de la propiedad (11.73)

e
U U = 1 U |U| = 1 |U| |U| = 1
|det U |2 = 1 det U = ei

de modo que el determinante al igual que los valores propios es un numero complejo con norma unidad. Esto
es consistente con el hecho de que cuando la matriz es diagonalizable, el determinante es el producto de sus
valores propios.
Existe otra propiedad fundamental de las matrices unitarias que con frecuencia la literatura la toma como
definici
on. Una matriz unitaria es aquella que transforma cualquier base ortonormal en otra base ortonormal,
ve
amoslo. Sean {ui } un conjunto de vectores ortonormales con respecto a algun producto interno i.e.

(ui , uj ) = ij

transformemos cada elemento ui de la base con una matriz unitaria i.e. ui = Uui tenemos que

ui , uj = (Uui , Uuj ) = (ui , uj )

donde hemos usado la definici


on de matriz unitaria como aquella que no altera el valor del producto interno.
Por lo tanto 
ui , uj = (ui , uj ) = ij
que es lo que se quera demostrar. Esta propiedad es de suma importancia dado que usualmente estamos
interesados en utilizar bases ortonormales incluso cuando cambiamos de base. Si definimos un espacio vectorial
an asociados al espacio Rn , en tanto que si los escalares son
donde los escalares son reales los vectores base est
complejos hablamos de una base en el espacio unitario C n de dimensi on n donde cada componente representa
un numero complejo. El espacio C 2 es por ejemplo de gran importancia en la caracterizaci on del espn en
mecanica cuantica y los cambios de base en este espacio se realizan con matrices unitarias de dimensi on dos.
Para nuestros prop ositos estaremos interesados en vectores de Rn en cuyo caso ser a suficiente trabajar el
subconjunto propio de matrices unitarias reales: es decir el conjunto de transformaciones ortogonales reales
propias6 . Los cambios de base se realizar an entonces con matrices ortogonales reales propias. Recordemos
entonces que ante un cambio de base, un operador activo A cambia su representaci on matricial en la forma

A = BAB1 (11.75)

y si ambas bases son ortonormales, B es una matriz unitaria u ortogonal real propia seg
un el espacio en el que
trabajemos.
La condici
on de unitariedad (11.74) se puede escribir en componentes en la forma siguiente
e = 1 ; U
UU e U = 1 uij u
ejk = jk ; eij ujk = jk
u
uij ukj = jk ; uji ujk = jk (11.76)

el primer conjunto de ecuaciones (11.76) nos indica que los vectores fila que constituyen a la matriz unitaria
son ortonormales entre s. Similarmente, el segundo conjunto de ecuaciones (11.76) muestra la ortonormalidad
de los vectores columna que constituyen la matriz unitaria. Es claro que solo un conjunto de estas relaciones
es independiente y el otro es redundante. Naturalmente, si las componentes son reales las condiciones de
unitariedad (11.76) coinciden con las condiciones de ortogonalidad Ecs. (11.52, 11.53).
Finalmente, cabe enfatizar que un cambio de base en C n (Rn ) de la forma (11.75) no requiere que la
matriz de transformacion sea unitaria u ortogonal. Solo se necesita que la matriz pasiva de transformaci
on sea
no singular. El problema es que la nueva base no ser a ortonormal lo cual puede traer varias dificultades que
6
Las matrices unitarias complejas mantienen la norma de los vectores que originalmente son reales, pero me pueden llevar un
vector de Rn a un vector de C n .
250CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

ilustraremos con un sencillo ejemplo, escribamos el producto interno de un cierto conjunto de vectores base en
la forma
(vi , vj ) = gij (11.77)

y denominamos a gij el tensor metrico. Si los vectores unitarios son ortonormales entonces gij = ij . Si la base
es ortogonal pero los vectores base no est an normalizados gij es no trivial pero sigue siendo diagonal. Si la
base no es ortogonal ni normal este tensor es adem as no diagonal. Escribimos x e y en terminos de la base y
calculamos el producto interno entre ellos

x = i vi ; y = j vj (x, y) = (i vi , j vj ) = i j (vi , vj )
(x, y) = i gij j

o en notaci
on matricial
(x, y) = G

Sea una matriz A que representa a un operador activo y veamos que relaci
on tiene esta matriz con su adjunta
B en esta base

(Ax, y) = (x, By) (Ax) Gy = x G (By)


x A Gy = x GBy

que nos lleva a la condici


on
A G = GB B = G1 A G

n
otese que la representacion del operador adjunto no est
a dada por la conjugada traspuesta de la representaci
on
del operador original.
Es f
acil ver la condici
on para que una matriz represente a un operador activo unitario en esta base
 
(Ux, Uy) = (x, y) x U G (Uy) = x Gy U GU = G
G1 U G = U1 (11.78)

En bases no ortonormales, la condici


on de ortogonormalidad entre dos vectores ai y aj se escribe

(ai , aj ) = ai Gaj = ij

Esto nos motiva a introducir una sutil diferencia entre operadores lineales adjuntos, unitarios, etc. y ma-
trices adjuntas, unitarias, etc. Tomemos de ejemplo los operadores unitarios y matrices unitarias para la
discusi
on. En general la literatura utiliza el termino matriz unitaria para los arreglos matriciales que cum-
plen el algoritmo matricial U1 = U esta es una definici on algebraica. Por otro lado, se define un operador
lineal unitario como aquel que deja invariante el producto interno entre dos vectores arbitrarios, esta es una
definici
on geometrica y por tanto independiente del sistema coordenado que se use. No obstante, una matriz
unitaria en el sentido aqu expuesto solo representa a un operador unitario cuando la base es ortonormal.
Cuando la base no es ortonormal la representaci on matricial de un operador unitario est a dada por el algo-
ritmo (11.78) y la llamaremos representaci on matricial del operador unitario. Por supuesto, la misma
discusi
on vale para el concepto de adjunto y otros conceptos que veremos a continuaci on como hermiticidad,
normalidad, etc.
Lo anterior nos ilustra algunas dificultades que aparecen cuando se toman bases no ortonormales, por esta
razon es usual que los cambios de base se hagan garantizando que se llega a otra base ortonormal i.e. con
matrices unitarias u ortogonales reales. Veremos sin embargo, que las bases no ortonormales nos permiten
resolver un problema modificado de valores propios con muchas aplicaciones en Fsica (ver Sec. 11.11).
11.9. MATRICES HERMITICAS Y SIMETRICAS
REALES 251

11.9. Matrices Hermticas y sim


etricas reales
Se define una matriz hermtica o autoadjunta si dicha matriz coincide con su adjunta i.e.
e A
A=A

Es facil demostrar que para una matriz hermtica de dimension arbitraria, su naturaleza hermtica se
preserva ante una transformaci
on de similaridad unitaria. Bajo una transformacion de similaridad

A = BAB1

la matriz conjugada traspuesta i.e. la adjunta, estar


a dada por

A = B1 AB

acter hermtico de A. Si la matriz B es unitaria entonces B1 = B y B1
donde hemos usado el car =

B = B de lo cual resulta
A = BAB1 = A
debe enfatizarse que la si la matriz del cambio de base B no es unitaria, en general la matriz transformada no
sera hermtica. Cuando los elementos matriciales son reales las matrices hermticas se vuelven simetricas y las
matrices unitarias se vuelven ortogonales. Por lo tanto las matrices simetricas reales y ortogonales reales son
casos particulares de matrices hermticas y unitarias respectivamente.
Veamos algunas propiedades de las matrices hermticas: hemos visto que la solucion del problema de valores
y vectores propios de una cierta matriz A, nos permite obtener una matriz que genera un cambio de base que
diagonaliza a la matriz A. La matriz de transformaci on (mas exactamente su inversa), se obtiene adjuntando
los arreglos columna que corresponden a los vectores propios y la matriz diagonalizada consta de los valores
propios colocados en la diagonal de la nueva matriz ver Ecs. (11.47, 11.46). Este procedimiento tiene sin
embargo algunos problemas en el caso general, por ejemplo si no todos los vectores propios son linealmente
independientes la matriz que debe diagonalizar se vuelve singular y por tanto, no existe su inversa. Esto implica
que en particular pueden existir problemas con la diagonalizaci on cuando hay valores propios degenerados. Sin
embargo, el proceso de diagonalizaci on es en general mas sencillo para las matrices Hermticas.
Una de las primeras propiedades interesantes de las matrices hermticas es que sus valores propios son
reales, a
un cuando la matriz sea compleja. Denotaremos a la matriz Hermtica como H para enfatizar en su
hermiticidad, adem as V(j) denotara el jesimo vector propio, con valor propio j . La ecuaci on de valores
propios se escribe como
HV(j) = j V(j)
haciendo el producto por la izquierda con el vector adjunto (conjugado traspuesto) correspondiente al vector
propio nesimo tenemos
V(n) HV(j) = j V(n) V(j) (11.79)
para la ecuaci
on de valores propios correspondiente al nesimo vector propio

HV(n) = n V(n)

podemos tomar la ecuaci


on adjunta
V(n) H = n V(n)
y multiplicamos por el vector (columna) V(j) a la derecha de ambos miembros, teniendo en cuenta adem
as
que la matriz H es hermtica, se obtiene

V(n) HV(j) = n V(n) V(j) (11.80)

restando las Ecs. (11.79, 11.80) resulta

(j n ) V(n) V(j) = 0 (11.81)


252CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

si j = n se obtiene que 2

(n n ) V(n) = 0
de modo que n = n y los valores propios son reales como se quera demostrar. Ahora bien, si j 6= n y j 6= n ,
es decir si estos valores propios no son degenerados, se obtiene de (11.81)
 
(j n ) V(n) V(j) = 0 V(n) V(j) = V(n) , V(j) = 0

donde hemos usado el car acter real de los valores propios. Vemos entonces que los vectores propios corres-
pondientes a valores propios diferentes son ortogonales. Este hecho tiene un gran alcance en terminos de
aplicaciones. Por ejemplo en ecuaciones diferenciales, muchos operadores diferenciales son lineales y hermti-
cos, tales operadores act uan sobre espacios vectoriales de funciones (usualmente de dimensi on infinita) sus
valores propios son reales y sus vectores propios son ortogonales al menos en ausencia de degeneraci on, estos
vectores propios permiten generalmente construr una base para el espacio vectorial en cuesti on. En consecuen-
cia el problema de Sturn-Liouville se reduce a un problema de valores propios de un operador hermtico que al
ser lineal admite una representaci on matricial (aunque estas matrices son en general de dimensi on infinita lo
cual introduce problemas que no trataremos aqu). Es necesario enfatizar sin embargo que los vectores propios
asociados a valores propios degenerados no son necesariamente ortogonales.
Si la matriz hermtica es real se convierte en una matriz sim etrica real y los cosenos directores (i.e. las
componentes de los vectores propios) ser an tambien reales, esto implicar
a a su vez que la matriz de rotaci on
que nos lleva a diagonalizar la matriz es real, en consecuencia si partimos de unos ejes en R reales, la n

transformaci on me lleva a otro conjunto de ejes Rn reales en donde la matriz es diagonal. En el caso del
espacio Euclideano Rn , el cambio de base que conduce a la diagonalizaci on corresponde a una reorientaci on
a un nuevo conjunto de ejes en donde la representaci on matricial es diagonal. Llamaremos a estos ejes los
ejes principales asociados a la matriz. Los ejes estar an orientados en la direcci on de los vectores propios
independientes asociados a la matriz.
Para enfatizar la importancia de que los valores propios de matrices reales simetricas sean reales, recordemos
por ejemplo que las matrices ortogonales reales en tres dimensiones, solo poseen un valor propio real excepto en
casos triviales y por tanto una sola direccion real asociada a un vector propio (eje de rotaci on). En contraste,
al ser los valores propios de H reales, y que los vectores asociados son ortogonales (al menos en ausencia de
degeneraci on) nos indica que hay n direcciones reales de los vectores propios que son mutuamente ortogonales.
En funci on de la matriz X1 que diagonaliza a H con una transformaci on de similaridad, vemos que esto
equivale a que dicha matriz sea ortogonal y real, de modo que tenemos garantizado el hecho de que si partimos
de un sistema cartesiano ortogonal real, la matriz X1 nos lleva a otro sistema cartesiano ortogonal real.

11.9.1. Problema de valores propios de matrices hermticas en tres dimensiones


Una propiedad interesante para la matrices hermticas en tres dimensiones es que dados dos vectores
propios ortogonales y sus valores propios correspondientes, el tercer vector propio se puede hallar simplemente
construyendo un sistema coordenado dextr ogiro con los dos anteriores. Para ello debemos demostrar que
(p) (p)
si u1 , u2 son vectores propios unitarios ortogonales que generan ejes principales, entonces un vector u3
ortogonal a los anteriores tambien es vector propio que genera el tercer eje principal7 . Para demostrarlo,
tengamos en cuenta que de acuerdo con la ecuaci on de vectores propios se cumple por hip otesis que
(p) (p) (p) (p)
Hp u1 = 1 u1 ; Hp u2 = 2 u2 (11.82)
(p)
aplicando ui a la izquierda
(p) (p) (p) (p) (p) (p) (p) (p)
ui Hp u1 = 1 ui u1 ; ui Hp u2 = 2 ui u2 ; i = 1, 2, 3
7
Cuando los vectores son complejos n dimensionales, es decir que yacen en el espacio C n donde cada componente es compleja,
on de ortogonormalidad se define por (ui , uj ) = ui uj = ij . Para el caso de vectores reales, el tercer eje principal se puede
la relaci
generar con u3 = u1 u2 que garantiza la obtenci on de ejes a derecha.
11.9. MATRICES HERMITICAS Y SIMETRICAS
REALES 253

tendremos entonces
(Hp )i1 = 1 i1 ; (Hp )i2 = 2 i2
de lo cual resulta que
(Hp )21 = (Hp )31 = (Hp )12 = (Hp )32 = 0
el car
acter hermtico de la matriz nos dice que los otros elementos fuera de la diagonal tambien son cero.
(p) (p) (p)
De modo que la matriz construda en la base u1 , u2 , u3 s es diagonal y en consecuencia el tercer eje es
tambien un eje principal. N otese que el car
acter hermtico de la matriz es necesario para aseverar que el tercer
(p) (p) (p)
eje tambien es principal. Si la matriz es simetrica real, los ejes definidos por u1 , u2 y u3 tambien seran ejes
principales.
Ya hemos visto que si los valores propios no son todos distintos no podemos garantizar que los vectores
propios sean ortogonales entre s. Sin embargo, en virtud de lo anterior, este problema no presenta mayor
obstaculo en tres dimensiones, al menos para ejes reales. Supongamos por ejemplo que 1 = 2 6= 3 , en
este caso siempre sera posible hallar al menos un vector propio que satisfaga la ecuaci on de valores propios
asociada al valor propio degenerado 1 , este vector tiene que ser ortogonal al vector propio asociado a 3 , estos
dos vectores propios ya me determinan dos ejes principales ortogonales de modo que el tercero se construye
simplemente definiendo un sistema coordenado dextr ogiro. En este caso sin embargo podemos decir algo m as,
(p) (p)
si definimos una nueva base en donde rotamos solo los vectores u1 y u2 i.e. los vectores asociados a la
degeneracion, tenemos que
u1 cos sin 0 u1
u2 = sin cos 0 u2
u3 0 0 1 u3
se puede verificar que los nuevos vectores u1 , u2 tambien son vectores propios con valor propio 1 = 2 . Debe
enfatizarse que la matriz de transformaci
on debe ser ortogonal real. Esto implica entonces que dados dos valores
propios degenerados 1 = 2 dos vectores propios independientes asociados a este valor propio degenerado me
definen un plano en donde todos los vectores que yacen en tal plano son vectores propios. Los ejes principales son
entonces cualquier par ortogonal de ejes en este plano. Tenemos entonces que esta degeneraci on est
a asociado
a una simetra axial (alrededor del eje X3 ). An alogamente, si todos los valores propios son iguales, todas las
direcciones del espacio conducen a vectores propios, es decir tenemos una simetra esferica pero en este caso
la matriz ya estara diagonalizada, de modo que la degeneraci on total no representa tampoco un problema en
tres dimensiones.

11.9.2. etricas reales en R3


Matrices sim
Finalmente, para matrices simetricas reales (i.e. hermticas reales) es interesante la interpretaci
on geometri-
ca que se le puede dar a los ejes principales en R3 . Tomemos un escalar definido por cierto vector unitario
real en la forma
e Hn H
n (11.83)
si denotamos 1 , 2 , 3 los cosenos directores de n tenemos

n = i ui

y podemos escribir la Ec. (11.83) usando el car


acter simetrico de H

i Hij j H

H11 21 + H22 22 + H33 23 + 2H12 1 2 + 2H13 1 3 + 2H23 2 3 = H


No obstante ser
a m
as pr
actico escribir esta ecuaci
on en forma normalizada para lo cual definimos un vector
en la forma
n
(11.84)
H
254CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

ahora dividimos por H a ambos lados de (11.83) con lo cual queda

eH = 1 (11.85)

usando el car
acter simetrico de H, esta ecuaci
on se escribe

H11 21 + H22 22 + H33 23 + 2H12 1 2 + 2H13 1 3 + 2H23 2 3 = 1 (11.86)

si la consideramos como una funci on en tres variables esta es la ecuaci


on de una superficie en el espacio de
configuracion con ejes 1 , 2 , 3 . Podemos realizar un cambio de base a traves de una matriz ortogonal real
propia B, reescribiendo (11.85) de la siguiente forma
  
e B1 B H B1 B = 1 e B e BHB1 B = 1

] BHB1 (B) = 1
(B)

y dado que para matrices simetricas reales es posible encontrar una matriz ortogonal real propia que la
diagonalice con una transformaci on de similaridad, escogemos a B como la matriz de diagonalizaci
on (que se
construira con los vectores propios de H) tenemos entonces que BHB1 = siendo la matriz diagonal con
los valores propios en la diagonal. Resulta entonces

e = 1 ; B (11.87)

Esto implica que en general siempre es posible pasar a un sistema coordenado con ejes 1 , 2 , 3 en donde la
Ec. (11.86) toma su forma normal
1 2 2 2
1 + 2 2 + 3 3 = 1 (11.88)
Si todos los coeficientes i son positivos, entonces la Ec. (11.88) define la superficie de un elipsoide, estando
los ejes principales del elipsoide a lo largo de los nuevos ejes de coordenadas. Esto ocurrir a cuando la matriz
H sea una matriz positiva como se discutir a en la seccion 11.11. A manera de ejemplo, se sabe que para el
tensor de inercia los momentos principales de inercia (elementos diagonales del tensor) son positivos cualquiera
que sea la inclinaci
on de los ejes, lo cual garantiza que la forma diagonal tiene solo coeficientes positivos. La
forma cuadr atica (11.88) es precisamente la forma que tiene la Ec. (11.86) en un sistema de coordenadas en el
cual la matriz simetrica real es diagonal. Es decir los ejes principales que vuelven diagonal a H son los mismos
que llevan a la ecuaci on de un elipsoide a su forma normal. Los valores propios en consecuencia determinan
las longitudes de los ejes del elipsoide. Si dos valores propios coinciden, el elipsoide tendr
a dos ejes iguales de
modo que ser a un elipsoide de revolucion manifestando la simetra axial asociada, si la degeneraci
on es total,
el elipsoide es una esfera manifestando la simetra esferica del problema.
Por supuesto es posible que los coeficientes en (11.88) y por lo tanto los valores propios de la matriz
simetrica asociada no sean positivos, en tal caso estaremos transformando otra clase de superficie (en general
c
onicas) a su forma normal.

11.10. Matrices normales (opcional)


Hemos visto que una matriz n n se puede diagonalizar a traves de una transformaci on de similaridad
siempre que se pueda encontrar un conjunto de n vectores propios linealmente independientes, de tal modo
que se pueda construr una matriz no singular de diagonalizacion. Adicionalmente, hemos visto que es deseable
que la diagonalizaci
on se pueda realizar a traves de una matriz unitaria u ortogonal real a fin de pasar de
una sistema ortonormal a otro sistema ortonormal. Sin embargo, la diagonalizaci on por matrices unitarias no
es posible para cualquier matriz, queremos indagar entonces cual es el conjunto m as general de matrices que
pueden ser diagonalizadas por matrices unitarias a traves de transformaciones de similaridad. Para averiguarlo,
partamos de la hipotesis de que la matriz A es diagonalizable con una matriz unitaria

UAU = UA U =
11.10. MATRICES NORMALES (OPCIONAL) 255

donde la segunda ecuaci on es simplemente la adjunta de la primera. Multiplicando las dos ecuaciones en
diferente orden tenemos
     
UAU UA U = ; UA U UAU =
UAA U = ; UA AU =

donde hemos usado el caracter unitario de U y el hecho de que dos matrices diagonales conmutan entre s.
Restando las dos ecuaciones queda
  h   i
U AA A A U = 0 U U AA A A U U = U 0U
AA A A = 0

por tanto para que una matriz sea diagonalizable con una transformaci
on unitaria, es necesario que la matriz
conmute con su adjunto, mas adelante demostraremos la suficiencia de esta condici on. LLamaremos entonces
matrices normales a aquellas que conmutan con su adjunto i.e.
h i
AA A A A, A = 0

en esta seccion, la notaci


on de parentesis cuadrados indicar a conmutador y no corchete de Poisson. Puede
demostrarse sin embargo, que los conmutadores obedecen un algebra similar a la de los corchetes de Poisson
Ecs. (8.9, 8.12). Es inmediato ver que las matrices hermticas y unitarias son casos particulares de matrices
normales, por tanto todos los resultados que se deriven aqu ser
an v
alidos para matrices hermticas y unitarias.
Veremos entonces algunas de las propiedades de las matrices normales. Escribamos la ecuaci on de valores
propios y su correspondiente adjunta
 
(A 1) x = 0 ; x A 1 = 0
Bx = 0 ; x B = 0 ; B A 1 (11.89)

calculemos el siguiente conmutador


h i h i h i
(A 1) , (A 1) = A 1, A 1 = A , A 1 [ 1, A 1]
h i h i h i h i
= A , A 1 = A , A A , 1 = A , A = 0

donde hemos usado el hecho de que la identidad conmuta con cualquier matriz. Tenemos entonces que
h i h i
(A 1) , (A 1) B , B = 0 (11.90)

de modo que B es tambien una matriz normal. Usando (11.89) y (11.90) resulta
   
x B Bx = 0 = x BB x B x B x = 0
 
B x = 0 A 1 x = 0

esto nos demuestra que para matrices normales, A tiene los mismos autovectores de A pero sus autovalores
son los conjugados de los autovalores de A.
on de valores propios para A y A en la forma
Usando lo anterior, tomemos ahora la ecuaci

A xi = i xi ; Axj = j xj

tomando la traspuesta de la primera ecuaci on por xi se tiene


on y multiplicando la segunda ecuaci

xi A = i xi ; xi Axj = j xi xj
256CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

multiplicando la primera ecuaci


on por xj a la derecha y restando las dos ecuaciones resulta

(i j ) xi xj = 0

para i 6= j se tiene que


xi xj = (xi , xj ) = 0

de modo que los autovectores correspondientes a autovalores diferentes son ortogonales. Esto significa que al
construr la matriz de diagonalizacion sus filas ser
an ortogonales (en el sentido del producto interno) y por
tanto formar an un matriz unitaria. Esto indica que al menos en ausencia de degeneraci on podemos construr
n vectores linealmente independientes ortogonales. La matriz de vectores propios tendr a columnas ortogonales
(en el sentido del producto interno) y por tanto formara una matriz unitaria. Entonces una matriz normal puede
ser diagonalizada por una matriz unitaria. Cuando existe degeneraci on, hay una mayor libertad para escoger
los vectores ortogonales asociados a los valores propios degenerados. Esto prueba la condici on de suficiencia
arriba mencionada. Tenemos entonces que las matrices normales son el conjunto m as general de matrices que
pueden diagonalizarse con una matriz unitaria.
Ya hemos dicho que las matrices unitarias y hermticas son normales. Por tanto, una matriz unitaria
puede ser diagonalizada por otra matriz unitaria que significado puede tener la diagonalizaci on de una matriz
unitaria por otra matriz unitaria?. Esto tendr a sentido geometrico si la matriz que se diagonaliza es activa
(por ejemplo una matriz que representa la rotaci on de un vector en C n o en Rn ) en tanto que la matriz que
diagonaliza debe ser pasiva (reorientacion de los ejes en C n o en Rn ).

11.11. Problema de valores propios modificado


En el tratamiento de los osciladores acoplados, se llega a una ecuaci
on matricial de la forma

Va = Ta (11.91)

Donde T y V son matrices, un n umero complejo y a un vector columna. N otese que la Ec. (11.91), es una
ecuaci
on de valores propios con estructura diferente a la mostrada en (11.39), ya que al operar V sobre a no
obtenemos a por una constante sino una constante multiplicada por Ta. Adicionalmente, asumiremos que las
matrices T y V en la Ec. (11.91) son simetricas y reales y adem as T es definida positiva en tanto que V es
positiva8 . Con estas hip
otesis de trabajo demostraremos las siguientes propiedades:

1. Los valores propios son reales no negativos. Si adem


as V es definida positiva, los valores propios
ser
an estrictamente positivos.

2. Si V no es definida positiva, tendremos un valor propio nulo mdegenerado, donde m es el n


umero de
vectores propios ak (no triviales) linealmente independientes tal que ak Vak = 0.

3. Las componentes de los autovectores a son reales, excepto por una posible fase global.

4. Los autovectores a correspondientes a valores propios diferentes son ortogonales, aunque bajo una metrica
diferente como veremos m as adelante.

5. La matriz de autovectores A diagonaliza tanto a T como a V. Esta diagonalizaci on se realiza con una
transformaci
on de congruencia que definiremos mas adelante. La matriz T se diagonaliza a la identidad
y la matriz V se diagonaliza a una matriz cuya diagonal contiene los valores propios.
8
Se dice que una matriz M es definida positiva cuando eaMa 0 para todo a, y solamente es cero si a = 0. Cuando e
aMa 0
pero no es necesario que a sea nulo para que esta cantidad sea nula, decimos que la matriz es positiva.
11.11. PROBLEMA DE VALORES PROPIOS MODIFICADO 257

Para demostrar esas propiedades comencemos por rotular los valores propios k y los correspondientes
vectores propios a(k) el parentesis indica que estamos rotulando un vector propio y no una componente del
vector, reescribimos la Ec. (11.91) en la forma

Va(k) = k Ta(k) (11.92)

la ecuaci
on adjunta resultante (para cualquier otro valor y vector propio) es

a(m) V = m a(m) T (11.93)

donde hemos usado el car acter real y simetrico de T y V 9 . Multiplicando (11.93) por a(k) a la derecha,
multiplicando (11.92) por a(m) a la izquierda y sustrayendo se obtiene

0 = k a(m) Ta(k) m a(m) Ta(k)


0 = (k m ) a(m) Ta(k) (11.94)

cuando k = m la Ec. (11.94) queda de la forma

(k k ) a(k) Ta(k) = 0 (11.95)

Queremos probar que el producto a(k) Ta(k) es real y positivo10 . Para ello separamos a(k) en sus partes real e
imaginaria
a(k) = (k) + i(k) (11.96)
la matriz producto se escribe como
  
a(k) Ta(k) = (k) i(k)

T (k) + i(k)
 
a(k) Ta(k) e(k) T(k) + e(k) T (k) + i
= e(k) T (k) e(k) T(k) (11.97)

donde hemos usado el hecho de que por construcci on los vectores , son reales y por tanto su adjunto
coincide con su traspuesto. La parte imaginaria en (11.97) se anula debido a la simetra de T de modo que el
factor a(k) Ta(k) es real.
a Ta(k) = e(k) T(k) + e(k) T
(k) (k) (11.98)
Pero dado que T es definida positiva para vectores reales, entonces los dos miembros de la derecha son positivos
y solo son cero si todas las componentes de y son cero, es decir si a = 0. Esto nos lleva a la conclusi
on de
que toda matriz simetrica definida positiva para vectores reales tambien sera definida positiva para vectores
complejos i.e. si a 6= 0 tenemos

a(k) Ta(k) > 0 (11.99)

combinando (11.99) con (11.95) se obtiene que los k son reales11 .


Ahora puesto que los valores propios son reales, los cocientes de las componentes de los autovectores aj(k)
determinados por las Ecs. (11.91) tienen que ser todos reales. Hay por supuesto aun un grado de arbitrariedad
ya que el valor de una componente particular de los aj(k) se puede escoger a voluntad sin violar la Ec. (11.91).
Podemos entonces requerir que esta componente sea real y el car acter real de k asegura entonces el caracter
9
Estrictamente, solo estaramos usando su car
acter hermtico.
10
Asumiremos que T es una matriz definida positiva solo para vectores reales a, y llegaremos a que tambien ser
a definida positiva
para vectores complejos.
11
Asumimos que el factor es estrictamente positivo ya que estamos interesados en los vectores propios no triviales.
258CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

real de todas las otras componentes12 . Multipliquemos ahora la Ec. (11.92) por e
a(k) a la izquierda y resolvemos
para k

e
a(k) Va(k) = k e
a(k) Ta(k)
e(k) Va(k)
a
k = (11.100)
e
a(k) Ta(k)

y como los vectores a(k) son reales y los asumimos no nulos13 , el numerador es no negativo y el denominador
es estrictamente positivo en virtud de la caracter positivo de V y definido positivo de T. Por tanto los valores
propios k son no negativos. Si adicionalmente V es definida positiva, el numerador es tambien positivo y
por lo tanto los valores propios son estrictamente positivos. Por otro lado, si V no es definida positiva, existe
un conjunto m de vectores no nulos linealmente independientes tal que a e(k) Va(k) = 0, por tanto tendremos m
valores propios nulos.
Volvamos a la Ec. (11.94) para la cual hemos examinado el caso en que k = m Ec. (11.95). Estudiemos
entonces el caso en el cual m 6= k, teniendo en cuenta que los vectores y valores propios son reales

(k m ) e
a(m) Ta(k) = 0 (11.101)

si las races k y m de la ecuaci


on secular son distintas, la Ec. (11.101) solo se cumple si

e(m) Ta(k) = 0
a ; m 6= k (11.102)

ya se ha mencionado en varias ocasiones que los valores de los aj(k) no est


an completamente fijados por la
ecuaci
on de valores propios (11.92). Podemos remover esta indeterminaci
on exigiendo la condici
on

e
a(k) Ta(k) = 1 (11.103)

hay n de estas ecuaciones y por tanto queda fija la componente que antes era arbitraria en cada a(k) , excepto
por un signo global ya que si cambiamos a(k) a(k) a un se siguen cumpliendo (11.102) y (11.103). Si
organizamos los vectores propios en columnas adyacentes para formar una matriz A con elementos ajk las Ecs.
(11.102) y (11.103) se pueden sintetizar en una sola

e
ATA =1 (11.104)

si existe alg
un tipo de degeneracion ya no ser
a v
alido el argumento que nos llevo a la Ec. (11.102). Estudiaremos
el caso de degeneraci on mas adelante. De momento estableceremos el hecho de que siempre se puede encontrar
un conjunto de coeficientes ajk que satisfagan la ecuaci on de valores propios (11.92) y las Ecs. (11.102, 11.103)
con lo cual se cumple la Ec. (11.104), dicha ecuaci on nos inspira para definir una relaci on semejante a la
transformaci on de similaridad. Hablamos de la transformaci on de congruencia de C por medio de A cuando
tenemos la relacion
e
C = ACA (11.105)
e = A1 B y la transformaci
si A es ortogonal se tiene que A on de congruencia se convierte en transformaci
on
de similaridad. La Ec. (11.104) nos dice entonces que A transforma a T por medio de una transformaci on de
congruencia en una matriz diagonal, en particular en la matriz identidad n n.
En componentes, la ecuaci on de valores propios (11.92) se escribe

Vij aj(k) = k Tij aj(k)


Vij aj(k) = Tij aj(m) mk k
12
a ei a, es decir que es necesario que
Es obvio de la Ec. (11.91) que si un vector real a es vector propio entonces tambien lo ser
cada componente del vector tenga la misma fase.
13
N
otese que aun si los vectores tienen una fase global, esta se anula en el cociente.
11.11. PROBLEMA DE VALORES PROPIOS MODIFICADO 259

no hay suma sobre k. Podemos definir una matriz diagonal que contiene a los valores propios en la diagonal,
de la forma mk = mk k . Si adem
as escribimos aj(k) como un arreglo matricial A de los vectores propios se
tiene que
Vij ajk = Tij ajm mk
que matricialmente se escribe
VA = TA (11.106)
e a la izquierda
multiplicando (11.106) por A

e
AVA e
= ATA

que teniendo en cuenta (11.104) se convierte en

e
AVA = (11.107)

las Ecs. (11.104) y (11.107) nos dicen entonces que la misma transformacion de congruencia (ambas con la
matriz A de vectores propios) diagonaliza tanto a T como a V. La primera se diagonaliza a la identidad y la
segunda a una matriz diagonal donde los elementos diagonales son los valores propios.
Reescribiendo (11.91) en la forma
(V T) a = 0
vemos que lo que tenemos es un conjunto homogeneo de ecuaciones para los coeficientes ak que solo tiene
soluci
on no trivial cuando el determinante del sistema es nulo

|V T| = 0 (11.108)

por tanto, los valores propios son las races de esta ecuaci
on secular (modificada). En coordenadas cartesianas
y usando T = 1, (11.108) se convierte en la ecuaci on secular usual

|V 1| = 0 (11.109)

11.11.1. Diagonalizaci
on simult
anea de dos formas cuadr
aticas
Una aplicaci
on interesante de los resultados anteriores es la diagonalizaci on simultanea de dos formas
cuadr
aticas. Tomemos dos formas cuadraticas en las variables i y i con coeficientes reales de la forma
n X
X n
1
T = Kij i j = i Tij j
2
i=1 ji
Xn X n
1
V = Zij i j = i Vij j
2
i=1 ji

siempre es posible tomar a Tij y Vij en forma simetrica. Impongamos la condici


on de que la matriz T definida
por los elementos Tij es definida positiva y que la matriz V definida por los Vij es una matriz positiva. Las
formas cuadraticas son entonces positivas. Matricialmente podemos escribir

1 1
T = eT ; V = eV (11.110)
2 2
hagamos una transformaci on a otras coordenadas y transformando estas coordenadas por medio de la
matriz de los vectores propios

= A ; = A (11.111)
260CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

por razones que veremos m as adelante, llamaremos a i y a i las coordenadas normales asociadas a las
formas cuadr aticas T y V respectivamente. Usando (11.111), la forma cuadratica positiva V Ec. (11.110) en
terminos de las coordenadas normales queda
1 1 f 1 ee 
V = eV = A V (A) = A V (A)
2 2 2
1e e 
V = AVA
2
pero recordemos que A diagonaliza a V a traves de una transformaci on de congruencia Ec. (11.107) de modo
que la estructura de la forma cuadr
atica positiva se simplifica en estas coordenadas.
1e 1
V = = k k k (11.112)
2 2
la forma cuadr
atica T definida positiva, adquiere una forma a un m as simple que la de V en las nuevas
coordenadas , puesto que A diagonaliza a T y la convierte en la identidad, como se ve en (11.104)
1 1 g 1  ee 
T =
eT = A T (A) = A T (A)
2 2 2
1e e  
T = ATA
2
y usando (11.104) esta forma cuadr
atica se reduce finalmente a
1e 1
T = = i i (11.113)
2 2
las Ecs. (11.112, 11.113) muestran que en coordenadas normales tanto V como T se simplifican puesto que
no aparecen terminos cruzados. Esto es en u ltimas consecuencia de que A produce una transformaci on a ejes
principales similar a la transformacion a ejes principales que deja a una matriz hermtica en forma diagonal.
Los ingredientes nuevos en este caso son: a) la transformaci on es de congruencia (y no de similaridad), b) La
transformaci on de congruencia diagonaliza simult aneamente a dos matrices T y V.
Esta tecnica resulta muy poderosa para desacoplar sistemas de ecuaciones algebraicas y diferenciales. En la
secci
on 14.2 aplicaremos esta tecnica para encontrar los modos normales de una red de osciladores acoplados.

11.12. Interpretaci
on geometrica de la diagonalizaci
on simult
anea de una
14
matriz positiva y otra definida positiva (opcional)
11.12.1. Argumentaci
on por geometra analtica
A priori la diagonalizaci on simultanea de las dos matrices parece un incidente afortunado. Sin embargo,
a traves de un analisis geometrico alterno, veremos que en realidad esto es una consecuencia inmediata de la
naturaleza positiva de V y definida positiva de T. Este an alisis nos llevar
a adem
as a la conclusion de que no
podemos en general diagonalizar tres formas cuadr aticas en forma simult anea.
Considerando que los vectores y yacen en un espacio cartesiano n dimensional, y teniendo en cuenta
que T es simetrica y real, se sigue que siempre existe una transformaci on ortogonal real B que lleve a un nuevo
sistema de coordenadas cartesianas y en el cual T sea diagonal

y = B (11.114)

la matriz B debe transformar a T mediante una transformaci


on de semejanza en una matriz diagonal C
e =C
BTB1 = BTB (11.115)
14
Esta secci
on no es muy util para c
alculos pr
acticos, pero aporta una gran claridad conceptual sobre la diagonalizaci
on simult
anea
de dos formas cuadr aticas. Puede omitirse en una primera lectura.
GEOMETRICA
11.12. INTERPRETACION SIMULTANEA
DE LA DIAGONALIZACION DE UNA MATRIZ POS

la transformaci
on inversa se escribe como

e
= By ; eB
e=y

la forma cuadr
atica T se transforma de la siguiente manera

2T =
eT = y e =y
eBTBy eCy = Ci yi yi (11.116)

la forma cuadr
atica Ci yi yi solo puede ser definida positiva si cada termino Ci es estrictamente positivo, lo cual
se puede ver haciendo todas las yi cero excepto una. De esta forma la ecuaci on para las yi

Ci
yi yi = 1 (11.117)
2T
define un elipsoide de dimension n cuyos ejes principales van a lo largo de los ejes definidos por las nuevas
coordenadas yi , la Ec. (11.117) se puede convertir de forma inmediata en la ecuaci on de una esfera para un
nuevo conjunto de variables zi
p
zi = yi Ci no suma (11.118)
1
zi zi = 1 (11.119)
2T
podemos reescribir (11.118) en la forma
p
zi = ij Cj yj = Dij yj
p
Dij ij Cj no suma (11.120)

en forma matricial podemos escribir



C1
C2

z = Dy ; D 1CR ; CR . (11.121)
..

Cn

la forma cuadr
atica T queda
2T = zi zi = e
z1z
es decir T ha sido transformado a la identidad a traves de dos transformaciones sucesivas: primero una
transformaci on de similaridad con una matriz ortogonal real Ec. (11.115) y luego un reescalamiento (11.118).
La primera transformaci on comporta una rotacion de ejes a los ejes principales en donde el elipsoide asociado
a T queda en su forma normal, la segunda transformaci on no involucra una rotaci on de ejes, sino un cambio
de escala de los ejes yi . Lo que hace tal reescalamiento es estirar o comprimir los ejes principales de modo que
el elipsoide se convierta en una esfera.
Ahora nos preguntamos que le hace estas transformaciones a la forma cuadr atica positiva V . Hagamos las
mismas transformaciones sobre las coordenadas asociadas a V

w B ; x Dw x = DB (11.122)

la inversa ser
a

e 1 x
= (DB)1 x = BD
eD1 B
e = x
 1
D 1 ij = p ij
Cj
262CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

donde hemos usado que D es diagonal y por tanto es simetrica y su inversa se obtiene con el recproco de los
elementos diagonales ver Ec. (11.120). La composici
on de estas dos transformaciones no diagonaliza en general
a V, pero la forma cuadratica V queda de la forma
   h i
e 1 x = x
eD1 B V BD
2V = eV = x e 1 x
e D1 BVBD

y dado que D1 y V son simetricas es inmediato que la matriz

e 1
M D1 BVBD (11.123)

es simetrica, adicionalmente todas las matrices involucradas son reales luego M es simetrica y real. N otese
e
que en general el producto BVB no necesariamente es diagonal, ya que la diagonalizaci on de V con la misma
transformaci on de congruencia, solo est
a garantizada si tal transformaci
on diagonaliza a T a la identidad. Sin
embargo, la matriz B diagonaliza a T pero no la convierte en general en la identidad (salvo en el caso que el
elipsoide asociado ya sea una esfera, en cuyo caso el escalamiento sera identico para todas las componentes
de yi ). No obstante, el hecho de que V se escriba

eMx
2V = x

siendo M simetrica y real nos garantiza que existe una transformaci


on ortogonal real F que diagonaliza a M
por medio de una transformaci on de similaridad

e x
= Fx x = F e
e = F (11.124)

e
eMx = FM
2V = x e =
F e = i i i (11.125)
como la idea es diagonalizar a las dos matrices T y V con la misma transformaci on, debemos realizar esta ter-
cera transformacion en las variables asociadas a T (que son las zi luego de las dos transformaciones anteriores),
para lo cual definimos unas nuevas variables i asociadas a T

= Fz (11.126)

2T = e e F
z1z = F1 e
e = 1

vemos que esta u ltima rotacion no afecta la estructura de la forma cuadr atica definida positiva T , de modo
que el tensor sigue siendo representado por la identidad. Geometricamente, esto se ve con el hecho de que la
esfera asociada no establece ninguna diferencia cuando se rotan los ejes. Aqu tenemos entonces la explicaci on
de porque una matriz definida positiva y otra positiva se pueden diagonalizar simult aneamente: la superficie
asociada a la forma cuadr atica definida positiva es un elipsoide que se puede transformar en una esfera me-
diante dos transformaciones sucesivas, una rotaci on ortogonal de ejes seguido de un reescalamiento de ejes.
Aunque esta transformaci on no diagonaliza a V, nos permite hacer una transformaci on ortogonal adicional ya
que cualquier rotaci on adicional sigue definiendo ejes principales para la esfera. Esta libertad para rotar los
ejes sin romper la estructura cuadr atica de T (i.e. sin cambiar la representacion para T) es la que permite
diagonalizar a V. En resumen, la diagonalizaci on de las dos formas cuadraticas se realiza comenzando con una
transformacion ortogonal real B que diagonaliza a T seguida de un rescalamiento de ejes D que lo trivializa,
y otra transformaci on ortogonal F que no cambia la representaci on de T. Por el lado de V las dos primeras
transformaciones no diagonalizan a V pero la matriz resultante resulta ser simetrica y real lo cual posibilita
la diagonalizaci
on de esa matriz a traves de la u ltima transformacion F.
En aras de organizar la informaci on resumiremos los resultados aqu obtenidos: hemos partido de dos
formas cuadr aticas en terminos de las variables , descritas por la Ec. (11.110)

1 1
T = eT ; V = eV
2 2
GEOMETRICA
11.12. INTERPRETACION SIMULTANEA
DE LA DIAGONALIZACION DE UNA MATRIZ POS

donde la matriz T es definida positiva y la matriz V es positiva, ambas son simetricas y reales. Hemos reescrito
esta forma cuadraticas en terminos de nuevas variables , que denominamos coordenadas normales en virtud
de que en ellas la forma cuadr atica se desacopla seg
un se ve en las Ecs. (11.112, 11.113)
1e 1 1e 1
V = = k k k ; T = = i i
2 2 2 2
la transformaci
on que nos lleva de las coordenadas originales a las normales se puede rastrear en las Ecs.
(11.122, 11.124) y las Ecs. (11.114, 11.121, 11.126)

= FDB ; = FDB

Esto entonces implica que la matriz de transformaci


on R que nos lleva desde las coordenadas originales a
las normales viene dada por
R = FDB (11.127)
por otro lado la matriz que trasnforma a T y V se obtiene f
acilmente de (11.123, 11.125)

g  ^ 
e 1 F
= FD1 BVBD e = FD1 BVB
eD e = FD1 B V FD
1 F 1
B

la matriz de trasnformaci
on de T y V es entonces
e FD1 B
A e
; AVA = e
; ATA =1 (11.128)

esta ecuaci on nos muestra que la matriz A no es en general ortogonal y por tanto las transformaciones de
congruencia (11.104, 11.107) no son en general transformaciones de similaridad, a menos que D sea proporcional
a la identidad en cuyo caso es obvio que la transformaci on resultante sea ortogonal, ya que esto implica que
la forma cuadr atica T ya tena forma esferica en la base de coordenadas original. An alogamente, la matriz de
valores propios en terminos de F, D, y B, se obtiene combinando (11.107) con (11.127).
Este razonamiento nos explica tambien porque en general no se puede diagonalizar tres formas cuadr aticas
digamos T, V1 y V2 donde la primera es definida positiva y las otras dos son positivas. La tercera rotaci on se
puede usar para diagonalizar digamos a V1 , pero V2 queda en general no diagonal, si intentamos una cuarta
rotacion para diagonalizar a V2 ocurre en general que se estropea la diagonalizaci on de V1 . Si tenemos por
ejemplo dos formas definidas positivas y una positiva, es evidente que se podr an diagonalizar las tres formas
simult aneamente cuando las superficies elipsoidales est an orientadas de la misma forma y son semejantes (i.e.
los cocientes entre sus ejes tomados digamos en orden ascendente son todos iguales). Lo primero asegura
que la misma reorientaci on de ejes lleva ambos elipsoides a su forma normal y lo segundo asegura que el
mismo reescalamiento convierte en esferas a las dos formas cuadr aticas definidas positivas (condicion suficiente
aunque no necesaria), al tener dos esferas tenemos entonces libertad para rotar y diagonalizar la tercera forma
cuadr atica sin romper la diagonalizaci on de las otras.
Notese que si las dos formas cuadr aticas son positivas pero ninguna es definida positiva, entonces la forma
normal de las cuadr aticas es tambien de la forma (11.116), pero por lo menos uno de los coeficientes es no
positivo, esto imposibilita que en general esta superficie defina un elipsoide que se pueda convertir en una
esfera con un reescalamiento. Es por esto que por lo menos una de las formas cuadr aticas debe ser definida
positiva. Por ejemplo, si uno o m as de los coeficientes en (11.116) es cero, la ecuacion define un elipsoide de
menor dimensi on que solo se puede convertir en una esfera tambien de menor dimensi on. Tomemos el caso
tridimensional, si uno de los coeficientes es cero entonces la ecuaci on define una elipse que se convierte en
crculo, pero un crculo no permanece invariante ante una rotaci on arbitraria de ejes en tres dimensiones.

11.12.2. Argumentaci
on por geometra de Riemann
Podemos darle una interpretaci on geometrica a la ecuaci
on de valores propios modificada (11.92), teniendo
en cuenta que la Ec. (11.104) se asemeja a una condicion de ortonormalidad (en coordenadas cartesianas T = 1
y obtenemos la condicion de ortogonormalidad). En realidad, la ecuaci on (11.104) es equivalente a la condici
on
264CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

de que los vectores propios a(k) sean ortonormales, pero en un espacio de Riemann que no es necesariamente
cartesiano. Por simplicidad todas las componentes de vectores y matrices se asumiran reales. En un espacio
de Riemann se define el elemento de longitud de camino en la forma

ds2 = gik dxi dxk

donde los gik son elementos del tensor m etrico G del espacio. En dicho espacio se define un producto escalar
inducido por el tensor metrico (ver Ec. 11.77)

eGy
(x, y) = x y = xi gij yj = x ; gij (vi , vk )

siendo vi los vectores de la base elegida. Este tensor induce a su vez una norma o m
odulo para los vectores

eGx 0
xx =x (11.129)

recordemos que una de las propiedades de la norma es que sea no negativa y solo sea cero para el vector
nulo del espacio, esto implica que el tensor metrico debe estar representado por una matriz definida positiva.
Adicionalmente, se ve de su definici on que es una matriz simetrica real. Para coordenadas cartesianas es
claro que el tensor metrico est
a descrito por la matriz identidad. En general, G ser a diagonal en el caso de
coordenadas ortogonales curvilneas tales como las esfericas o cilndricas. Pero es no diagonal si el sistema que
forma los vectores base no es ortonormal.
Comparando la Ec. (11.99) con la Ec. (11.129), podemos decir que la matriz T cumple con las propiedades
de un tensor metrico ya que el modulo de un vector sera no negativo y es nulo solo si corresponde al vector
nulo. T es por definicion una matriz simetrica real y definida positiva como lo es el tensor metrico. En otras
palabras, en un espacio de configuracion en el cual T sea el tensor metrico, el termino e
aTa define una norma al
cuadrado para un vector en el espacio de configuraciones. En tal espacio, la Ec. (11.104) o las correspondientes
ecuaciones por vectores componentes (11.102, 11.103), representan
 una condici on de ortonormalidad.

Veamos primero como hacer el cambio de una base viT que no es ortonormal a otra base viI que s es
ortonormal. Escribamos el producto interno para el espacio de Riemann con tensor metrico T
 
(x, y) = xeTy = x e B1 B T B1 B y

elijamos a B como una matriz ortogonal real. Dado que T es una matriz simetrica real, siempre es posible
encontrar una matriz ortogonal real que la diagonalice, por tanto para una elecci
on apropiada de B se tiene

eB
(x, y) = x ] (By) = x
e BTB1 By = (Bx)C ea Cya
(x, y) = x ea Cya ; xa Bx
eTy = x (11.130)

donde C es una matriz diagonal. La Ec. (11.130) nos muestra que la transformaci`
on de coordenadas inducida
por B nos lleva a un tensor metrico C diagonal

Cij = viC , vjC = ij Ci

esto quiere decir que los vectores que forman la nueva base son ortogonales pero no son normales, es decir
su norma no esla unidad. Si cada Ci es diferente, tenemos que cada vector base tiene norma diferente (que
corresponde a Ci ). Pasemos ahora a una base normalizada
!
 p  vC vC p 
j
(x, y) = x ea Cya = xai Cij yja = xai viC , vjC yja = Ci xai i , Ci yja
Ci Ci

(x, y) = xbi v biD , v
bjD yjb

donde hemos definido


p vC
xbi Ci xai ; v
biD i (11.131)
Ci
GEOMETRICA
11.12. INTERPRETACION SIMULTANEA
DE LA DIAGONALIZACION DE UNA MATRIZ POS

biD son ahora unitarios y ortogonales, el producto interno se escribe entonces en la


claramente los vectores v
forma
(x, y) = xbi ij yjb = xbi yib
Esta relaci
on se puede construr tambien por componentes
p  p 
ea Cya = xai Cij yja = xai ij Ci yja = xai Ci yia =
(x, y) = x Ci xai Ci yia = xbi yib

la primera de las Ecs. (11.131), se puede escribir matricialmente en la forma

xb Dxa

donde D es la matriz descrita en las Ecs. (11.120, 11.121). Tenemos que el tensor metrico es ahora la identidad

(x, y) = xbi yib = x


e b yb = x
eb 1yb

hemos partido de una base que no es ortogonal ni normal para llegar a una base ortonormal. Esto se hizo
con dos transformaciones: la primera es una transformaci on asociada a una matriz ortogonal que convierte
la base original en una base ortogonal pero que no est a normalizada. La segunda es una transformaci on de
escala que se usa para normalizar los vectores de la base ortogonal, los factores de escala son efectivamente
las normas de los vectores de la base ortogonal. El tensor metrico asociado es ahora la identidad. N
otese que
aqu podramos realizar una tercera transformaci
on con cualquier matriz ortogonal real y el tensor seguira
siendo la identidad ya que esta matriz me convertira una base ortonormal en otra base ortonormal. Hagamos
entonces una transformaci on ortogonal real F que m as adelante se elegir
a de forma adecuada.
  
eb 1yb = x
(x, y) = x e
eb F1Fy b
= ^
Fxb 1 Fyb
ec 1yc ;
(x, y) = x xc Fxb

rastreando las definiciones tenemos

Bx = xa ; DBx = xb Nx = xb ; N DB
FDBx = xc Rx = xc ; R FDB

el producto interno se puede escribir en los pasos sucesivos



eTy = x
(x, y) = x e
eBBT e
BBy xa Cya = x
=e ea DD1 CD1 Dya = x e D1 CD1 Dya
ea D
eb 1yb = x
= x e FFy
eb FF1 e b=x e c=x
ec F1Fy ec 1yc

donde hemos usado el car


acter simetrico de D. N
otese que dado que D y C son ambos diagonales, entonces con-
mutan entre s de modo que D1 CD1 = D2 C = 1. Se puede ver entonces que el algoritmo de trivializaci on
del tensor metrico es
  h   i h   i
T BTB e D 1 BTB e D1 F D1 BTB e D1 F e = F D1 BTB e D e 1 F e
h  i h i
= F D1 B T(D ^ 1 B) Fe F KTK e F ^ WTW
e = (FK) T(FK) f

donde hemos definido


K D1 B ; W FD1 B
como esto es valido para x, y arbitrarios se tiene que despues de las dos primeras transformaciones donde el
tensor metrico ya se ha trivializado, el producto interno se escribe
 
eTy = x
(x, y) = x eb 1yb = x
eNe KTK e Ny
266CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

y luego de la tercera transformaci


on donde el tensor contin
ua trivializado
 
eTy = x
(x, y) = x ec 1yc = x e WTW
eR f Ry

K es entonces la primera transformaci


on que trivializa al tensor metrico. Veamos como se comporta V ante
esta misma trasnformaci
on
V KVK e
en virtud de la simetra de V y del hecho de que todas las matrices que intervienen son reales, es claro que esta
nueva matriz es simetrica y real. Por tanto puede ser diagonalizada por alguna matriz ortogonal real. Esgogemos
entonces la matriz ortogonal real F de modo que diagonalize a V recordemos que esta transformaci on continua
dejando trivial al tensor metrico de modo que las dos matrices T y V quedan diagonalizadas una vez se ejecuta
la tercera transformaci on
 
V F KVK e F e = WVW f =

e
AVA e W = FD1 W
= ; A (11.132)
la matriz de diagonalizaci on esta entonces dada por la Ec. (11.132) que coincide con la Ec. (11.128). N otese
que la diagonalizaci on de V a traves de A no nos da los valores propios de la ecuaci on normal de valores
propios ya que esta matriz posee una matriz de reescalamiento.

Con base en lo anterior, podemos dar una interpretacion geometrica a la diagonalizacion simultanea de T y
V a traves de A. La transformaci on (11.104) corresponde a una transformacion lineal de un sistema de ejes que
no son ortogonales ni normales para pasar a un sistema de ejes ortogonales y normales, a traves de tres pasos.
En el primer paso se hace una transformaci on ortogonal que me produce una base ortogonal pero no normal
(tensor metrico diagonal), en el segundo paso se realiza un reescalamiento que me normaliza los vectores. Con
estos pasos se consigue una base ortonormal lo cual equivale a trivializar al tensor metrico T. En cuanto a la
matriz V estas dos transformaciones no la diagonalizan pero la matienen simetrica y real. Esto implica que
una trasnfomacion ortogonal adicional (tercer paso) puede diagonalizarla al tiempo que dicha trasnformaci on
mantiene inalterada la forma del tensor metrico ya que una matriz ortogonal me lleva de una base ortonormal
a otra base ortonormal. Obtenemos entonces un conjunto de ejes principales comunes para T y V.
Cuando se presenta degeneraci on el n
umero de ecuaciones independientes entre los valores propios resulta
insuficiente para determinar los cocientes entre componentes de un vector propio. Por ejemplo, si es una
an elegir de forma arbitraria dos componentes cualesquiera aj , y las dem
raz doble, se podr as se determinan a
traves de las ecuaciones de valores propios. Recordemos adem as que degeneraci on corresponde a una simetra
del sistema, cuanto m as degenerados son los valores propios, m
as libertad existe de escoger los vectores propios,
es decir aumentan las transformaciones que dejan invariante al sistema.
Finalmente, vale decir que esta interpretacion debe tomarse con cuidado en el sentido de que sugiere que
la matriz T es pasiva. Por ejemplo en el problema de los osciladores acoplados se llega a la ecuaci on de valores
propios modificada en la cual T representa la matriz de energa cinetica y V representa al potencial, en este
problema ambas matrices son activas.

11.13. Tensores
Hemos visto que los vectores en 3 dimensiones (mas estrictamente los vectores Euclidianos) transforman
bajo una transformaci
on ortogonal de coordenadas de la forma
Vi = aij Vj
siendo aij los elementos de la matriz ortogonal A. Todas las transformaciones que consideraremos en esta
secci
on son de tipo pasivo, pero omitiremos la notacion con parentesis. Si adjuntamos dos vectores V, W la
transformacion de dicha yuxtaposici
on se escribe de la forma
Vi Wj = (aik Vk ) (ajm Wm ) = aik ajm Vk Wm
11.13. TENSORES 267

similarmente podemos yuxtaponer un conjunto de N vectores, los cuales transformaran de la forma


(1) (2) (N ) (1) (2) (N )
Vi1 Vi2 . . . ViN = ai1 j1 ai2 j2 . . . aiN jN Vj1 Vj2 . . . VjN (11.133)

donde V(i) denota al iesimo vector. Esta yuxtaposicion tendra 3N componentes (en 3 dimensiones). Por ex-
tensi
on, diremos que un tensor T de rango N en el espacio cartesiano tridimesional es una cantidad constituda
por 3N componentes que denotamos por Ti1 i2 ...iN (i.e. con N ndices) que bajo una transformacion ortogonal
de coordenadas A, transforma bajo el esquema

Ti1 i2 ...iN = ai1 j1 ai2 j2 . . . aiN jN Tj1 j2 ...jN (11.134)

lo cual es una emulacion directa de la propiedad de transformaci on (11.133) que posee una yuxtaposici on
de N vectores. Sin embargo, el tensor Ti1 i2 ...iN es una entidad independiente definida por la propiedad de
transformaci
on (11.134) y no necesariamente proviene de una yuxtaposici on de vectores.
Con esta definici
on, un tensor de rango cero tendra una sola componente, que sera invariante bajo una
transformaci
on ortogonal. Pero esta ha sido nuestra definici on de escalar, por lo tanto un escalar es un tensor de
rango cero. Naturalmente, por la forma en que ha sido construda esta definici on, es inmediato que un vector
Euclidiano es un tensor de primer rango. Adicionalmente, las nueve componentes de un tensor de segundo
rango se transforman como
Tij = aik ajl Tkl
en rigor, es necesario distinguir entre un tensor de segundo rango T y la matriz cuadrada formada por sus
componentes. Un tensor est a definido solo por sus propiedades de transformaci on ante una transformaci on
ortogonal de coordenadas. En contraste, una matriz no est a restringida de ninguna forma por los tipos de
transformacion que pueda experimentar y se puede considerar totalmente independiente de sus propiedades
bajo un tipo particular de transformacion. Una matriz es simplemente un arreglo de elementos con un algoritmo
de suma y multiplicaci on. Tales arreglos junto con sus algoritmos sirven para expresar de manera sintetica
cualquier transformacion lineal aplicada sobre cierto espacio (no necesariamente vectorial). De la misma forma,
un arreglo en columna no es necesariamente un vector Euclidiano, pero est a bien definido el producto del arreglo
matricial con el arreglo vectorial. Incluso las matrices se pueden definir por s solas con sus propiedades de
suma, producto, inversa etc. formando estructuras matem aticas tales como grupos, anillos etc. En contraste,
los tensores siempre estan ligados a un espacio vectorial o a una variedad.
Vale decir sin embargo, que si una matriz representa una transformaci on activa sobre un espacio vectorial,
los componentes tensoriales y matriciales se manipulan en la misma forma al menos dentro del dominio
restringido a las transformaciones ortogonales. Para toda ecuaci on tensorial habra una ecuaci on matricial
correspondiente y viceversa. La Ec. (11.38) nos indica la manera en que transforma una matriz que representa
a un operador lineal en un espacio vectorial, cuando hacemos un cambio de base (cambio de sistema coordenado)

T = ATA1

siendo A la matriz que genera el cambio de coordenadas (transformacion pasiva). La nueva matriz T representa
al mismo operador en una base diferente. Si la transformacion es ortogonal se tiene
e
T = ATA

que en componentes se escribe


Tij = aik Tkl e
alj = aik Tkl ajl = aik ajl Tkl
que resulta identica a la transformacion de un tensor de segundo rango al menos bajo las transformaciones
ortogonales especficamente.
N
otese sin embargo que si la matriz T tiene por ejemplo el rol pasivo de representar un cambio de coor-
denadas de un sistema especfico a otro tambien especfico, entonces no tiene sentido preguntarse por sus
propiedades de transformaci on ATA1 es posible y sigue siendo
on. Algortmicamente hablando, la operaci
una transformaci on de similaridad pero ya no tiene sentido geometrico. En el caso de matrices activas que
268CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

representan un operador lineal en un espacio vectorial, la transformacion ATA1 es autom aticamente inducida
por el cambio de base, en cambio no hay una manera natural geometrica de inducir la misma transformaci on
en una matriz que juega el rol de cambio de base. En este punto queda quiz as mas claro el hecho de que
las matrices y sus algoritmos se pueden trabajar sin saber que est an representando, pero para conocer sus
eventuales propiedades de transformaci on es necesario saber en que espacio actuan y sobre que objetos (e.g.
los vectores o el sistema coordenado).
En virtud de la analoga entre las propiedades de los tensores y las matrices activas, podemos deducir
que la misma terminologa derivada del algebra matricial (traspuesta, antisimetrica etc.) ser
a de gran utilidad
tambien en el
algebra de tensores de segundo rango. De igual modo, en el algebra de tensores de primer rango,
podemos usar formas de vector fila y columna para las manipulaciones algebraicas.
En el espacio Rn con coordenadas cartesianas, no existe diferenciaci on entre los ndices covariantes y
contravariantes, de modo que no se emplea esta terminologa. Estrictamente estos tensores est an construdos
n
en una base cartesiana de R y deben llamarse en principio tensores Cartesianos. Sin embargo, emplearemos
la simple denominaci on de tensor mientras no se presente ambig uedad.
Por otro lado, inspirados en el concepto de vector axial o pseudovector que ante transformaciones orto-
gonales propias e impropias transforma seg un la prescripcion (11.60), podemos tambien definir pseudotenso-
res en tres dimensiones. Su ecuaci on de transformacion (ante una transformaci on ortogonal de coordenadas)
tendra una forma similar a (11.60):
TiS
1 i2 ...iN
= |A| ai1 j1 ai2 j2 . . . aiN jN TjS1 j2 ...jN
si la transformaci
on es impropia se puede descomponer en una transformaci
on ortogonal contnua (propia) y
una inversion. De esto se deduce que bajo el operador paridad obtenemos
PTS = (1)N +1 TS
Los vectores axiales son pseudotensores de primer rango y los pseudoescalares son pseudotensores de rango
cero. Un ejemplo de pseudotensor muy importante en Fsica es el tensor de Levi Civita. Supongamos que
tenemos un pseudotensor de tercer rango Tijk que en una base particular coincide con el tensor de Levi civita,
cuando cambiamos a otro sistema coordenado ortogonal (comenzando con el sistema en donde ijk = Tijk ) se
tiene que

Tijk = |A| aip ajq akr pqr (11.135)
puede demostrarse explcitamente que
a1p a2q a3r pqr = |A|
de modo que las componentes T123 transforman como

T123 = |A|2 = 1 = 123
y se puede comprobar explcitamente por componentes que

Tijk = ijk
lo cual demuestra que ijk es un pseudotensor. Podemos ver que el factor |A| en (11.135) es crucial para
obtener la misma forma numerica del Levi Civita cuando se cambia de base.
En virtud de la forma en que se construy o el concepto de tensor podemos definir estructuras algebraicas
que permiten realizar f
acilmente las operaciones. Definiremos una diada, como la yuxtaposici
on de dos vectores
en la forma AB, CD etc. Podemos definir por ejemplo el producto punto entre una diada y un vector en la
forma
A (BC) (A B) C ; (BC) A B (C A)
n
otese que el orden es importante en este producto punto. No es igual operar por la izquierda que por la
derecha. Adem as el producto punto entre una diada y un vector es otro vector (ya no podemos llamarlo
producto escalar). Cada vector se puede escribir en una base, de modo que una diada se escribe como
AB = (ai ui ) (bj uj ) = ai bj ui uj
11.13. TENSORES 269

esto nos lleva a construr el concepto de afinor, como una combinaci


on lineal de diadas

aAB + bCD + ...

y la diada se puede ver como un afinor construdo con la yuxtaposici


on de los vectores base. Hemos supuesto
implcitamente propiedades de distributividad y de producto por escalar (linealidad). Se puede definir el
producto punto doble de la siguiente forma

(AB) : (CD) = (A C) (B D)

quiz
as una notaci
on mas apropiada es

A (CD) B = (A C) (B D)

este doble producto punto s es un producto escalar. La diada identidad se construye en la forma

1 ui ui

donde ui son los vectores unitarios de una base ortonormal. Es f


acil ver su car
acter de identidad con los
algoritmos que acabamos de establecer

A 1 = (ak uk ) (ui ui ) = ak uk (ui ui )


A 1 = ak (uk ui ) ui = ak ki ui = ak uk = A

similarmente se puede demostrar que

A1 =1A=A ; A1A=AA

al igual que las matrices, las diadas y afinores son algoritmos de c


alculo que permiten clarificar las operaciones
con tensores de segundo rango. Sin embargo, es el tensor el que tiene significado geometrico y el algoritmo
puede cambiar si usamos por ejemplo bases diferentes a las cartesianas (en donde los conceptos de covarianza
y contravarianza adquieren sentido) o definimos tensores en espacios m as generales. Por el momento, notemos
que si definimos la diada a traves de dos ndices (cada uno correspondiente a un vector) i.e.

AB Ai Bj Tij

podemos emular el
algebra de los tensores en la forma

K (AB) = (K A) B = Ki Ai Bj
K T = Ki Tij

similarmente
T K = Tij Kj ; D T K = Di Tij Dj
estas operaciones son en consecuencia totalmente an alogas a los algoritmos construdos para matrices y vec-
tores fila y columna. As mismo, son los algoritmos para trabajar tensores cartesianos. La suma sobre ndices
repetidos se conoce como contracci on, notese que cuando un n umero n de ndices de un tensor se contrae con
ndices de otro, el rango del tensor est
a dado por N 2n, siendo N el n umero total de ndices y n el n
umero
total de contracciones. Por ejemplo Tij Kj tiene en total tres ndices y una contracci on, su resultado es un
tensor de primer rango (3 2 1). El producto cruz entre dos vectores ijk Aj Bk tiene N = 5 y n = 2 de modo
que tiene rango 1. N otese que ijk es un pseudotensor y si A y B son vectores polares, el producto ser a un
pseudovector como ya vimos que ocurre con el producto cruz entre dos vectores polares. El producto D T K
donde T es tensor de segundo rango y D, K son de primer rango, da como resultado un escalar. Si uno (o
tres) de ellos es un pseudotensor obtendremos un pseudoescalar, si dos de ellos son pseudotensores obtenemos
un escalar.
270CAPITULO 11. INTERLUDIO MATEMATICO:
MATRICES, VECTORES Y TENSORES CARTESIANOS

Estas reglas de contracci


on no son sin embargo un simple capricho, sino consecuencia directa de las pro-
piedades de transformacion de los tensores. Por ejemplo si Tij es un tensor cartesiano de segundo rango y Ki
un tensor cartesiano de primer rango (vector euclidiano) y hacemos la contracci on
Rj Ki Tij (11.136)
demostraremos que la cantidad Rj es efectivamente un tensor cartesiano de primer rango, para ello NO basta
con saber que es una cantidad que depende de un solo ndice, es necesario que se examinen sus propiedades
de transformaci
on ante una transformaci
on ortogonal B
Rj = Ki Tij = (aik Kk ) (aim ajn Tmn ) = (aik aim ajn ) (Kk Tmn )
donde hemos usado el hecho de que Ki y Tij son tensores cartesianos. Usando las condiciones de ortogonalidad
(11.52) resulta
Rj = (km ajn ) Kk Tmn = ajn Km Tmn = ajn Rn
Rj = ajn Rn (11.137)
donde hemos usado la definici on de Rj Ec. (11.136). La Ec. (11.137) nos muestra que efectivamente, la con-
on definida en (11.136) corresponde a un tensor de primer rango. Si por ejemplo Tij es un pseudotensor
tracci
y Ki es un vector polar se puede demostrar con una transformaci on ortogonal impropia, que el resultado de
la contracci
on es un pseudovector o vector axial. Se deja al lector la demostraci
on general para la contracci
on
de tensores de rango arbitrario.
Por otro lado, consideremos el conjunto de ecuaciones
Ki Ai = B (11.138)
Kij Aj = Bi (11.139)
Kij Ajk = Bik (11.140)
Kijkl Aij = Bkl (11.141)
Kij Ak = Bijk (11.142)
donde en cada expresi on, A y B son tensores cartesianos de rangos indicados por los ndices, y A es arbitrario.
En cada caso K es una cantidad desconocida. La llamada regla del cociente establece que si la ecuaci on en
cuesti
on es v
alida en todo sistema (rotado) cartesiano de coordenadas, K es un tensor cartesiano del rango
indicado por sus ndices.
Probaremos la regla del cociente (11.139) a manera de ilustraci on. En un cierto sistema cartesiano primado
tenemos

Kij Aj = Bi = aik Bk
donde hemos usado las propiedades tensoriales de B. Puesto que la ecuaci
on es v
alida en todo sistema cartesiano
rotado
aik Bk = aik (Kkl Al )
y transformando A de nuevo al sistema cartesiano primado tenemos


Kij Aj = aik Kkl Al = aik Kkl ajl Aj


Kij aik ajl Kkl Aj = 0
alido para cara ndice i y para todo sistema coordenado primado, y dado que Aj es arbitrario18
esto debe ser v
resulta

Kij = aik ajl Kkl (11.143)
que es la definicion de un tensor de segundo rango. Vale mencionar sin embargo que es importante que B sea
diferente de cero. Las otras reglas de cociente se demuestran en forma similar.
18
Por ejemplo si tomamos Aj = 1j se sigue de inmediato que Ki1

= aik a1l Kkl . Otras escogencias adecuadas nos dan el resto de
Ecs. (11.143).
Captulo 12

Cinem
atica del cuerpo rgido

Ya hemos definido un cuerpo rgido como un conjunto de partculas cuyas distancias relativas son constantes.
La condici
on de cuerpo rgido se traduce en un conjunto de ligaduras holonomas de la forma

rij = cij ; i < j, i = 1, . . . , N (12.1)

siendo rij la distancia entre las partculas iesima y j-esima, y cij son valores constantes. Aunque esto cons-
tituye una idealizacion, la mecanica del cuerpo rgido es de fundamental importancia en muchos campos de la
Fsica. En este captulo discutiremos la cinem atica del cuerpo rgido, es decir las caractersticas de su movi-
miento, para lo cual ser a necesario desarrollar ciertas herramientas matem aticas, que adem as ser
an aplicables
en muchos otros campos de la Fsica.
De particular importancia ser a el movimiento de rotaci on de un cuerpo rgido, el cual estudiaremos con
el formalismo de la matrices ortogonales. Dicho tipo de movimiento introducir a consideraciones geometricas
relativas a la rata de cambio de un vector con el tiempo con respecto a un sistema de referencia rotante.
Posteriormente se estudiar a la din
amica del cuerpo rgido, es decir la respuesta que estos sistemas producen
cuando se someten a torques y fuerzas externas.

12.1. Coordenadas independientes de un cuerpo rgido


Como punto de partida, es necesario clarificar cuales son los grados de libertad independientes de un cuerpo
rgido, es decir las coordenadas necesarias para especificar completamente su configuraci on en un instante dado
de tiempo. La intuici on nos indica que para ubicar la configuraci on completa de un s olido rgido es necesario
especificar la posici on de un punto de referencia del cuerpo (por ejemplo su centro de masa, un punto fijo
de este, etc.), y la orientacion relativa de este cuerpo, todo ello con respecto a un sistema inercial fijo de
coordenadas que lo llamaremos el sistema de laboratorio (S) ver Fig. 12.1. Si trasladamos paralelamente los
ejes de S hasta el punto de referencia que se tomar a como nuevo origen (sistema S0 en la Fig. 12.1), la
orientaci on relativa se obtiene usando un sistema S cuyos ejes est an fijos al cuerpo rgido y que por tanto,
siguen su din
amica. El sistema S est a en general rotado con respecto a S0 pero con origen com un con este.
El sistema S se puede obtener entonces por rotaci on pura del sistema S0 (sin traslaci on), para realizar esta
rotacion hay que definir el eje de rotacion i.e. un vector unitario en direcci on de dicho eje, esto representa dos
grados de libertad (dos angulos, o las tres coordenadas cartesianas con la ligadura de normalizaci on), para
completar la rotaci on se requiere conocer el angulo que barre el eje de rotacion cuando el giro se ejecuta, con lo
cual tenemos tres grados de libertad necesarios para lograr girar desde S0 hasta S . Esto nos conduce entonces
a seis grados de libertad para definir la configuraci on del cuerpo rgido a partir de S: 3 para definir el punto

de referencia (origen de S0 y de S ) y 3 para definir la orientaci on relativa de S con respecto a S (o lo que es
lo mismo, con respecto a S0 ). N otese que dicho n umero de grados de libertad es independiente del n umero de
partculas del solido e incluso de su naturaleza discreta o contnua.
Veamos como conciliar este n umero con las ligaduras enunciadas en (12.1). Hay 3N grados de libertad
superficiales debidos a las N partculas del s olido. Para un numero N de partculas el n umero de ecuaciones

271
272 CAPITULO 12. CINEMATICA
DEL CUERPO RIGIDO

Figura 12.1: Orientacion relativa de un cuerpo rgido. El sistema S es inercial, S0 es un sistema cuyo origen
est un punto de referencia del cuerpo y cuyos ejes son paralelos a los de S. El sistema S est
a fijo en alg a fijo
al cuerpo y tiene origen comun con S0 .

de ligadura de la forma (12.1) viene dado por N (N 1) /2. Si intentamos simplemente sustraer el n umero de
ligaduras de los 3N grados de libertad, obtenemos valores negativos (para N 8) que crecen r apidamente en
magnitud cuando aumenta N . El punto es que estas ligaduras no son todas independientes. Para fijar un punto
en el cuerpo rgido, no es necesario especificar las distancias a todos los dem as puntos del cuerpo, es suficiente
con especificar su distancia a otros 3 puntos fijos al cuerpo y no colineales como se ve en la figura 12.2. Por lo
tanto, una vez fijadas las posiciones de tres partculas no colineales del cuerpo, las ligaduras fijan las posiciones
de las otras. Por el momento esto nos deja con 9 grados de libertad, sin embargo, una vez fijada la partcula
1 de referencia (3 grados de libertad) la ubicaci on de la partcula 2 solo requiere dos grados de libertad pues al
estar fija su distancia a la primera, debe yacer en la superficie de una esfera centrada en la partcula 1. Fijadas
las partculas 1 y 2 la tercera debe yacer en una circunferencia cuyo centro pasa por el eje definido por el vector
relativo r12 siendo dicho vector perpendicular al crculo y la distancia entre un punto de la circunferencia y
las partculas 1 y 2 fijadas por las ligaduras (12.1), esto nos deja con un grado de libertad necesario para fijar
esta posicion (por ejemplo un angulo). Aparecen entonces seis grados de libertad en consistencia con lo que se
obtuvo con el argumento anterior. Esto se puede ver a su vez de forma m as simple teniendo en cuenta que a
los 9 grados de libertad para fijar las tres partculas se les deben restar 3 ligaduras independientes

r12 = c12 ; r23 = c23 ; r13 = c13

por supuesto pueden haber ligaduras adicionales tales como condiciones de rodadura, existencia de puntos fijos
etc. que pueden disminur a
un m
as el n
umero de grados de libertad independientes.
DE LOS GRADOS DE LIBERTAD DE UN CUERPO RIGIDO
12.2. ASIGNACION 273

Figura 12.2: Tres puntos de referencia no colineales del cuerpo rgido permiten localizar cualquier partcula
i-esima en dicho cuerpo.

12.2. Asignaci
on de los grados de libertad de un cuerpo rgido
Ya mencionamos que una forma de determinar la configuraci on del cuerpo rgido en un instante dado
con respecto a un sistema de referencia inercial S, consiste en construr un sistema de referencia S0 con ejes
paralelos a S y con su origen en un punto de referencia del s olido. Adicionalmente construmos otro sistema de
ejes S fijos al cuerpo y con origen en el punto de referencia del s olido. Tres grados de libertad fijan el origen
com
un de S0 y S con respecto a S (i.e. la posici on del punto de referencia con respecto a S), en tanto que
otros 3 fijan la orientacion relativa de S con respecto a S0 o lo que es lo mismo con respecto a S.
Como la determinaci on de la posici
on del origen de S0 con respecto a S no representa particular dificultad,
nos restringiremos a estudiar la forma de parametrizar la orientaci on relativa de S con respecto a S0 . Hay
varias maneras de realizar esta parametrizaci on. Una de las mas fructferas es la determinaci
on de los cosenos

directores de los ejes primados (de S ) con respecto a los ejes no primados (de S0 ). Por simplicidad usaremos
una notaci on de ndices en lugar de la nomenclatura x, y, z i.e. x1 , x2 , x3
La direcci on del eje X1 se puede especificar a traves de los angulos que este eje hace con cada uno de los
ejes X1 , X2 , X3 . Los cosenos directores se definen de la forma

cos ij = cos ui , uj = ui uj = uj ui ; i, j = 1, 2, 3 (12.2)
siendo uj los vectores cartesianos unitarios a lo largo de los ejes Xj , y ui los an
alogos para el sistema S . En
ij el primer ndice se refiere al ndice primado y el segundo al ndice no primado. La proyecci
on de un vector
ui a lo largo de u1 esta dada por ui u1 de modo que la componente de ui a lo largo de u1 viene dada por
(ui u1 ) u1 de manera similar se obtienen las componentes de ui a lo largo de u2 y u3 con lo cual se obtiene
  
ui = ui u1 u1 + ui u2 u2 + ui u3 u3
274 CAPITULO 12. CINEMATICA
DEL CUERPO RIGIDO

pero recordando la definici


on de los cosenos directores y usando convenci
on de suma sobre ndices repetidos
de aqu en adelante
ui = (cos ij ) uj (12.3)
con lo cual se muestra que los 9 cosenos directores determinan completamente la orientaci on del nuevo sistema
coordenado X1 , X2 , X3 con respecto a X1 , X2 , X3 de S0 . El proceso es f
acilmente invertible para obtener a los
on de los uj .
ui en funci

ui = ui uj uj = (cos ji ) uj (12.4)
Podemos escribir entonces
r = xi ui = xj uj
puesto que el vector posici
on en esencia no cambia (ya que el origen es com un), solo cambian las componentes
y bases con que se mide. Claramente

xi = r ui = (xj uj ) ui = xj uj ui
xi = cos ij xj (12.5)

los cosenos directores en consecuencia permiten obtener la relaci on entre las coordenadas de un punto en un
sistema con respecto a las del otro (componentes de r). Claramente el an alisis anterior es extensible a otros
on1 . La componente de un cierto vector G a lo largo de Xi viene dada por
vectores, diferentes al vector posici

Gxi = G ui = (Gj uj ) ui = Gj uj ui = cos ij Gj

de modo que el conjunto de los 9 cosenos directores nos da la transformaci on completa entre los dos sistemas
coordenados.
Al ser los ejes primados fijos al cuerpo, los 9 cosenos directores son en general funciones del tiempo ya que
el cuerpo puede cambiar su orientaci on en el curso del movimiento. En tal sentido, los cosenos directores se
pueden considerar como coordenadas que especifican la orientaci on instant
anea del cuerpo rgido con respecto
a S0 . Ya hemos visto sin embargo, que solo tres coordenadas son necesarias para orientar el cuerpo de modo
que los 9 cosenos directores no pueden ser independientes.
Veamos el problema primero geometricamente, a partir de los ejes X1 , X2 , X3 se puede construr el eje X1
con dos grados de libertad (e.g. dos angulos que definen al vector unitario u1 ). Recordando que el origen es
comun para S0 y S el eje X2 yace en el plano perpendicular a X1 y que pasa por el origen. En consecuencia
solo un grado de libertad adicional es necesario (e.g. un angulo) para orientar a X2 en este plano. Finalmente,

X3 ya queda determinado si queremos construr ejes a derecha.
Veamos como traducir las ligaduras sobre los cosenos directores en forma de ecuaciones. Tanto los sistemas
primado como sin primar son ortogonales

ui uj = ij ; ui uj = ij (12.6)

teniendo en cuenta las ecuaciones (12.3)

ui uk = [(cos ij ) uj ] [(cos km ) um ] = cos ij cos km uj um


ui uk = cos ij cos km jm = cos im cos km

que combinado con las relaciones de ortonormalidad en el sistema primado nos da

cos im cos km = ik (12.7)


1
Notese que estrictamente hablando, la posici
on no es un vector en el sentido Euclidiano, pues a un punto en el espacio no se
le puede asignar magnitud ni direcci
on. Un vector debe ser un objeto independiente del sistema coordenado con que se mire, por
ejemplo esto lo cumple el vector desplazamiento. El vector posici
on se puede pensar como un vector relativo entre el punto en
cuesti
on y un punto de referencia (origen).
12.3. TRANSFORMACIONES ORTOGONALES 275

se puede obtener una expresi


on an
aloga partiendo de expresar ui uk en terminos de cosenos directores

cos mi cos mk = ik (12.8)

en cualquiera de sus formas, estas relaciones nos brindan seis ecuaciones independientes (por ejemplo se puede
imponer que i k en estas ecuaciones). Esto nos deja con tres grados de libertad independientes como
esperabamos.
En vista de lo anterior, los 9 cosenos directores no se pueden usar como coordenadas generalizadas en un
formalismo Lagrangiano o Hamiltoniano para encontrar las ecuaciones de movimiento, es necesario encontrar
tres funciones independientes de estos cosenos directores. Discutiremos m as adelante algunos de ellos siendo los
mas importantes los angulos de Euler. No obstante, los cosenos directores son de gran utilidad para estudiar
la conexion entre los dos sistemas cartesianos y expresar de una forma mas simple y general varios teoremas
relativos a los cuerpos rgidos. De igual forma permite el uso de algoritmos extendibles a la relatividad especial
y la mecanica cuantica. Por lo tanto, seguiremos trabajando en el lenguaje de los cosenos directores.

12.3. Transformaciones ortogonales


Con el fin de acortar la notaci
on definiremos

aij cos ij

las ecuaciones (12.5) constituyen un conjunto de transformaciones lineales siendo aij un conjunto de coe-
ficientes constantes (independientes de x, x ). En la nueva notaci
on podemos sintetizar estas transformaciones
como
xi = aij xj , i = 1, 2, 3 (12.9)

dado que los cosenos directores no son todos independientes, estas ecuaciones no definen la transformaci on
lineal m
as general. Las ligaduras obtenidas anteriormente se pueden ver f
acilmente a la luz de la nueva notaci
on,
teniendo en cuenta que el vector posicion tiene la misma magnitud en ambos sistemas de referencia S y S0 en
virtud de su origen com un. Esto nos conduce a la condici
on

xi xi = xi xi (12.10)

que en el caso de vectores reales corresponde a la invarianza de su norma, y como se puede ver en la secci on
11.4, la transformaci
on lineal m
as general que deja invariante la cantidad xi xi , conduce a las condiciones

aij aik = jk ; j, k = 1, 2, 3 (12.11)

que resultan identicas a las ligaduras expresadas en (12.8). Naturalmente, la forma alternativa de la condici
on
de ortogonalidad Ec. (12.7), se escribe en esta notacion en la forma

aji aki = jk ; j, k = 1, 2, 3 (12.12)

La transformacion lineal (12.9) se denomina transformaci on ortogonal si los coeficientes aij de la trans-
formaci on satisfacen las Ecs. (12.11) conocidas como condiciones de ortogonalidad. De modo que la tran-
sicion entre las coordenadas de S0 y las de S se realizan a traves de una transformaci on ortogonal. Los
coeficientes de la transformaci on se pueden escribir en un arreglo matricial de la forma

a11 a12 a13
A a21 a22 a23
a31 a32 a33
276 CAPITULO 12. CINEMATICA
DEL CUERPO RIGIDO

que denominaremos matriz de la transformaci on siendo los aij elementos matriciales de la transformaci
on.
Notese que la condici
on de ortogonalidad (12.11) se puede ver mnemotecnicamente como si la matriz estuviera
constituda por 3 vectores columna ortonormales entre s i.e.

a1k
Vk a2k ; k = 1, 2, 3
a3k
Vj Vk = aij aik = jk (12.13)

la cual se puede ver como una relacion de ortonormalidad entre los vectores columna arriba descritos2 . Sin
embargo, es importante enfatizar que esta es una regla mnemotecnica ya que los Vk no definen ning un vector
en el espacio. Un vector en un espacio vectorial est a constitudo por combinaciones lineales en una u nica
base. Estos coeficientes son realmente enlaces entre dos bases diferentes y constituyen una transformaci on que
genera un cambio de base. El producto punto definido aqu es solo un algoritmo establecido para el arreglo
vectorial pero no se est
a realizando el producto entre vectores unitarios bien definidos.
A manera de ejemplo, veamos el caso del movimiento en un plano. Si por simplicidad, nos restringimos a
rotaci on es el eje X3 de modo que u3 = u3 . Pensemos que en un
on en el plano X1 X2 entonces el eje de rotaci
instante dado de tiempo el angulo entre X1 y X1 es , se tiene entonces que
 
a11 = cos 11 = u1 u1 = cos ; a12 = u1 u2 = cos = sin ; a13 = u1 u3 = u1 u3 = 0
  2

a21 = u2 u1 = cos + = sin ; a22 = u2 u2 = cos ; a23 = u2 u3 = u2 u3 = 0

2
a31 = u3 u1 = u3 u1 = 0 ; a32 = u3 u2 = u3 u2 = 0 ; a33 = u3 u3 = 1

la matriz de transformaci
on queda de la forma

cos sin 0
Ax1 ,x2 = sin cos 0 (12.14)
0 0 1

y la transformacion de coordenadas queda



cos sin 0 x1 x1
sin cos 0 x2 = x2
0 0 1 x3 x3

x1 = x1 cos + x2 sin ; x2 = x1 sin + x2 cos ; x3 = x3


puede observarse que las condiciones de ortogonalidad (12.11) se cumplen en esta matriz. Es claro que en este
caso solo hay una coordenada independiente cual es el angulo de rotaci
on del eje X3 , los otros dos grados de
libertad requeridos para determinar el vector unitario a lo largo del eje de rotacion ya han sido considerados.
Para continuar trabajando sobre la cinem atica del cuerpo rgido, es necesario utilizar las propiedades
matriciales que desarrollamos en el captulo 11. Insistimos nuevamente que estas propiedades son identicas en
cualquiera de las dos interpretaciones activa o pasiva, de modo que en general no haremos distincion entre (r)
y r en las operaciones subsecuentes, a menos que se especifique lo contrario.

12.4.
Angulos de Euler
Hemos visto que los 9 cosenos directores no forman un conjunto independiente de modo que no pueden
ser usados como coordenadas generalizadas para un formalismo Lagrangiano o Hamiltoniano. Es necesario en
2
Similarmente, se puede ver a la matriz como compuesta de tres vectores fila que tambien son ortonormales entre s. Esto se
puede ver de la forma alternativa de la condici
on de ortogonalidad Ec. (12.12).

12.4. ANGULOS DE EULER 277

Figura 12.3: Conjunto de rotaciones para llegar desde los ejes X1 X2 X3 hasta los ejes X1 X2 X3 .

consecuencia buscar tres par ametros independientes con los cuales se pueda escribir la matriz ortogonal de
rotaci
on. Estos par
ametros se podr an usar entonces como coordenadas generalizadas independientes para un
formalismo Lagrangiano o Hamiltoniano. Por otro lado, dado que las rotaciones son transformaciones contnuas,
se sigue que ademas de las condiciones de ortogonalidad, las matrices ortogonales asociadas deben ser propias
278 CAPITULO 12. CINEMATICA
DEL CUERPO RIGIDO

i.e. su determinante debe ser +1.


Hay muchas escogencias posibles para los tres par ametros independientes, siendo las m as populares los
angulos de Euler que describimos a continuaci
on: Queremos pasar de un conjunto de ejes coordenados ortogo-
nales X1 X2 X3 a otro conjunto de ejes ortogonales X1 X2 X3 donde ambos sistemas de ejes tienen origen com un.
Es claro que si determinamos las direcciones de los ejes X1 X2 el tercer eje est a unvocamente determinado
si la transformaci
on es contnua (ya que en este caso se conserva la quiralidad del sistema de ejes). Para ello
necesitamos determinar el plano en donde yace X1 X2 y alg un angulo que oriente a estos ejes en dicho plano. La
figura 12.3 muestra al plano generado por X1 X2 y al plano (sombreado) generado por X1 X2 los cuales forman
un angulo diedro, y se intersectan en una lnea nodal como indica la figura 12.3. Para pasar del sistema
X1 X2 X3 al sistema X1 X2 X3 debemos llevar a los ejes X1 X2 a sus posiciones finales lo cual se puede realizar
esquem aticamente en tres pasos (a) Rotar el sistema para que el nuevo eje X1 quede en el plano sombreado
(plano generado por X1 X2 ), (b) rotar el sistema para que el nuevo eje X2 entre tambien en el plano sombreado,
una vez que los nuevos ejes X1 X2 ya esten en el plano de X1 X2 el paso final es (c) hacer una rotaci on de los
ejes en el plano sombreado para que tengan su orientaci on final.
(a) (a) (a)
Veamos en detalle el proceso, (a) En primer lugar pasamos del sistema X1 X2 X3 al sistema X1 X2 X3
(a)
haciendo una rotaci on alrededor del eje X3 en un angulo de modo que el nuevo eje X1 quede a lo largo de
(a) (a)
la lnea nodal, es decir X1 queda dentro del plano sombreado, en este caso es claro que X3 = X3 . (b) En
(a) (a) (a) (b) (b) (b) (b)
el siguiente paso, pasamos del sistema X1 X2 X3 al sistema X1 X2 X3 de modo que el nuevo eje X2
quede dentro del plano sombreado pero sin sacar al eje que ya se introdujo en ese plano, por tanto se deduce
(a)
que la rotaci on debe realizarse alrededor de X1 para que este eje no se salga del plano sombreado, haremos
(a) (b)
entonces una rotaci on en un angulo alrededor de X1 siendo el angulo adecuado para que el eje X2
(b) (a)
quede dentro del plano sombreado. En este caso es claro que X1 = X1 y con este paso hemos conseguido
(b) (b)
que los nuevos ejes X1 y X2 esten en el plano generado por X1 X2 , solo falta en consecuencia realizar una
(b) (b)
rotaci on dentro de este plano que nos lleve desde X1 X2 hacia los ejes X1 X2 lo cual se logra con (c) una
(b) (b)
rotaci on alrededor del eje X3 en un angulo . En este caso X3 = X3 .
En consecuencia, una rotaci on arbitraria del sistema coordenado X1 X2 X3 al sistema coordenado X1 X2 X3
se puede realizar de la forma que se ve en la Fig. 12.3: comenzamos haciendo una rotaci on antihoraria en un
(a) (a)
angulo alrededor de X3 , al sistema coordenado resultante de esta rotaci
on lo denotaremos por X1 , X2 ,
(a) (a)
X3 (naturalmente, X3 coincide con X3 ). En el segundo paso, rotamos al nuevo sistema coordenado con
(a)
respecto a X1 en sentido antihorario en una cantidad como muestra la figura 12.3, denotamos al sistema
(b) (b) (b) (b) (a)
resultante como X1 , X2 , X3 . El eje X1 (que coincide con X1 ), se forma con la intersecci on entre los planos
(b) (b)
X1 X2 y X1 X2 y se conoce como lnea nodal. Finalmente, se hace una rotaci on antihoraria alrededor
(b)
de X3 para llegar al sistema coordenado final X1 X2 X3 . Los elementos de una transformaci on completa se
puede obtener por composici on de las tres operaciones aqu descritas. La rotacion inicial (alrededor de X3 )
transforma a un vector (o a sus componentes) en la forma


cos sin 0
x(a) = Dx ; D = sin cos 0 (12.15)
0 0 1

(a) (a) (a)


donde D es una matriz que describe un cambio de base de la forma X1 X2 X3 X1 X2 X3 . La segunda
(a) (a) (a) (a) (b) (b) (b)
rotaci
on alrededor de X1 describe un cambio desde la base X1 X2 X3 hacia la base X1 X2 X3 y nos
da

1 0 0
x(b) = Cx(a) ; C = 0 cos sin (12.16)
0 sin cos

12.5. PARAMETROS DE CAYLEY-KLEIN 279

(b) (b) (b) (b)


y finalmente describimos el cambio de base X1 X2 X3 X1 X2 X3 con la rotaci
on alrededor de X3 :

cos sin 0
x = Bx(b) ; B = sin cos 0 (12.17)
0 0 1

de modo que llegamos desde x hasta x con la transformaci


on:

x = Ax ; A BCD (12.18)

haciendo el producto de las tres matrices se obtiene la matriz de rotaci on mas general en terminos de los
angulos de Euler


cos cos cos sin sin cos sin + cos cos sin sin sin
A = sin cos cos sin cos sin sin + cos cos cos cos sin (12.19)
sin sin sin cos cos

se puede verificar que esta matriz es ortogonal propia. Tambien se puede demostrar que su inversa coincide
con su traspuesta como corresponde a toda matriz ortogonal

cos cos cos sin sin sin cos cos sin cos sin sin
A1 = A e = cos sin + cos cos sin sin sin + cos cos cos sin cos (12.20)
sin sin cos sin cos

Existe por supuesto una arbitrariedad en la secuencia de rotaciones que se puede escoger, la primera rotaci on
se puede realizar con respecto a cualquiera de los ejes y en las dos rotaciones posteriores, la u
nica limitacion
es que no se puede hacer dos rotaciones sucesivas con respecto al mismo eje. Por lo tanto hay un total de
12 convenciones posibles para un sistema dextr ogiro. Las dos convenciones m as usadas en Fsica solo difieren
en la segunda rotacion: en nuestra convencion (xconvenci on) la segunda rotaci on se hace con respecto a
(a) (a)
X1 en tanto que en la otra (yconvenci on), la rotaci
on se realiza con respecto al eje X2 . Hay una tercera
convenci
on muy usada en aplicaciones en ingeniera conocida como xyzconvenci on. Es muy importante
conocer la convencion usada en la construcci
on de la matriz a la hora de comparar resultados.

12.5. Par
ametros de Cayley-Klein
????????????????????

12.6. Teorema de Euler para el movimiento del cuerpo rgido


Hemos visto que la orientacion relativa de un cuerpo rgido en cualquier instante se puede especificar con
una transformacion ortogonal real propia. Tres parametros debidamente escogidos determinan la matriz de la
transformacion. Ahora bien, la orientaci
on del cuerpo puede cambiar en el tiempo, y por lo tanto la matriz de
transformacion se escribe como A (t). En particular, se pueden escoger los ejes iniciales de S coincidentes con
los de S0 con lo cual
A (0) = 1
como el movimiento del cuerpo es contnuo, la matriz debe evolucionar en forma contnua desde la identidad
hasta su valor en un tiempo dado A (t).
Habamos tambien mencionado que intuitivamente, una orientacion arbitraria pareca poder ser generada
especificando un eje de rotaci
on (vector unitario) y el
angulo de rotaci
on alrededor de tal eje. El siguiente
teorema es un enunciado formal de tal hecho

Theorem 8 Teorema de Euler: El movimiento general de un cuerpo rgido con un punto fijo es una rotaci
on
alrededor de alg
un eje
280 CAPITULO 12. CINEMATICA
DEL CUERPO RIGIDO

El teorema establece que para toda rotaci on con un punto fijo es siempre posible encontrar un eje que pasa
por el punto fijo orientado de una forma particular (con respecto a S0 ), tal que la rotaci on con un cierto angulo
alrededor de este eje, emula la rotaci on general. En este caso podemos pensar en los par ametros , (que
orientan al eje) y el par ametro de rotaci on como los tres par ametros independientes.
Es claro que una rotaci on con un punto fijo en un intervalo dado de tiempo nos lleva de una configuraci on
inicial a una configuraci on final. Si bien el teorema nos afirma que a partir de la configuraci on inicial es posible
llegar a la configuraci on final por medio de una rotaci on con un eje fijo para cierto
angulo, esto no quiere decir
que el movimiento real haya sido con eje fijo, de hecho durante el movimiento es posible que la orientaci on
del eje de rotaci on haya cambiado en el tiempo. Esto es an alogo al caso traslacional: el movimiento de una
partcula puntual nos lleva de una posici on inicial a una posici
on final, para ir de esta posicion inicial a la
posic on final es siempre posible realizarlo a traves de una lnea recta (direcci on constante) recorriendo cierta
distancia, pero esto no siginifica que el movimiento real haya sido en lnea recta, aunque en ambos casos la
posici on inicial y la final coincidan.
Si el punto es fijo con respecto al sistema inercial S (el punto fijo no es necesariamente el centro de masa
del cuerpo), entonces S0 coincide con S y tal punto se toma como origen de S, S0 y S para todo tiempo, el
desplazamiento del cuerpo rgido no involucra traslaci on de los ejes del cuerpo respecto a S, solo cambia su
orientaci on. El teorema entonces establece que los ejes coordenados X1 X2 X3 se pueden obtener para cualquier
tiempo t, por medio de una u nica rotaci on alrededor de un eje dado del sistema X1 X2 X3 . Esto implica
formalmente que el operador representado por la matriz A que describe el movimiento fsico del cuerpo rgido
es una rotaci on. Es caracterstico de una rotaci on, que la direcci
on del eje de rotaci on permanezca inalterada
en el proceso. Por tanto, un vector que vaya a lo largo de tal eje debe tener las mismas componentes en S0
y S . La otra condici on necesaria para una rotaci on de que la magnitud de los vectores sea un invariante,
est
a garantizada por el car acter ortogonal real de la matriz como vimos en la secci on 11.4. En consecuencia,
el teorema de Euler ser a probado si podemos mostrar que existe al menos un vector x que tiene las mismas
componentes en ambos sistemas coordenados S y S . En notaci on matricial esto implica

x = Ax = x (12.21)

comparando esta ecuaci on con la ecuacion de valores propios (11.39), se observa que el problema se reduce a
demostrar que = 1 es un valor propio de la matriz A. Podemos entonces reescribir el teorema de Euler en la
siguiente forma:
La matriz ortogonal real que especifica el movimiento de un cuerpo rgido con un punto fijo es tal que al
menos uno de sus valores propios es igual a la unidad.
En la seccion 11.4 encontramos que para toda matriz ortogonal real propia de dimensi on impar
siempre hay por lo menos un valor propio igual a la unidad. Recordando adem as que las rotaciones solo
pueden ser descritas por matrices ortogonales propias y que nuestra dimensi on es tres, se obtiene lo que se
quera demostrar. Notese que la validez del teorema de Euler dependi o del car
acter impar de la dimensi on
del espacio. Por ejemplo, en dos dimensiones no existe un vector en el espacio bidimensional que quede
invariante ante una rotaci on, el eje de rotacion es perpendicular al plano y est a por tanto fuera de dicho
espacio.
Adicionalmente, examinando los valores propios de una matriz ortogonal propia de tres dimensiones Ecs.
(11.65) y recordando las transformaciones asociadas a las posibles estructuras de valores propios (ver pag 247),
se puede dar una forma m as completa al teorema de Euler: Cualquier matriz ortogonal real propia no trivial de
tres dimensiones posee uno y solo un valor propio igual a la unidad. Esto es de esperarse, ya que una rotaci on
no trivial transforma de manera no trivial a cualquier vector que no sea colineal con el eje de rotaci on.
La Ec. (12.21) nos muestra que el autovector asociado a = 1 determina la direcci on del eje de rotacion,
y dado que si la rotaci
on es no trivial solo hay un valor propio = 1 podemos determinar unvocamente dicho
eje. Los cosenos directores del eje de rotaci
on se pueden obtener entonces haciendo = 1 en las ecuaciones de
valores propios (11.41) y resolviendo para X1 , X2 , X3 cuyas soluciones forman un autovector asociado a = 1
(recordemos que estrictamente solo se obtienen cocientes entre tales componentes, si imponemos unitariedad
podemos definir casi completamente un vector en la direcci on del eje excepto por su sentido, cualquier multiplo
de este autovector tambien es autovector asociado al mismo autovalor).
12.7. ROTACIONES FINITAS 281

Una vez determinado el eje de rotaci on procedemos a encontrar el angulo de rotaci


on alrededor de dicho
eje. A traves de una transformaci
on de similaridad (cambio de base), es posible transformar la matriz A a una
matriz equivalente i.e. que describe al mismo operador pero en otra base

A = BAB1

en particular podemos escoger el cambio de base B de tal forma que el nuevo eje X3 coincida con el eje de
on. En tal sistema coordenado A representa una rotaci
rotaci on alrededor de X3 i.e. en el plano X1 X2 , en un

angulo . En consecuencia, la matriz A adquiere la forma


cos sin 0
A = sin cos 0 (12.22)
0 0 1

la traza de A es de la forma
T rA = 1 + 2 cos (12.23)
y recordando que la traza es invariante ante una transformaci
on de similaridad tenemos que

T rA = T rA
3
X
aii = 1 + 2 cos (12.24)
i=1

siendo aii los elementos diagonales (conocidos) de la matriz A. Por tanto, se puede despejar en terminos
de estos elementos. Por otra parte, asumamos otra transformaci on de similaridad que nos lleve a una forma
diagonal equivalente (ver Ecs. 11.46, 11.47). De nuevo usando la invarianza de la traza y la estructura de
valores propios (11.65)
T rA = T r = 1 + ei + ei = 1 + 2 cos (12.25)
e igualando (12.24) con (12.25) resulta

1 + 2 cos = 1 + 2 cos
= (12.26)

de modo que el angulo de rotaci on es igual a una de las fases complejas asociadas a los valores propios.
Ya hemos mencionado que si xk es un autovector asociado a k entonces xk tambien lo es. De modo que
no solo es ambig ua la magnitud del vector sino tambien su sentido. Similarmente, la soluci on del problema
de valores propios tambien nos da una ambig uedad en el sentido de giro del eje de rotaci
on segun se ve en
(12.26). En realidad, es claro que la soluci on de valores propios no fija unvocamente a la matriz ortogonal
A. Por ejemplo, la ecuaci on secular para el determinante (11.42) nos muestra que la matriz traspuesta (y
por tanto la inversa en una matriz ortogonal) tiene los mismos autovalores y autovectores que A. Esto es
l
ogico geometricamente, ya que la rotaci on inversa corresponde al mismo eje de rotaci on y al mismo angulo
excepto por un signo relativo en uno u otro, pero ya vimos que los vectores propios contin uan siendo vectores
propios bajo un cambio de signo y los valores propios de una matriz ortogonal propia 33 tienen la estructura
i = 1, ei es decir invariante ante un cambio de signo de la fase . A pesar de lo anterior, las ambig uedades
pueden ser al menos aminoradas asumiendo que se asocia a A y se asocia a A1 , y fijando el sentido de
los ejes de rotacion por la regla de la mano derecha.
Como corolario del teorema de Euler aparece el Teorema de Chasles: El desplazamiento m as general
de un cuerpo rgido consiste en una traslaci on mas una rotaci on. Esto se ve simplemente teniendo en cuenta
que si el punto de referencia ya no es fijo entonces podemos descomponer el movimiento visto por S como
la traslaci
on pura de S0 mas la rotaci on pura de S con respecto a S0 . En realidad, Chasles demuestra una
versi
on m as fuerte que dice que es posible escoger el origen de S de modo que la traslaci
on este en la misma
direcci
on que el eje de rotacion.
282 CAPITULO 12. CINEMATICA
DEL CUERPO RIGIDO

Figura 12.4: Rotacion finita en un


angulo . El vector unitario n determina el eje de rotaci
on en el sentido
horario (regla de la mano izquierda).

12.7. Rotaciones finitas


Hemos trabajado hasta aqu dos parametrizaciones para determinar la orientaci on relativa de un sistema
coordenado. Por un lado los angulos de Euler me permiten construr cualquier orientacion relativa de S a partir
de la orientaci
on de S0 mediante tres rotaciones sucesivas. Por otro lado, el teorema de Euler nos dice que la
transformaci on de coordenadas necesaria para cualquier cambio de orientaci on se puede llevar a cabo con una
sola rotacion en torno a una direccion adecuada. Es natural entonces tratar de construr una representaci on
en terminos de los grados de libertad de dicha rotaci
on como son el angulo de rotacion y los cosenos directores
del eje (probablemente con condici on de unitariedad del vector director).
Es m as conveniente en este caso utilizar un punto de vista activo de la rotaci on de modo que el sistema
coordenado permanece inalterado y se hace una rotaci on de los vectores. Hay que recordar que una rotaci on
antihoraria para el sistema coordenado corresponde a una rotaci on horaria para los vectores.

En la figura 12.4, el vector OP es la posici on final r ser
on inicial r del vector y la posici a OQ. El vector
unitario n define la direcci
on del eje de rotaci
on y su sentido sigue la regla de la mano izquierda, los vectores

N P y N Q son perpendiculares al eje de rotaci on y pasan por el. Es claro que la distancia ON tiene valor n r,
por lo tanto podemos escribir

ON = n (n r) (12.27)
Del diagrama tambien se observa que

ON + N P = OP N P = OP ON

N P = r n (n r) (12.28)

y as mismo se observa que



N P = N Q = kr nk (12.29)
estas magnitudes son iguales al radio de la circunferencia en la figura. La figura 12.4 muestra a la derecha
el diagrama de vectores en el plano N QP perpendicular al eje de rotaci on. Con estas relaciones ya podemos
on entre r y r en funci
escribir la relaci on de n y . De este diagrama es f
acil ver que

r = ON + N V + V Q (12.30)
12.7. ROTACIONES FINITAS 283


siendo el vector V Q perpendicular a N P . El vector r n es perpendicular al plano ON P . Por otro lado la
figura tambien muestra que


N P NP NP
N V = N V = N Q cos
= N P cos = N P cos
N P N P N P

donde hemos usado (12.29). Ahora usando (12.28) resulta



N V = [r n (n r)] cos (12.31)

similarmente escribamos el vector V Q usando (12.29)

(r n) (r n)

V Q = V Q = N Q sin


kr nk N Q

V Q = (r n) sin (12.32)

reemplazando (12.27), (12.31) y (12.32) en (12.30) resulta

r = n (n r) + [r n (n r)] cos + (r n) sin

ahora simplemente reagrupamos terminos para escribir el resultado final

r = r cos + n (n r) [1 cos ] + (r n) sin (12.33)

a la ecuaci
on (12.33) se le conoce como formula de rotaci on. Esta ecuacion es v
alida para cualquier rotaci
on
de cualquier magnitud, y por tanto constituye una versi on para la rotaci
on finita (en sentido horario, es decir
con el vector unitario definido por la regla de la mano izquierda) de la expresion que se encontro en la p
agina
74 para rotaciones infinitesimales en un vector.

12.7.1. Forma matricial de la f


ormula de rotaci
on
La f
ormula (12.33) para la rotaci
on se puede colocar en forma mas adecuada para una formulacion matricial
introduciendo un escalar e0 y un vector de componentes e1 , e2 , e3 en la forma


e0 = cos ; e = n sin (12.34)
2 2
es evidente que estos par
amtros est
an relacionados por

e20 + e2 = e20 + e21 + e22 + e23 = 1 (12.35)

usando la identidad

cos2 sin2 = cos = e20 e2
2 2
cos = e20 e21 e22 e23 (12.36)

y de la identidad


2 sin cos = sin = 2e0 e
2 2
n sin = 2e0 e (12.37)
284 CAPITULO 12. CINEMATICA
DEL CUERPO RIGIDO

usando las identidades (12.34), (12.35), (12.36), (12.37) en la Ec. (12.33) resulta
 

r
= r e20
e21 e22 e23
+ n (n r) 2 sin + 2 (r e) e0 2
2
 
2 2 2 2

r = r e0 e1 e2 e3 + 2n sin n sin r + 2 (r e) e0
2 2
2

r = r e0 ek ek + 2e (e r) + 2 (r e) e0 (12.38)

esta ecuaci
on establece una relaci on lineal entre r y r, en una forma vectorial. Para construir la matriz
ortogonal A en estos parametros, se procede a escribir la ecuaci on para cada componente xi en terminos de
una combinacion lineal de los xj , los coeficientes de la combinaci
on nos dan la matriz A. Por ejemplo, para
una componente primada se tiene

xi = xi e20 ek ek + 2ei (ej xj ) + 2ijk e0 xj ek

xi = xj ij e20 ek ek + 2ei ej xj + 2ijk e0 ek xj
  
xi = ij e20 ek ek + 2ei ej + 2ijk e0 ek xj aij xj

la matriz asociada es entonces



aij = ij e20 ek ek + 2ei ej + 2ijk e0 ek

que explcitamente se escribe



e20 + e21 e22 e23 2 (e1 e2 + e0 e3 )  2 (e1 e3 e0 e2 )
A = 2 (e1 e2 e0 e3 ) e0 e21 + e22 e23
2 2 (e2 e3 + e0 e1 )  (12.39)
2 (e1 e3 + e0 e2 ) 2 (e2 e3 e0 e1 ) e0 e21 e22 + e23
2

a manera de consistencia veremos que la traza de la matriz (12.39) es identica a la traza expresada en la Ec.
(12.25), puesto que la traza es invariante ante un cambio de base.
 
2 2 2 2
T rA = 3e20 e21
= 3 cos e22 e23
sin = 2 cos 2
+ cos sin
2 2 2 2 2
= (1 + cos ) + cos = 1 + 2 cos

que coincide con (12.25).

12.7.2. Relaci
on entre n y y los
angulos de Euler
La relaci
on entre los
angulos de Euler y el angulo de rotacion alrededor del eje de rotaci on, se puede
obtener igualando las trazas de la matrices en (12.19) y (12.39). La traza de (12.19) se escribe como

T r1 A = cos cos cos sin sin sin sin + cos cos cos + cos
= (1 + cos ) cos cos (1 + cos ) sin sin + cos
= (1 + cos ) (cos cos sin sin ) + cos
= (1 + cos ) cos ( + ) + cos
         
+ +
= 1 + cos2 sin2 cos2 sin2 + cos2 sin2
2 2 2 2 2 2
       
+ +
= 2 cos2 cos2 sin2 + cos2 sin2
2 2 2 2 2
12.8. ROTACIONES INFINITESIMALES 285

         
2 2 + 2 + 2 + 2 2
T r1 A = 2 cos 2 cos cos sin + cos sin
2 2 2 2 2 2
      
+
= 2 cos2 2 cos2 1 + cos2 sin2
2 2 2 2
       
2 2 + 2 2 2
= 4 cos cos 2 cos + cos sin
2 2 2 2 2
 
+
= 4 cos2 cos2 cos2 sin2
2 2 2 2
 
+
= 4 cos2 cos2 1
2 2

en tanto que la traza de (12.39) se escribe como



T r2 A = 3e20 e21 e22 e23 = 3 cos2 sin2
  2 2

T r2 A = 3 cos2 1 cos2 = 4 cos2 1
2 2 2
igualando ambas trazas se obtiene
 
+
4 cos2 1 = 4 cos2 cos2 1
2 2 2
     
+
cos = cos cos
2 2 2

12.8. Rotaciones infinitesimales


A lo largo de este captulo hemos aprendido que para generar rotaciones tridimensionales solo se requieren
tres elementos independientes, con lo cual una representaci on matricial 3x3 necesariamente contiene muchos
elementos redundantes y se han tenido que agregar ligaduras que garanticen el n umero correcto de grados de
libertad. El hecho de que las componentes independientes sean tres y que hayamos podido encontrar un eje de
rotacion que permita realizar el cambio de orientaci
on con una sola rotacion, nos conduce a la posibilidad de
construr un vector que denota a tal transformacion. Una posibilidad mas bien evidente sera elegir un vector
a lo largo del eje de rotaci
on cuya magnitud sea una funcion del
angulo de rotaci
on. Veremos sin embargo, que
esta construccion no es consistente: si realizamos dos transformaciones sucesivas asociadas a vectores A y B
la composicion de ellos debe hacerse por la suma de estos la cual es conmutativa

A+B=B+A

hemos visto que la composici on de dos matrices en general no es conmutativa y esto es v alido en particular para
las matrices ortogonales. Es facil mostrar un ejemplo fsico en el cual las rotaciones sucesivas no conmutan,
la Fig. 12.5 muestra dos rotaciones sucesivas de un bloque realizadas en diferente orden: en el primer caso
se comienza con una rotaci on antihoraria alrededor de x con x = /2 seguida por otra rotaci on antihoraria
de /2 alrededor de y. En el segundo caso se invierte el orden de las rotaciones y se observa una marcada
diferencia entre las dos configuraciones.
En consecuencia, si un vector representara satisfactoriamente a una rotaci on, y la adici
on de vectores me
representara la composici on de rotaciones, dicha operaci on de adicion vectorial no debera ser conmutativa,
pero esta es un propiedad fundamental de un espacio vectorial. Luego, las rotaciones finitas no pueden ser
representadas por vectores.
Veremos a continuaci on que las transformaciones infinitesimales conmutan a primer orden y que por tanto
pueden ser representadas por un vector. Visto de manera pasiva, consideraremos un cambio de orientaci on de los
ejes coordenados en la cual los ejes X1 , X2 , X3 solo difieren infinitesimalmente de X1 , X2 , X3 respectivamente.
286 CAPITULO 12. CINEMATICA
DEL CUERPO RIGIDO

on solo difiere de la identidad por cantidades infinitesimales. Las nuevas componentes xi de un


La transformaci
vector vendr
an dadas por
xi = xi + ij xj
donde los par
ametros ij son infinitesimales de modo que para efectos de c
alculo solo se conservar
an terminos
de primer orden en tales par
ametros. La relacion anterior se escribe

xi = (ij + ij ) xj

que en notaci
on matricial adquiere la forma:

r = (1 + ) r (12.40)

que manifiesta el hecho ya mencionado de que la matriz de transformaci


on solo difiere infinitesimalmente de
la identidad. Veamos ahora como act
ua la composici
on de dos transformaciones infinitesimales

A1 A2 = (1 + 1 ) (1 + 2 ) = 1 + 1 + 2 + 1 2

sin embargo, considerando solo terminos de primer orden

A1 A2 = 1 + 1 + 2 (12.41)

esta operaci
on es claramente conmutativa (solo el termino de segundo orden que se despreci o es no conmuta-
tivo). En consecuencia, es posible representar estas operaciones infinitesimales mediante vectores.
Es muy sencillo obtener la matriz inversa de una transformaci on infinitesimal si tenemos en cuenta la
regla de composicion a primer orden dada por (12.41), en esta composici on se obtiene la identidad si y solo si
1 = 2 , por lo tanto la inversa se escribira con la siguiente asociaci
on

A = (1 + ) A1 = (1 )

n on escalar de primer orden (1 + x)1


otese que esto se asemeja a la relaci = 1x. Recordando que la condicion
on3
de ortogonalidad equivale a que la inversa sea identica a la traspuesta, se obtiene la siguiente relaci

1 + e = 1
e =

de modo que la matriz infinitesimal debe ser antisimetrica. Dada su antisimetra los elementos diagonales de
la matriz son nulos y tenemos tres grados de libertad como corresponde a toda matriz antisimetrica real 3x3.
Esto a su vez implica que la diagonal de A sigue teniendo elementos unidad y al expandir el determinante se
observa que este contin ua siendo +1 a primer orden. Naturalmente, no era de esperarse un cambio brusco del
determinante a 1 ya que estas transformaciones son contnuas e infinitesimales. Visto de otro modo, no era
de esperarse que ocurriera una transformaci on discreta de inversi
on cuando lo que tenemos son par ametros
contnuos infinitesimales. En conclusi
on estas transformaciones ortogonales son propias y pueden asociarse a
una rotacion.
Ya hemos visto que una matriz antisimetrica se puede parametrizar como en la ecuaci on (11.19). Aplicando
esta parametrizaci on para escribimos

0 d3 d2
= d3 0 d1 (12.42)
d2 d1 0

donde la notacion enfatiza el car


acter infinitesimal de los par
ametros. Teniendo en cuenta (12.40), el cambio
infinitesimal en las componentes de un vector se escribe como
3
Lo discutido hasta aqu es v
alido para cualquier transformaci
on lineal infinitesimal, ya que no se ha usado la relaci
on de
ortogonalidad en ninguna forma.
12.8. ROTACIONES INFINITESIMALES 287

r r dr = r (12.43)
Aplicando adem
as las Ecs. (11.19, 11.20, 11.21, 11.22) vemos que un diferencial del vector r se escribe
dr = r d ; d (d1 , d2 , d3 )T (12.44)
Esta ecuaci on nos dice que el cambio infinitesimal del vector r es perpendicular a r mismo y al vector d el
cual como veremos m as adelante va a lo largo del eje de rotaci on. Lo primero se puede ver por el hecho de
que si hubiera una componente de dr a lo largo de r implicara un cambio de magnitud de r que no puede ser
producido por una transformaci on ortogonal. Ahora bien, ya hemos visto que el vector asociado a una matriz
antisimetrica es un vector axial (ver secci
on 11.5). N
otese que la ecuaci
on (12.44) es consistente con este hecho,
ya que r y dr son vectores polares, por lo tanto es necesario que d sea axial para que su producto cruz con un
vector polar sea polar. Como todo vector axial d posee las propiedades de transformaci on dadas por (11.60)
di = |B| bij dj
la forma explcita de d en terminos de los par
ametros de rotaci
on se puede encontrar tomando la formula de
rotaci
on Ec. (12.33) y aplic
andola a un angulo infinitesimal para el cual cos d 1, sin d d, resulta

r = r + (r n) d
r r = dr = (r n) d (12.45)
comparando esta expresi
on con (12.44) obtenemos que
d = n d (12.46)
Notese que hemos obtenido lo que esper abamos: el vector d que caracteriza a la rotaci on infinitesimal va en
la direcci
on del eje de rotacion y su magnitud es el angulo de rotaci on infinitesimal d. Vale la pena anotar
que este vector diferencial no proviene de ninguna diferencia entre vectores finitos, ya que las rotaciones finitas
no pueden ser asociadas a un vector como ya se vi o. Geometricamente, una inversi on pasiva nos cambia de un
sistema dextr ogiro a uno lev
ogiro para definir el sentido de n con lo cual dicho vector sera axial, y dado que d
tambien es axial, se deduce que d debe ser un escalar (y no un pseudoescalar). La relaci on (12.46) tambien se
puede encontrar muy f acilmente considerando un angulo infinitesimal de rotaci on en la figura (12.6). El signo
de d se considera positivo en la direccion horaria es decir con convenci on quiral izquierda.
Finalmente, debemos tener en cuenta que las interpretaciones pasiva o activa de las transformaciones se
han tomado a conveniencia. Originalmente se tom o la interpretaci
on pasiva que nos permite orientar los ejes
coordenadas que se mueven con el cuerpo rgido. Vimos adem as que una interpretacion activa de la rotacion de
un vector en un sistema coordenado fijo implica una rotaci on en el sentido contrario i.e. en el sentido horario.
Sin embargo, es m as usual considerar tales transformaciones activas en la convenci on antihoraria (en tal caso
n y d s estaran definidos por la regla de la mano derecha). Por esta raz on, haremos un resumen de las
f
ormulas utiles encontradas pero en la convenci on de sentido antihorario de rotaci on. De aqu de adelante
se usaran estas f ormulas en esta convenci on antihoraria es decir con regla de la mano derecha
La f
ormula de rotaci on (12.33) en convenci on antihoraria es
r = r cos + n (n r) [1 cos ] + (n r) sin
la rotaci
on infinitesimal correspondiente (12.45, 12.46) es
r r = dr = (n r) d = d r (12.47)
la matriz antisimetrica de rotaci
on (12.42) se escribir
a como

0 d3 d2 0 n3 n2
= d3 0 d1 = n3 0 n1 d
d2 d1 0 n2 n1 0
N d (12.48)
288 CAPITULO 12. CINEMATICA
DEL CUERPO RIGIDO

ni son las componentes del vector unitario n que define al eje de rotaci
on. dr es el cambio infinitesimal desde
r hasta r . Teniendo en cuenta (12.43), as como (12.48) se tiene que

dr = r = (N d) r

resultando entonces una ecuaci


on diferencial matricial con respecto al
angulo de rotaci
on
dr
= Nr (12.49)
d
los elementos de la matriz N definida en (12.48), est
an dados por

Nij = ijk nk = jik nk (12.50)

adicionalmente, la matriz en (12.48) se puede representar de la siguiente forma



0 0 0 0 0 1 0 1 0
= ni Mi d ; M1 0 0 1 ; M2 0 0 0 ; M3 1 0 0 (12.51)
0 1 0 1 0 0 0 0 0

las matrices Mi se conocen como los generadores de rotaciones infinitesimales y su combinaci


on posee la
siguiente propiedad
Mi Mj Mj Mi [Mi , Mj ] = ijk Mk (12.52)
la diferencia entre los dos productos matriciales se denomina conmutador o corchete de Lie. La Ec. (12.52)
define un algebra de Lie del grupo de rotaciones parametrizado en terminos del angulo de rotacion y el vector
unitario a lo largo del eje de rotaci
on.
Veremos ahora como se puede construr un operador de rotaci on finita, a partir de infinitas rotaciones
infinitesimales sucesivas que parten desde la identidad. El proceso es similar al realizado para las transforma-
ciones canonicas seccion 8.9 aunque aqu partiremos en el orden inverso, comenzando con transformaciones
infinitesimales para construr la transformacion finita. Partiendo de un cierto eje de rotaci on el
angulo de
rotacion comienza en = 0 hasta un valor final , podemos hacer la transformaci on en k etapas sucesivas y
en cada una el angulo aumenta en una cantidad = /k. Si k es suficientemente grande se puede considerar
que cada una de las k rotaciones es infinitesimal de modo que la primera transformaci on es
 

r (0) + r = (1 + ) r (0) = (1 + ni Mi ) r (0) = 1 + n M r (0)
k
donde hemos usado (12.51). El producto punto definido por n M es solo una forma sintetica para denotar
la suma ni Mi la cual a su vez es una matriz. La segunda transformaci
on es
 
2
r (0) + r + r = (1 + ) (1 + ) r (0) = 1 + n M r (0)
k
y as sucesivamente se requieren k transformaciones para llegar al vector final
 
k
r (0) + kr = r () = 1 + n M r (0)
k
para que cada transformaci
on sea realmente infinitesimal debe tomarse el lmite cuando k
 
k
r () = lm 1 + n M r (0) (12.53)
k k
y recordando que en funciones ordinarias esta es precisamente una representaci
on de la exponencial
 
x k
ex = lm 1 +
k k
DE CAMBIO DE UN VECTOR VISTO POR SISTEMAS ROTANTES
12.9. RAZON 289

se tiene entonces que la Ec. (12.53) se puede reescribir como

r () = e(nM )
r (0) (12.54)

es decir el operador de rotaci b se puede escribir como una funci


on O on de operadores
b r (0)
r () = O ; b exp (n M )
O

donde n y se denominan par ametros de la rotaci on y las tres matrices M definidas en (12.51) son los
generadores. N otese que las matrices M son las mismas para cada rotaci on en tanto que los parametros varan
de una rotacion a otra.
Hay por supuesto otras representaciones de los generadores M, pero todas ellas deben cumplir el algebra
definida por los corchetes de Lie en (12.52). N otese la similitud entre (12.54) y (8.54), la cual no es coinci-
dencial ya que ambas representan transformaciones contnuas que se construyen a partir de transformaciones
infinitesimales partiendo de la identidad. N
otese finalmente que (12.54) es solucion de la ecuacion diferencial
(12.49) con N = n M.

12.9. Raz
on de cambio de un vector visto por sistemas rotantes
Consideremos la dinamica de un vector tal como el vector posici on, momento angular etc. El vector puede
estar cambiando en el tiempo de cierta manera. No obstante, el cambio observado depender a en general del
sistema coordenado elegido para medir dicho cambio. Definiremos sistemas de referencia S, S0 , Srot en donde
S es un sistema inercial, S0 un sistema con ejes paralelos a S y Srot es un sistema rotante con respecto a S0
pero que tiene origen comun con el. Srot tiene por tanto un eje de rotaci
on instant
aneo n (t). Nos centraremos
en la forma en que S0 y Srot ven la razon de cambio de un cierto vector V, ya que la transformaci on desde S0
hasta S es muy sencilla (S0 posee traslaci on pura con respecto a S).

12.9.1. Raz
on de cambio por argumentos vectoriales
Es importante notar que para ciertos vectores que llamaremos primitivos ambos sistemas S0 y Srot ven
el mismo vector, solo que lo escriben en componentes diferentes como ya se ha mencionado de las transfor-
maciones pasivas. El caso m as importante de este tipo de vector es el vector posici on teniendo en cuenta que
ambos sistemas de referencia tienen origen com un. Antes de hacer el formalismo general tomemos un ejemplo:
Supongamos que el sistema Srot est a fijo a un cuerpo rgido de tal forma que el vector posici
on de un punto del
cuerpo es claramente constante visto por Srot . Es claro tambien que si el cuerpo rgido tiene cierta din amica,
dicho vector no sera constante con respecto a S0 . Notese entonces que S0 y Srot miden el mismo vector en cada
instante, digamos en r (t) y en r (t + t). No obstante, ambos sistemas de referencia miden diferentes cambios
en tal vector medidos en el mismo intervalo entre t y t + t, ya que es evidente que para Srot el cambio del
vector en cualquier intervalo es nulo, en tanto que el cambio visto por S0 es diferente de cero. Lo anterior nos
lleva a conclur que aunque en ambos sistemas de referencia S0 y Srot los vectores son los mismos en cada
instante de tiempo, tales sistemas de referencia van a medir razones de cambio diferentes de dichos vectores,
veamos ahora el formalismo general.
Tomemos un vector primitivo pero por lo dem as arbitrario V. En un instante t dicho vector se escribe
en ambas bases de la forma
V = Vi ui = Virot urot
i (12.55)
un diferencial de este vector se escribir
a en la forma

dV = (dVi ) ui = dVirot urot
i + Vi
rot
durot
i (12.56)

donde hemos empleado la convenci on de que los vectores unitarios asociados a S0 son constantes, lo cual es
razonable ya que esta misma base se usara en el sistema inercial S. Los vectores unitarios uroti pueden en
on con respecto a S0 . Dado que los urot
cambio cambiar de direcci i son unitarios, no pueden cambiar su magnitud
290 CAPITULO 12. CINEMATICA
DEL CUERPO RIGIDO

y por tanto su cambio es una transformaci on infinitesimal ortogonal y propia (rotaci


on infinitesimal) alrededor
del eje de rotaci
on instant
aneo n (t). En consecuencia podemos tomar el resultado expresado en (12.47).

durot rot
i = n ui d = d urot
i

a partir de esta expresi


on la Ec. (12.56) queda
 
(dVi ) ui = dVirot urot
i + d Virot urot
i

ambos miembros de esta ecuaci on se refieren al cambio del vector visto por S0 4 . En contraste, el cambio
del vector visto por S rot corresponde solo al primer termino de la derecha, ya que este sistema ve que los
vectores ui son estacionarios, es decir que visto por S rot se tiene que durot
rot
i = 0 y por tanto d urot
i = 0.
rot rot
Finalmente, de acuerdo con (12.55) tenemos que Vi ui es simplemente V

(dV)S0 = (dV)rot + d V (12.57)

N
otese que dado que V como tal es igual en ambos sistemas, no escribimos un r otulo para designar al sistema
que lo mide. Finalmente la raz
on de cambio en un intervalo de tiempo dt sera
   
dV dV d
= + V
dt S0 dt rot dt

definimos la velocidad angular instant


anea asociada al eje de rotaci
on como

d d
=n (12.58)
dt dt
este vector est
a orientado a lo largo del eje de rotaci
on con su sentido definido por la regla de la mano derecha.
Su magnitud corresponde al angulo barrido por unidad de tiempo en el intervalo dt. La raz on de cambio se
escribe    
dV dV
= +V (12.59)
dt S0 dt rot
Es importante diferenciar las rotaciones est aticas con las cuales se realiza un cambio de base, de las
rotaciones dinamicas que estamos trabajando aqu. Las rotaciones est aticas nos llevan de un conjunto

de ejes ortogonales X1 X2 X3 a otro conjunto de ejes X1 X2 X3 inclinado con respecto al primero, pero esta
transformacion no ocurre en el tiempo, y la inclinaci
on es la misma en todo instante (i.e. los
angulos de Euler
que caracterizan la rotaci
on son constantes). En las rotaciones din
amicas, el sistema S no solo est a rotado
con respecto a S sino que tambien es rotante, es decir la rotaci
on evoluciona en el tiempo y tanto la velocidad
de rotaci
on como la direccion del eje son funciones del tiempo (o equivalentemente los angulos de Euler son
funciones del tiempo).

12.9.2. Raz
on de cambio por argumentos algebr
aicos
Tambien podemos realizar una derivacion con base en el formalismo de las matrices ortogonales. Si deno-
on desde la base en S0 a la base en S rot . Las componentes de
tamos A a la matriz que produce la transformaci
V en ambas bases se escriben como

(V)rot = A (V)S0 A1 (V)rot = (V)S0


(V) e (V)
= A (12.60)
S0 rot

4
Aunque S0 no es necesariamente inercial, solo tiene traslaci
on pura con respecto a un sistema inercial. Por tanto, todas las
propiedades puramente rotacionales que aparezcan en S0 se ver an identicas en un sistema inercial S. Incluso podra permitirse que
los ejes de S0 estuvieran inclinados con respecto a los de S, siempre que esta inclinaci on no cambie en el tiempo.
DE CAMBIO DE UN VECTOR VISTO POR SISTEMAS ROTANTES
12.9. RAZON 291

de aqu en adelante acortaremos la notaci


on para escribir (V)S y (V)r en lugar de (V)S0 y (V)rot . En
componentes la Ec. (12.60) se escribe
ViS = aji Vjr (12.61)
la matriz A (i.e. sus componentes) evoluciona en forma contnua con el tiempo. Por tanto, una transformaci on
infinitesimal (en un intervalo dt) produce cambios infinitesimales en sus elementos. El diferencial del cambio
del vector ser
a
dViS = aji dVjr + daji Vjr (12.62)
por otro lado, siempre es posible elegir los ejes de modo que S0 coincida con S rot en un cierto instante t. De
esta forma se tiene que
A (t) = 1 ; A (t + dt) = 1 + (12.63)
como corresponde a las transformaciones infinitesimales, Ec. (12.40). A partir de (12.63) se observa que
aji (t + dt) = ji + ji ; daji = ji = ij (12.64)
donde hemos usado la antisimetra de . Como los ejes de ambos sistemas coordenados son coincidentes en t,
las componentes de los vectores coinciden instant aneamente, pero los diferenciales no ser
an identicos ya que
los dos sistemas se mueven el uno relativo al otro. Se tiene entonces que
VjS = Vjr ; aji dVjr = (ji + ji ) dVjr = dVir (12.65)
donde solo se conservan diferenciales de primer orden. Reemplazando las Ecs. (12.65, 12.64) en (12.62) se
obtiene
dViS = dVir ij Vjr (12.66)
Por otro lado, usando las Ecs. (12.46), (12.48) y (12.50), podemos escribir los elementos de la matriz
a ijk 5 . Hay sin embargo un aspecto delicado cual
antisimetrica ij en terminos del tensor cclico de Levi civit
es el hecho de que estamos trabajando una transformaci on pasiva, recordemos que una trasnformaci on activa
en convenci on antihoraria equivale a una pasiva en convenci on horaria, por tanto debemos trabajar con la
convencion original de ejes a izquierda, para ello basta con cambiar de signo uno de los miembros de la Ec.
(12.50) manteniendo intactas las definiciones en (12.46), (12.48)
ij = Nij d = ijk nk d = ikj dk
ij = ikj dk (12.67)
y reemplazando (12.67) en (12.66) se obtiene
dViS = dVir + ikj dk Vjr
(dV)Si = (dV)ri + (d Vr )i
as que las componentes del vector como tal coinciden entonces Vjr = VjS Vj y se obtiene
recordando adem
finalmente
(dV)S = (dV)r + d V (12.68)
que coincide con la expresi
on (12.57). Notese que la Ec. (12.68) no es tanto una ecuaci on acerca de un vector
particular sino mas bien una aseveraci
on acerca de la transformaci on infinitesimal entre dos sistemas coorde-
nados. Ahora bien, dado que (12.59) es v alida para un vector o pseudovector arbitrario, podemos escribir una
ecuaci
on de operadores de la forma
   
d (. . .) d (. . .)
= + (. . .) (12.69)
dt S dt r
y la ecuaci
on vectorial resultante puede ser resuelta a lo largo de cualquier conjunto ortogonal de ejes, fijo o
movil. N
otese de nuevo que la raz
on de cambio en el tiempo es solo relativa a un conjunto coordenado especfico.
Cuando la derivada temporal de un vector es con respecto a un sistema coordenado, las componentes pueden
ser tomadas a lo largo de otro sistema coordenado solo despues de realizar la diferenciaci on.
5
Dado que el tensor de Levi Civit
a tiene tres ndices y la matriz antisimetrica que genera las rotaciones infinitesimales tiene
dos ndices, no habr
a confusi
on aunque se use la misma letra.
292 CAPITULO 12. CINEMATICA
DEL CUERPO RIGIDO

12.9.3. Segunda derivada en el sistema rotante


Para consideraciones futuras ser
autil tambien calcular la segunda derivada del vector arbitrario V en S0
y S rot .
Para simplificar la notaci
on definimos
 
dV
ZS,r (12.70)
dt S,r

la segunda derivada de V en el sistema S0 (denotada por WS ) se escribe como


 
dZS
WS (12.71)
dt S

y aplicando el operador (12.69) sobre el vector ZS resulta


   
dZS dZS
WS = = + ZS (12.72)
dt S dt r

n
otese que en la expresi
on ZS hemos puesto un r otulo para denotar el sistema de referencia en donde se observa
a Z, situaci
on diferente a la que se ve en la Ec. (12.59), en la cual no se especifica el sistema que observa a V.
La diferencia consiste en que V es un vector primario que no depende del sistema de referencia, en tanto
que Z ya es una raz on de cambio temporal, que en consecuencia depende explcitamente del sistema elegido.
Por otro lado, usando (12.59) con la nueva notaci on resulta

ZS = Zr + V (12.73)

reemplazando (12.73) en (12.72) resulta


 
d
WS = (Zr + V) + Zr + ( V) (12.74)
dt r

es claro que la segunda derivada vista por S rot sera


 
dZr
Wr =
dt r

de modo que  
d
WS = Wr + ( V) + Zr + ( V) (12.75)
dt r
tomaremos el caso de constante i.e. eje de rotacion y rapidez angular constantes
 
dV
WS = Wr + + Zr + ( V)
dt r

usando (12.70) queda


WS = Wr + 2 Zr + ( V) (12.76)
retornando a escribir estas segundas derivadas en terminos del vector original V, para ello usamos (12.70,
12.71) y resulta          
d dV d dV dV
= + 2 + ( V)
dt dt S S dt dt r r dt r
que nos induce a escribir la ecuaci
on de operadores equivalente
         
d d (. . .) d d (. . .) d (. . .)
= + 2 + [ (. . .)] (12.77)
dt dt S S dt dt r r dt r
12.10. SISTEMAS NO INERCIALES ROTANTES 293

Una anotacion metodologica importante, para la validez de las ecuaciones (12.69, 12.77) no es estricta-
mente necesario suponer que ninguno de los sistemas de referencia S0 o S sea inercial o que alguno de los
dos este relacionado con un sistema inercial a traves de una traslaci on pura. Ambos sistemas podran ser
rotantes con respecto a un sistema inercial, las relaciones aqu obtenidas son puramente cinem aticas y parten

simplemente de dos premisas: S0 y S tienen origen com un y establecemos a S0 como el sistema no rotante
y a S como el sistema rotante. Lo que hacemos entonces es comparar los vectores y sus derivadas vistas
por ambos sistemas, es entonces la rotaci on de S vista por S0 . Cuando entremos al estudio de la din
amica,
sera importante que uno de los dos sistemas sea inercial (o de lo contrario introducimos un tercero que s lo
sea) a fin de establecer un marco de referencia en donde se puedan emplear las leyes de Newton. Pero las Ecs.
(12.69, 12.77) mantendr an su validez incluso cuando ambos sistemas sean no inerciales.

12.10. Sistemas no inerciales rotantes


Las Ecs. (12.69, 12.77) son las leyes cinem aticas basicas sobre las cuales se escribir
an las ecuaciones de
movimiento del cuerpo rgido. Sin embargo, su validez es mucho m as general dado que son aplicables a un
vector arbitrario.
Las Ecs. (12.69, 12.77) ser an de particular utilidad en el estudio del movimiento de una partcula o sistemas
de partculas relativo a un sistema coordenado rotante. Describiremos brevemente el problema de una partcula
que se mueve relativo a un sistema rotante. Para ello tomaremos como vector base el vector posici on de la
partcula (que coincide en ambos sistemas S0 y S ), medido desde el origen com un de S0 y S . Dado que la
base de la descripci on dinamica de la partcula es la segunda ley de Newton, debemos calcular la primera y
segunda derivada de este vector con respecto a ambos sistemas de referencia. Partamos de la segunda ley de
Newton en un sistema inercial
F = maS
por simplicidad asumiremos que S0 es un sistema inercial y podemos entonces tomarlo coincidente con S.
Debemos entonces calcular la relaci on vista por S0 denotada por aS y la vista por S
on entre la aceleraci
denotada como ar . Primero aplicamos el operador (12.69)
   
dr dr
= +r
dt S dt r
vS = vr + r

y la aceleraci
on se obtiene aplicando el operador (12.77) al vector r
         
d dr d dr dr
= + 2 + [ r]
dt dt S S dt dt r r dt r
aS = ar + 2 ( vr ) + [ r]

despejando ar se obtiene
ar = aS + 2 (vr ) + [( r) ] (12.78)
analicemos los terminos que aparecen a la derecha de la expresi on (12.78). El termino [( r) ] se ilustra en
la Fig. 12.7, en tal figura se asume que y r est
an en el plano del papel de modo que r es perpendicular al
papel hacia adentro. Colocando la cola del vector [( r) ] en el punto donde se ubica la partcula, vemos
que tal vector es perpendicular a y apunta en la direcci on que se aleja de y por tanto del eje de rotaci on,
razon por la cual se le conoce como aceleraci 2
on centrfuga. Su magnitud es r sin siendo el angulo entre
y r. El termino 2 (vr ) se conoce como aceleraci on de coriolis y es claramente perpendicular al eje de
rotaci
on y a la velocidad de la partcula vista por el sistema rotante.
Multiplicando (12.78) por la masa de la partcula vemos que un observador en el sistema rotante observa
el movimiento de la partcula como si esta se moviera bajo la influencia de una fuerza efectiva:

mar = maS + 2m (vr ) + m [( r) ] (12.79)


294 CAPITULO 12. CINEMATICA
DEL CUERPO RIGIDO

Ff ict = F + 2m (vr ) + m [( r) ] (12.80)


Naturalmente, los terminos correspondientes a las aceleraciones centrfuga y de coriolis se denominan efecto
centrfugo y efecto de coriolis. Es mas adecuado usar los terminos efecto de coriolis o efecto centrfugo que
los terminos fuerza de Coriolis o fuerza centrfuga. Ya que la primera terminologa nos recuerda que estos
efectos surgen de emplear un observador no inercial y no corresponde a interacciones entre sistemas fsicos.
Esto se puede ver claramente del hecho de que cada uno de estos terminos est a relacionado con la masa de
la partcula por una aceleraci on que no esta relacionada con la partcula sino con el sistema rotante. En la
literatura tambien se usa el termino fuerza ficticia para indicar este tipo de efectos.
Notese que el efecto de coriolis solo aparece si la partcula tiene una velocidad no nula con respecto al
sistema rotante y produce una aceleraci on normal a la velocidad instant anea, esto implica a su vez que este
efecto (tomado aisladamente) solo produce cambio de direcci on pero no de rapidez en la partcula. De otra
parte el efecto centrfugo desaparece si el vector posici
on de la partcula es paralelo al vector velocidad angular
i.e. al eje de rotaci
on.
Un sistema rotante particular de gran utilidad en la Fsica es el planeta tierra. Aunque un sistema de
referencia fijo a la tierra puede tomarse en buena aproximaci on como un sistema inercial, para ciertas medidas
de alta precision es necesario considerar el hecho de que este sistema rota con respecto a un sistema mucho
mas cercano al ideal inercial (sistema de referencia de las estrellas fijas). En tal caso, debe estudiarse los
efectos centrfugo y de coriolis para un sistema de referencia fijo a la tierra. Estimaremos entonces el orden de
magnitud de estos efectos en la tierra. La tierra rota en direcci on antihoraria con respecto al polo norte, con
una velocidad angular relativa a las estrellas fijas dada por
  
2 366,25
= = 7,292 105 s1
(24 3600) s 365,25

el primer termino entre parentesis se refiere a la velocidad angular relativa al radio vector del sol. La cantidad
en el segundo parentesis se refiere a el cociente entre el n umero de das siderales en un ano, dividido por el
numero de das en un ano solar, es decir es el factor de correcci
on para obtener la velocidad angular relativa a
las estrellas fijas. Tomado este valor de junto con el radio de la tierra en el ecuador, la m axima aceleracion
centrpeta estara dada por
2 r = 3,38cm/s2
que corresponde a un 0,34 % de la aceleraci on de la gravedad. Este efecto es peque no pero no despreciable.
En realidad, el efecto medido de la gravedad representa el efecto combinado del campo gravitacional de la
distribuci
on de masa de la tierra y los efectos de la aceleraci
on centrpeta. En general se denota la suma de los
dos efectos como el campo de gravedad, para distinguirlo del campo gravitacional.
????????????????????????????????
????????????????????????????????

12.11. Velocidad angular en t


erminos de los
angulos de Euler
Para prop ositos futuros, es conveniente expresar el vector velocidad angular en terminos de los angulos
de Euler y sus derivadas temporales. La rotaci on infinitesimal asociada a se puede construr como tres
rotaciones infinitesimales sucesivas cada una asociada a velocidades angulares = , = ,
= . Dadas
las propiedades vectoriales de las rotaciones infinitesimales, el vector se puede obtener como una suma de
cada uno de los tres vectores asociados a las rotaciones sucesivas. Sin embargo, las direcciones , y no
estan dispuestas en forma simetrica. esta dispuesta a lo largo del eje X3 del sistema sin rotar S0 , est
aa
(a) (b)
lo largo del eje X1 (lnea de nodos), y est a a lo largo del eje X3 . Por esta razon, es mas viable recurrir a
las matrices B, C, D definidas en las Ecs. (12.15, 12.16, 12.17) para obtener las componentes de estos vectores
a lo largo de cualquier conjunto de ejes coordenados.
El sistema mas conveniente para discutir las ecuaciones de movimiento en un cuerpo rgido es el sistema
S fijo al cuerpo. Es importante enfatizar que es la velocidad angular medida por S0 pero se escribir a en la

12.11. VELOCIDAD ANGULAR EN TERMINOS
DE LOS ANGULOS DE EULER 295

base de vectores unitarios de S es decir


= i ui = i ui
de hecho la velocidad angular medida por S es cero. No podemos entonces confundir un vector medido por
S , con un vector medido por S0 pero escrito en la base de S .
Obtendremos entonces las componentes de con respecto a los ejes de S , aunque omitiremos la notaci on
primada para las componentes. Comencemos entonces con el vector . Dado que es paralelo al eje X3 del
sistema S0 , podemos escribirlo f acilmente en la base de los ejes X1 X2 X3 en la forma (0, 0, )T . Para obtener
sus componentes a lo largo de los ejes del cuerpo X1 X2 X3 debemos en consecuencia transformar el vector de la
base X1 X2 X3 a la base X1 X2 X3 para lo cual hay que aplicar la transformaci on ortogonal completa A = BCD,
Ecs. (12.18, 12.19)

cos cos cos sin sin cos sin + cos cos sin sin sin 0
( )S = sin cos cos sin cos sin sin + cos cos cos cos sin 0
sin sin sin cos cos

resultando
( )X = sin sin ; ( )X = sin cos ; ( )X = cos
1 2 3

otese que tiene la proyecci


n on sin en el plano X1 X2 y es perpendicular a la lnea de nodos.
Ahora debemos escribir las componentes de con respecto a los ejes X1 X2 X3 . Dado que va a lo largo
(a) (b)
de la lnea de nodos, la cual est
a definida por el eje X1 = X1 , vemos que el vector se puede escribir en
(b) (b) (b)
el sistema coordenado X1 X2 X3 en la forma ( , 0, 0)T . Para escribir sus componentes con respecto a los
(b) (b) (b)
ejes de S requerimos en consecuencia pasar del sistema X1 X2 X3 al sistema X1 X2 X3 lo cual se obtiene
aplicando u nicamente la transformaci on ortogonal final B definida en (12.17)

cos sin 0
( )S = sin cos 0 0
0 0 1 0

con lo que se obtiene


( )X = cos ; ( )X = sin ; ( )X = 0
1 2 3

(b)
no es necesaria ninguna transformaci on para obtener  , el cual
 yace a lo largo de X3 = X3 ( = ) de
modo que en la base X1 X2 X3 ya se escribe en la forma 0, 0, . Sumando las componentes de cada velocidad
angular, se obtienen las componentes de con respecto a los ejes fijos al cuerpo i.e. de S :

X1 = sin sin + cos


X2 = sin cos sin
X3 = cos + (12.81)

con un procedimiento similar se puede encontrar las componentes de a lo largo de los ejes de S0 en terminos
de los
angulos de Euler.
296 CAPITULO 12. CINEMATICA
DEL CUERPO RIGIDO

Figura 12.5: Dos rotaciones finitas sucesivas realizadas en diferente orden: Este ejemplo ilustra la no conmu-
tatividad de las operaciones finitas de rotaci
on.

12.11. VELOCIDAD ANGULAR EN TERMINOS
DE LOS ANGULOS DE EULER 297

Figura 12.6: Ilustraci


on de una rotaci
on infinitesimal. Se usa regla de la mano izquierda para la determinaci
on
del vector unitario n que determina al eje de rotacion.

Figura 12.7: Ilustracion de la aceleraci


on centrfuga. Para una posicion dada de la partcula, la aceleraci
on
centrfuga va en la direcci
on perpendicular al eje y alej
andose de el.
Captulo 13

Ecuaciones de movimiento del cuerpo


rgido

En el captulo anterior, hemos desarrollado las herramientas matem aticas para el estudio sistematico de
la cinematica del cuerpo rgido. Los
angulos de Euler proveen un conjunto conveniente (aunque asimetrico)
de 3 coordenadas generalizadas independientes para determinar la orientaci on relativa de un cuerpo rgido.
En particular, el metodo de transformaciones ortogonales propias provee una elegante tecnica para generar
las orientaciones relativas. Finalmente, las transformaciones ortogonales infinitesimales proveen un marco para
generar rotaciones finitas por transformaciones sucesivas infinitesimales (tal como ya se vi o en el captulo de
transformaciones can onicas). En este captulo se pondr
a en acci
on el formalismo ya descrito para encontrar
las ecuaciones din amicas de movimiento de Euler para el cuerpo rgido en una forma conveniente. Veremos
tambien las soluciones para algunas configuraciones simples pero muy importantes.

13.1. Momento angular y energa cin


etica de movimiento alrededor de un
punto
El teorema de Chasles establece que el movimiento general de un cuerpo rgido consta de una traslaci on mas
una rotacion. Esto permite separar el movimiento en una fase traslacional y una rotacional. En particular si el
cuerpo rgido posee un punto fijo, es claro que alrededor de dicho punto solo tenemos rotaci on y la componente
traslacional estara ausente. Incluso cuando no hay un punto fijo, los seis grados de libertad para determinar la
configuracion del cuerpo rgido se pueden separar en tres grados de libertad que determinan la posici on de un
punto de referencia y otros tres grados de libertad (e.g. los angulos de Euler) que determinan la orientaci on
del cuerpo rgido. Si adicionalmente tomamos como punto de referencia el centro de masa del cuerpo rgido,
entonces una divisi on similar ocurre para el momento angular seg un se ve en la Ec. (1.24), en donde se observa
que el momento angular visto por el laboratorio (sistema S) se escribe como la suma del momento angular con
respecto al centro de masa (sistema S0 con origen en el centro de masa) mas el momento angular debido a la
traslaci
on del centro de masa. El primer termino involucra solo variables angulares, en tanto que el segundo
incluye solo a las coordenadas cartesianas del centro de masa. Adicionalmente, la Ec. (1.31) nos muestra que
se puede hacer una divisi on analoga para la energa cinetica del cuerpo rgido, en una notaci on adecuada para
nuestras variables independientes escribimos
1 2
T = M vCM + TCM (, , )
2
para el potencial ocurre con frecuencia que una divisi
on similar es tambien posible, si bien no hay un teorema
que lo garantice. El potencial puede usualmente escribirse en dos terminos donde cada uno de ellos involucra
solo uno de los conjuntos coordenados traslacional o rotacional. Como ejemplos sencillos se puede ver que la
energa potencial en un campo gravitacional uniforme depender a solo de la coordenada vertical del centro de
gravedad (que para campo uniforme coincide con el centro de masa). Por otro lado, si la fuerza sobre un cuerpo

298
13.1. MOMENTO ANGULAR Y ENERGIA CINETICA
DE MOVIMIENTO ALREDEDOR DE UN PUNTO299

es debida a un campo magnetico uniforme B, actuando sobre su momento dipolar magnetico M el potencial
sera proporcional a M B que involucra solo la orientaci on del cuerpo. En realidad casi todos los problemas
solubles en la practica permiten este tipo de divisi
on de modo que el Lagrangiano, L = T V se podr a dividir
en dos partes una que involucra solo coordenadas traslacionales y otra que solo involucra variables rotacionales
(coordenadas angulares). Los dos grupos de coordenadas se separar an completamente y por tanto el problema
traslacional y el rotacional se resolveran tambien por separado.
Es por tanto de gran importancia encontrar expresiones para el momento angular y la energa cinetica
de movimiento con respecto a alg un punto fijo en el cuerpo. Para ello emplearemos la relaci on (12.69) que
liga a las derivadas temporales entre sistemas rotantes y no rotantes. No obstante, es necesario demostrar
previamente la siguiente aseveraci on: el
angulo de rotaci on asociado al desplazamiento de un cuerpo
rgido, as como el vector velocidad angular de rotaci on, son independientes de la escogencia de
origen del sistema coordenado fijo al cuerpo.
Para probarlo tomemos a partir del origen de S dos vectores R1 , R2 asociados a dos posibles orgenes de
sistemas de ejes fijos al cuerpo S1 y S2 respectivamente. Sea R el vector relativo que va desde el origen de S1
hasta el origen de S2 . Claramente resulta que

R2 = R1 + R

si el origen de S2 se considera como un medida relativa a S1 , entonces la derivada temporal de R2 relativa a


S se escribe      
dR2 dR1 dR
= + (13.1)
dt S dt S dt S
calculemos el segundo miembro de la derecha usando (12.69)
   
dR dR
= + 1 R
dt S dt r1

donde 1 es el vector velocidad angular apropiado para el sistema S1 . Teniendo en cuenta adem
as que las
derivadas de R relativas a todo sistema de ejes fijos al cuerpo deben ser nulas se obtiene:
 
dR
= 1 R
dt S

con lo cual la Ec. (13.1) queda    


dR2 dR1
= + 1 R (13.2)
dt S dt S
por otro lado, podemos tambien considerar el origen de S1 como una medida relativa a S2 . El origen del primer
sistema coordenado se considera fijo en el segundo sistema con vector posici
on R. En este caso la derivada
del vector posicion R1 con respecto a los ejes de S se escribe
       
dR1 dR2 dR dR2
= = 2 R
dt S dt S dt S dt S
   
dR2 dR1
= + 2 R (13.3)
dt S dt S

restando las Ecs. (13.2, 13.3) se obtiene la relaci


on

(1 2 ) R = 0

es decir cualquier diferencia en los vectores velocidad angular en dos puntos arbitrarios debe ser paralela a la
lnea que une los dos puntos. Asumiendo que es un campo vectorial contnuo, la unica soluci
on posible para
todos los pares de puntos es que los dos vectores velocidad angular sean iguales

1 = 2
300 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

de modo que el vector velocidad angular es el mismo para todo sistema coordenado fijo al cuerpo rgido. Esto
se puede vislumbrar intuitivamente teniendo en cuenta que las partculas del cuerpo rgido se mueven y rotan
como un todo.
Ahora bien, dado un sistema S0 no rotante1 con origen en cierto punto O, el momento angular del cuerpo
rgido alrededor de este origen ser
a
L = mi (ri vi ) (13.4)
siendo ri , vi el radio vector y la velocidad respectivamente de la iesima partcula relativa al origen escogido.
Es conveniente colocar el origen de S0 en un punto por donde pase el eje de rotaci on. Cuando hay un punto
fijo del cuerpo rgido respecto a un sistema inercial, este punto es un buen origen ya que el eje de rotaci on
pasa por el (teorema de Euler), y el sistema S0 ser a inercial. Si no hay punto fijo un origen conveniente ser a el
centro de masa, ya que en este caso el movimiento se podr a separar en una traslacion pura del centro de masa
y una rotaci on pura alrededor de un eje que pasa por el centro de masa.
Como el problema de la traslaci on pura es muy simple, nos concentraremos en la rotaci on pura. Supon-
dremos por simplicidad que existe un punto fijo con respecto a un sistema inercial de modo que S0 coincide
con nuestro sistema inercial S. Su origen estar a en el punto fijo y el eje de rotaci on pasa por este punto
(de lo contrario el punto no podra ser fijo). Es claro que cada partcula i del cuerpo rgido realizar a un
movimiento circular con la misma frecuencia angular alrededor del eje de rotaci on2 , donde el radio del
a ri sin i siendo ri la posici
crculo ser on de la partcula y i el
angulo entre el eje de rotacion y ri . La rapidez
instantanea de la partcula est a dada por

vi = Ri = ri sin i

y su desplazamiento es tangente al crculo de modo que en direccci


on y magnitud tenemos que

vi = ri (13.5)

como corresponde a todo movimiento circular. Es importante enfatizar que para que esta expresi on y otras
que vienen de aqu en adelante sean v alidas, ri debe medirse con respecto a un origen tal que el eje de rotaci
on
pase por el3 . Otra forma de ver esta relaci
on es usando la Ec. (12.69) aplicada al vector ri en donde el sistema
rotante S se define como un sistema con ejes fijos al cuerpo
   
dri dri
= + ri
dt S dt S

el primer termino a la derecha es nulo porque en S la partcula debe estar en reposo, ya que el sistema es fijo
al cuerpo. Por tanto se reproduce la Ec. (13.5). Usando (13.5) en la Ec. (13.4) se obtiene

L = mi [ri ( ri )]

expandiendo el triple producto cruz resulta


 
L = mi ri2 ri (ri ) (13.6)

explcitamente se escribe n h io
Ln = mi n ri2 (ri )n (ri )j j
1
Con esto queremos decir que existe un sistema inercial S con ejes paralelos a los de S0 todo el tiempo. Es decir entre S y S0
solo hay traslacion pura.
2
El eje de rotaci
on puede variar de direcci
on, pero para nuestros fines, es posible tomar el eje de rotaci
on instant
aneo definido
en un tiempo t. En consecuencia, el movimiento circular tendr a un plano fijo solo en un intervalo de tiempo infinitesimal, pero
esto no limita nuestra demostracion.
3
Hay un aspecto delicado en el sentido de que n como vector no define completamente al eje de rotaci on, ya que los vectores
no tienen su origen localizado, puesto que una traslaci on paralela los deja identicos. En contraste, el eje de rotacion est
a bien
localizado en el espacio y no se puede trasladar paralelamente sin alterar el problema fsico.
13.1. MOMENTO ANGULAR Y ENERGIA CINETICA
DE MOVIMIENTO ALREDEDOR DE UN PUNTO301

donde los ndices j, n denotan componentes en tanto que el ndice i rotula a una partcula, hay suma sobre los
ndices i, j. Expandiendo la componente x del momento angular resulta
n h io n h io
Lx = mi x ri2 (ri )x (ri )j j = mi x ri2 xi (ri )x x + (ri )y y + (ri )z z

Lx = mi x ri2 xi [xi x + yi y + zi z ]

Lx = mi ri2 x2i x mi xi yi y mi xi zi z

y ecuaciones similares para las otras componentes de L. Vemos que L est a relacionado con a traves de una
transformaci
on lineal. Parametrizaremos las trasformaciones lineales de las componentes de L en la forma

Lx = Ixx x + Ixy y + Ixz z


Ly = Iyx x + Iyy y + Iyz z
Lz = Izx x + Izy y + Izz z (13.7)

Comparando las expresiones de Lx se tiene



Ixx = mi ri2 x2i ; Ixy = mi xi yi ; Ixz = mi xi zi (13.8)

donde a los elementos diagonales se les conoce como coeficientes de momento de inercia, en tanto que
los elementos no diagonales se denominan productos de inercia. Las Ecs. (13.8) son adecuadas si el sistema
de partculas es discreto. Para cuerpos rgidos contnuos la suma sobre i debe reemplazarse por una integral
volumetrica, la masa se convierte en diferencial de modo que los elementos de matriz se escriben como
Z Z
2 2
 
Ixx = r x dm = (r) r 2 x2 dV
Z V

Ixy = (r) xy dV (13.9)


V

podemos condensar la notaci on para los elementos diagonales y no diagonales si denotamos los ejes por Xi con
i = 1, 2, 3 y el elemento de matriz Ijk se escribir
a como
Z

Ijk = (r) r 2 jk xj xk dV (13.10)
V

De la Ec. (13.7) podemos escribir la ecuaci


on que relaciona al momento angular total con la velocidad angular
de rotaci
on en la forma
Li = Iij j LS = IS S (13.11)
donde los elementos matriciales Iij est
an dados por (13.10). El subndice S enfatiza que esta ecuacion y todos
los observables se miden en el sistema inercial S y con la base de vectores unitarios definida por S. En la
practica sin embargo, resulta poco u til esta relaci
on ya que los elementos de la matriz IS dependen de la
dinamica del cuerpo y solo se podra calcular cuando este resuelto el problema. Por tanto reescribiremos a los
vectores L y y al operador I en una base de vectores unitarios de un sistema S de ejes fijos al cuerpo. Para
ello usamos la matriz pasiva de cambio de base B que nos lleva de la base en S a la base en S , esta matriz es
ortogonal real propia ya que pasa una base ortonormal a otra base ortonormal, multiplicando por B a ambos
lados de (13.11)

BLS = BIS B1 B S (BLS ) = BIS B1 (B S )
LS = I S S (13.12)

recordando que estas transformaciones son de tipo pasivo tenemos que LS , S representa a los mismos
vectores que LS , S . As mismo, IS representa al mismo operador que IS . Simplemente, se est
an escribiendo
en bases diferentes. Por ejemplo LS NO representa el momento angular medido por el sistema S (el cual
302 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

obviamente es cero), lo que representa es al vector momento angular que mide el sistema S pero escrito en la
base de vectores unitarios ui fija al sistema S .
Que se logra con esta transformaci on pasiva? basta notar el hecho de que si la matriz que representa
al operador I en la nueva base conserva su forma, es decir si IS viene dada por las Ecs. (13.10) con el
simple reemplazo xk xk esta matriz ser a independiente del tiempo, ya que las coordenadas xi , yi , zi son
constantes en el tiempo para cada partcula iesima cuando S est a fijo al cuerpo. En consecuencia IS solo
depender a de factores geometricos. Los elementos de matriz ser an constantes en el tiempo caractersticas del
cuerpo involucrado y dependientes del origen y orientaci on del sistema coordenado particular fijo al cuerpo.
Sin embargo, para poder afirmar que IS es constante en el tiempo, es necesario demostrar que efectivamente
la representacion matricial de I conserva su forma ante una transformaci on ortogonal propia (cambio de base),
esto se ve simplemente del hecho de que I es un tensor euclidiano de segundo rango, seg un se puede demostrar
a traves de la regla del cociente expresada en la Ec. (11.139). Para ello notamos que se cumplen todas las
condiciones exigidas para la validez de esta regla del cociente: la ecuaci
on (13.11) es v
alida en cualquier sistema
cartesiano rotado seg un se puede ver en el procedimiento que nos llev o a la Ec. (13.12) pues aunque elegimos
el sistema primado como un sistema de ejes del cuerpo, esta condici on no es necesaria para llegar a (13.12), el
vector es arbitrario pues en principio un cuerpo rgido se puede poner a rotar en cualquier direcci on y con
cualquier velocidad angular y finalmente las cantidades L y son tensores bien definidos (vectores axiales).
En consecuencia, la regla del cociente nos lleva a que I es un tensor euclidiano de segundo rango (y no un
pseudotensor).
Con base en la discusi on anterior, entenderemos que de ahora en adelante, la ecuaci on
L = I (13.13)
se escribir
a en componentes usando la base de vectores unitarios definida por alg un sistema coordenado fijo
al cuerpo rgido S 4 . Pero no debemos perder de vista que los observables involucrados en esta ecuaci on son
los medidos con respecto al sistema de referencia S. El operador I est a representado por una matriz 3x3 cuyos
elementos son los coeficientes de momento de inercia y los productos de inercia. L y son vectores columna. Es
claro que el operador I act ua desde un punto de vista activo sobre . Esto se puede ver de varias maneras: los
vectores L y son vectores fsicamente diferentes que incluso tienen diferentes dimensiones, y no simplemente
el mismo vector expresado en sistemas coordenados distintos. A diferencia del operador de rotaci on que es
adimensional, el operador I tiene dimensiones de masa por longitud al cuadrado, y no est a restringido por
ninguna condici on de ortogonalidad.

13.2. Tensor de inercia y momento de inercia


Considerado como un operador lineal que transforma a en L, la matriz I posee las propiedades de
transformacion de un tensor de segundo rango. Por esta raz on se conoce como tensor de inercia. A partir
de la Ec. (13.8) se puede ver claramente que este tensor se puede escribir en forma de afinor de la forma

I = mi ri2 1 ri ri (13.14)
de lo cual resulta  
I = mi ri2 ri (ri ) = L
que coincide con la Ec. (13.6) y nos muestra la ventaja de usar el algoritmo algebraico de afinores. La energa
cinetica del cuerpo rgido se escribe como
1
T = mi vi2
2
donde vi es la velocidad de la partcula iesima relativa al punto fijo en el sistema S0 . A partir de la Ec.
(13.5), esta energa cinetica se puede escribir de la forma
1
T = mi vi ( ri )
2
4
Naturalmente esta base de vectores unitarios es diferente en cada instante de tiempo, pero esto no compromete la validez de
la Ec. (13.13), la cual se eval
ua en cada instante de tiempo.
13.2. TENSOR DE INERCIA Y MOMENTO DE INERCIA 303

utilizando identidades vectoriales esto se escribe como



T = mi (ri vi )
2
la cantidad sumada sobre i se reconoce como el momento angular total del cuerpo alrededor del origen de S0
y en consecuencia la energa cinetica se puede escribir en la forma
L I
T = = (13.15)
2 2
definamos ahora
n (13.16)
siendo n la direcci
on del eje de rotaci
on, reescribimos la expresi
on como
2 1
T = n I n = I 2 ; I nIn (13.17)
2 2
usando (13.14) y la definici
on de I en (13.17) vemos que esta cantidad est a dada por
h i
I n I n = mi ri2 (ri n)2 (13.18)

este factor I es un escalar y se conoce como el momento de inercia con respecto al eje de rotaci
on definido
por n y que pasa por el origen de S0 . Podemos escribir esta cantidad de la forma:
 
I n I n = mi ri2 ri2 cos2 i = mi ri2 sin2 i

La figura 13.1 muestra que la distancia entre el eje de rotaci on y la partcula iesima est
a dada por
Ri = ri sin i . Por lo tanto, el momento de inercia se puede escribir como

I = mi Ri2 (13.19)

siendo Ri la distancia entre la partcula iesima y el eje de rotaci on. De esta expresion es claro que el valor del
momento de inercia depende de la direcci on y localizaci on5 . Dado que cambia en general
on del eje de rotaci
su direccion con respecto al cuerpo a medida que el tiempo transcurre, el momento de inercia ser a tambien en
general funci 6
on del tiempo . No obstante, si el cuerpo est a restringido a rotar sobre un eje fijo, el momento de
inercia sera una constante. En tal caso, la energa cinetica (13.15) est
a casi en la forma requerida para construir
ecuaciones de movimiento de Lagrange o Hamilton, solo se requiere escribir como la derivada temporal de
algun angulo lo cual est
a sugerido en la Ec. (12.58), y no presenta mayor dificultad.
Tanto el tensor de inercia como el momento de inercia dependen del origen elegido para los ejes fijos al
cuerpo. Si tenemos en cuenta que adem as el momento de inercia depende del eje de rotaci on, vemos que esta
cantidad debe recalcularse cada vez que cambiamos de ejes. Sin embargo, existe un teorema que relaciona a
los momentos de inercia entre dos ejes paralelos cuando uno de ellos para por el centro de masa del cuerpo
rgido.

Theorem 9 Teorema de Steiner: si tenemos dos ejes paralelos y uno de ellos pasa por el centro de masa del
cuerpo rgido, los momentos de inercia vistos por ambos ejes est
an relacionados por

I = IC + M a2

siendo M la masa total del cuerpo y siendoa la distancia entre los ejes.

5
Es decir para calcular el momento de inercia debemos ubicar la direcci on del eje y un punto por donde pasa. Por otro lado,
recordemos que el origen se debe tomar de tal forma que pase por el eje de rotaci on, en ese sentido se dice que el momento de
inercia (y el tensor de inercia) depende de la orientaci
on del eje y del origen.
6
De la expresi
on (13.18) vemos que I depende del tiempo solo a traves de n, puesto que el tensor I es independiente del tiempo,
al menos si usamos una base fija al cuerpo.
304 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

Figura 13.1: Ilustraci


on del momento de inercia con respecto al eje definido por n y que pasa por el punto O
que se elige como origen. La partcula iesima del cuerpo rgido est
a a una distancia Ri de dicho eje.

Definamos un eje XO que pasa por un cierto origen O, y sea XC un eje que pasa por el centro de masa
del cuerpo y que es paralelo a XO . Denotemos por RC a la posicion del centro de masa (CM) con respecto al
origen O. Recurriendo a la definici
on del momento de inercia (13.19) y a las Figs. 13.1 y 13.2, escribiremos el
momento de inercia con respecto a XO

IO = mi Ri2 = mi (ri n)2 (13.20)

donde la posici
on de la partcula iesima con respecto al origen O se define por ri , y su posici
on con respecto
13.2. TENSOR DE INERCIA Y MOMENTO DE INERCIA 305

Figura 13.2: Ilustraci


on del teorema de los ejes paralelos o teorema de Steiner para el momento de inercia.

al CM se denota por ri , la Fig. 13.2 muestra que

ri = RC + ri (13.21)

es claro adem as de la Fig. 13.2, que la distancia entre la partcula iesima y el eje XC viene dada por
2 2 2
RiC = ri sin i . Reemplazando (13.21) en (13.20), el momento de inercia se escribe (escribiremos la suma
explcita)
X   2 X h 2  i
IO = mi ri + RC n = mi ri n + (RC n)2 + 2 ri n (RC n)
i i
Xh  i
IO = mi ri2 sin2 i + mi (RC n)2 + 2 mi ri n (RC n)
i
! " ! #
X X 2 1 X
2
IO = mi RiC + mi (RC n) + 2M mi ri n (RC n)
M
i i i
P
el termino i mi ri /M
se refiere a la posicion del centro de masa vista por el propio centro de masa de modo
que se anula. Por otro lado, el primer termino a la derecha es claramente el momento de inercia visto por el
eje XC . 
IO = IC + M (RC n)2 = IC + M RC 2
sin2
y nuevamente la Fig. 13.2 muestra que RC sin es la distancia entre los dos ejes, de modo que (omitiendo el
subndice O)
I = IC + M a2 (13.22)
lo cual demuestra el teorema de Steiner. El segundo termino de la derecha equivale al momento de inercia que
tendra el cuerpo rgido con respecto al eje X0 si toda la masa del cuerpo estuviera condensada en un punto
306 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

que esta a una distancia a de tal eje (en particular, un punto que pasa por el eje XC ). Podemos ver como
corolario que dada una orientacion especfica, de todos los ejes con esta orientaci
on el que pasa por el centro
de masa es el que da el mnimo valor posible del momento de inercia.
Para el tensor de inercia existe una propiedad an aloga. Reemplacemos (13.21) en (13.14) y escribamos la
suma de forma explcita
X h 2  i
I = mi RC + ri 1 RC + ri RC + ri
i
X     
2
I = mi RC 1 + ri2 1 + 2 RC ri 1 RC RC + RC ri + ri RC + ri ri
i

el tensor de inercia medido en el origen O se puede escribir en forma de afinor de la siguiente forma
( )
X  2  
2
I = M RC 1 + mi ri + 2RC ri 1 ri ri + RC ri + ri RC M RC RC
i
( )
X   2
I = mi r2
i 1 ri ri + 2RC ri 1 RC ri ri RC + M RC 1 M RC RC
i
( ) ! ( )
X   X X X
2
I = mi r2
i 1 ri ri + 2RC mi ri 1 RC mi ri mi ri RC + M RC 1 M RC RC
i i i i

todas las sumas de la forma mi ri se anulan ya que est an asociadas a la posici


on del CM vista por el propio
CM. La expresi
on se reduce a
" #
X  
2
I = mi ri2 1 ri ri + M RC 1 RC RC (13.23)
i
2

I = IC + M RC 1 RC RC (13.24)

de la Ec. (13.14) vemos que el segundo termino a la derecha de (13.24) correspondera al tensor de inercia con
respecto a O asociado a una partcula puntual de masa M situada en el centro de masa. En tal sentido, tanto
el momento de inercia como el tensor de inercia admiten una descomposici on relativa al CM muy semejante a
la que existe para la energa cinetica, el torque y el momento angular.
Finalmente, para distribuciones de masa bidimensionales, es f acil relacionar el momento de inercia de un
sistema de tres ejes perpendiculares con origen com un, si colocamos el solido rgido plano sobre el plano XY
es claro que sus momentos de inercia con respecto a cada eje vendr an dados por

Ix = mi yi2 ; Iy = mi x2i ; Iz = mi x2i + yi2

de modo que se obtiene la identidad


Ix + Iy = Iz
que se conoce como teorema de los ejes perpendiculares, v
alido solo para s
olidos bidimensionales contnuos
o discretos.

13.3. Compendio de propiedades del tensor de inercia


A partir de (13.10) se observan algunas propiedades inmediatas

1. La representacion matricial del tensor de inercia depende de la base de vectores cartesianos elegida pero
tambien del origen de coordenadas elegido, ya que depende del vector posici on y de sus coordenadas.
13.3. COMPENDIO DE PROPIEDADES DEL TENSOR DE INERCIA 307

2. Iij = Iji el tensor de inercia es simetrico y real, lo cual corresponde a una matriz hermtica real.
Recordemos que la propiedad de simetra es invariante ante un cambio de base ortogonal. Por tanto,
esta propiedad es v alida en cualquier sistema ortogonal de ejes7 . La simetra a su vez, implica que el
tensor tiene seis grados de libertad.

3. Iii 0, en cualquier base de modo que los elementos diagonales son no negativos. La ecuaci
on (13.8) nos
muestra que Ixx se puede escribir como

Ixx = mi yi2 + zi2

que solo es cero si todos los yi y zi son nulos. Esto indicara que la masa del cuerpo rgido est
a toda
distribuda sobre el eje X como ocurre por ejemplo con un filamento que va a lo largo de dicho eje.

Por otro lado, como la representacion matricial de este tensor es simetrica y real es por tanto hermtica,
a partir de la discusi
on de matrices hermticas dada en la secci
on 11.9 se deduce que sus valores propios son
reales. Mas a
un dado que sus elementos diagonales son no negativos en cualquier base, lo ser an en particular
en la base que diagonaliza tal tensor. Es inmediato ver que una matriz diagonal cuyos elementos diagonales
son no negativos corresponden a una matriz positiva (ver seccion 11.11) el lector puede adem as comprobar que
la positividad de una matriz se preserva ante una transformaci on de similaridad ortogonal real propia. Si los
elementos de la diagonal son estrictamente positivos la matriz sera definida positiva, y esto es lo que ocurre en
la mayora de los casos para el tensor de inercia, pues hemos visto que estos elementos solo pueden ser nulos
para distribuciones unidimensionales de masa.
Otra forma de ver la positividad del tensor de inercia es a traves de la definici
on del momento de inercia
(13.17) combinada con la Ec. (13.19) para el momento de inercia con lo cual

n I n I = mi Ri2 0 (13.25)

siendo n un vector unitario arbitrario y Ri la distancia de la masa mi al eje de rotaci on. Puesto que I es
positivo y n es arbitrario la Ec. (13.25) corresponde a la definici
on de una matriz positiva. De hecho la matriz
es definida positiva excepto para distribuciones unidimensionales para las cuales el momento de inercia con
respecto a un eje que pasa por la distribucion de masa es nulo.
Puesto que el tensor de inercia es positivo, su ecuaci
on de valores propios corresponde a un caso particular
de la Ec. (11.91) con T = 1, con lo cual podemos aplicar los resultados de la secci on 11.11. Resultan entonces
las siguientes propiedades

1. El tensor de inercia es simetrico real y positivo. En realidad, salvo para ciertas singularidades unidimen-
sionales, ser
a definido positivo.

2. Sus valores propios son reales no negativos. En la mayora de los casos ser
an estrictamente positivos.

3. Siempre es posible para un origen dado hacer una rotaci on a ejes principales donde este tensor sea
diagonal, incluso en presencia de degeneraci
on de los valores propios.

4. Cuando hay degeneraci on simple (1 = 2 6= 3 ), y encontramos vectores propios V1 , V2 linealmente


independientes asociados al valor propio degenerado, cualquier conjunto de ejes en el plano generado por
ellos son ejes principales. Esto es un indicativo de simetra axial, como ocurre con los s
olidos de revoluci
on
8
cuando uno de los ejes principales es el eje de simetra . Adem as un vector ortogonal a V1 y V2 tambien
ser
a vector propio y por tanto tambien define un eje principal (ver secci on 11.9.1). Similarmente, si V1
es vector propio asociado a 1 = 2 y V3 es vector propio asociado a 3 entonces V2 = V1 V3 tambien
es vector propio asociado a 1 = 2 (secci on 11.9.1).
7
En tensores, es de suma importancia saber si cierta propiedad es independiente de la base, o es v alida s
olo en una base
particular.
8
Si el origen que elegimos no pasa por el eje de simetra, el eje de simetra no ser
a en general eje principal con respecto a dicho
origen.
308 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

5. La degeneracion completa indica simetra esferica como es el caso de esferas, cascarones y anillos esfericos
etc. (con densidad uniforme).

6. La rotacion que nos lleva a ejes principales tiene una interesante analoga con la rotaci
on que lleva a la
ecuacion de un elipsoide a su modo normal (ver secci on 11.9.2). En tal caso hablamos del elipsoide de
inercia. Los momentos principales de inercia determinan las longitudes de los ejes del elipsoide de inercia.

7. Recordemos que la degeneracion simple tiene como an


alogo geometrico a un elipsoide de revoluci
on y la
degeneraci
on total corresponde a una esfera.

Vimos adem
as otras propiedades como son:

1. La cantidad I es un tensor cartesiano de segundo rango, lo cual justifica el termino tensor de inercia. Esto
ademas implica que esta cantidad conserva su forma (definida por 13.10) en cualquier base cartesiana.
En notaci
on diadica, I se escribe en la forma de la Ec. (13.14)

I = mi ri2 1 ri ri (13.26)

2. Tanto el momento de inercia como el tensor de inercia poseen un teorema de ejes paralelos, estos teoremas
se escriben:

I = IC + M a2 (13.27)
2

I = IC + M RC 1 RC RC (13.28)

La Ec. (13.27) nos dice que si tenemos dos ejes paralelos uno de los cuales pasa por el centro de masa
del cuerpo, siendo a la distancia entre los ejes y M la masa del cuerpo rgido, el momento de inercia en
los dos ejes est
a relacionado por dicha ecuacion. La Ec. (13.28) nos dice que si tenemos dos sistemas de
ejes S X1 X2 X3 y SC X1C X2C X3C paralelos entre s donde el origen de SC yace sobre el centro de
masa del cuerpo, los tensores de inercia medidos por ambos sistemas coordenados est an relacionados por
esta ecuacion, siendo RC el vector posici
on del origen de SC medido con respecto al origen de S.

3. A partir de la definici
on de momento de inercia (13.18), se ve que esta cantidad depende de la orientacion
y localizaci
on del eje con que se mide. El vector unitario n define la direccion, pero como I depende del
origen (el cual se debe elegir de modo que el eje pase por el), tenemos la direcci
on del eje y un punto por
donde pasa, lo cual define al eje unvocamente.

4. En el caso de cuerpos rgidos planos, tenemos un teorema de ejes perpendiculares: si la distribuci


on de
masa del cuerpo yace sobre el plano XY entonces los momentos de inercia con respecto a estos ejes est
an
relacionados por
Ix + Iy = Iz

Ahora bien, dado que el tensor de inercia es simetrico y real lo cual garantiza la existencia de ejes prin-
cipaples en los cuales su representaci
on matricial es diagonal, veremos que aspecto adquieren las ecuaciones
antes vistas cuando se expresan en esta base de ejes principales. Cuando calculamos el tensor sobre los ejes
principales obtendremos una diada de la forma

I = Ikk uk uk Ik uk uk ; k = 1, 2, 3

con un origen dado, la relaci


on entre el momento angular y la frecuencia angular Ec. (13.13) se simplifica en
la forma
Lk = Ik k ; k = 1, 2, 3 (no hay suma) (13.29)
13.3. COMPENDIO DE PROPIEDADES DEL TENSOR DE INERCIA 309

de la misma manera la expresi


on para la energa cinetica ser
a
1 1
T = I = (m um ) (Ik uk uk ) (n un )
2 2
1 1
T = (m Ik n ) (um uk ) (uk un ) = (m Ik n ) mk kn
2 2
1
T = Ik k2 (13.30)
2
se observa ademas, que si el eje de rotaci
on coincide con alguno de los ejes principales digamos X3 entonces
k = k3 entonces la Ec. (13.29) nos da

Lk = Ik k3 = I3 k3

es decir que solo sobrevive la componente 3, de modo que cuando la rotaci on es alrededor de alguno de los ejes
principales, el momento angular es paralelo a la velocidad angular. Recordemos que la direcci on de los ejes
principales coincide con la direcci
on de los vectores propios (conociendo los vectores propios, solo hay que elegir
un origen para determinar los ejes, pero este origen debe pasar por el eje de rotaci on), por lo tanto el efecto
de I sobre cualquier vector paralelo a un eje principal nos da otro vector tambien paralelo al eje principal, sea
v un vector paralelo a uj

I v = (Ik uk uk ) (vuj ) = Ik vuk (uk uj ) = Ik vuk jk


I v = Ij vuj (no suma)

lo cual demuestra la anterior afirmaci


on. Este vector v tambien es naturalmente vector propio de I ya que la
on de un operador sobre uno de sus vectores propios es tambien un vector propio9 .
acci
Un concepto muy relacionado con el momento de inercia es el factor geometrico denominado radio de
giro definido por
I M R02 (13.31)
es decir dado un eje XO , el radio de giro es la distancia a este eje a la cual habra que colocar una masa puntual
con la masa de todo el solido, para que tuviese el mismo momento de inercia (con respecto a XO ) que el s olido
completo. Recordando la definici on original del momento de inercia Ec. (13.18)

I =nIn

y comparando con la Ec. (11.83) podemos retomar el an alisis hecho en la secci


on 11.9.2. La Ec. (11.84) en este
contexto nos queda
n n
=
I R0 M
El radio vector a un punto sobre el elipsoide de inercia es entonces inversamente proporcional a R0 con respecto
a la direcci
on del vector. Las ecuaciones analogas a (11.86) y a (11.88) nos dan

I11 21 + I22 22 + I33 23 + 2I12 1 2 + 2I13 1 3 + 2I23 2 3 = 1


I1 2 2 2
1 + I2 2 + I3 3 = 1

siendo la u
ltima la ecuacion escrita en la base que diagonaliza al tensor de inercia, en la cual el elipsoide de
inercia adquiere su forma normal, lo cual geometricamente significa que los ejes de la base (ejes principales)
van a lo largo de los ejes del elipsoide. Ii son los valores propios del tensor de inercia (en cualquier base), en
presencia de degeneraci on simple el elipsoide de inercia corresponder a a un elipsoide de revolucion, en tanto
que en el caso de degeneraci on completa el elipsoide se convierte en esfera.
El hecho de que el tensor de inercia y todas las cantidades asociadas a el tales como el ejes principales,
momentos principales, elipsoide de inercia etc., dependan del punto particular fijo en el cuerpo (origen elegido),
9
Existen en todo caso posibles diferencias relativas a las unidades.
310 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

tiene como consecuencia que si cambiamos de punto en el cuerpo todas estas cantidades en general se modifican.
La Ec. (13.28) nos indica la manera en que el tensor de inercia se modifica cuando pasamos del punto de
referencia centro de masa a otro punto. En particular, la transformaci on que diagonaliza a I cuando
 el punto
fijo es el centro de masa no diagonalizar a en general al termino diferencia M RC 21R R de modo que
C C
en general no definira ejes principales en el nuevo punto. El tensor diferencia solo ser a tambien diagonal en
el caso en el cual RC vaya a lo largo de uno de los ejes principales relativos al centro de masa. En tal caso,
el nuevo tensor de inercia I posee los mismos ejes principales que en el centro de masa, pero los momentos
principales de inercia cambian, excepto en lo que corresponde al desplazamiento de ejes, donde es claro que el
elemento diagonal del tensor diferencia ser a nulo. El teorema de los ejes paralelos para la forma diagonalizada
del tensor de inercia tiene entonces una forma algo especial y restringida.
El analogo geometrico del elipsoide de inercia resulta muy comodo para resolver al menos cualitativamente,
algunos aspectos de la din amica del cuerpo rgido, para esto resulta m as conveniente parametrizar al vector
usando las Ecs. (13.17) y (13.16)

= = p = (13.32)
I 2T / 2 2T
en el sistema coordenado de los ejes principales del cuerpo, definimos la funci
on

F () = I = 2i Ii (13.33)

donde las superficies con F constante son elipsoides y F = 1 define el elipsoide de inercia (cuyos semiejes nos
dan los momentos principales de inercia). A medida que el eje de rotaci on cambia en el tiempo, el vector
se mueve con el, y su extremo siempre esta en un punto de la superficie del elipsoide10 . El gradiente de F
evaluado en ese punto nos da la direcci
on de la normal al elipsoide en ese punto. De acuerdo con (13.33) tal
gradiente con respecto a viene dado por

( F )m = m ( I ) = m (k Ikj j ) = (m k ) Ikj j + k Ikj (m j )


( F )m = mk Ikj j + k Ikj mj = Imj j + k Ikm

usando la simetra del tensor de inercia

( F )m = Imj j + Imk k = 2Imk k

que en el lenguaje de diadas se escribe


2I
F = 2I =
2T
r
2
F = L (13.34)
T
con lo cual se observa que se movera de tal forma que la normal11 al elipsoide de inercia (en el punto donde
el extremo de toca al elipsoide) va en la direcci
on del momento angular.

13.4. Ecuaciones de Euler para el movimiento de un cuerpo rgido


Con las herramientas anteriores estamos en capacidad de plantear ecuaciones de movimiento para un cuerpo
rgido. Si existen ligaduras no hol
onomas tales efectos deben manejarse para cada problema particular. Quiz as
el caso m as simple de ligadura no hol
onoma que se emplea en la mec anica del cuerpo rgido, ocurre en el caso
de las ligaduras por rodadura, las cuales deben introducirse en la ecuaciones de movimiento por el metodo
de los multiplicadores indeterminados de Lagrange.
10
Si la energa cinetica no es constante, el vector no dictamina unvocamente la magnitud de , pero sigue emulando la din
amica
de su orientaci on.
11
Es claro que esta normal va hacia afuera del elipsoide en este punto, ya que el gradiente va en la direcci` on en la cual aumenta
F.
13.4. ECUACIONES DE EULER PARA EL MOVIMIENTO DE UN CUERPO RIGIDO 311

La estrategia general es buscar un punto de referencia que permita separar el movimiento en una parte
traslacional y otra rotacional. Cuando el cuerpo rgido posee un punto fijo respecto a un sistema inercial, este
punto sera una buena eleccion ya que solo tendremos que tratar con el movimiento rotacional alrededor de
tal punto. Cuando no hay puntos fijos, casi siempre el mejor punto de referencia ser a el centro de masa del
cuerpo, en virtud del teorema de Chasles y del hecho de que la energa cinetica y el momento angular se pueden
escribir como un termino relativo a la traslaci
on del centro de masa mas uno relativo a la rotacion alrededor
del centro de masa. La energa cinetica por ejemplo tendra la forma

1 1
T = M VC2 + IC 2
2 2
adem as ocurre que una separaci
on similar es posible para el potencial en muchos problemas de aplicacion. Esto
implica que las ecuaciones de movimiento se podr an separar en una parte traslacional y otra rotacional que se
resuelven por separado. Por las ecuaciones de movimiento de Newton, esto es posible utilizando las Ecs. (1.14)
para la traslaci
on del CM y las Ecs. (1.19) para la rotaci on alrededor del CM. Por otro lado, si el sistema es
holonomo y conservativo la formulaci
on de Lagrange o Hamilton puede ser apropiada. El Lagrangiano tendr a la
forma
L (q, q)
= LC (qC , qC ) + Lr (qr , qr )
siempre que el potencial admita una separaci on similar. El primer termino condensa los efectos de traslaci on
y tendra coordenadas y velocidades generalizadas del centro de masa. El segundo termino condensa los efectos
de rotacion alrededor del CM y depende de variables angulares, que definen la orientaci on del cuerpo en
cada instante. esta estructura permite de nuevo separar los problemas traslacional y rotacional. Bien sea
con el formalismo Newtoniano, Lagrangiano o Hamiltoniano, es muy ventajoso trabajar en el sistema de ejes
principales del punto de referencia, que como ya vimos simplifica mucho la expresi on para la energa cinetica
y el momento angular.
Para trabajar el movimiento rotacional casi siempre se usan los angulos de Euler como coordenadas gene-
ralizadas. Sin embargo, cuando el movimiento rotacional es bidimensional, podemos definir un solo par ametro
independiente de rotaci on y se simplifica el problema.
Bien sea que nuestro punto de referencia sea un punto fijo o el centro de masa, podemos obtener las
ecuaciones de movimiento de un cuerpo rgido empleando las Ecs. (1.14, 1.19) del formalismo Newtoniano.
Consideramos entonces un sistema inercial con origen en el punto fijo, o un sistema de ejes no rotante (con
respecto a un sistema inercial) con origen en el CM. En ambos casos es v alida la Ec. (1.19) como se puede
verificar con la Ec. (1.27), estos sistemas los llamaremos simplemente sistemas no rotantes S0 , de modo que se
puede escribir  
dL
=N (13.35)
dt S0
donde cambiamos la notaci on para el torque por N. Podemos relacionar esta raz
on de cambio con aquella que
mide un sistema fijo al cuerpo usando (12.69)
   
dL dL
= +L (13.36)
dt S0 dt S

combinando (13.35) con (13.36) se obtiene


 
dL
+L =N (13.37)
dt S

n
otese que esta ecuaci on es estrictamente de car
acter mixto en el sentido de que la razon de cambio de L es
medida por el sistema rotante fijo al cuerpo en tanto que los vectores N, L y estan medidos en el sistema no
rotante, sin embargo las coordenadas de estos vectores se escribiran en la base de vectores unitarios asociados
a S . A pesar de este car
acter mixto, esta ecuaci
on resulta ser la mas conveniente para extraer la dinamica
312 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

del cuerpo rgido. Borraremos ahora el subndice S sobreentendiendo que se usa la base de un sistema
on en componentes12
coordenado fijo al cuerpo y escribiremos esta ecuaci
dLk
+ kmn m Ln = Nk
dt
si tomamos ejes principales con respecto al punto de referencia, podemos emplear (13.29) para escribir

dk
Ik + kmn m n In = Nk (13.38)
dt
no hay suma sobre k pero s sobre los otros ndices. Hemos usado el hecho de que los momentos principales de
inercia son independientes del tiempo, lo cual a su vez esta ligado al hecho de escribir los vectores en la base
generada por S . Vale decir sin embargo, que aunque todos los observables en esta ecuaci on est
an escritos en
la base de ejes principales, como vector est a medido en el sistema S0 . En forma expandida estas ecuaciones
se escriben

I1 1 2 3 (I2 I3 ) = N1
I2 2 3 1 (I3 I1 ) = N2
I3 3 1 2 (I1 I2 ) = N3 (13.39)

Las Ecs. (13.38) o (13.39) se denominan ecuaciones de Euler de movimiento para un cuerpo rgido
con un punto fijo. Estas ecuaciones definen un sistema acoplado, sin embargo en presencia de degeneraci on
simple (e.g. I1 = I2 6= I3 simetra cilndrica) se observa un desacople parcial de la tercera ecuacion ya que las
componentes N1 y N2 del torque solo afectan a 1 y 2 , cuando la degeneraci on es total (simetra esferica)
las ecuaciones se desacoplan completamente, esto nos muestra de nuevo que la degeneraci on est
a asociada con
simetras del sistema.
Es necesario hacer notar que las ecuaciones de Euler solo contienen la descripci on del movimiento rotacional,
y deben ser complementadas con las ecuaciones de la din amica traslacional del centro de masa o del punto
de referencia. Finalmente, es necesario se nalar otro inconveniente con las Ecs. (13.39), las componentes de
los vectores y N que all aparecen, est an evaluadas en la base fija al cuerpo, de modo que para obtener
el valor de cada uno de estos vectores necesitamos conocer la orientaci on relativa de los vectores unitarios
base con respecto a los vectores base del sistema no rotante en el instante de tiempo en que evaluemos a
estos vectores. Por lo tanto, necesitaremos en general conocer la din amica del sistema de ejes rotante para
determinar completamente a estos vectores en cualquier instante.

13.4.1. Ecuaciones de Euler con el formalismo de Lagrange


Podemos tambien deducir estas ecuaciones a partir del formalismo de Lagrange partiendo de la Ec. (2.17)
 
d T T
= Qj
dt qj qj

y dado que las coordenadas generalizadas ser an angulares (e.g. los angulos de Euler) las fuerzas generalizadas
seran los torques asociados a tales
angulos. Sin embargo, solo uno de los angulos de Euler tiene su torque
asociado dirigido a lo largo de uno de los ejes del cuerpo y las otras dos ecuaciones deber an obtenerse por
permutaci on cclica. Comenzamos por escribir la energa cinetica con base en los momentos principales
1
T = Ik k2 (13.40)
2
como la base mas conveniente para escribir las ecuaciones es la asociada a S , emplearemos las relaciones
(12.81) que nos dan las componentes de la velocidad angular en terminos de los
angulos de Euler y en la base
12
Es necesario que todos los vectores esten escritos en la misma base para que sea v
alida la igualaci
on componente a componente.
LIBRE
13.5. PRECESION 313

de los vectores fijos al cuerpo (ver secci


on 12.11)

1 = sin sin + cos


2 = sin cos sin
3 = cos + (13.41)

las coordenadas generalizadas son q1 = , q2 = , q3 = , los angulos de Euler. Escribamos la ecuaci


on de
movimiento para
 
d T T
= N
dt
    
d 1 2 1 2
Ik k Ik k = N (13.42)
dt 2 2
 
d k k
Ik k Ik k = N (13.43)
dt
k k
debemos calcular las cantidades y
para lo cual usamos (13.41)

1 2
= sin + sin cos = 2 ; = cos sin sin = 1

3 1 2 3
= = =0 ; =1 (13.44)

y reemplazando (13.44) en (13.43) resulta
 
d 3 1 2
I3 3 I1 1 I2 2 = N
dt
I3 3 I1 1 (2 ) I2 2 (1 ) = N
I3 3 1 2 (I1 I2 ) = N3

que nos reproduce la tercera de las Ecs. (13.39), las otras ecuaciones se obtienen por permutacion cclica de
esta

I2 2 3 1 (I3 I1 ) = N2
I1 1 2 3 (I2 I3 ) = N1

13.5. Precesi
on libre
Un problema muy sencillo pero con muchas aplicaciones consiste en la din amica de un cuerpo rgido sin
fuerzas ni torques netos. En este caso el centro de masa define un sistema inercial ya que tiene velocidad
uniforme con respecto al laboratorio, por supuesto tambien es posible en este caso tomar cualquier punto fijo
del cuerpo rgido con respecto al laboratorio como punto de referencia, siempre que no haya torque neto con
respecto a este punto (recordemos que el torque depende en general del origen elegido). En este caso, con el
origen colocado en el centro de masa, el movimiento sera de rotaci
on pura de modo que las ecuaciones de Euler
me determinaran la din amica completa del cuerpo rgido, y el momento angular solo se debe a la rotacion
alrededor del centro de masa. En ausencia de torques netos, las ecuaciones de Euler se escriben en la forma

I1 1 = 2 3 (I2 I3 )
I2 2 = 3 1 (I3 I1 )
I3 3 = 1 2 (I1 I2 ) (13.45)
314 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

Ahora bien, ya hemos visto que para un sistema de partculas exento de torque neto externo, el momento
angular es una constante de movimiento. Por otro lado, dado que la fuerza neta externa es cero, la energa
potencial externa se puede tomar como cero y por tanto se debe conservar la energa propia (que al ser
medida por el centro de masa corresponde a la energa interna), la cual consta de la energa cinetica mas
la potencial interna, pero esta u ltima se conserva en virtud de que las distancias relativas de las partculas
permanecen constantes (que es precisamente la condici on de cuerpo rgido), en consecuencia la energa cinetica
del sistema debe conservarse. Se concluye entonces que para un cuerpo rgido exento de torques y fuerzas netas
externas, tenemos dos integrales primeras de movimiento correspondientes a la conservaci on del momento
angular y la energa cinetica. Con estas dos integrales es posible en principio integrar completamente las Ecs.
(13.45) en terminos de funciones elpticas. No obstante, ser a mas ilustrativo usar el an
alogo geometrico del
elipsoide (conocido como construcci on de Poinsot) que nos dar a muchas caractersticas del movimiento sin
resolver completamente el problema. M as adelante, abordaremos el problema algebr aicamente para s olidos con
simetra axial.

13.5.1. Construcci
on de Poinsot para la precesi
on libre

Figura 13.3: Ilustracion de la construccion de Poinsot para el estudio de la precesi


on libre. El elipsoide rueda
sin deslizar sobre el plano invariable definido por el momento angular. La Polhodia y Herpolodia son las curvas
trazadas sobre la superficie del elipsoide y el plano invariable respectivamente.

Ya hemos visto que en el sistema coordenado de los ejes principales del s olido, la superficie que forma el
elipsoide de inercia nos da una relaci on entre y L. En particular cuando la energa cinetica es constante, el
vector dado por (13.32) nos define completamente la din amica del vector , y ya vimos que el extremo de
define un punto sobre la superficie del elipsoide, y que la normal a la superficie del elipsoide en este punto
determina precisamente la direcci on del momento angular como se puede apreciar en (13.34).
En el caso particular de s olido libre, el momento angular es fijo en el sistema inercial y por tanto define
la direcci
on de un plano, y dado que precisamente L es perpendicular a la superficie del elipsoide en el punto
donde esta el extremo de , podemos definir unvocamente un plano normal a L y tangente al elipsoide en el
punto donde esta ubicado el extremo de (que denominaremos plano invariable). Cuando cambia el valor de
(i.e. de ), el elipsoide (que est
a fijo al cuerpo) se debe mover entonces sobre este plano tangente a fin de
preservar la conexi on entre y L. La fig 13.3 muestra la configuraci
on geometrica resultante. Adicionalmente,
se puede mostrar que la distancia entre el origen del elipsoide y el plano tangente a este en el extremo de
debe ser constante en el tiempo. Esta distancia es la proyecci on de sobre la direccion de L

b L L 2T
L= = =
L L 2T L
LIBRE
13.5. PRECESION 315

donde hemos usado las Ecs. (13.15, 13.32). Es claro que esta cantidad es constante en nuestro caso ya que T y
L son constantes. En consecuencia el centro del elipsoide est a a una altura constante con respecto al plano
invariable. Adicionalmente el centro del elipsoide coincide con el origen de todos los sistemas de referencia que
estamos usando ya que este origen se eligi o para que no exista traslaci on respecto al sistema inercial del centro
de masa (o punto fijo), por tanto dicho punto es estacionario con respecto al plano invariable. De lo anterior
se puede ver que el movimiento libre de fuerzas de un cuerpo rgido se puede representar considerando que
es el del elipsoide de inercia rodando sin deslizar sobre el plano invariable, con el centro del elipsoide fijo y a
una altura constante en el plano. La rodadura tiene lugar sin deslizamiento puesto que el punto de contacto
esta definido por el extremo de , el cual por estar dirigido seg un el eje instant
aneo de rotacion, es la direcci
on
del cuerpo que est a moment aneamente en reposo. La curva trazada por el punto de contacto sobre la superficie
del elipsoide de inercia se denomina polhodia. En tanto que la curva que traza el punto de contacto sobre
el plano invariable se denomina herpolhodia. Ocurre entonces que la polohodia rueda sin deslizar sobre la
herpolhodia que est a en el plano invariable.
La construccion de Poinsot es adecuada para describir completamente el movimiento de un cuerpo rgido
libre de fuerzas, ya que la direccion del plano invariable y la altura del elipsoide de inercia se determinan con los
valores de T y L, las cuales est an entre las condiciones iniciales del problema. El problema se reduce entonces
al problema geometrico de trazar la polhodia y la herpolhodia. Es notable el hecho de que la herpolhodia
es siempre c oncava hacia el origen de aqu su nombre que significa en forma de serpiente. La direcci on y
magnitud de la velocidad angular est an dictaminadas por el vector como se puede ver de (13.32) teniendo en
cuenta que en nuestro caso T es constante. Por otro lado, la orientaci on instant
anea del cuerpo esta determinada
por la orientacion del elipsoide de inercia, ya que este est
a fijo al cuerpo. Muchas descripciones del movimiento
libre de un cuerpo rgido basadas en estos argumentos se pueden encontrar en la literatura.
En el caso especial de simetra axial del cuerpo (que se representa por la degeneraci on simple de los valores
propios del tensor de inercia), el elipsoide de inercia se convierte en un elipsoide de revoluci on, de modo que
claramente la polhodia sobre el elipsoide es un crculo alrededor del eje de simetra. De la misma manera,
la herpolhodia ser a tambien un crculo sobre el plano invariable. Un observador fijo al cuerpo ver a que se
mueve sobre la generatriz de un cono (denominado el cono del cuerpo) cuya intersecci on con el elipsoide
de inercia forma la polhodia. De manera an aloga, un observador fijo en los ejes inerciales ve que se mueve
sobre la superficie de un cono del espacio cuya intersecci on con el plano invariable genera la herpolhodia.
Por esta raz on es usual describir el movimiento libre de un s olido con simetra axial como el generado por el
rodamiento del cono del cuerpo sobre el cono del espacio.
Adicionalmente, si el momento de inercia alrededor del eje de simetra es menor que aquel correspondiente
a los otros dos ejes principales, se ve a traves de la Ec. (11.88) que el elipsoide sera prolato i.e. la longitud a
lo largo del eje de simetra sera mayor a la longitud de la secci on de revolucion (alargado como un bal on de
rugby). Si por el contrario, el momento de inercia alrededor del eje de simetra es mayor, el elipsoide es oblato
(achatado).
En el caso de elipsoides prolatos, el cono del cuerpo es exterior al cono del espacio, para elipsoides oblatos
el cono del cuerpo rueda sobre el interior del cono del espacio. No obstante, en ambos casos se observa que
la direccion de precesa en el tiempo alrededor del eje de simetra del cuerpo. Por esta raz on hablamos del
fenomeno de precesi on libre.

13.5.2. Elipsoide de Binet y el momento angular


La construccion de Poinsot nos dice como se mueve con respecto al sistema inercial y con respecto al
sistema de ejes del cuerpo. Sin embargo, esta construcci on no nos describe la din
amica del vector L vista por
el sistema de ejes del cuerpo13 . Para describir el movimiento de L medido por un observador que se mueve con
los ejes principales del cuerpo, recurrimos a otro artificio geometrico. Combinando las Ecs. (13.29) y (13.30),
vemos que en los ejes principales, la energa cinetica se puede escribir como
L21 L2 L2
T = + 2 + 3 (13.46)
2I1 2I2 2I3
13
Es claro que con respecto al sistema de ejes inerciales, L es constante.
316 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

puesto que T es constante, esta relaci on define un elipsoide, referido como el elipsoide de Binet, que tambien
esta fijo en los ejes del cuerpo pero que NO coincide con el elipsoide de inercia14 . Si adoptamos la convenci
on
I3 I2 I1 y escribimos la ecuaci on para el elipsoide en forma estandar

L21 L22 L2
+ + 3 =1 (13.47)
2T I1 2T I2 2T I3

a semiejes que en orden decreciente corresponden a 2T I1 , 2T I2 , 2T I3 . Por otro lado,
el elipsoide tendr
dado que se conserva la magnitud del momento angular podemos escribir una ecuacion de la forma

L21 + L22 + L23


=1 (13.48)
L2

que corresponde a una esfera de radio L en el espacio L1 , L2 , L3 . El vector L se mueve de tal manera que
describe un camino tanto sobre el elipsoide (13.47) como sobre la esfera (13.48). Es decir, el camino de L visto
por un observador fijo al cuerpo, es la intersecci
on del elipsoide y la esfera. Naturalmente, para que esta imagen
sea consistente es necesario garantizar que dicha intersecci on existe, y es claro que esto equivale a demostrar
que el valor del radio L de la esfera est
a entre el valor del semieje menor y el semieje mayor. Cada semieje del
elipsoide est
a dado por la cantidad
p
ai 2T Ii

ahora usando convenio de suma de ndices, reescribimos (13.47) en la forma

Li Li
=1
ai ai

on por a2j siendo j un ndice fijo j = 1, 2, 3 se obtiene


multiplicando la ecuaci

a2j
a2j = Li Li
ai ai

si aj es el menor de los semiejes principales (por convenci


on a3 ) tendremos que aj /ai 1 y por tanto

a23 2
2 a3
2
2 a3
a23 = L21 + L 2 2 + L 2 2 2
3 2 L1 + L2 + L3 = L
2
a21 a2 a3

similarmente para el mayor de los semiejes se puede probar

a21 L2

por lo tanto
p p
2T I3 L 2T I1 (13.49)

que es lo que se quera demostrar. Si a3 6= a1 , la esfera est


a fuera del elipsoide sobre el eje L3 y dentro del
15
elipsoide en el eje L1 . Las Figs. 13.4 muestran las curvas que resultan de la intersecci on del elipsoide con la
esfera para diferentes valores de L ydesde diferentes perspectivas. Las curvas que aparecen como lneas rectas
en la Fig. 13.4 corresponden a L = 2T I2 .
14
De (13.47), es inmediato ver que las longitudes de los semiejes del elipsoide de Binet son diferentes a las del elipsoide de
Poinsot. Incluso las longitudes de los ejes tienen dimensiones diferentes.
15
Si a3 = a1 entonces por definici
on todos los momentos de inercia seran iguales y el elipsoide coincide con la esfera.
LIBRE
13.5. PRECESION 317

Figura 13.4: Ilustraci


on de las trayectorias posibles del vector L sobre la superficie del elipsoide de Binet fijo
al cuerpo, para el estudio de la precesi
on libre.

13.5.3. Elipsoide de Binet, rotaci


on estacionaria y condiciones para la rotaci
on estable
Las ecuaciones de Euler para s
olido libre (13.45) muestran claramente que la rotaci on estacionaria (i.e. con
todas las componentes de constantes) solo es posible para un s
olido libre de fuerzas si se cumple la condicion

1 2 (I1 I2 ) = 2 3 (I2 I3 ) = 3 1 (I3 I1 ) = 0

Recordemos que i son componentes medidas en la base de los ejes principales del cuerpo, por tanto la
estacionaridad se est a midiendo con respecto a ejes fijos al cuerpo. Si en general suponemos que todos los
momentos principales de inercia son diferentes como es de esperarse con un s olido irregular, vemos que el
movimiento estacionario para dicho s olido solo es posible si al menos dos de las componentes de son cero, es
decir va a lo largo de un solo eje principal16 . Si existe degeneracion simple por ejemplo I1 = I2 solo existe
la condicion de que 3 = 0 de modo que puede estar en cualquier direcci on dentro del plano X1 X2 lo cual
es de esperarse ya que cualquier eje sobre ese plano es eje principal. Si la degeneraci on es total puede estar
en cualquier direccion ya que cualquier eje es principal en virtud de la simetra esferica.
Retornemos al caso no degenerado en donde los ejes principales forman un conjunto con una orientaci on
bien definida. En este caso como ya vimos el movimiento solo puede ser estacionario si hay rotaci on alrede-
dor de alguno de los ejes principales. Una pregunta natural que surge en toda condici on estacionaria es su
estabilidad, es decir la desviaci
on del comportamiento estacionario ante peque nas perturbaciones, para lo cual
examinaremos lo que ocurre en cada eje. Supongamos que como condici on inicial la rotacion comienza alrede-
dor del tercer eje principal (recordemos que por convenci on I3 es el menor de los tres momentos de inercia),
ocurrira movimiento estable alrededor de L3 si comenzando con L en la direcci on L3 garantizamos que no hay
otras orientaciones posibles en la vecindad del eje L3 ; geometricamente esto significa que la esfera y el elipsoide
de binet solo se deben intersectar en un punto en una vecindad de L3 de modo que el radio de la esfera debe
coincidir con el valor del semieje menor, es decir L2 = 2T I3 . Cuando hay una peque na desviaci
on de este
valor, el radio de la esfera del momento angular es solo un poco mayor de este valor17 , y la intersecci on con el
16
En tal caso L es paralelo a , y como L es constante, tambien lo ser
a .
17
La Ec. (13.49) nos garantiza que el radio de la esfera no puede ser menor que el semieje menor del elipsoide de Binet.
318 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

elipsoide de la energa cinetica sera una pequena figura cerrada alrededor del eje L3 . El movimiento es entonces
estable ya que una peque na perturbacion produce una desviaci on ligera de L alrededor del eje original.
Una situaci on similar ocurre en el otro extremo en el cual el movimiento se hace alrededor del eje de mayor
momento de inercia. El movimiento estable ocurre cuando L2 = 2T I1 y cuando este movimiento es perturbado,
el radio de la esfera del momento angular es solo ligeramente menor que este valor. La intersecci on es de nuevo
un peque no crculo alrededor del eje principal y el movimiento es estable. En contraste, para el eje intermedio
L2 , la energa cinetica tiene dos
orbitas que circundan al elipsoide y se cruzan entre s donde L2 pasa a traves
del
elipsoide (ver Figs. 13.4). En consecuencia, hay dos orbitas diferentes con
valores ligeramente menores que
2T I2 y otras dos orbitas diferentes con valores ligeramente mayores que 2T I2 18 , todas las cuatro orbitas
tienen caminos largos y apartados sobre la superficie del elipsoide (Figs. 13.4). Este es un fen omeno tpico de
bifurcacion que por supuesto implica inestabilidad.
Lo anterior se puede entender teniendo en cuenta que para el eje con momento intermedio el radio de
curvatura del elipsoide en una direcci on es mas grande que el de la esfera de contacto en tanto que es menor
en la direcci on perpendicular. En los otros extremos en cambio los radios de curvatura son o bien mas grandes
o bien m as peque nos que el radio de la esfera en todas las direcciones. Estos criterios de estabilidad son de
gran utilidad en aplicaciones concernientes a la estabilidad de sistemas rotantes tales como naves espaciales.
No obstante, cuando hay fuerzas disipativas presentes, estos argumentos de estabilidad deben ser modificados.
Por ejemplo, para un cuerpo con L constante pero con T suavemente decreciente, la u nica rotaci
on estable
es alrededor del eje principal con mayor momento de inercia. Esto se puede ver teniendo en cuenta que la
energa cinetica de rotaci on alrededor de un eje principal iesimo viene dada por T = L2 /2Ii la cual tiene
un valor mnimo para el eje con mayor momento de inercia, y por tanto conduce a un movimiento estable
alrededor de tal eje. Cuando se pone a rotar al cuerpo alrededor de otro de los ejes principales el efecto de
decrecimiento ligero de la energa cinetica es el de cambiar gradualmente el eje de rotaci on hasta que termina
rotando alrededor del eje con m aximo valor de momento de inercia.

13.5.4. Soluci
on algebraica para la precesi
on libre con simetra axial
Para un cuerpo simetrico no es difcil obtener la soluci
on analtica de las ecuaciones de Euler para el caso
de cuerpo libre de fuerzas. Tomemos el eje de simetra como el eje principal L3 de modo que I1 = I2 . Las
ecuaciones de Euler (13.45) se reducen entonces a

I1 1 = 2 3 (I1 I3 )
I1 2 = 3 1 (I3 I1 )
I3 3 = 0 (13.50)

la u
ltima de estas ecuaciones establece que 3 es constante, y se puede tratar como una condici
on inicial
conocida del problema. Las dos ecuaciones siguientes se escriben como
I3 I1
1 = 2 ; 2 = 1 ; 3 (13.51)
I1
derivando la primera de estas ecuaciones y teniendo en cuenta la segunda, se obtiene

1 = 2 = 2 1
1 = 2 1

esta ecuaci
on tiene la tpica soluci
on arm
onica

1 = A cos t (13.52)
Similarmente tampoco puede ser mayor que el semieje mayor. Estrictamente, tanto la esfera como el elipsoide pueden cambiar,
por ejemplo si se introduce una peque na fuerza que produce un peque no torque por un breve instante, puede ocurrir en general un
ligero cambio en el momento angular y tambien en la energa cinetica y ambas figuras deben cambiar. En cualquier caso al volver
a ser libre el cuerpo rgido se tiene que mantener la relaci
on (13.49) de modo que no cambia nuestra discusi on.
18
N
otese que en este caso el radio de la esfera puede aumentar o disminuir dentro de cierto intervalo sin violar la condici on
(13.49).
LIBRE
13.5. PRECESION 319

y sustituyendo esta expresi


on en la segunda de las Ecs. (13.51) resulta

2 = A cos t 2 = A sin t (13.53)

estas soluciones muestran que 3 u3 es constante en tanto que 1 u1 + 2 u2 es constante en magnitud y rota
uniformemente alrededor del eje de simetra X3 del cuerpo con frecuencia angular . Esto indica entonces que
el vector completo es constante en magnitud y precesa alrededor de X3 con la misma frecuencia, tal como
lo predijo la construcci
on de Poinsot.
Otra forma interesante de ver la precesion es construyendo un vector a lo largo de X3 y con magnitud
descrita por la tercera de las Ecs. (13.51). En tal caso, las Ecs. (13.50) se pueden sintetizar en una ecuaci
on
vectorial
=
la cual muestra inmediatamente la precesi on de con frecuencia .
Es importante tener en cuenta que la precesi on aqu descrita es vista por los ejes del cuerpo, que a su vez
rotan en el espacio con una frecuencia que es mayor que . De otra parte, la tercera de las Ecs. (13.51)
nos dice que entre mas cerca este I1 de I3 mas lenta sera la precesi
on i.e. menor sera con respecto a . Las
constantes A (amplitud de precesi on) y 3 se pueden evaluar en terminos de las constantes de movimiento
mas usuales como son T y L2 , es facil ver que estas cantidades se pueden escribir en terminos de A y 3 de la
siguiente forma. Empleamos primero las Ecs. (13.29, 13.30) para ejes principales con I1 = I2 y tendremos en
cuenta las Ecs. (13.52, 13.53)

1  1 1  1
T = I1 12 + 22 + I3 32 = I1 A2 cos2 t + A2 sin2 t + I3 32
2 2 2 2
1 2 1 2
T = I1 A + I3 3
2 2
L2 = (I ) (I ) = [(Ik uk uk ) (m um )] [(Ij uj uj ) (n un )]
= [Ik m uk (uk um )] [Ij n uj (uj un )] = [Ik m uk km ] [Ij n uj jn ]
= [Ik k uk ] [Ij j uj ] = Ik Ij k j (uk uj ) = Ik Ij k j kj = Ik2 k2

= I12 12 + 22 + I32 32 = I12 A2 + I32 32

quedando finalmente
1 1
T = I1 A2 + I3 32 ; L2 = I12 A2 + I32 32
2 2
y estas relaciones se pueden invertir para obtener A y 3 en terminos de T y L2 .
Por ejemplo, es de esperarse que la tierra sufra una precesion aproximadamente libre ya que los torques
externos son muy debiles. La tierra es aproximadamente simetrica alrededor del eje polar y oblata en los polos
de modo que I1 es menor que I3 . Numericamente, el radio de estos momentos es tal que

I3 I1
= 0,00327
I1

y la magnitud de la frecuencia angular de la precesi


on debe ser
3 3
= =
305,81039 306

y dado que 3 es casi igual en magnitud que este resultado predice un periodo de precesi on de unos 306
dias es decir unos 10 meses. Si alguna perturbaci on ocurre sobre el eje de figura de la tierra, esperaramos que
el eje de rotaci
on precese alrededor del eje de figura (alrededor del polo norte) una vez cada diez meses. En
realidad se ha medido una precesi on alrededor del polo con una amplitud del orden de unas pocas decimas
de segundo de latitud, aunque modelos m as realistas deben inclur otros efectos tales como fuerzas de fricci
on
que se producen por la no rigidez del planeta.
320 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

13.5.5. Estabilidad de s
olidos irregulares por m
etodos algebr
aicos
Retornemos al caso de s olidos irregulares para los cuales los tres momentos de inercia a lo largo de ejes
principales son diferentes. Veremos el problema de la estabilidad directamente con las ecuaciones de Euler y sus
soluciones. Asumiremos que en t = 0 el movimiento comienza con 2 = 3 = 0 y 1 6= 0. Y que inmediatamente
despues de una breve perturbaci on, 2 y 3 adquieren valores no nulos pero mucho menores que 1 . Cuando
la perturbacion termina, el movimiento vuelve a ser libre de fuerzas y torques de modo que las ecuaciones de
Euler quedan

I1 1 = 2 3 (I2 I3 ) (13.54)
I2 2 = 3 1 (I3 I1 ) (13.55)
I3 3 = 1 2 (I1 I2 ) (13.56)

dado que 2 y 3 son peque nos con respecto a 1 el termino a la derecha de la ecuaci on (13.54) es de segundo
orden y se puede despreciar, por tanto tenemos que a primer orden I1 1 = 0 y 1 se puede considerar constante.
Derivando (13.55)
I2
2 = ( 3 1 + 3 1 ) (I3 I1 ) 3 1 (I3 I1 ) (13.57)
y sustituyendo (13.56) en (13.57) resulta
   
(I1 I2 ) (I1 I2 ) (I3 I1 ) 2
I2
2 = 1 2 1 (I3 I1 ) = 1 2
I3 I3
 
(I1 I2 ) (I3 I1 ) 2

2 = A2 ; A 1 (13.58)
I2 I3

si I1 es el mayor o el menor de los tres momentos de inercia A ser a negativo


y la Ec. (13.58) corresponde
a la ecuacion de un oscilador armonico simple. 2 oscila con frecuencia A con amplitud acotada, es f acil
demostrar que 3 tambien realiza movimiento arm onico simple, en tanto que 1 es constante a primer orden.
Esto implica que el vector solo sufre una ligera desviaci
on de su valor original. En contraste, si I1 es el eje
intermedio, A sera positivo y las componentes 2 y 3 tender an a crecer exponencialmente con el tiempo,
dando un movimiento inestable.

13.6. La peonza sim


etrica pesada con un punto fijo
Consideraremos ahora un ejemplo un tanto m as complejo pero muy ilustrativo y de amplias aplicaciones:
la peonza simetrica pesada en un campo gravitacional uniforme con un punto fijo sobre el eje de simetra
del cuerpo. Este ejemplo permite estudiar diversos sistemas que van desde los trompos infantiles hasta los
instrumentos girosc opicos de navegaci
on. Puesto que la mayor parte del tiempo utilizaremos los ejes fijos al
an por X1 X2 X3 contrario
cuerpo, denotaremos X1 X2 X3 a dichos ejes, en tanto que los ejes inerciales se denotar
a lo tradicional. La configuraci
on se muestra en la Fig. 13.5

13.6.1. Reducci
on del problema a cuadraturas
El eje de simetra es claramente un eje principal del cuerpo. Dado que un punto es estacionario, la configu-
racion de la peonza esta completamente especificada por los tres angulos de Euler: nos da la inclinaci on del
eje X3 (eje de simetra fijo al cuerpo ) con respecto a la vertical i.e. con respecto al eje X3 asociado al sistema
inercial; mide el azimuth de la peonza alrededor de la vertical, en tanto que mide el angulo de rotaci on de
la peonza alrededor del eje de simetra X3 , (ver Fig. 13.5). La distancia entre el centro de masa y el punto fijo,
ambos sobre el eje de simetra est a dada por l. La razon de cambio de cada angulo nos da las caractersticas
del movimiento de la peonza

1. mide la rotaci
on (o spinning) de la peonza alrededor de su eje de figura X3 .

13.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 321

Figura 13.5: Peonza simetrica pesada con un punto fijo en el cual se coloca el origen de ambos sistemas
coordenados. En esta configuraci
on el punto fijo no est
a en el centro de masa.

2. mide la precesi on del eje de figura X3 alrededor del eje vertical X3 .


on o rotaci

3. mide la nutaci
on, o cabeceo arriba y abajo del eje de figura X3 relativo al eje vertical X3 .

an en la siguiente jerarqua: >> >> .


En la mayora de casos de interes estas razones de cambio est
Puesto que I1 = I2 6= I3 las ecuaciones de Euler (13.39) quedan

I1 1 + 2 3 (I3 I1 ) = N1
I2 2 + 1 3 (I1 I3 ) = N2
I3 3 = N3 (13.59)

consideremos el caso en el cual inicialmente N3 = N2 = 0, N1 6= 0 y 1 = 2 = 0, 3 6= 0, con lo cual 3


sera constante. El torque N1 hace que 1 cambie ya que debido a este torque 1 6= 0 incluso al principio,
como se puede ver de la primera ecuaci on (13.59) teniendo en cuenta que 2 es nulo al principio. Dado que
para tiempos posteriores a t = 0 se tiene que 1 ya no es nulo, la segunda ecuaci on requiere que 2 tambien
comience a cambiar. Sin embargo, no es f acil descifrar el significado de esta dinamica puesto que lo que se
mide en el laboratorio son los cambios en los angulos de Euler , ,
y sus
angulos asociados en el sistema
X1 X2 X3 del laboratorio. No se observa directamente a 1 , 2 , 3 y sus
angulos asociados en los ejes principales.
Esto sugiere que las ecuaciones de Euler no nos dan la descripci on m as u
til del movimiento del sistema. En
322 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

consecuencia, utilizaremos el formalismo Lagrangiano en lugar de las ecuaciones de Euler. El origen tanto del
sistema inercial como del fijo al cuerpo esta en el punto fijo de la peonza, de modo que para el sistema inercial
con este origen hay una rotaci on pura alrededor de alg un eje que pasa por este origen (teorema de Euler). La
energa cinetica para cuerpos simetricos en rotaci
on pura se escribe como
1  1
T = I1 12 + 22 + I3 32
2 2
como la idea es escribirla en terminos de los
angulos de Euler, usaremos las Ecs. (12.81)
 2  2
12 + 22 = sin sin + cos + sin cos sin
12 + 22 = 2 sin2 sin2 + 2 cos2 + 2 sin sin cos
+ 2 sin2 cos2 + 2 sin2 2 sin cos sin (13.60)

 
12 + 22 = 2 sin2 sin2 + cos2 + 2 cos2 + sin2 (13.61)
12 + 22 = 2 sin2 + 2 (13.62)
 2
32 = cos + (13.63)

la energa cinetica en terminos de


angulos de Euler queda

1   I 
3
2
T = I1 2 sin2 + 2 + cos + (13.64)
2 2
por otro lado, la energa potencial gravitacional del cuerpo rgido es la suma de las energas potenciales
individuales de cada partcula
m r 
i i
V = Fi ri = mi g ri = M g
M
V = M RC g

siendo g el campo gravitacional uniforme en la superficie de la tierra y RC la posici


on del centro de gravedad
de la peonza (que coincide con el centro de masa para campo gravitacional uniforme). En consecuencia la
energa potencial es la misma que si todo el cuerpo estuviera concentrado en su centro de masa. A partir de
la geometra de la Fig. 13.5 se ve que

V = M kRC k kgk cos ( ) = M gl cos ( )


V = M gl cos

el Lagrangiano queda entonces de la forma

1   I 
3
2
L = I1 2 sin2 + 2 + cos + M gl cos
2 2
los angulos y no aparecen explcitamente en este Lagrangiano. En consecuencia son coordenadas cclicas
y sus momentos conjugados ser an constantes de movimiento. Hemos visto que el momento conjugado a una
coordenada angular de rotaci on corresponde a la componente del momento angular total a lo largo del eje de
rotacion, el cual para es el eje vertical, para es el eje de simetra del cuerpo y para es la lnea de nodos.
Precisamente se puede ver de una forma directa la raz on de que estos momentos sean constantes teniendo en
cuenta que el torque generado por la gravedad va a lo largo de la lnea de nodos, de modo que no hay componente
del torque a lo largo del eje vertical ni del eje de simetra, los cuales son por definicion perpendiculares a la
lnea de nodos. La ausencia de torques en estos ejes conduce entonces a que las componentes del momento
angular total a lo largo de ellos sean constantes en el tiempo.

13.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 323

Aparecen entonces dos integrales primeras de movimiento


L  
p = = I3 + cos = I3 3 I1 a (13.65)

L 
p = = I1 sin2 + I3 cos2 + I3 cos I1 b (13.66)

donde hemos usado la tercera de las Ecs. (12.81). Adem as hemos expresado estas constantes de movimiento en
terminos de nuevas constantes a y b. Es inmediato ver que existe una constante adicional de movimiento dado
que el sistema es conservativo: la energa total del sistema (que coincide con la funci
on energa y numericamente
con el Hamiltoniano)
1   I
3
E = T + V = I1 2 sin2 + 2 + 32 + M gl cos (13.67)
2 2
donde hemos usado la Ec. (13.64) y la tercera de las Ecs. (12.81). Solo se requieren tres cuadraturas para resolver
el problema, estas se pueden obtener de las integrales primeras de movimiento sin recurrir explcitamente a
las ecuaciones de Euler Lagrange. Despejando en (13.65) se obtiene

I3 = I1 a I3 cos (13.68)

que a su vez se puede sustituir en (13.66) para eliminar en dicha ecuaci on


 
I1 sin2 + I3 cos2 + I1 a I3 cos cos I1 b
I1 sin2 + I1 a cos I1 b

y despejando
b a cos
= (13.69)
sin2
esta ecuaci
on sera integrable si conocieramos a en funci on del tiempo. Sustitumos (13.69) de nuevo en
(13.68) de lo cual resulta una ecuaci
on an aloga para
 
b a cos
I3 = I1 a I3 cos
sin2
 
I1 a b a cos
= cos (13.70)
I3 sin2
que de nuevo es integrable siempre que conozcamos a en funci on del tiempo. Finalmente, se observa que las

Ecs. (13.69, 13.70) se pueden usar para eliminar y en la ecuaci on (13.67) de la energa19 , con lo cual se
obtendra una ecuaci on diferencial ordinaria para . Antes de hacer esto, notemos que la Ec. (13.65) nos dice
que 3 es una constante en el tiempo y por tanto tambien lo ser on I3 32 /2. En consecuencia la
a la expresi
expresi
on
I3 32
E = E
2
es tambien una constante de movimiento, esto permite eliminar esta constante de la Ec. (13.67) ya que un
corrimiento constante en la energa no tiene ninguna consecuencia fsica. Reemplazando (13.69) en (13.67) y
redefiniendo E se tiene
" 2 #
1 b a cos
E = I1 sin2 + 2 + M gl cos
2 sin2
1 2 1 (b a cos )2
E = I1 + I1 + M gl cos (13.71)
2 2 sin2
19
Estrictamente ya ha sido eliminada en (13.67) a traves del factor 3 .
324 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

la Ec. (13.71) tiene la forma de un problema unidimensional equivalente si definimos un potencial efectivo de
la forma
1 (b a cos )2
Vef () = M gl cos + I1
2 sin2
el cual ser
a muy util para describir el movimiento en al igual que en el caso de fuerzas centrales en el cual
la construcci o para analizar el movimiento radial20 . Es conveniente hacer
on de un potencial efectivo nos sirvi
el cambio de variable u = cos , con lo cual du = sin d ya que en tal caso la ecuaci
on (13.71) queda de la
forma
1 2 1 (b au)2
E = I1 + I1 + M glu
2 2 1 u2
y como
du d 
= sin u 2 = sin2 2 = 1 u2 2
dt dt
la expresi
on para E queda

1 u 2 1 (b au)2
E = I1 + I1 + M glu
2 (1 u2 ) 2 (1 u2 )
 1 1 
E 1 u2 = I1 u 2 + I1 (b au)2 + M gl u 1 u2
2 2
despejando u 2
2E  2M gl 
u 2 = 1 u2 (b au)2 u 1 u2 (13.72)
I1 I1
es conveniente introducir las siguientes constantes de movimiento

2E 2E I3 32 2M gl p I3 3 p
= = ; = ; a= = ; b= (13.73)
I1 I1 I1 I1 I1 I1
donde a y b provienen de las Ecs. (13.65, 13.66). Estas constantes est
an asociadas a los momentos conservados,
la energa total y la energa potencial. Por ejemplo, es proporcional a la energa del sistema excluyendo la
energa cinetica angular asociada a X3 (es decir excluyendo el spinning asociado a 3 ). Usando (13.73) en
(13.72) se obtiene
 
u 2 = 1 u2 (b au)2 u 1 u2

u 2 = 1 u2 ( u) (b au)2 (13.74)

que se puede reducir de manera inmediata a cuadraturas


Z u(t)
du
t= q (13.75)
u(0) 2
(1 u2 ) ( u) (b au)

integrando esta ecuaci


on obtenemos en principio = (t) que al ser sustitudo en (13.69) y (13.70) nos reduce
a cuadraturas la dinamica de y . En cuanto a la soluci on de (13.75), el polinomio del radical es cubico de
manera que las soluciones son integrales elpticas. De nuevo la forma analtica de las soluciones puede ser muy
compleja y poco ilustrativa. Por lo tanto es mas provechoso para los prop
ositos actuales realizar consideraciones
generales, con las cuales se pueden extraer aspectos de la naturaleza general del movimiento sin integrar las
ecuaciones de movimiento.
Antes de analizar las soluciones posibles de (13.75), es importante analizar las constantes definidas en
(13.73). La Fig. 13.5 muestra un caso en el cual el punto fijo no yace en el centro de masa. Si la peonza
20
As como en el escenario de fuerzas centrales, los terminos adicionales en el potencial efectivo corresponden a las componentes
de la energa cinetica asociadas a las coordenadas cclicas que en este caso son dos. Sin embargo, en la definici on de E hemos
sustrado las componentes que dependen de las cuales est
2
an contenidas en 3 .

13.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 325

esta rotando sobre una superficie horizontal, entonces tanto como son mayores que cero. Si en cambio la
peonza posee un soporte que le permite estar por debajo de la horizontal, entonces sigue siendo mayor que
cero pero puede ser positivo o negativo. En otras aplicaciones como algunos gir oscopos, el punto fijo puede
estar en el centro de masa, en tal caso se tiene que = l = 0 y 0. Enfocaremos nuestra atenci on al caso
en el cual la energa cinetica rotacional alrededor de X3 es mucho mayor que la energa cinetica asociada a los
otros dos ejes.

13.6.2. An
alisis cualitativo del movimiento
Definamos f (u) usando (13.74), y ordenando las potencias de u
 
u 2 f (u) = u3 + a2 u2 + (2ab ) u + b2 (13.76)

esta ecuaci
on nos muestra por un lado que la funci on f (u) es un polinomio de grado 3 en u, y por otro lado
que debe ser no negativa ya que f (u) = u 2 . Es decir valores de u (y por tanto de ) que conduzcan a valores
negativos de f (u) estaran fsicamente descartados. Esto a su vez nos llevar
a a que las races de este polinomio

de tercer grado nos dan los valores de en los cuales cambia de signo, es decir los angulos de retorno en
. El conocimiento de estos angulos nos puede dar informacion cualitativa del movimiento del sistema.
Para el gir
oscopo f (u) es cuadr atica puesto que = 0, pero para la peonza contribuye en general todo el
polinomio cubico. Dado que en muchas aplicaciones los gir oscopos usan montajes libres de torque, la precesi on y
la nutaci
on estaran suprimidos de modo que el movimiento del gir oscopo es trivial. Para entender el movimiento
general de un cuerpo rotante, consideraremos solo el caso en el cual > 0.
Las ecuaciones c ubicas con coeficientes reales poseen tres races que pueden venir en cuatro tipos de
combinaciones21

1. Una raz real y un par conjugado de races complejas

2. Tres races reales, dos de las cuales son iguales

3. Tres races reales todas distintas

4. Tres races reales todas identicas

Estas posibilidades dependen de los signos relativos y magnitudes de las cuatro constantes definidas en
(13.73). Para nuestro problema especfico, hay tambien una restricci on fsica y es que 1 u 1 para que
sea real. Consideraremos solo el caso en el cual u > 0 que corresponde a que el centro de masa permanezca
por encima de la horizontal. Recordemos sin embargo que muchos gir oscopos poseen un soporte puntual que
permite que el centro de masa se sit ue por debajo del plano horizontal.
En los puntos u = 1, f (u) adquiere el valor (b a)2 y es por tanto negativa en ambos extremos,
excepto en el caso inusual en que u = 1 es una raz, lo cual corresponde a tener una peonza vertical, caso
que analizaremos m as adelante. Por tanto, en el presente an alisis asumiremos que el polinomio no tiene races
en u = 1 y por tanto que f (1) < 0.
Para u grande, el termino dominante en f (u) es u3 . Dado que es una constante siempre positiva seg un
se ve en la Ec. (13.73), f (u) sera positiva para valores grandes positivos de u y negativa para valores grandes
negativos de u. Ahora bien, ya que f () > 0 y f (1) < 0, el polinomio debe cortar al eje u en alg un punto
del intervalo (1, +). En conclusi on, f (u) tiene una raz real en el intervalo (1, ). Ahora bien puesto que
un valor de u en este intervalo est a fsicamente excludo, vemos que a lo m as existen dos races reales de u que
correspondan a una situaci on fsicamente posible. Dicho algebr aicamente, hay a lo m as dos races reales en el
intervalo 1 < u < 1.
Por otro lado, la ausencia de races de f (u) en el intervalo 1 < u < 1, indicara que no hay ning un
valor posible para lo cual sera inconsistente. Esto indica que tiene que haber al menos una raz real en tal
21
Puede verse que para cualquier polinomio de grado n con coeficientes reales, el n umero de soluciones complejas (no reales)
deben ser siempre par, pues es inmediato ver que si ua es una raz, entonces ua tambien ser
a una raz.
326 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

intervalo. Vemos entonces que f (u) tiene al menos dos races reales una en (1, 1) y la otra en (1, +). Esto
descarta los casos 1 y 4 y nos conduce a que las tres races deben ser reales a lo m
as con degeneraci
on simple.
Hemos visto que en ambos extremos del intervalo f (u) es negativa. Si un polinomio posee el mismo signo
en los dos extremos de un intervalo dado, entonces debe ocurrir uno de estos casos

(a) El polinomio puede contener un n


umero par de races diferentes (o no tener ninguna) en dicho
intervalo.

(b) Hay un n
umero impar de races diferentes en el intervalo debido a un degeneramiento. En tal caso,
al menos una raz coincide con un maximo (mnimo) local, si la funcion es negativa (positiva) en el
intervalo.

Para nuestro polinomio c ubico, el escenario (a) indicara que todas las tres races son reales y diferentes
(caso 3) estando dos de ellas en el intervalo 1 < u < 1 (la ausencia de races sera inconsistente). El escenario
(b) indica que solo una raz22 aparece en el intervalo 1 < u < 1; esta raz correspondera a un m aximo local.
En el primer escenario hay dos races reales distintas u1 < u2 en el intervalo (1, 1). Puesto que f (1) < 0
entonces f (u) 0 en el intervalo [u1 , u2 ]. Esto se puede probar f acilmente teniendo en cuenta que si f (u) > 0
para alg un punto en [u1 , u2 ] entonces para que f (u) < 0 en otros puntos de este intervalo tendra que haber m as
races del polinomio, lo cual no es posible. Por otro lado, es posible que f (u) < 0 en todo el intervalo (u1 , u2 ),
esto solo se logra si f (u) posee un m aximo local en u1 , un m aximo local implica que la raz es degenerada, lo
cual nos lleva a que el polinomio tendra cuatro races (u1 contara por dos, u2 6= u1 y u3 que est a fuera del
intervalo [1, 1]), esto contradice al teorema fundamental del algebra.
En el segundo escenario, solo hay una raz u1 en el intervalo (1, 1), que coincide con un m aximo local
(degeneraci on). Como f (1) < 0 se concluye que f (u) < 0 en [u1 , u2 ] excepto en la raz u1 donde f (u) = 0.
Analicemos fsicamente las dos soluciones algebr aicas posibles. Cuando hay dos races distintas u1 , u2 en
(1, 1), hemos visto que f (u) 0 en [u1 , u2 ], lo cual significa que todo el intervalo es una region accesible
fsicamente. Cuando hay una sola raz en (1, 1) hay un solo valor posible fsicamente para u ya que en el
resto del intervalo f (u) < 0.
En resumen, el movimiento fsico corresponde a casos en que f (u) = u 2 es un valor no negativo estando u
en el intervalo 1 u 1, lo cual corresponde a que este entre 0 y . Se llega a que para cualquier peonza
fsica no vertical, f (u) debe tener dos races u1 y u2 (posiblemente degeneradas) en el intervalo (1, 1) y la
peonza se mueve de manera que el cos permanezca entre estas races. Si no hay degeneraci on (ver Fig. 13.7a,
Pag.332) la peonza cabecea o nuta dentro del intervalo de permitido. Si hay degeneraci on (ver Fig. 13.7b,
Pag.332) solo hay un valor de permitido y no se produce nutaci on. Es importante por tanto, localizar estas
dos races para extraer informaci on cualitativa del comportamiento de y para los valores de permitidos.
Es usual describir el movimiento de la peonza trazando la curva que se produce con la intersecci on entre el
eje de figura y una esfera de radio unidad centrada en el punto fijo. Esta curva es conocida como el locus del
eje de figura. La coordenada de un punto sobre el locus se especifica con los angulos de Euler y definidos
23
por los ejes del cuerpo . Las races u1 y u2 definen el intervalo permitido para

2 1 ; 1,2 = arc cos u1,2 (13.77)

donde hemos asumido que u1 u2 . El locus yace entonces entre dos crculos de colatitud 1 y 2 trazados sobre
la esfera unidad (ver Figs. 13.6). El valor de es nulo en ambos crculos y por tanto son puntos de retorno en
.
Es natural ahora preguntarse si hay puntos de retorno posibles para , esto corresponde a hacer = 0, y
de la Ec. (13.69) vemos que esto equivale a la condici on

b au = 0
22
Puesto que hay al menos una raz fuera del intervalor [1, 1], no es posible que la tres races esten all.
23
Es decir, el locus describe la precesi
on y nutaci
on pero no dice nada sobre el spinning. No obstante, en ausencia de fricci
on
esto no implica ninguna perdida de informacion ya que el spinning esta descrito por 3 que es constante de movimiento.

13.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 327

Figura 13.6: Ilustraci


on de la precesi on y nutaci
on de una peonza simetrica pesada con un punto fijo. La
nutaci
on se realiza entre dos crculos.

La forma del locus est


a determinada en gran medida por el valor de la raz de esta ecuaci
on, la cual
denotamos por u
b
u (13.78)
a
supongamos por ejemplo que las condiciones iniciales son tales que u es mayor que u2 . En tal caso la Ec.
(13.69) nos dice que siempre tendr a el mismo signo para todos los valores permitidos de entre 2 y 1 (si
u1 < u2 2 < 1 ), puesto que los puntos de retorno de ocurren en regiones no accesibles para . Por lo
tanto, el locus del eje de figura debe ser tangente a los crculos lmite de tal forma que est a en la misma
direcci
on tanto en 2 como en 1 . En otras palabras, la precesi on del eje de figura alrededor del eje X3 nunca
revierte su sentido. Sin embargo, a diferencia de la precesi on libre, en este caso el eje de figura tambien produce
un cabeceo o nutaci on (variaci on de ) hacia arriba y hacia abajo dentro del intervalo definido por 2 y 1 . Hay
entonces una nutaci on durante la precesi on de la forma ilustrada en la Fig. 13.6a. Por otro lado, vale la pena
aclarar que la precesion de la que hablamos aqu es del eje de simetra del cuerpo y no de la velocidad angular
o del momento angular con respecto a ejes del cuerpo que es la precesi on que se discute en el caso libre.
Si ahora asumimos que u est a entre u1 y u2 , tenemos que existe un punto de retorno para dentro del
intervalo permitido para i.e. = 0, para alg un valor de entre 2 y 1 . En otras palabras, la direcci on de la
precesi
on sera diferente en los dos crculos lmite, de manera que el locus del eje de figura exhibe lazos cerrados
como muestra la figura 13.6b. No obstante, el promedio de no es nulo y hay un sentido neto de avance de la
precesi
on.
Otro caso interesante ocurre cuando u coincide con una de las races de f (u). Por ejemplo, si u = u2 , tanto
como deben anularse en el crculo superior lo cual requiere que el locus tenga c uspides tocando este crculo,
como muestra la figura 13.6c. Este caso no es tan excepcional como podra pensarse a priori, pues se cumple
cuando asumimos que la peonza simetrica est a rotando inicialmente alrededor del eje de figura solamente. En
otras palabras, asumamos que en t = 0 solo hay rotaci on alrededor del eje de figura y en ese instante se suelta
dicho eje. El movimiento subsecuente viene descrito por las condiciones iniciales 0 , 0 (orientaci on inicial del
24
eje de figura) y (0) = (0) = 0 . La cantidad u0 = cos 0 tiene que ser entonces una de las races de f (u)
ya que = 0 significa que el punto inicial es de retorno en . De hecho, corresponde a la raz del crculo lmite

24
Por supuesto las condiciones iniciales (0) = 0 y (0) = 3 tambien son necesarias. La primera se puede tomar 0 = 0 sin
perdida de generalidad y la segunda es constante de movimiento.
328 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

superior (correspondiente a 2 )
b
cos 0 = u0 = u2 = u = (13.79)
a
para probarlo, notemos que con estas condiciones iniciales E en t = 0, coincide con M gl cos 0 y que los
terminos en E provenientes de la energa cinetica no pueden ser negativos. Por tanto, tan pronto como y
comienzan a ser no nulos, la energa solo se puede conservar si hay un decrecimiento del termino potencial
M gl cos i.e. aumentando 25 . El valor inicial de corresponde por tanto a 2 el mnimo valor posible
para que corresponde al crculo superior. En otras palabras, tan pronto como el eje de figura se suelta la
peonza comienza a caer hasta que llega al valor m aximo de que es 1 para retornar de nuevo hacia 2 y
as sucesivamente. Adicionalmente, el eje tambien esta precesando mientras se cumple el ciclo de nutaci on ver
Fig. 13.6c. Finalmente, dado que en este caso u = u2 , el locus presenta cuspides en el crculo superior.
Desde el punto de vista de la energa (omitiendo la energa constante de spinning) podemos decir que
cuando = 2 las energas cineticas de nutaci on y precesi
on son nulas y la potencial toma el valor m aximo,
cuando la peonza cae hasta el punto m as bajo, la energa potencial alcanza su valor mnimo y la energa
on vuelve a ser nula ya que = 0, en tanto que la energa cinetica de precesi
cinetica de nutaci on alcanza su
valor m aximo.

13.6.3. An
alisis cuantitativo aproximado de la peonza r
apida
Tomemos de nuevo las condiciones iniciales (0) = (0) = 0, y supongamos adicionalmente que la energa
cinetica de rotacion alrededor de X3 es mucho mayor que el m aximo valor posible para el cambio en la energa
potencial,
1
I3 32 >> 2M gl (13.80)
2
los efectos de los torques gravitacionales, es decir, la precesi on y la nutaci
on que los acompa nan, ser
an solo
peque nas perturbaciones de la rotaci
on dominante (spinning) alrededor del eje de figura. Esta condici on define
el regimen de peonza r apida. Bajo estas suposiciones es posible obtener expresiones analticas aproximadas
para la amplitud y frecuencia de nutaci on, as como para la frecuencia promedio de precesi on.
La extension de la nutaci
on para las condiciones iniciales dadas se obtiene a traves de u1 u0 , siendo u0 la
raz de f (u) dada en (13.79) y siendo u1 la otra raz fsica de f (u). Las condiciones iniciales nos conducen a
1
E = I3 32 + M gl cos 0 E = M gl cos 0
2
que se puede reescribir como
2E 2M gl
= cos 0
I1 I1
y teniendo en cuenta (13.73, 13.79) tales condiciones equivalen a la igualdad

= u0

esta relaci
on nos permite reescribir f (u) en la Ec. (13.76) de la forma
 
f (u) = u3 u0 + a2 u2 + (2ab ) u + u0 b2

f (u) = u3 u0 u2 u + u0 a2 u2 + 2abu b2
 h i
f (u) = (u0 u) 1 u2 (au)2 2b (au) + b2

f (u) = (u0 u) 1 u2 [au b]2
25
En otras palabras, existe una energa cinetica asociada al spinning, otra asociada a la precesi on, y otra a la nutacion. La
primera es una constante en el tiempo puesto que est a asociada a 3 , y las dos siguientes son nulas en t = 0, por tanto en t = 0 la
energa cinetica adquiere el valor mnimo posible y por lo tanto, tan pronto como la peonza adquiere energa cinetica de nutacion
y precesion, debe compensar con una disminuci on de la energa potencial ya que bajo estas condiciones la energa cinetica de
spinning no cambia.

13.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 329

por otro lado la Ec. (13.79) nos dice que


b = au0 (13.81)
de modo que

f (u) = (u0 u) 1 u2 [au au0 ]2

f (u) = (u0 u) 1 u2 a2 (u u0 )2

quedando finalmente
  
f (u) = (u0 u) 1 u2 a2 (u0 u) (13.82)
esta parametrizaci
on permite encontrar las otras races diferentes de u0 por medio de la expresi
on cuadr
atica
en los brackets. La raz buscada u1 debe en consecuencia satisfacer tal ecuaci
on cuadr atica que la podemos
expresar en la forma
 a2
1 u21 (u0 u1 ) = 0 (13.83)

de acuerdo con la discusi on de la secci
on 13.6.2, una de las races de f (u) es real con u > 1, es decir no es
fsicamente accesible. En este caso debe corresponder a una de las races de la ecuacion cuadr
atica (13.83), y
por tanto tal ecuacion solo nos dara una soluci
on fsica. Definiendo la cantidad

x1 u0 u1 (13.84)

de acuerdo con la secci on 13.6.2, vemos que si u1 es una soluci


on fsica, entonces x1 > 0. Solo las soluciones
positivas de x1 son fsicamente accesibles. Podemos reescribir (13.83) como
h i a2
1 (u0 x1 )2 x1 = 0

a2
1 u20 + 2u0 x1 x21 x1 = 0

 2 
a
x21 + 2u0 x1 + u20 1 = 0

teniendo en cuenta (13.79) la ecuaci


on cuadr
atica queda de la forma

a2
x21 + px1 q = 0 ; p 2 cos 0 ; q = sin2 0 (13.85)

Hasta el momento no se ha realizado ninguna aproximaci on, aunque si se han usado las condiciones iniciales
(0) = (0) = 0, ya que de ellas depende la validez de las Ecs. (13.79, 13.81). La condici
on de peonza r
apida
2
(13.80) implica que p es mucho mayor que q, lo cual se puede ver calculando el radio a / y empleando (13.73)
 
a2 I3 3 2 I1
=
I1 2M gl
 
a2 I3 I3 32
= (13.86)
I1 2M gl

claramente bajo la condici


on (13.80) este cociente es mucho mayor que la unidad excepto en el caso en el cual
I3 << I1 (que correspondera a una peonza tipo cigarro). De esto se deduce entonces que p >> q. Calculemos
las races de (13.85)
p  r    
p p2 + 4q p 4q p 2q
x1 = = 1 1+ 2 = 1 1 + 2
2 2 p 2 p
330 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

y dado que 2q/p2 << 1, solo hay una raz positiva y por tanto solo hay una soluci on fsica como se anticip
o.
Por lo tanto, la u
nica raz fsicamente realizable de (13.85), est
a dada a primer orden en q/p por
q
x1 =
p

usando la segunda de las Ecs. (13.85) y despreciando 2 cos 0 comparado con a2 / este resultado se escribe
como
sin2 0 I1 2M gl
x1 = = sin2 0 (13.87)
a 2 I3 I3 32
donde hemos usado (13.73). En consecuencia, la extensi on de la nutaci
on medida por x1 = u0 u1 disminuye
2
en la misma forma que 1/3 , de modo que a mayor spinning de la peonza menor es la extensi on de la nutaci
on.
Tambien vemos que la extensi on de la nutaci on disminuye cuando disminuye 0 , es decir a medida que nos
acercamos a la vertical en la condici on inicial. Debemos recordar sin embargo que la condici on 0 = 0 de
peonza vertical ha sido excluda del analisis hasta el momento.
La frecuencia de la nutacion para la peonza r apida se puede encontrar de manera aproximada teniendo en
cuenta que en (13.82) podemos hacer la aproximaci on
 
1 u2 = 1 u20 = sin2 0

en virtud de lo peque
no de la extensi
on de la nutaci
on. Teniendo en cuenta esta aproximaci
on y definiendo

x u0 u (13.88)

tenemos que la Ec. (13.82) queda


 
 2 2 sin2 0
 2
f (u) = x sin 0 a x = a x x
a2

de las Ecs. (13.74, 13.76) vemos que f (u) = u 2 = x 2 . Adicionalmente, usando la Ec. (13.87), se tiene que

f (u) = x 2 = a2 x (x1 x) ; x u0 u

si corremos el origen de x hasta el punto medio de su intervalo permitido por medio del cambio de variable
x1
y =x y = x
2
la ecuaci
on diferencial queda en la forma
 x1  h  x1 i  x1  h x1 i
y 2 = a2 y + x1 y + y 2 = a2 y + y
 2 2  2 2 2
x
y 2 = a2 1
y2
4
al derivar a ambos lados se obtiene
2y y = 2a2 y y
que se simplifica a la ecuaci
on familiar de un oscilador arm
onico

y = a2 y y = A cos (at + )
x1 x1
x = A cos (at + ) x = + A cos (at + )
2 2
puesto que u (0) = u0 se tiene que x (0) = 0, y la condici on inicial (0) = 0 implica x (0) = 0. Con estas
condiciones iniciales la amplitud A y la fase vienen dadas por
x1
A= ; =0
2

13.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 331

la soluci
on completa es
x1
x= (1 cos at) (13.89)
2
donde x1 viene dada por (13.87). La frecuencia angular de la nutaci
on del eje de figura entre 0 y 1 es entonces
I3
a= 3 (13.90)
I1
donde se ha tenido en cuenta (13.73). Vemos que esta frecuencia angular de nutaci on se incrementa cuando
aumenta el spinning inicial de la peonza.
Finalmente, la velocidad angular de precesi on se obtiene a traves de (13.69)
b

b a cos a cos a (u0 u) ax
= 2 = a
2 = = (13.91)
sin sin sin2 sin2 0
donde hemos tenido en cuenta las definiciones (13.79) y (13.88). Sustituyendo (13.89) en (13.91) se obtiene
a x1

= (1 cos at) (13.92)
sin2 0 2
La Ec. (13.92), nos muestra que la velocidad de precesi on es directamente proporcional a la extensi
on de la
nutaci
on x1 . Usando (13.87)
 
a I1 2M gl
= sin2 0 (1 cos at)
2 sin2 0 I3 I3 32
 2 
a I1 2M gl
= 2 2 (1 cos at)
2 I3 3 I1

finalmente, aplicando las definiciones (13.73)


a 1

= (1 cos at)
2 a2


= (1 cos at) (13.93)
2a
con lo cual se ve que la rata de precesion no es constante sino que vara arm onicamente con el tiempo con la
misma frecuencia que la nutaci on. No obstante, debe tenerse en cuenta que para este caso no hay inversi on del
sentido de precesi
on ya que nunca invierte su signo seg
un se ve en (13.93), esto se debe a que = 0 ocurre
al mismo tiempo que = 0 en un extremo del intervalo permitido. La frecuencia promedio de precesi on es
sin embargo
Z 2/a
1
= (1 cos at) dt
2/a 0 2a
M gl

= = (13.94)
2a I3 3
que indica que la rata de precesion promedio disminuye a medida que aumenta la velocidad rotacional inicial
de la peonza.
Tenemos ahora un cuadro completo del movimiento de la peonza simetrica pesada con punto fijo, cuando
el eje de figura est
a inicialmente en reposo. Una vez se suelta dicho eje, la peonza comienza a caer bajo la
influencia de la gravedad. Pero a medida que cae, el torque resultante alrededor del eje de cada (lnea de nodos)
causa que la peonza adquiera una velocidad de precesi on, directamente proporcional a la extensi on de su cada,
el eje de figura empieza entonces a precesar alrededor de la vertical. La cada inicial resulta en una nutaci on
periodica del eje de figura que se combina con la precesion. A medida que incrementamos el valor inicial de
la velocidad angular alrededor del eje de figura la extensi on de la nutacion decrece r apidamente aunque la
frecuencia de la nutaci on aumenta, y la precesi
on alrededor de la vertical tambien disminuye. En la pr actica,
332 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

para peonzas suficientemente r apidas, la nutaci on se amortigua muy rapidamente debido a la friccion en el
pivote y resulta muy difcil de observar. En consecuencia, la peonza parece precesar uniformemente alrededor
de la vertical. Puesto que la peonza parece precesar uniformemente solo en apariencia se habla frecuentemente
de precesion pseudoregular.
Notese sin embargo que aunque en la pr actica la nutaci
on suele ser inobservable para peonzas rapidas,
ignorar completamente la nutaci on nos lleva a la conclusion inconsistente de que una vez que se suelta el
eje de figura, la peonza comienza inmediatemente a precesar uniformemente, un movimiento que es normal
a las fuerzas de gravedad las cuales son la u ltima causa de la precesi
on. Nuestro tratamiento de precesi on
pseudoregular resuelve la inconsistencia; la precesi on crece contnuamente a partir del reposo sin ninguna
aceleraci
on infinita y la tendencia inicial de la peonza es moverse en la direcci
on de la fuerza de gravedad.

13.6.4. Peonza con precesi


on regular

Figura 13.7: Comportamiento de las races del polinomio f (u) dado en la Ec. (13.76). (a) Hay dos races en
el intervalo (1, 1) y el sistema exhibe nutaci on. (b) Hay solo una raz fsica u0 en el intervalo (1, 1) y por
tanto un solo valor permitido de , en este caso no hay nutaci on (precesi on regular). (c) Corresponde a un
maximo local con una u nica raz fsica en u = 1 que corresponde a peonza vertical sin nutaci on. Finalmente,
en (c) hay dos races fsicas donde una de ellas corresponde a u = 1, esto describe una peonza inicialmente
vertical con nutaci
on.

En vista de lo anterior, resulta de interes saber que condiciones iniciales conducen a una precesi on verdade-
ramente regular. En tal caso permanece constante con su valor inicial 0 , lo cual significa que 1 = 2 = 0 .
Esto implica que f (u) debe tener una degeneraci on simple en las races que yacen en el intervalo [1, 1] i.e.
u1 = u2 = u0 (ver Fig. 13.7b). Recordando que en este caso f (u) era no positivo en todo el intervalo [1, 1],
la u
nica manera de obtener una sola raz (o m as bien dos races degeneradas) en el interior de tal intervalo es
considerar el caso en el cual f (u) posee un m aximo local en la raz, como se aprecia en la Fig. 13.7b, es decir

df
f (u0 ) = u 20 =0 ; =0 (13.95)
du u=u0

13.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 333

a partir de (13.74) la primera de las condiciones en (13.95) con u 0 = 0 conduce a

(b au0 )2
( u0 ) = (13.96)
1 u20

utilizando (13.74), la segunda de las condiciones en (13.95) se traduce en



df (u) 2

= 1 u () 2u0 ( u0 ) 2 (b au0 ) (a) = 0
du u0
0


1 u20 = 2u0 ( u0 ) + 2a (b au0 )
a (b au0 ) ( u0 )
= 2 u0 (13.97)
2 1 u0 1 u20
sustituyendo (13.96) en (13.97) y teniendo en cuenta (13.69), se llega a una ecuaci atica para
on cuadr

a (b au0 ) 1 (b au0 )2
= u0
2 1 u20 1 u20 1 u20
 
(b au0 ) b au0 2
= a u0
2 sin2 0 sin2 0


= a 2 cos 0 (13.98)
2
y teniendo en cuenta las definiciones de (13.73) para y a podemos escribir estos terminos en dos formas
alternativas, dependiendo de si a se expresa en terminos de 3 o de los valores constantes de y (ver Ecs.
13.73 y 13.65)
I3   I
3 2M gl
a= + cos = 3 ; = (13.99)
I1 I1 I1
reemplazando (13.99) en (13.98) usando las dos formas de a

M gl I3
= 3 2 cos 0
I1 I1
M gl I3  
= + cos 0 2 cos 0
I1 I1
donde hemos tenido en cuenta que = 0 para todo tiempo. Estas ecuaciones se pueden escribir como
 
M gl = I3 3 I1 cos 0
h i
M gl = I3 (I1 I3 ) cos 0 (13.100)

las condiciones iniciales para el problema de la peonza pesada simetrica con punto fijo, requieren la especifica-
ci y
on de , , , , o 3 en el tiempo t = 0. Dado que las variables y son cclicas sus valores iniciales
no son muy relevantes, y en general podemos elegir cualquier valor que deseemos para cada una de las otras
cuatro constantes. Pero si hacemos la exigencia adicional de que el eje de figura precese uniformemente sin
nutacion, nuestra escogencia de estas cuatro condiciones iniciales ya no es completamente libre, ya que debe
satisfacer cualquiera de las Ecs. (13.100), que en general nos dan una relaci on entre 0 , 0 y 0 o entre 0 , 0
y 3 . Para = 0 podemos a un elegir valores iniciales de y 3 casi arbitrariamente, pero el valor de queda
entonces determinado a traves de la Ec. (13.69). La frase casi arbitrariamente, se refiere a que al ser las Ecs.
(13.100) cuadr aticas, y teniendo en cuenta que debe ser real, entonces el discriminante de (13.100) debe ser
positivo
I32 32 > 4M glI1 cos 0 (13.101)
334 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

para 0 > /2 es decir cuando el centro de masa puede estar por debajo del punto fijo, el miembro derecho
on es negativo, de modo que cualquier valor de 3 puede conducir a precesi
de esta expresi on uniforme. Pero

para 0 < /2, el valor escogido para 3 tiene que ser mayor a un valor mnimo 3 que se obtiene igualando
los miembros en (13.101)
2p
3 > 3 = M glI1 cos 0 (13.102)
I3
para lograr la precesion uniforme. Condiciones similares se pueden obtener a partir de la segunda de las
Ecs. (13.100) para los valores permitidos de . Como un resultado de la naturaleza cuadr atica de (13.100),
habr
a en general dos soluciones para conocidas como precesi on rapida y lenta. N otese tambien que las
Ecs. (13.100) no se pueden satisfacer con (0) = 0 para valores finitos de o de 3 ; para obtener precesion
uniforme, debemos darle siempre al cuerpo rgido un impulso a la peonza que la ponga en tal situacion. Sin esta
velocidad precesional adecuadamente generada, podemos en el mejor de los casos obtener solo una precesi on
pseudoregular. Esto es logico ya que sin un torque adicional no es posible generar la precesi on sin una cada
previa del centro de masa (que generara la nutacion), como ya vimos anteriormente.
on es lenta, podemos despreciar a cos 0 comparado con a de la Ec.
En el caso en el cual la precesi
(13.98) vemos entonces que una soluci on aproximada para viene dada por
M gl

= = precesion lenta
2a I3 3
expresion que coincide con la correspondiente para el promedio de la precesi on pseudoregular de una peonza
r
apida Ec. (13.94). Este resultado es l
ogico ya que si la precesi
on es lenta no hay mucha diferencia entre aplicar
un ligero impulso al giroscopo, o no imprimirle impulso en lo absoluto. Se puede ver que con este valor de ,
despreciar a cos 0 con respecto a a es equivalente a requerir que 3 tenga un valor mucho mayor a su
cota inferior permitida. Para estos valores grandes de 3 existe un lmite de precesi on r
apida (no confundir
con el lmite de peonza r on), que se obtiene cuando
apida cuyo lmite se refiere al spinning y no a la precesi
es grande de tal forma que M gl es peque
no comparado con los otros terminos en las Ecs. (13.100)
I3 3
= precesi
on rapida
I1 cos 0
vemos entonces que la precesion r
apida es independiente de los torques gravitacionales, ya que precisamente
estos se han despreciado. Es natural entonces suponer que dicho lmite est
a m
as relacionado con la precesi
on
libre, dado que no hay mas torques en el sistema.

13.6.5. Peonza inicialmente vertical


En la secci
on 13.6.2 se descarto del analisis la posibilidad de que una de las races de f (u) estuviera en
u = 1. Un lmite interesante es el caso en que u = 1 es una de las races de f (u). Este caso corresponde a
una peonza inicialmente vertical con el centro de masa por encima del origen, y se debe analizar por aparte ya
que en todo el tratamiento que se ha hecho hasta ahora el sin2 0 ha aparecido a menudo en el denominador.
Trabajemos entonces bajo la condici on de que la peonza este inicialmente vertical con una velocidad angular
inicial de spinning 3 . En t = 0 el eje de figura coincide con el eje vertical, y recordando que p (p ) es la
componente total del momento angular alrededor del eje vertical (de figura), se concluye que p = p en t = 0
y en todo tiempo ya que son constantes de movimiento. De las Ecs. (13.65, 13.66) vemos entonces que lo
anterior conduce a que a = b. Por otro lado, dado que la energa cinetica inicial es solo de spinning se obtiene
que
1
E = E I3 32 = M gl
2
de esta expresi
on y las relaciones (13.73) se obtiene que = . Con estas condiciones, la Ec. (13.74) queda en
la forma

f (u) = u 2 = 1 u2 (1 u) a2 (1 u)2
f (u) = u 2 = (1 u) (1 + u) (1 u) a2 (1 u)2
 
f (u) = u 2 = (1 u)2 (1 + u) a2

13.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 335

lo cual nos indica que u = 1 es una raz doble siempre que sea raz de f (u), donde la tercera raz viene dada
por
a2
u3 = 1 (13.103)

si a2 / > 2, lo cual se cumple por ejemplo en el lmite de peonza r apida, se tiene que u3 > 1, de modo que
solo la raz u = 1 corresponde a una situacion fsica. Esto significa que la peonza continua con su eje de figura
vertical, con energa cinetica de spinning u
nicamente. En tal caso la raz degenerada u = 1 corresponde a un
maximo local de f (u) con la tercera raz en algun punto fuera del intervalo [1, 1], como se ve en la Fig. 13.7c.
Por otro lado, si a2 / < 2 se tiene que la tercera raz es menor que 1, tomaremos solo el caso en que u3 est a en
el intervalo (0, 1). En este escenario, la raz u = 1 corresponde a un mnimo local y f (u) se comporta como
muestra la Fig. 13.7d, la peonza nutar a entre 0 y 3 que ser an los puntos de retorno en . Estas desigualdades
2
muestran en consecuencia que existe un valor crtico a / = 2 que define la transici on entre un movimiento
perfectamente vertical y uno con nutaci on y precesi on26 . Aplicando (13.86), este valor lmite nos da
 
a2 I3 I3 2
= =2
I1 2M gl

la u
nica variable que se puede modular en este termino (para una peonza dada) es la velocidad angular. Por
tanto, existe una velocidad angular crtica por encima de la cual solo el movimiento vertical es posible.
M glI1
2 = 4 (13.104)
I32

expresi
on que es identica al valor expresado en la Ec. (13.102) de la frecuencia mnima para precesi on constante,
y que ahora se aplica para 0 = 0.
En la practica, si la peonza gira inicialmente con eje vertical y 3 es superior al valor crtico, ella rotar
a un
tiempo solo sobre el eje vertical (trompo dormido) pero su spinning va disminuyendo por efecto de la fricci on,
cuando 3 pasa el valor crtico, comienza a bambolearse en cantidades cada vez mayores a medida que disminuye
el spinning.

13.6.6. Efectos de fricci


on, torques adicionales y aplicaciones de la peonza sim
etrica
pesada
Los efectos de fricci on (que no se pueden introducir en forma directa en el formalismo Lagrangiano)
producen ciertos fen omenos inesperados. Un ejemplo notable es el tippie-top que consiste basicamente en algo
mas que media esfera con un soporte unido a la parte plana. Cuando se comienza a rotar con la superficie esferica
hacia abajo sobre una superficie dura y lisa, el artefacto comienza a deslizarse y nutar hasta que eventualmente
se gira quedando con la superficie esferica hacia arriba, pivoteando sobre el soporte, comport andose como un
trompo dormido. La inversi on completa del vector momento angular es el resultado del torque friccional que
ocurre cuando el trompo se desliza sobre su superficie esferica.
Hay una amplia gama de aplicaciones concernientes al uso de peonzas r apidas. Una de ellas es el gir
oscopo
que consiste en una peonza simetrica que se monta sobre un soporte que permite la reorientaci on del eje de
figura en cualquier direccion, el eje de figura gira muy rapidamente debido a la aplicacion de ciertos torques
externos. El centro de masa se hace coincidir con el punto fijo a traves de alg un contrapeso colocado al otro
extremo de la peonza. Una vez se libera el eje de figura con una gran velocidad angular, se observa que la
direccion del eje de figura permanece constante (medida por un observador inercial, por ejemplo las estrellas
fijas) sin importar como reorientemos el montaje, fen omeno conocido como inercia girosc opica, el cual se debe a
la ausencia de torques netos externos. En particular, si el montaje se deja por seis horas (asumiendo muy bajo
amortiguamiento) se puede observar una rotaci on del eje de figura de /2 que en realidad se debe justamente
26
Vemos que cuando u = 1 es una raz, es posible que las tres races de f (u) sean todas fsicas, aunque solo hay a lo m as dos
races fsicas diferentes. Es tambien posible que las tres races sean degeneradas. Estas caractersticas difieren del an
alisis realizado
en la secci on 13.6.2, cuando descart abamos la posibilidad de que u = 1 fueran races de f (u).
336 CAPITULO 13. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO

a que el eje de figura permanece constante en direcci on respecto a un sistema inercial, en tanto que la tierra
ha tenido una rotaci on de /2. Esta caracterstica hace del gir
oscopo un excelente instrumento para mantener
direcciones especficas, por ejemplo para proveer plataformas estables.
Si se le aplican torques externos adecuados al giroscopo, puede generar precesi on y nutaci
on. En la mayora
de ocasiones se puede utilizar el lmite de peonza r apida para estos dispositivos y como vimos antes, en
la practica la nutacion se atenua r apidamente por efectos de fricci on y pronto se vuelve inobservable. En
realidad, en muchos gir oscopos el montaje se realiza para atenuar deliberadamente el efecto de nutaci on. En
tal caso, el estado estacionario del sistema solo presenta precesi
on, lo cual simplifica fuertemente el tratamiento
matem atico. Podemos entonces generalizar el tratamiento hecho para la peonza simetrica de una manera simple.
Si R es el radio vector que va desde el punto fijo hasta el centro de masa a lo largo del eje de figura, el
torque gravitacional que se ejerce sobre la peonza viene dado por

N = R Mg (13.105)

donde g define al campo gravitacional uniforme en la vecindad de la superficie terrestre. Definamos L3 como
la componente del momento angular de la peonza a lo largo del eje de figura, el cual describe el momento
angular de espn del s
olido, y definamos p como el vector de precesi
on, el cual est
a alineado con el eje vertical
y posee magnitud igual a la velocidad angular promedio de precesi
on dada aproximadamente por (13.94).
De las definiciones es claro que

p u3 ; L3 I3 3 u3

y aplicando (13.94), podemos calcular |p L3 |


 
M gl
|p L3 | = |L3 | sin = (I3 3 ) sin = |M g| |R| sin = |R M g|
I3 3

La direcci
on de la precesi a dada por u u3 u3 que es la direcci
on pseudoregular est on de la lnea de nodos.
Por tanto, p L3 esta dado por

p L3 = |p L3 | u3 u3 = |R M g| u

pero recordando que la direcci


on de la lnea de nodos u es tambien la direcci
on del torque, nos queda finalmente

p L3 = N (13.106)

Puesto que el torque alrededor del punto fijo o del centro de masa se puede colocar en la forma R F, en
forma similar a (13.105), la rata de precesion promedio para una peonza r apida se puede derivar siempre de
(13.106), donde la direcci on de la fuerza F define al eje de precesi on. Casi todas las aplicaciones pr acticas de
los gir
oscopos involucran el comportamiento del equilibrio (despreciando transientes) que se puede derivar de
(13.106).
En virtud de la ecuaci on (13.106) se puede ver que un gir oscopo originalmente libre de torques puede servir
para medir ratas de rotaci on angular y torques aplicados por medio del fen omeno de precesi on. Pues dicha
ecuacion nos dice que la rata de precesi on es proporcional al torque, en contraste con el caso de un cuerpo sin
rotacion de espn en el cual es la aceleracion angular la que es proporcional al torque. Una vez que el torque se
remueve, el cuerpo que no tiene espn contin ua moviendose; bajo condiciones similares el gir oscopo contin ua
con su espn sin precesar.
El caso del girocomp as es m as complejo, ya que en este caso lo que se pretende es mantener el objeto con
direccion fija con respecto a un sistema de referencia no inercial (la tierra). Para ello se le adiciona al dispositivo
una precesi on aplicada a una rata tal que contrarrestre la rata de rotaci on terrestre. Una vez ajustado en la
direccion de rotacion de la tierra i.e. la direcci
on norte, el girocompas preserva esta direcci on, por lo menos en
vehculos que se muevan lentamente.
Dos ejemplos interesantes como fen omenos en s y para la aplicaci
on de las tecnicas aqu descritas, son: la
precesion de los equinoccios, y la precesi on del movimiento de cargas en un campo magnetico.
13.7. EJERCICIOS 337

13.7. Ejercicios
1. Sea un s
olido de revoluci
on como el de la Fig. 3.2, P
ag. 51, con densidad constante. Demuestre que los
momentos de inercia con respecto a los ejes X e Y vienen dados por (ver problema 4 p ag 52, y Ref. [7])
Z Z xf
xf 4 IX
IX = f (x) dx ; IY = + x2 f (x)2 dx
2 x0 2 x0
Captulo 14

Oscilaciones

Un tipo de sistema clasico de muy amplia utilidad en diversas ramas de la Fsica es aquel que consiste de un
conjunto de elementos que oscilan alrededor de sus posiciones de equilibrio. Si la desviaci
on del equilibrio estable
de cada elemento del sistema es suficientemente peque na, entonces el movimiento de este se puede simular
como un conjunto de osciladores arm onicos acoplados. Estudiaremos en este captulo el comportamiento de un
sistema discreto de osciladores. Las tecnicas matematicas a emplear ser
an muy similares a las que se usan para
estudiar la mecanica del cuerpo rgido, aunque los sistemas mec anicos considerados aqu, no necesariamente
deben involucrar cuerpos rgidos.

14.1. Peque
nas oscilaciones y equilibrio estable
Consideraremos sistemas conservativos en donde la energa potencial solo es funci on de la posici
on. Adi-
cionalmente, asumiremos que las ecuaciones de transformaci on que definen a las coordenadas generalizadas
del sistema q1 , . . . , qn no dependen explcitamente del tiempo. En consecuencia, se excluye la posibilidad de
ligaduras dependientes del tiempo explcitamente. Decimos que el sistema est a en equilibrio cuando cada una
de las fuerzas generalizadas asociadas a las coordenadas qi se anulan
 
V
Qi = =0
qi 0

la energa potencial posee por lo tanto un extremo en la configuraci on de equilibrio del sistema, que describimos
por q01 , . . . , q0n . Si el sistema est
a inicialmente en equilibrio con velocidades generalizadas nulas i.e. qi (0) = 0,
el sistema continuar a indefinidamente en el equilibrio.
Intuitivamente tenemos la idea de lo que es el equilibrio estable e inestable. Por ejemplo, un l apiz que se
suspende verticalmente con su punta como punto de apoyo, abandona f acilmente su configuraci on de equilibrio
ante la mas mnima perturbaci on. En cambio un pendulo simple vertical no tiende a alejarse de su posici on de
equilibrio cuando ejercemos una peque na perturbacion, mas bien el sistema oscila ligeramente alrededor del
equilibrio gracias a la presencia de fuerzas restauradoras que apuntan siempre hacia el punto de equilibrio.
Clasificamos como posici on de equilibrio estable a aquella en la cual una peque na perturbacion del sistema
resulta solo en un movimiento acotado en cierta regi on alrededor del equilibrio, con la condici
on adicional de que
esta region de oscilaci on se puede hacer arbitrariamente peque na modulando adecuadamente la perturbaci on1 .
El equilibrio se dice inestable si una perturbaci on arbitrariamente peque na se traduce en movimiento acotado
en una regi on finita o en movimiento no acotado. Vemos pues que el pendulo vertical y el l apiz descritos arriba
est
an en equilibrio estable e inestable respectivamente de acuerdo con esta definici on.
Podemos ver que si el extremo en el potencial es un mnimo local entonces el equilibrio tiene que ser estable.
Para demostrarlo tendremos en cuenta que en cierta vecindad alrededor del punto de equilibrio, el potencial
1
El equilibrio inestable tambien puede producir movimiento acotado como se ve en la Fig. ???. Sin embargo, vemos que el
intervalo permitido mnimo para el movimiento, no se puede hacer arbitrariamente peque no, incluso si la perturbaci
on se hace
arbitrariamente peque na.

338

14.1. PEQUENAS OSCILACIONES Y EQUILIBRIO ESTABLE 339

se incrementa en cualquier direccion. Supongamos que el sistema tiene inicialmente la energa total V (q0i ) i.e.
est
a en reposo en la configuraci
on de equilibrio. Cuando hacemos un incremento de energa E (perturbaci on)
el sistema adquiere energa cinetica cuyo valor en t = 0 es justamente E, como en cualquier direcci on
la energa potencial aumenta, entonces la energa cinetica debe disminuir, podemos hacer un incremento de
energa (perturbaci
on) suficientemente peque no para que

E Vmax V (q0i ) (14.1)

donde Vmax es el m aximo valor que toma el potencial dentro de la regi on alrededor del equilibrio en la cual el
potencial aumenta en todas direcciones (denotamos a esta regi on por Rmax ). Si se cumple la condici
on (14.1)
entonces existe un valor del potencial Vc dentro de la regi on en cuestion para la cual E = Vc V (q0i ).
El conjunto de puntos en donde V (q0i ) V Vc define una regi on que denotamos por Rc , y claramente
Rc Rmax . En los puntos de Rc en donde E = Vc V (q0i ) la energa cinetica es cero (punto de retorno) y
solo puede volver a aumentar si el sistema se mueve hacia donde disminuye el potencial. Esto impide al sistema
salir de la region Rc ya que en los puntos inmediatamente fuera de tal regi on el potencial es superior al de
cualquier punto en Rc . Finalmente para una funci on bien comportada, la region Rc disminuye arbitrariamente
a medida que disminumos a E.
En un m aximo local, ocurre que en general la energa cinetica aumenta a medida que nos alejamos del
equilibrio dado que el potencial disminuye en cualquier direcci on. Cuando hay un m aximo local de una funci
on
bien comportada existe una regi on finita en la cual el potencial decrece mon otonamente y se puede ver que
dentro de esta regi on no hay puntos de retorno. En consecuencia si E > 0, el sistema se mueve mnimo
en esta regi on finita accesible a
un cuando la perturbaci on sea arbitrariamente peque na. Gr
aficamente, estas
caractersticas son faciles de visualizar para sistemas unidimensionales como se puede apreciar en la figura
????.
Estaremos interesados en el movimiento del sistema dentro de una peque na region alrededor de un punto
de equilibrio estable. Dado que las desviaciones del equilibrio son peque nas, podemos hacer una expansi on de
Taylor para las funciones involucradas alrededor del punto de equilibrio y retener solo los terminos de m as
bajo orden. Denotaremos las desviaciones de las coordenadas generalizadas por i

qi = q0i + i (14.2)

estas se tomaran como las nuevas coordenadas generalizadas del movimiento. Una expansi on de Taylor del
potencial alrededor del punto de equilibrio nos da
   2 
V 1 V
V (q1 , . . . , qn ) = V (q01 , . . . , q0n ) + i + i j + . . . (14.3)
qi 0 2 qi qj 0

se ha usado convenci on de suma sobre ndices repetidos. Los terminos lineales en i se anulan debido a la
condici
on de equilibrio (14.1). El primer termino es una constante que se puede remover redefiniendo el cero
de potencial. Por tanto, nos quedamos solo con los terminos cuadr aticos en i como primera aproximaci
on a
V.  2 
1 V
V (q1 , . . . , qn ) = Vij i j + . . . ; Vij (14.4)
2 qi qj 0
Los coeficientes Vij son constantes que dependen de los valores de las qi en el punto de equilibrio. De la
definici
on es claro que los Vij son simetricos i.e. Vij = Vji . Es posible que bajo diversas circunstancias, algunos
de estos coeficientes se anulen, por ejemplo, si el potencial es independiente de una coordenada qk el equilibrio
ocurrira para un valor arbitrario de esta coordenada y hablaremos de equilibrio neutro o indiferente con respecto
a dicha coordenada. Tambien puede ocurrir que el potencial se comporte como cuadr atico (sin algunos terminos
cruzados) en tal punto, de modo que uno o m as de los Vij ser
an nulos. Cualquiera de estos casos debe ser
tratado por aparte con respecto a la formulaci on que desarrollaremos.
Una expansi on en serie es tambien posible para la energa cinetica. Como las transformaciones a las qi no
dependen explcitamente del tiempo (y por lo tanto, tampoco las transformaciones a las i ) la energa cinetica
340 CAPITULO 14. OSCILACIONES

resulta ser una funci


on homogenea de grado dos en las velocidades como se puede verificar a partir de (2.24)
1 1
T = mij qi qj = mij i j (14.5)
2 2
los coeficientes mij son en general funciones de las coordenadas que por tanto tambien pueden ser expandidos
alrededor de la configuracion de equilibrio.
 
mij
mij (q1 , . . . , qn ) = mij (q01 , . . . , q0n ) + k + . . . (14.6)
qk 0

pero dado que la ecuacion (14.5) ya es cuadr


atica en los i , el termino m
as bajo que no se anula en T se obtiene
del primer termino en la expansion (14.6) definimos entonces

Tij mij (q01 , . . . , q0n ) (14.7)

y escribimos la energa cinetica a orden cuadr


atico como
1
T = Tij i j (14.8)
2
es claro que tambien los coeficientes Tij siempre se pueden hacer simetricos, ya que la expresi
on total no se
afecta con un intercambio de ndices. El Lagrangiano se obtiene entonces a partir de las Ecs. (14.4) y (14.8)
1
L= (Tij i j Vij i j ) (14.9)
2
tomando las s como coordenadas generalizadas, podemos construr las ecuaciones de Lagrange
L Tij i Tij j Tij Tij
= j + i = ik j + jk i
k 2 k 2 k 2 2
L Tkj Tik Tki Tki
= j + i = i + i
k 2 2 2 2
donde hemos usado la simetra de los Tij y el hecho de que los ndices de suma son mudos, tenemos entonces
que  
L d L
= Tki i = Tki i
k dt k
similarmente, usando la simetra de las Vij
 
L Vij i j Vij
= j + i = (ik j + jk i )
k 2 k k 2
Vkj Vik
= j i = Vki i
2 2
las ecuaciones de Lagrange quedan
Tki i + Vki i = 0 (14.10)
cada una de las Ecs. (14.10) involucra en general a todos los i y forman un conjunto acoplado de ecuaciones
diferenciales simult
aneas que debemos resolver para describir el movimiento del sistema alrededor del equilibrio.
En la mayora de aplicaciones, la energa cinetica se puede escribir de modo que no posea productos
cruzados, con lo cual el Lagrangiano (14.9) se escribe como
1 
L= Ti i2 Vij i j (14.11)
2
y las ecuaciones de movimiento (14.10) quedan

Tk k + Vki i = 0 (no suma sobre k) (14.12)


DE LAS ECUACIONES DE MOVIMIENTO COMO PROBLEMA DE VALORES PROPIOS341
14.2. SOLUCION

14.2. Soluci
on de las ecuaciones de movimiento como problema de valores
propios
Las Ecs. (14.10) son ecuaciones diferenciales lineales con coeficientes constantes. Como se trata de osci-
ladores acoplados es natural usar una funci
on de ensayo de naturaleza arm onica, por lo cual realizaremos el
siguiente ansatz
i = Cai eit (14.13)

donde Cai es una amplitud compleja de la oscilaci


on para cada coordenada i , el factor C es un factor de escala
que se introduce por conveniencia y que es igual para todas las coordenadas. Por supuesto se sobreentiende
que es la parte real de (14.13) la que corresponde a la soluci
on fsica del problema. Sustituyendo (14.13) en
(14.10) se obtiene

C 2 ai Tki eit + Cai Vki eit = 0


Vki ai 2 Tki ai = 0 (14.14)

El sistema (14.14), consiste en un conjunto de n ecuaciones homogeneas para las ai , y por tanto solo tendran
soluci
on no trivial si el determinante de los coeficientes se anula

V11 2 T11 V12 2 T12 V13 2 T13

V21 2 T21 V22 2 T22 V23 2 T23

V31 2 T31 V32 2 T32 V33 2 T33 = 0 (14.15)

.. .. .. ..
. . . .

esta condicion secular, que consiste en encontrar las n races i2 del polinomio caracterstico, nos provee de
on de (14.10). Para cada valor de 2 las Ecs.
los valores de las frecuencias para los cuales (14.13) es soluci
(14.14) pueden ser resueltas para las amplitudes ai o m as exactamente para los cocientes de n 1 amplitudes
con la amplitud restante.
Matricialmente podemos reescribir las Ecs. (14.14) sustituyendo 2 en la forma

Va = Ta (14.16)

que coincide con la ecuaci on de valores propios modificada que se estudi o en la secci
on 11.11 como se puede
2
ver de la Ec. (11.91) . Tenemos adem as que tanto T como V son matrices simetricas y reales. Por otro lado,
la energa cinetica dada por (14.8) se puede reescribir en forma matricial

1
T = eT

2
pero la energa cinetica es positiva y solo es cero cuando todas las velocidades son cero, esto nos lleva a conclur
que T es una matriz definida positiva ya que un termino de la forma zTz corresponde a dos veces la energa
cinetica cuando z se interpreta como un vector de velocidades . Finalmente, la condicion de que el potencial
se este evaluando en un mnimo local nos lleva a la condici on

i Vij j 0 V 0

de modo que la matriz V es positiva. Como consecuencia se cumplen todas las hip otesis establecidas en la
secci
on 11.11 es decir tenemos una ecuaci on de valores propios modificada de la forma (14.16) donde T y V
son matrices reales y simetricas, siendo T definida positiva y V positiva. En dicha seccion se concluyo que
bajo estas hip
otesis
2
Similarmente, (14.15), corresponde a la ecuaci
on secular modificada (11.108).
342 CAPITULO 14. OSCILACIONES

1. Los valores propios son reales no negativos: en este contexto, significa que 2 es positivo y por lo tanto
las frecuencias son reales. De la Ec. (11.100) se puede ver claramente que si V no fuera positiva (i.e.
no estuvieramos en un mnimo local del potencial) entonces es posible que sea negativo y por lo tanto
sera imaginario. Por otro lado, se puede ver que introducir un imaginario en el ansatz (14.13)
producira movimiento no acotado en i con el tiempo. Este movimiento sera obviamente inestable con
lo cual se ve desde otro punto de vista, que la estabilidad requiere un mnimo de potencial.
2. Las componentes de los autovectores a son reales, excepto por una posible fase global: En nuestro
contexto, vemos que una fase compleja en la amplitud se puede absorber en el factor C de la Ec. (14.13),
de modo que la posibilidad de a complejo resulta a
un mas irrelevante.
3. Los autovectores a correspondientes a valores propios diferentes son ortogonales bajo la metrica definida
por T. En este caso, si interpretamos a z como un vector cuyas componentes son velocidades generalizadas
podemos decir que la norma al cuadrado inducida para z viene dada por dos veces la energa cinetica

= 2T = kzk2
zTz T

kzk = 2T

la ortogonalidad con la metrica T est


a definida por la propiedad (11.102). Si queremos normalizar los
vectores propios debemos imponer una condici on de normalizaci
on de la forma (11.103), recordando que
ambas ecuaciones se sintetizan en la Ec. (11.104)
e
ATA =1 (14.17)

siendo A la matriz de vectores propios ortonormales bajo la metrica T.


4. La matriz de autovectores ortonormales A diagonaliza tanto a T como a V a traves de una transformaci
on
de congruencia. T se diagonaliza a la identidad Ec. (14.17) y V se diagonaliza a una matriz diagonal en
donde los valores propios yacen en la diagonal.

AVA = ; diag 12 , 22 , ..., n2

retomando la Ec. (11.100) en nuestro contexto tenemos que



e
a(k) Va(k) 2V a(k)
k2 = = 
e
a(k) Ta(k) 2T a(k)
el denominador es dos veces la energa cinetica con velocidades generalizadas ai(k) , en tanto que el
numerador es dos veces la energa potencial asociada a coordenadas ai(k) . Insistimos nuevamente en que
la positividad del numerador esta asociada con el hecho de que la energa potencial est
a evaluada en un
mnimo local.

Finalmente recordemos que la transformaci on de congruencia que diagonaliza a T y V se puede interpretar


como el paso desde un sistema de ejes inclinados no cartesianos a un conjunto de ejes principales cartesianos.
El proceso total de obtenci
on de las frecuencias fundamentales de peque nas oscilaciones es un tipo particular
de transformaciones a ejes principales (que diagonaliza a V) que tambien involucran una transformaci on del
3
tensor metrico (desde T hasta la identidad que es el tensor metrico cartesiano ).

14.2.1. Un ejemplo con dos grados de libertad


A manera de ejemplo, pensemos en una partcula de masa m con dos grados de libertad (x1 , x2 ) para la
cual el Lagrangiano viene dado por (14.9)
1  1
L= m x 21 + x 22 Vij xi xj
2 2
3
Estrictamente hay que definir xi = xi mi para que el tensor metrico (tensor cinetico) sea de la forma Tij = ij .
DE LAS ECUACIONES DE MOVIMIENTO COMO PROBLEMA DE VALORES PROPIOS343
14.2. SOLUCION

donde las Vij son constantes. Como las coordenadas son cartesianas podemos normalizar al tensor T como
Tij = ij . De modo que la ecuaci on de valores propios modificada (11.91), se convierte en la ecuacion de
valores propios ordinaria Ec. (11.39). La transformacion de congruencia (11.107) tiene soluciones solo cuando
se satisface la relaci
on (11.109), que en dos dimensiones se escribe

V11 V12
=0
V21 V22
que resulta en una ecuaci
on cuadratica para con soluciones
 q 
1 2
1,2 = V11 + V22 (V11 V22 ) + 4V12 V21 (14.18)
2
asociado a los valores propios i hay asociados vectores propios a(i) . Denotamos la jesima componente del
iesimo vector en la forma aji . El vector propio a(i) se define con
    
V11 V12 a1i a1i
= i
V21 V22 a2i a2i
   
V11 a1i + V12 a2i a1i
= i
V21 a1i + V22 a2i a2i
 
V11 a1i + V12 a2i i a1i
= 0
V21 a1i + V22 a2i i a2i
para i = 1 queda
V11 a11 + V12 a21 1 a11 = 0 (14.19)
V21 a11 + V22 a21 1 a21 = 0 (14.20)
similarmente se pueden escribir las expresiones para i = 2
V11 a12 + V12 a22 2 a12 = 0 (14.21)
V21 a12 + V22 a22 2 a22 = 0 (14.22)
solo una del par de ecuaciones para cada i es linealmente independiente, tomemos las Ecs. (14.19) y (14.22) y
asumiendo suma sobre j pero no sobre i reescribimos estas ecuaciones en la forma
Vij aji i aii = 0 (14.23)
reescribiendo la Ec. (14.23) y usando la condici on de los autovectores4 escribimos
on de normalizaci
aji (Vij i ij ) = 0 ; a21i + a22i = 1 ; i = 1, 2 ; suma sobre j no sobre i (14.24)
consideremos dos casos lmites
Primer caso: Asumimos V11 > V22 > 0 y 0 6= V21 = V12 << (V11 V22 ). Con estas condiciones podemos
definir un par
ametro peque no de la forma
V12

(V11 V22 )
escribiendo los autovalores (14.18) en terminos de
s !
1 2
4V12
1,2 = V11 + V22 (V11 V22 ) 1 +
2 (V11 V22 )2
1 p 
1,2 = V11 + V22 (V11 V22 ) 1 + 42
2
1 
1,2
= V11 + V22 (V11 V22 ) 1 + 22
2
4
recordemos que la normalizaci on se hace de acuerdo con la metrica impuesta por T. Pero al ser las cooordenadas cartesianas,
esta se reduce a la metrica Eucldea.
344 CAPITULO 14. OSCILACIONES

1 
1,2
= V11 + V22 (V11 V22 ) 22 (V11 V22 )
2 
1 2 (V11 V22 )
1,2 = V11 + V22 (V11 V22 ) 2 V12
2 V12
 
1 2 1
1,2 = V11 + V22 (V11 V22 ) 2 V12
2
1
1,2 = [V11 + V22 (V11 V22 ) 2V12 ]
2
los valores propios quedan finalmente
1 = V11 + V12 ; 2 = V22 V12 (14.25)
veamos como quedan los autovectores a primer orden en . Para ello reemplacemos (14.25) en la Ec. (14.19)
V11 a11 + V12 a21 (V11 + V12 ) a11 = 0
V12 a21 V12 a11 = 0
a21 = a11 (14.26)
junto con la condici
on de normalizaci
on

a211 + a221 = 1 a211 + (a11 )2 = 1 a211 1 + 2 = 1
s
1 1
a11 = 2 = 1 2 (14.27)
(1 + ) 2
donde hemos tomado la raz positiva, recuerdese que a un con la condici
on de normalizaci
on, hay una am-
big
uedad en el vector propio concerniente al sentido de dicho vector. El vector propio normalizado asociado a
1 se obtiene entonces de (14.27) y (14.26) y se escribe como
   
a11 1 12 2
a(1) = =
a21 12 3
reemplazando (14.25) en (14.22) y con un procedimiento an
alogo se obtiene el vector propio asociado a 2
   
a12 + 12 3
a(2) = =
a22 1 12 2
la matriz asociada a los vectores propios se escribe como
   
a11 a12 1 12 2 + 12 3
A= = (14.28)
a21 a22 12 3 1 12 2
que nos da las relaciones (v
alidas a primer orden en )
a11 = a22 ; a12 = a21 (14.29)
Segundo caso: Examinemos el caso en el cual V12 > V22 > 0 y (V11 V22 ) << V12 = V21 . En este
caso un parametro conveniente es = (V11 V22 ) /8V12 que es una cantida peque
na. A primer orden en los
autovalores y autovectores est
an descritos por
1
1 = (V11 + V22 ) + V12 + (V11 V22 )
2
1
2 = (V11 + V22 ) V12 (V11 V22 )
2
!
1 (1 + 2) 1 (1 2)
A= 2 2 (14.30)
1 (1 2) 1 (1 + 2)
2 2
en este caso tambien se cumplen las relaciones (14.29), aunque los valores numericos difieren fuertemente. En
la primera matriz los valores fuera de la diagonal son de orden en tanto que los diagonales
son de orden 1.
En cambio, los elementos de la matriz en el segundo caso son todos de l orden de 1/ 2.

14.3. PROBLEMA DE VALORES PROPIOS CON DEGENERACION 345

14.3. Problema de valores propios con degeneraci


on
Ya mencionamos que en el caso en el cual existe degeneraci on hay m as grados de libertad disponibles para
crear los vectores propios. Los vectores propios posibles escogidos no es de esperarse que sean ortogonales entre
s. No obstante, siempre es posible construr un conjunto de vectores propios ortogonales entre s, con base
en los vectores previamente elegidos. Estos vectores ortogonales se pueden entonces usar para construr una
matriz ortogonal A.
Vamos a considerar por simplicidad el caso de una doble raz. Sean a(k) y a(l) un cierto par de vectores
propios asociados a una raz doble . Asumiremos que estos vectores ya han sido normalizados seg un (11.103)
i.e. normalizados segun la metrica T. Cualquier combinaci
on lineal entre ak y al tambien ser
a un autovector
correspondiente a la raz . Construmos entonces un vector al en la forma

al = c1 ak + c2 al (14.31)

donde c1 , c2 son constantes elegidas de tal forma que al sea ortogonal a ak . Multiplicando ambos miembros
de (14.31) por Tak y usando las condiciones de ortogonalidad (11.102) y (11.103) se obtiene

al Tak = c1 e
e ak Tak + c2 e
al Tak = 0
al Tak = c1 + c2 e
e al Tak = 0

con lo cual se obtiene el cociente entre las constantes


c1
al Tak l
= e (14.32)
c2

as que al este normalizado seg


requiriendo adem un (11.103), tenemos una condici
on adicional sobre tales cons-
tantes
al Tal = 1 = c21 + c22 + 2c1 c2 l
e (14.33)

las condiciones (14.32) y (14.33) fijan a c1 y c2 en forma casi unvoca5 . Hemos formado entonces el conjunto
ortonormal al y ak = ak . Estos adem as son ortogonales a los otros vectores propios correspondientes a valores
propios diferentes, lo cual ya se ha demostrado. De esta forma ya tenemos un conjunto de n autovectores aj
cuyas componentes pueden formar la matriz A que diagonaliza simult aneamente a T y a V.
Este procedimiento constituye un caso particular del llamado proceso de ortogonalizaci on de Gram-Schmidt.
Cuando tenemos una raz de multiplicidad m, los vectores ortonormalizados se forman por combinaciones linea-
les de una conjunto original de vectores propios linealmente independientes a1 , . . . , am . El conjunto ortonormal
a1 , . . . , am se forma de la siguiente forma: el primero se elige igual a un m ultiplo (normalizado) de a1 ; a2 se
toma como una combinaci
on lineal de a1 y a2 y as sucesivamente. Con este algoritmo, el n umero de constantes
1
a determinar equivale a la suma de los primeros m n umeros i.e. 2 m (m + 1). Las condiciones de normalizaci on
nos dan m condiciones, junto con 12 m (m 1) condiciones de ortogonalidad, de esta forma los vectores quedan
definidos casi unvocamente excepto por sus sentidos pues si se cambia ak por ak el nuevo vector sigue siendo
ortogonal a los otros y normal, esto est a relacionado con el hecho de que las condiciones de normalizaci on son
cuadr aticas e invariantes ante una cambio de signo en todas las componentes de un vector dado. Finalmente,
cabe destacar que este conjunto ortogonal no es en general u nico.
Recordemos adem as que en general la degeneraci on est
a ligada con alguna simetra, por ejemplo en el caso
de matrices 3x3 (como el tensor de inercia), la indeterminaci on en las componentes de los autovectores para
una raz doble indican que todos los vectores en un cierto plano son vectores propios, con lo cual basta elegir
dos vectores perpendiculares en dicho plano para formar ejes principales, y los vectores en A son vectores
normalizados que van a lo largo de tales ejes.
5
Recordemos que el cambio ci ci para ambas constantes tambien satisface ambas ecuaciones, es decir el sentido del vector
queda a
un ambig
uo.
346 CAPITULO 14. OSCILACIONES

14.3.1. Un ejemplo bidimensional con degeneraci


on
Un caso muy simple que ilustra las caracterstica enunciadas para el problema degenerado, consiste en el
ejemplo bidimensional dado en la secci
on (14.2.1). Este ejemplo presenta degeneraci
on cuando la matriz del
potencial cumple las condiciones

V11 = V22 V0 , V12 = 0 1 = 2 = V0

como un paso al lmite podemos analizar el problema de dos formas


a) Tomando el lmite V12 0, para luego tomar el lmite V11 V22 . En este caso los autovectores en
(14.28) quedan de la forma    
1 0
a1 = ; a2 = (14.34)
0 1
b) Tomando el lmite V11 V22 para luego tomar el lmite V12 0, en este caso la Ec. (14.30) nos da los
vectores propios ! !
1 1
b1 = 2 ; b2 = 2 (14.35)
1 1
2 2

cada par de autovectores es combinaci


on lineal del otro i.e.
1 1
b1 = (a1 + a2 ) ; b2 = (a2 a1 )
2 2
n
otese que ambos pares de vectores (14.34) y (14.35) poseen la estructura generica
   
c1 c2
c1 = ; c2 = (14.36)
c2 c1

de modo que los anteriores resultados se generalizan para pares de vectores propios con la estructura (14.36).
Por tanto, los vectores propios est
an determinados por cualquier par de n umeros c1 y c2 que formen la estructura
(14.36) y cumplan la condici on de normalizaci on definida en (11.103). Esto nos muestra que hay un conjunto
infinito de pares de vectores propios normalizados y linealmente independientes en el caso en que hay presencia
de degeneraci on.
Existe otra forma de ver los resultados anteriores. N otese que los autovectores aproximados dados por
(14.28) corresponden al caso en el cual los terminos principales de la energa potencial V11 y V22 , estan sobre
la diagonal en tanto V12 est a en las posiciones fuera de la diagonal. Si tomamos los autovectores de las Ecs.
(14.30) en el lmite 0 y hacemos que los autovectores (14.30) transformen a V seg un la prescripci
on
e
V = AVA, obtenemos el tensor de energa potencial transformado
 1 1

2 (V11 + V22 ) + V12 2 (V11 V 22 )
V = 1 1
2 (V11 V22 ) 2 (V11 + V22 ) V12

en el cual el termino diferencia (V11 V22 ) est


a fuera de la diagonal. En consecuencia, el conjunto de auto-
vectores dados por las Ecs. (14.30) corresponden a la situaci on fsica en la cual el peque
no termino de energa
(V11 V22 ) est
a fuera de la diagonal.

14.4. Frecuencias de vibraci


on libre y coordenadas normales
Hemos visto que con los valores adecuados de las constantes, la expresion (14.13) representa una solucion
consistente para las ecuaciones de movimiento (14.10) asociadas a peque nas oscilaciones. Sin embargo, esta no
es necesariamente la soluci
on mas general del problema ya que no ha tenido en cuenta las condiciones iniciales.
Por otro lado, en virtud de la linealidad de la Ec. (14.10) se observa inmediatamente que una superposici on
de soluciones de tal ecuaci
on es tambien una soluci
on. Combinando este hecho con el teorema matem atico que
LIBRE Y COORDENADAS NORMALES
14.4. FRECUENCIAS DE VIBRACION 347

nos dice que las funciones ein t son completas en un intervalo acotado (teorema de Fourier) podemos deducir
que la soluci
on mas general a las Ecs. (14.10) consiste en una superposici on de soluciones de la forma (14.13).
Por tanto, si el sistema se desva ligeramente del equilibrio es posible que realice oscilaciones alrededor de
cualquiera de las frecuencias permitidas 1 , . . . , n . Por esta raz
on a las soluciones de la ecuaci
on secular se
les conoce usualmente como frecuencias de vibraci on libre o frecuencias de resonancia del sistema.
Escribamos entonces la soluci on general como superposici on de soluciones del tipo (14.13), representada
como una suma sobre el ndice k
i = Ck aik eik t (14.37)
donde Ck es un factor complejo asociado a cada frecuencia de resonancia k . Podra objetarse que para cada
soluci
on k de la ecuaci on secular tanto k como k son frecuencias de resonancia ya que ambas est an
asociadas al mismo vector propio ak pero los factores de escala para cada frecuencia denotados por Ck+ y Ck
podran ser en general diferentes. Con esta argumentacion la soluci on debe escribirse como

i = aik Ck+ eik t + Ck e+ik t (14.38)

recordemos sin embargo que el movimiento fsico est a descrito por la parte real de la soluci
on compleja plan-
teada, y la parte real de cualquiera de las dos ecuaciones (14.37) o (14.38) se puede escribir en la forma

i = fk aik cos (k t + k ) (14.39)

donde las amplitudes fk y fases k se determinan a partir de las condiciones iniciales. Por tanto cualquiera
de las soluciones (14.37, 14.38, 14.39) puede representar al movimiento fsico. Tomaremos entonces la m as
conveniente para nuestros prop ositos Ec. (14.37). N
otese que en la Ec. (14.37), la fase del movimento real k
esta contenida en la fase compleja de Ck , en tanto que la magnitud de Ck estara relacionada con la amplitud
asociada a cada frecuencia k .
Los factores de escala Ck se pueden determinar f acilmente gracias a las propiedades de ortogonalidad de
A. En el tiempo t = 0 la parte real de (14.37) se reduce a

i (0) = aik ReCk (14.40)

donde hemos tenido en cuenta que los elementos de A son reales. Para las velocidades generalizadas i se
obtiene una expresi
on an
aloga. Derivando (14.37) y evaluando la parte real de la soluci
on en t = 0

i = ik Ck aik eik t ; Re i (0) = k aik Re (iCk )


Re i (0) = k aik Re [i (ReCk + i ImCk )]
i (0) = k aik ImCk (14.41)

las 2n ecuaciones (14.40) y (14.41) nos permiten evaluar las n partes reales y n partes imaginarias a partir de
las condiciones iniciales6 . Para resolver (14.40) es m
as conveniente escribir dicha ecuaci
on en notacion matricial

(0) = A ReC
e y usando (11.104) se obtiene la soluci
multiplicando a la izquierda por el factor AT on para ReC
e
ReC = AT (0)
ReCl = ajl Tjk k (0) (14.42)

similarmente, se obtiene para la parte imaginaria de C


1 X
ImCl = ajl Tjk k (0) (14.43)
l
j,k

6
Estrictamente, las Ecs. (14.40) y (14.41) deberan contener i (0) y i (0) a la izquierda de estas expresiones. Sin embargo,
asumimos que las condiciones iniciales son reales y por ello dicha notaci
on no es necesaria.
348 CAPITULO 14. OSCILACIONES

Las Ecs. (14.42) (14.43), permiten calcular directamente los factores complejos (y por tanto las amplitudes y
fases) en terminos de las condiciones iniciales y las matrices A y T.
La solucion para cada coordenada dada por (14.37) es en general una suma de oscilaciones arm onicas
simples en todas las frecuencias k que satisfacen la ecuaci on secular. A menos que todas las frecuencias
sean conmesurables, el conjunto de todas las i no retornan en general a sus valores iniciales en ning un
on de las i no es una funci
instante posterior, esto significa que la configuraci odica simple del tiempo7 .
on peri
No obstante, la condici on de ortogonalidad de A nos permite encontrar a partir de las i un conjunto de
coordenadas generalizadas i que son todas funciones peri odicas en el tiempo. A este conjunto de coordenadas
generalizadas las llamaremos coordenadas normales. Partiendo de (14.37) y multiplicando por a1 ni a ambos
lados
ik t
a1 1
ni i = ani aik Ck e = nk Ck eik t
in t
a1
ni i = Cn e

n
otese que el resultado de la derecha en la u
ltima ecuaci on depende solo de la frecuencia n y de su correspon-
diente factor de escala Cn ; es por tanto natural definir las nuevas coordenadas generalizadas en la forma
in t
a1
ni i n n = Cn e (14.44)

la relaci
on inversa ser
a

amn a1
ni i = amn n mi i = amn n
m = amn n (14.45)

matricialmente se escribe
= A (14.46)
comparando con el procedimiento de la seccion 11.11.1, Ecs. (11.110), (11.111), vemos que las coordenadas i
son precisamente las que diagonalizan la forma cuadr
atica positiva, que en nuestro contexto est
a asociada con
el potencial
1
V = eV (14.47)
2
por tanto podemos tomar el resultado (11.112) para escribir
1e 1
V = = k2 k k (14.48)
2 2
la energa cinetica es una forma cuadr
atica definida positiva que se escribe como
1
T = eT
(14.49)
2

comparando con la Ec. (11.110) vemos que y la coordenada normal asociada es simplemente . Es
decir que en este caso las coordenadas normales asociadas a la matriz definida positiva se obtienen simplemente
derivando temporalmente (14.46)8
= A (14.50)
y la forma cuadratica para la energa ci
netica se obtiene de (11.113)
1 e 1
T = = i i (14.51)
2 2
7
Si las coordenadas generalizadas i son todas funciones peri
odicas simples en el tiempo, esto implicara que la trayectoria en
el espacio de fase es cerrada como vimos en el movimiento peri odico de libraci
on en el captulo de Hamilton Jacobi.
8
Recordemos que en el caso m as general, el conjunto de coordenadas normales asociadas a la matriz positiva es totalmente
independiente del conjunto de coordenadas normales asociadas a la matriz definida positiva, como se aprecia en la secci on 11.11.1.

14.5. VIBRACIONES LIBRES DE UNA MOLECULA
TRIATOMICA 349

Usando (14.48) y (14.51) podemos construir el Lagrangiano y las Ecuaciones de movimiento en coordenadas
normales
1  2 2

L = k k k k (14.52)
2
k + k2 k = 0 (14.53)

las soluciones de (14.53) son inmediatas


k = Ck eik t (14.54)

en concordancia con (14.44). Cada una de estas nuevas coordenadas es entonces una funci on periodica simple
del tiempo que involucra a una sola frecuencia de resonancia.
Cada coordenada normal corresponde a una vibraci on del sistema con una sola frecuencia y estas oscilacio-
nes componentes suelen denominarse modos normales de vibraci on. Todas las partculas en cada modo vibran
9
con la misma frecuencia y la misma fase . Las amplitudes relativas est an dadas por los elementos de matriz
aij . Finalmente, los modos normales se deben superponer para formar la soluci on fsica, cada modo contribuye
con un peso es decir con cierta amplitud relativa y fase contenidos en Ck .
Los armonicos de frecuencias fundamentales est an ausentes en el movimiento completo b asicamente debido
a la estipulaci
on de que la oscilacion del movimiento sea peque na. Podemos entonces representar el potencial
como una forma cuadr atica, la cual es caracterstica del movimiento arm onico simple. La transformaci on a
coordenadas normales enfatiza este hecho puesto que el Lagrangiano en tales coordenadas se puede escribir
como la suma de lagrangianos desacoplados correspondientes a osciladores arm onicos de frecuencias k (ver
Ec. 14.52). Por lo tanto, podemos considerar que el movimiento completo para peque nas oscilaciones se puede
obtener excitando los osciladores arm onicos con diferentes intensidades y fases. Este punto de vista es muy
u
til en mecanica cu antica, por ejemplo para la cuantizaci on del campo electromagnetico. Las frecuencias de
los osciladores arm onicos se identifican con las frecuencias de los fotones y las amplitudes de excitaci on se
convierten en los numeros de ocupaci on discretos y cuantizados, i.e. el n
umero de fotones para cada frecuencia.
Caso similar se presenta en el estudio de otras excitaciones colectivas que se pueden desacoplar en sumas de
osciladores arm onicos tales como las redes de fonones y magnones en la Fsica del estado s olido.

14.5. Vibraciones libres de una mol


ecula triat
omica
Ilustraremos la obtencion de los modos normales de oscilaci on considerando el caso de una molecula
triat
omica lineal, la cual en estado de equilibrio consiste de dos masas m en los extremos y una masa M
en el centro, la distancia entre cada masa m y la masa M se denota por b. Todos los atomos estan en lnea
recta como lo indica la figura ????. Por simplicidad asumiremos que solo hay vibraciones longitudinales y el
potencial interat
omico se aproximar a a aquel equivalente a dos resortes acoplados identicos que unen a la masa
M con las dos masas m. Esta aproximaci on est
a justificada siempre que haya peque nas oscilaciones alrededor
del equilibrio. No obstante, este modelo hace implcitamente una aproximaci on adicional, ya que se desprecia
la interacci
on entre las masas m. De acuerdo con la Figura ???, la energa potencial se puede escribir en la
forma
k k
V = (x2 x1 b)2 + (x3 x2 b)2
2 2
introducimos entonces las coordenadas relativas a la posici
on de equilibrio

i = xi x0i

donde claramente se ve que


x02 x01 = b = x03 x02
9
Las partculas pueden estar tambien en total antifase si las a s poseen signos contrarios.
350 CAPITULO 14. OSCILACIONES

La energa potencial en estas coordenadas se escribe como

k k
V = (2 1 )2 + (3 2 )2 (14.55)
2 2
k 2 
V = 1 + 222 + 32 21 2 22 3 (14.56)
2
para construr la matriz asociada a V definimos
1
V i Vij j (14.57)
2
comparando (14.56) con (14.57) y escribiendo los terminos de tal modo que Vij sea simetrico, el tensor V se
escribe de la forma
k k 0
V = k 2k k (14.58)
0 k k
la energa cinetica en estas coordenadas tiene la forma

m 2  M 2
T = 1 + 32 + (14.59)
2 2 2
de modo que el tensor T es diagonal
m 0 0
T= 0 M 0 (14.60)
0 0 m
con base en los tensores (14.58) y (14.60) la ecuaci
on secular queda

k 2m k 0

V T =
2
k 2
2k M k =0

0 k k 2m

ubico caracterstico para 2


que nos da el polinomio c
 
2 k 2 m k (M + 2m) 2 M m = 0

cuyas soluciones son inmediatas


r s  
k k 2m
1 = 0, 2 = , 3 = 1+ (14.61)
m m M

el primer valor propio 1 = 0 puede ser sorprendente e incluso alarmante a priori ya que no correspondera a
un movimiento oscilatorio, sino a la soluci
on de una ecuaci
on de la forma

1 = 0

que describe un movimiento traslacional uniforme a lo largo del eje de la molecula (dado que solo estamos
permitiendo movimiento longitudinal). Pero precisamente hay que tener en cuenta que la traslaci on rgida de la
molecula a lo largo de su eje no produce ning
un cambio en la energa potencial, este es un ejemplo del equilibrio
indiferente que ya hemos comentado. Este modo de frecuencia nula corresponde entonces a una traslaci on rgida
de la molecula, pues no hay fuerza restauradora asociada a este movimiento. Hemos hecho la suposici on de que
la molecula posee tres grados de libertad para el movimiento vibracional, pero en realidad uno de ellos es un
grado de libertad asociado a este movimiento rgido. Otro aspecto interesante de las frecuencias de resonancia
nulas se puede ver a traves de la Ec. (11.100) que un valor nulo de solo se puede obtener si la energa

14.5. VIBRACIONES LIBRES DE UNA MOLECULA
TRIATOMICA 351

potencial es positiva pero no definida positiva (i.e. positiva si y solo si todos los i son cero)10 . La Ec. (14.55),
muestra efectivamente que la condici on necesaria y suficiente para que V sea nulo es que 1 = 2 = 3 , la cual
efectivamente corresponde a traslaci on rgida de la molecula.
Por otro lado, si relajamos la condici on de movimiento longitudinal (que solo nos da un grado de libertad
traslacional) y permitimos vibraciones en todas las tres direcciones el n umero de grados de libertad de traslacion
rgida se incremente a 6 ya que la molecula podr a moverse a lo largo de los tres ejes o realizar rotaciones
uniformes alrededor de tales ejes. Por lo tanto, en un sistema general de n grados de libertad habr a 6 frecuencias
nulas y solo n 6 frecuencias verdaderas de vibraci on.
Adem as de la traslaci
on o rotaci on rgida, existe una condici on adicional bajo la cual ocurren frecuencias
nulas y es el caso en el cual tanto la primera como la segunda derivada del potencial se anulan en la posici on
de equilibrio. En este escenario k = 0 (no hay termino cuadr atico en la expansi
on de Taylor del potencial) y
aun son posibles peque nas oscilaciones si la cuarta derivada es no nula (la tercera debe ser nula para que haya
equilibrio estable). No obstante, en este caso la oscilaci on no ser a de tipo armonico pues el primer termino
no nulo en la expansi on del potencial ser a de orden cu artico, el caso mas simple es un potencial de la forma
V = ax4 con a positivo, siendo x = 0 el punto de equilibrio. Este es un caso de peque nas oscilaciones diferente
a la aproximaci on arm onica usual, pero no se presenta con mucha frecuencia.
De la discusion anterior se ve entonces que las frecuencias nulas de resonancia no tienen ninguna incidencia
en el estudio de los modos vibracionales. Una forma de remover los modos traslacionales (aunque no los
rotacionales) es imponer la condici on de que el centro de masa permanezca estacionario en el origen (para lo
cual uso el sistema de referencia adecuado)

m (x1 + x3 ) + M x2 = 0 (14.62)

esta ecuacion se puede usar para eliminar coordenadas en V y T .


Volvamos ahora al examen de los modos vibracionales reales. La frecuencia de resonancia 2 descrita en
(14.61), se reconoce como la frecuencia de oscilacion de una masa suspendida por un resorte de constante k
atado a un soporte fijo. En consecuencia, es de esperarse que los atomos de los extremos sean los que esten
vibrando en tanto que el atomo del centro esta en reposo con el fin de que sirva como soporte fijo para los
resortes. Solo en el tercer modo de vibraci
on 3 la masa central M participa de la vibracion en el movimiento
oscilatorio. Estas predicciones se pueden verificar encontrando los vectores propios asociados a cada modo de
vibraci
on.
Las componentes aij de la matriz A de los vectores propios se obtiene para cada frecuencia a traves de las
ecuaciones  
k j2 m a1j ka2j = 0
 
ka1j + 2k j2 M a2j ka3j = 0 (14.63)
 
ka2j + k j2 m a3j = 0

que junto con la ecuaci


on de normalizaci
on

m a21j + a23j + M a22j = 1 ; j = 1, 2, 3 (14.64)

determina a los vectores propios excepto por un signo. Con 1 = 0 se obtiene de la primera y tercera de las
Ecs. (14.63) que todos los coeficientes ak1 son iguales. Este hecho junto con la condici
on de normalizaci
on
(14.64) nos fija el valor de ak1
1
a11 = a21 = a31 = (14.65)
2m + M
la igualdad de los ak1 era de esperarse en virtud de la naturaleza traslacional del movimiento asociado.
10
Si la energa potencial fuera definida positiva entonces = 0 solo podra corresponder a la situaci
on trivial de reposo de todas
las partculas en sus posiciones de equilibrio.
352 CAPITULO 14. OSCILACIONES


Para el segundo modo tomando el 2 de (14.61) vemos que k 22 m se anula y las ecuaciones (14.63)
muestran que a22 = 0 como se haba anticipado y a12 = a32 . Nuevamente estas relaciones junto con la
condici
on de normalizaci
on (14.64) nos determinan el segundo vector propio

1 1
a12 = ; a22 = 0 ; a32 = (14.66)
2m 2m

en este modo el atomo central est a en reposo en tanto que los


atomos de los extremos vibran en antifase (o
contrafase), lo cual es necesario para que haya conservaci
on del momento lineal.
Finalmente, para 3 se obtiene que a13 = a33 . Los vectores propios normalizados son
1 2
a13 = a33 = q  ; a23 = q  (14.67)
2m M
2m 1 + M 2M 2 + m

en este tercer modo los


atomos de los extremos vibran con la misma amplitud, y en fase en tanto que el
atomo
central vibra en antifase con respecto a los otros y tiene diferente amplitud. Los tres modos de vibraci on
longitudinal se muestran en la figura ???.
Con base en las Ecs. (14.65, 14.66, 14.67) se construye la matriz A de vectores propios, y usando (14.46)
hallamos las coordenadas normales i
e
= A1 = A
donde hemos usado la condici
on de ortogonalidad de A. Explcitamente las coordenadas normales quedan
1
1 = (m1 + M 2 + m3 )
2m + M
r
m
2 = (1 3 )
2
s
mM
3 = [(1 + 3 ) 22 ]
2 (2m + M )

cualquier vibracion longitudinal de la molecula que no involucre traslaci on rgida ser


a una combinacion lineal
de los modos asociados a 2 y 3 . Las amplitudes de los modos normales, as como las fases relativas, estar an
determinadas por las condiciones iniciales.
Hasta el momento nos hemos limitado al estudio de las vibraciones longitudinales. El caso m as general
en el cual se consideran vibraciones transversales es m as complicado matem aticamente ya que el movimiento
general involucra 9 grados de libertad, por tanto solo haremos un an alisis cualitativo de dicho movimiento.
En primer lugar, el n umero de modos con frecuencia cero nos va a dar los grados de libertad asociados al
movimiento como cuerpo rgido, en consecuencia habr a 6 grados de libertad asociados a tales frecuencias sin
importar el n umero de atomos de la molecula, es decir 3n 6 modos vibracionales para una molecula de n
atomos.

En el caso de una molecula lineal habra tres grados de libertad de traslacion pero solo dos grados de libertad
de rotaci
on rgida, puesto que una rotacion alrededor del eje de la molecula no es relevante y no aparecera como
un modo de rotaci on rgida. Esto implica que tendremos cuatro grados de libertad asociados a la vibraci on:
2 de las vibraciones longitudinales como ya vimos, y otros dos asociados a vibraciones perpendiculares al
eje (transversales). No obstante, la simetra axial de la molecula nos dice que los dos modos vibracionales
transversales deben ser degenerados. No hay nada que distinga a una vibraci on a lo largo de cualquier eje
perpendicular a la lnea de la molecula, por lo cual las frecuencias asociadas deben ser identicas.
La indeterminaci on de los autovectores inherentes a los modos degenerados se refleja en el hecho de que
todas las direcciones perpendiculares al eje de la molecula son equivalentes, cualquier par ortogonal de ejes
que yace en el plano perpendicular a tal eje se pueden escoger como las direcciones de los modos normales
de vibracion. El movimiento transversal depende de las amplitudes y fases de estos modos degenerados. Por
ejemplo, si ambos modos est an presentes y en fase los
atomos se mover an en lnea recta pasando a traves de
14.6. VIBRACIONES FORZADAS Y AMORTIGUADAS 353

la configuraci on de equilibrio. Pero si est an en antifase, el movimiento compuesto producir a una elipse que
corresponde a una figura de Lissajous, tal como ocurre con el oscilador arm onico bidimensional isotr opico.
Esto significa que los dos modos representan una rotaci on mas que una vibraci on.
La simetra tambien nos lleva a que las amplitudes de los
atomos de los extremos sean identicas en magnitud.
El calculo detallado muestra adem as que los
atomos de los extremos viajan en la misma direcci on que las figuras
de Lissajous. Por tanto el atomo del centro viaja en direcci on opuesta con el fin de mantener el centro de masa
en reposo. La figura ??? muestra el movimiento de los atomos en el caso en el.cual los modos degenerados
estan en desfase /2.
Cuando la complejidad de la molecula crece, la complejidad de la ecuaci on secular aumenta significativamen-
te. No obstante, en muchos casos las simetras de la molecula han jugado un papel simplificador fundamental a
traves de la teora de grupos, gracias a la cual es a veces posible factorizar la ecuaci
on secular en bloques m as
peque nos que se pueden diagonalizar por separado para encontrar las amplitudes y las frecuencias normales del
sistema. Estos metodos encuentran importantes aplicaciones en espectroscopa infraroja y en espectroscopa
Raman.

14.6. Vibraciones forzadas y amortiguadas


14.6.1. Vibraciones forzadas
Ocurre con frecuencia que el sistema no se deja oscilar libremente sino que es sometido a alguna fuerza
externa en forma contnua a partir de un cierto tiempo t = 0. Cuando dicha fuerza es tambien de tipo oscilatorio,
el sistema termina vibrando con la frecuencia de la fuerza externa en lugar de su frecuencia natural. No obstante,
las coordenadas normales siguen siendo de gran importancia para la determinaci on de las amplitudes de la
vibracion forzada y contin
ua siendo las coordenadas que desacoplan a las ecuaciones diferenciales como veremos
a continuacion.
Si denotamos por Fj a la fuerza generalizada correspondiente a la coordenada j , tenemos que en virtud
de la Ec. (2.9) la fuerza generalizada Qi asociada a la coordenada normal i se escribe como

Qi = aji Fj (14.68)

en este caso las ecuaciones de movimiento en coordenadas normales se escriben como

i + i2 i = Qi (14.69)

en este caso las n ecuaciones (14.69) son inhomogeneas y para solucionarlas se debe conocer Qi en funci on
de tiempo. Vale recalcar que estas ecuaciones para las coordenadas normales aunque inhomogeneas, siguen
estando desacopladas como ya se haba anticipado.
A menudo la fuerza externa es de tipo senoidal como ocurre por ejemplo si el forzamiento lo da una onda
incidente sobre el sistema (mecanica o electromagnetica), o si el forzamiento lo produce un sistema mec anico
externo que a su vez tambien esta vibrando. En otros casos aunque el forzamiento no sea senoidal, se puede
escribir como una superposicion de componentes senoidales, por ejemplo si el forzamiento es peri odico se puede
escribir como una serie de Fourier y si no es peri
odico una integral de Fourier podra representar el forzamiento.
Teniendo en cuenta que las ecuaciones (14.69) son lineales las soluciones para frecuencias particulares se pueden
superponer para generar la solucion general para Qi dado.
Escribiremos entonces un forzamiento de la forma

Qi = Q0i cos (t + i ) (14.70)

siendo la frecuencia externa de forzamiento, las ecuaciones de movimiento quedan

i + i2 i = Q0i cos (t + i ) (14.71)

de acuerdo con la teora de ecuaciones diferenciales, la soluci


on de (14.71) consta de una soluci
on general de la
ecuaci
on homogenea correspondiente mas una soluci on particular de la inhomogenea. Por medio de una elecci
on
354 CAPITULO 14. OSCILACIONES

apropiada de condiciones iniciales, es posible hacer que las vibraciones libres superpuestas se cancelen11 , por
lo tanto vamos a centrar nuestra atencion en las soluciones particulares de (14.71), teniendo presente que es
de esperarse que el sistema termine oscilando con la frecuencia del forzamiento es natural comenzar con un
ansatz de la forma
i = Bi cos (t + i ) (14.72)
las amplitudes Bi se obtienen sustituyendo este ansatz en (14.71)
Q0i
Bi = (14.73)
i2 2
la soluci
on para las coordenadas j son
aji Q0i cos (t + i )
j = aji i = (14.74)
i2 2
de nuevo, la vibraci on de cada partcula est
a compuesta por una combinaci on lineal de los modos normales,
pero en este caso cada oscilacion normal posee la frecuencia de la fuerza externa.
A partir de (14.74) se puede observar que la excitaci on de cada modo est a determinada por la amplitud
2 2
del forzamiento Q0i y por la diferencia i . Si la fuerza sobre cada partcula no tiene componente en la
direcci
on de vibraci on de algun modo normal particular es obvio que la fuerza generalizada asociada a tal
modo ser a nula i.e. Q0i = 0. En consecuencia, una fuerza externa solo puede excitar un modo normal si tiende
a mover a las partculas en la misma direcci on que el modo dado. Por otro lado, se puede ver que a medida
que disminuye la diferencia i2 2 aumenta el valor de la amplitud del modo asociado, entre m as cerca este la
frecuencia natural de un modo dado a la frecuencia externa, mayor ser a la intensidad de este modo relativo a
los otros. Se puede ver incluso que la ecuacion (14.74) predice una divergencia cuando i = (resonancia). Sin
embargo, hay que tener en cuenta que el formalismo que nos llev o a (14.74) presupone peque nas oscilaciones
alrededor de la configuracion de equilibrio, de modo que cuando la f ormula predice amplitudes grandes ya no
es v
alida. Finalmente podemos ver que cuando i > (i < ) las oscilaciones est an en fase (antifase) con la
fuerza externa, es hay un cambio brusco en la fase relativa entre el sistema y el forzamiento cuando pasamos
por la resonancia.

14.6.2. Vibraciones amortiguadas


En problemas reales de la fsica es muy usual que los sistemas que vibran esten sujetos a fuerzas disipativas
debidas a la interacci
on con sistemas externos. En muchas situaciones, las fuerzas disipativas son proporcionales
a las velocidades de las partculas de tal manera que se pueden generar a traves de una funci on de disipaci
on
de Rayleigh como la discutida en la secci on 2.5. De su definici on Ec. (2.37), debe ser una funci
on homogenea
de segundo grado en la velocidades
1
= ij i j (14.75)
2
los coeficientes ij se pueden definir para que sean simetricos ij = ji , y ser an en general funciones de las
coordenadas. Dado que estamos interesados solo en peque nas oscilaciones alrededor del equilibrio, expandiremos
los coeficientes alrededor del equilibrio reteniendo solo el primer termino de la expansi on de forma analoga al
caso de la energa cinetica T . De aqu en adelante la notacion ij se refiere a esos factores constantes
ij ij (q01 , . . . , q0n ) (14.76)
recordemos que de acuerdo con la Ec. (5.19), 2 representa la rata de disipaci
on de energa debida a las fuerzas
on. Por lo tanto no puede ser nunca negativa. Las ecuaciones de Lagrange en este caso se pueden
de fricci
extraer de (2.38)
Tij j + ij j + Vij j = 0 (14.77)
11
Las vibraciones libres son b
asicamente los transientes generados por la aplicacion de la fuerza externa. Si consideramos que el
sistema est a inicialmente en la configuraci
on de equilibrio y que la fuerza crece desde cero en forma contnua, estos transientes no
aparecen. Alternativamente, las fuerzas disipativas cuando est an presentes amortiguan las oscilaciones libres.
14.6. VIBRACIONES FORZADAS Y AMORTIGUADAS 355

Se puede ver que si queremos encontrar coordenadas normales en donde las ecuaciones (14.77) desacoplen,
es necesario encontrar ejes principales de transformaci
on en los cuales las tres formas cuadraticas T, V y
se diagonalicen simultaneamente. Sin embargo, esto no es posible en el caso m as general y solo se pueden
encontrar coordenadas normales para ciertos tipos de funciones de disipaci on (ver secci
on 11.11.1).
Uno de los casos en los cuales es posible encontrar coordenadas normales es aquel en el cual la fuerza de
on es proporcional tanto a la velocidad de las partculas como a su masa, en tal caso ser
fricci a diagonal
siempre que T sea diagonal. En tal caso la ecuacion en coordenadas normales se escribe como

i + i i + i2 i = 0 (no suma) (14.78)

los i son los coeficientes (no negativos) de la funci on en la base de ejes principales en la cual se
on disipaci
expresa en terminos de i . Siendo un conjunto de ecuaciones diferenciales lineales con coeficientes constantes
podemos establecer un ansatz de soluci on para las Ecs. (14.78) en la forma

i = Ci eii t (14.79)

introduciendo (14.79) en (14.78) resulta una ecuaci atica para i


on cuadr

i2 + ii i i2 = 0 (no suma) (14.80)

cuyas soluciones son de la forma


r
2i i i
i = i2 i i i (14.81)
4 2 2
la soluci
on para las coordenadas normales es entonces de la forma
i
t
i = Ci e 2 eii t (14.82)

vemos entonces que la din amica de las coordenadas normales nos da un factor de amortiguamiento para la
amplitud debido a la componente imaginaria de i , que como era de esperarse es causada por la funci on de
disipacion i.e. por las fuerzas disipativas. Notese que este termino es siempre decreciente ya que i no puede
ser negativo (aunque i puede ser cero si no hay efectos de fricci on en el modo normal correspondiente). Desde
el punto de vista de la energa se ve que cuando las partculas vibran las fuerzas disipativas hacen un trabajo
negativo sobre ellas con lo cual el sistema que vibra pierde energa traduciendose en una disminuci on de la
amplitud con el tiempo. Por otro lado, la Ec. (14.82) muestra que la parte real de i produce un termino
oscilatorio, se ve ademas que la fricci
on tambien afecta las frecuencias de oscilaci
on y que como es de esperarse
a medida que disminuye el efecto de la fricci on, tales frecuencias se acercan a las frecuencias naturales del
sistema. Por otro lado, si 2i > i la cantidad i tambien se vuelve compleja y deja de ser oscilante para
convertirse en otro termino de decaimiento (sobreamortiguamiento); cuando 2i = i la forma de la soluci on
cambia ligeramente pero sigue siendo decayente sin oscilaci on (amortiguamiento crtico), el caso en el cual el
amortiguamiento es peque no y se presenta oscilacion se conoce como subamortiguamiento.
Si la funcion de disipaci
on no puede ser diagonalizada junto con T y V , la soluci on es mucho m as difcil de
obtener debido a la ausencia de desacople en las ecuaciones de movimiento. No obstante, la naturaleza general
de las soluciones es similar: un termino que decae y un termino que oscila (para amortiguamiento peque no).
Aunque no trabajaremos exhaustivamente la soluci on del problema, podemos extraer mucha informaci on cua-
litativa e incluso semicuantitativa a partir de ciertas consideraciones generales
Comencemos con un ansatz de soluci on para (14.77) de la forma

j = Caj eit = Caj et e2it (14.83)

introduciendo este ansatz en (14.77) resulta un conjunto de ecuaciones lineales simult


aneas

Vij aj iij aj 2 Tij aj = 0 (14.84)


356 CAPITULO 14. OSCILACIONES

definimos
i = 2i (14.85)
El conjunto de ecuaciones (14.84) se puede escribir en terminos de los tensores T, y V as como de las
constante en la forma
Va + a + 2 Ta = 0 (14.86)
el conjunto de ecuaciones homogeneas (14.84) o (14.86) se puede resolver para las aj solo para ciertos valores
de o de . Sin embargo, es posible demostrar que tiene que ser no negativo sin necesidad de resolver la
ecuaci
on secular completa. En primer lugar, convertimos la Ec. (14.86) en una ecuaci on escalar multiplicando
a ambos lados por a a la izquierda de tal ecuaci
on

a Va + a a + 2 a Ta = 0 (14.87)

que es una ecuacion cuadr


atica para cuyos coeficientes son productos matriciales con una estructura semejante
a los que aparecen en la Ec. (11.97). Descomponiendo al vector a de la misma forma que en (11.96)

a = + i (14.88)

Y con un an alisis an
alogo al efectuado en la secci
on 14.2, podemos ver que en virtud de la simetra de T, V, y
todos los productos matriciales en (14.87) son reales. En consecuencia si es una solucion de la Ec. (14.87),
a . Ahora bien para una cuadr
tambien lo ser atica

2 b b2 4ac
ax + bx + c ; x1,2 =
2a
b
x1 + x2 =
a
como en este caso nuestras races son y tenemos que

a a
+ = = 2
a Ta
donde tambien se tuvo en cuenta la definici
on de Ec. (14.85). Usando (14.88) podemos expresar de la
forma
1 ij (i j + i j )
=
2 Tkl (k l + k l )
la funci on definida en (14.75) debe ser positiva por tanto la matriz asociada ij debe ser
on de disipaci
positiva, en tanto que la matriz Tkl es definida positiva, por lo tanto no puede ser negativo. Es decir, la
oscilaci
on del sistema puede decrecer exponencialmente pero no puede crecer en el tiempo. Es de anotar que si
ij fuera definida positiva, entonces sera estrictamente positivo y todos los modos normales estaran amorti-
guados. Como antes, las frecuencias de oscilaci on estaran afectadas por el factor de amortiguamiento, aunque
naturalmente estas frecuencias deben tender a las frecuencias libres cuando el factor de amortiguamiento es
muy peque no.

14.6.3. Vibraciones amortiguadas forzadas


Considerando ahora en el cual el sistema que vibra posee una fuerza arm onica externa y fuerzas disipativas
externas, podemos plantear m as f
acilmente las ecuaciones diferenciales usando una extension compleja. Para
ello escribamos la fuerza arm
onica externa en la forma

Fj = F0j eit

donde F0j es complejo de modo que absorbe cualquier fase inicial que pueda existir. Las ecuaciones de movi-
miento quedan en la forma
Vij j + ij j + Tij j = F0i eit (14.89)
14.6. VIBRACIONES FORZADAS Y AMORTIGUADAS 357

coloquemos como soluci


on particular (fase estacionaria) un ansatz de la forma

j = Aj eit

se obtiene el siguiente conjunto de ecuaciones lineales inhomogeneas para las amplitudes Aj



Vij iij 2 Tij Aj = F0i (14.90)

las soluciones de estas ecuaciones se obtienen por regla de Cramer para los determinantes

Dj ()
Aj = (14.91)
D ()

D () es el determinante correspondiente a la versi on homogenea de (14.89), en tanto que Dj () es el determi-


nante que resulta de modificar D () cuando la jesima columna se reemplaza por los terminos inhomogeneos
F01 , . . . , F0n . Para la presente discusi
on no centraremos en las propiedades de D () solamente, ya que las
caractersticas de las resonancias en la amplitud dependen fundamentalmente del denominador en (14.91).
D () es el determinante que aparece en la ecuaci on secular correspondiente a la versi
on homogenea de las
Ecs. (14.89) i.e. las Ecs. (14.84), sus races son las frecuencias complejas de la vibraciones sin el forzamiento
arm onico. Por otro lado, el requerimiento de que y sean ambas races de la Ec. (14.87) significa teniendo
en cuenta la Ec. (14.85) que si i es una raz de D () entonces i tambien lo es. Por lo anterior es posible
representar D () para un sistema de n grados de libertad en la forma

D () = G ( 1 ) ( 2 ) . . . ( n ) ( + 1 ) ( + 2 ) . . . ( + n )

siendo G una constante. En notaci


on de productoria y denotando por 2 podemos escribir
n
Y
D () = G [2 ( i ) + ii ] [2 ( + i ) + ii ] (14.92)
i=1

racionalizando la Ec. (14.92) para separar Ai en sus partes real e imaginaria, el denominador sera
n h
Y ih i
D () D () = GG 4 2 ( i )2 + 2i 4 2 ( + i )2 + 2i (14.93)
i=1

las amplitudes de la oscilaci on forzada exhiben entonces resonancia en las cercanas de las frecuencias de las
oscilaciones libres i . Se ve tambien de la Ec. (14.93) que la presencia de la constante de amortiguamiento
i remueve la divergencia que aparecan en las resonancias forzadas sin amortiguamiento. Las frecuencias
del forzamiento externo para las cuales la amplitud alcanza m aximos locales ya no coincide exactamente con
las frecuencias de los modos libres debido a la dependencia con la frecuencia de terminos en Aj diferentes al
denominador. No obstante, de nuevo estas frecuencias de resonancia se aproximan a las frecuencias de vibraci on
libre cuando el factor de amortiguamiento se vuelve muy peque no.
Aunque la presente discusi on se realiz
o en el marco de sistemas mec anicos, hay en realidad diversos sis-
temas fsicos que est an descritos por ecuaciones de la forma (14.89). Quiz as el ejemplo mas conocido es el de
los circuitos electricos en donde las Ecs. (14.89) representan la din amica de un conjunto de n circuitos aco-
plados donde los coeficientes Vij representan coeficientes recprocos de capacitancia, las ij son resistencias,
y las Tij son inductancias. Adicionalmente, el termino de forzamiento representara generadores senoidales de
determinada frecuencia aplicada a uno o m as de los circuitos.
Hay una serie de consideraciones generales que solo mencionaremos por efecto de espacio, por ejemplo,
cuando el forzamiento sobre un sistema oscilante lineal tiene una dependencia temporal de forma arbitraria, la
tecnica de la transformada de Laplace resulta muy u til para estudiar la respuesta de estos sistemas. Cuando
tomamos la expansi on del potencial mas all
a del termino cuadratico en (14.4) aparecen oscilaciones no lineales
(oscilaciones anarm onicas). Otro aspecto relevante es la generalizaci on a oscilaciones de sistemas contnuos.
358 CAPITULO 14. OSCILACIONES

14.7. Ejemplos de oscilaciones anarm


onicas
Consideraremos el caso de un pendulo amortiguado y forzado en el cual no haremos restriccion sobre los
ngulos de oscilaci
a on i.e. . Asumiremso por simplicidad que la varilla que lo sostiene no tiene masa
y esta se concentra en la lenteja.
Para el presente analisis haremos consideraciones de torques en lugar de fuerzas. Por ejemplo, la din
amica
del pendulo simple de longitud R y masa m est a gobernada por el torque gravitacional mgR sin el cual es de
tipo restaurador.
d2
mR2 2 + mgR sin = 0 (14.94)
dt
donde I = mR2 es el momento de inercia. Para desplazamientos peque nos se hace la aproximacion sin
=
lo cual linealiza las ecuaciones haciendo que el torque sea proporcional al desplazamiento, y el movimiento
sera armonico simple con frecuencia caracterstica 0
r 
g
0 =
R
Si aplicamos un torque adicional N al pendulo estacionario, este oscilar
a hasta un cierto
angulo . El valor de
este
angulo puede ser acotado gracias a la acci
on del torque gravitacional restaurador y el pendulo asume una
posici
on de equilibrio a un
angulo dado por
 
d
N = mgR sin =0 (14.95)
dt
por supuesto que entre mayor sea N , mayor es el angulo . Por ejemplo, para N = 0 se tiene que = 0; para
1
N = 2 mgR se tiene = /6 y para N = mgR se tiene que = /2 este u ltimo caso define un valor crtico
Nc para el torque

Nc = mgR ; = (14.96)
2
si N excede este valor crtico, el torque aplicado ser
a siempre mayor al torque restaurador N > mgR sin . En
consecuencia, el pendulo girar a en forma indefinida hasta que dejemos de aplicar dicho torque (o deje de ser
v
alida la condicion N > Nc ) aunque naturalmente el movimiento puede continuar despues de que ha cesado
el torque.
Si ahora el pendulo esta amortiguado debido por ejemplo a alg un medio viscoso en el cual est
a inmerso, es
usual considerar que la fuerza viscosa es proporcional a la velocidad lineal, en nuestro caso ser
a mas conveniente
(y equivalente) asumir que es proporcional a la velocidad angular
d
F = = ; N =
dt
a
nadimos entonces a las ecuaciones de movimiento (14.94), el torque asociado a la fuerza viscosa con lo cual
queda
d2 d
mR2 2 + mgR sin + =N (14.97)
dt dt
ahora definimos una frecuencia crtica c a la cual el torque se iguala al torque crtico mgR
mgR Nc
c = = (14.98)

con lo cual la Ec. (14.97) se puede escribir en una forma normalizada

N 1 d2 1 d
= 2 2 + + sin (14.99)
Nc 0 dt c dt
las soluciones a esta ecuacion poseen comportamiento complejos de en funci on del tiempo. Estudiaremos
el caso en el cual se aplica un torque constante a un pendulo inicialmente en reposo. En tal sistema hay un

14.7. EJEMPLOS DE OSCILACIONES ANARMONICAS 359

comportamiento transitorio inicial que eventualmente cede para dar paso a un comportamiento estacionario.
Examinaremos varios casos concentr andonos unicamente en el estado estacionario
1) Para torques peque
nos N Nc hay un estado estacionario est atico

N = Nc sin (14.100)

en el cual se anulan todas las derivadas temporales despues de que se han extinguido todas las oscilaciones
transitorias iniciales. Esto se ilustra en la Fig. ???? que nos muestra un pendulo estacionario en el
angulo .
2) Para movimiento no amortiguado ( = 0) con torque aplicado constante N , la Ec. (14.97) toma la forma

d2
NT = N mgR sin = mR2 (14.101)
dt2
que nos muestra que el torque neto NT depende del
angulo. Es f
acil ver el valor de este torque para ciertos
ngulos particulares
a

NT = N ; =0
NT = N Nc ; = /2
NT = N ; =
NT = N + Nc ; = 3/2 (14.102)

si el torque aplicado excede al valor del torque crtico Nc el movimiento ser a de rotaci
on contnuamente
acelerada, de modo que el pendulo incrementa su energa cinetica con el tiempo. La velocidad angular tambien
se incrementara con el tiempo, pero con fluctuaciones que varan cclicamente como lo muestra la Fig. ???, El
promedio sobre estas oscilaciones nos da una velocidad angular
 
d
hi =
dt

que se incrementa linealmente con el tiempo cuando no hay atenuaci on.


3) Cuando hay atenuacion con c << 0 y N > Nc , la velocidad angular contin ua aumentando hasta que
el termino de atenuaci
on d/dt alcanza el valor del torque aplicado. En tal caso, la velocidad angular promedio
hi alcanza un valor asint

otico hi
L como muestra la Fig. ???, y la aceleraci on fluctua de tal forma que su
valor promedio es nulo d2 /dt2 = 0. En este regimen asint otico, el pendulo experimenta un movimiento
cuasi-estatico rotando con una velocidad angular que fluct ua alrededor de hiL pero que permanece cerca
al valor promedio hiL .
Es f
acil obtener informacion cuantitativa de este regimen asintotico cuasi estatico, ya que solo hay que
despreciar el termino de aceleraci
on en (14.99)

N 1 d
= + sin (14.103)
Nc c dt
que tiene soluci
on analtica de la forma

hi = 0 f or N < Nc
h i1/2
hi = c (N/Nc )2 1 f or N > Nc
hi = (N/Nc ) c f or N >> Nc

la figura ??? muestra el comportamiento del promedio hi en tanto que la figura ???? muestra el comporta-
miento de las fluctuaciones en los puntos A y B de la grafica anterior. En A se ha tomado N = 1,2Nc de modo
que a partir de las Ecs. (14.102) se ve que el torque neto vara entre 0,2Nc y 2,22Nc alrededor del ciclo, y la
velocidad angular es grande en la parte baja y lenta en la parte superior, con las variaciones que se muestran
en la parte de abajo de la fig. ???. Para el punto B se tom o N = 2Nc de tal modo que seg un (14.102), el
360 CAPITULO 14. OSCILACIONES

torque vara entre Nc y 3Nc , produciendo las variaciones m


as regulares en la rapidez angular que se muestran
en la parte superior de la fig. ????. En el lmite N >> Nc que se traduce en hi >> c , la rapidez angular se
aproxima a una variaci on sinusoidal en el tiempo

(t)
= hi + sin t

que es en forma aproximada el perfil que se ve para las fluctuaciones del punto B en la fig. ???.
Captulo 15

Relatividad especial

??????????????????????
??????????????????????

15.1. Propiedades de las transformaciones de Lorentz puras


Consideremos dos sistemas de referencia S y S cuyo origen es coincidente en t = 0 vistos por ambos
sistemas. S se mueve a velocidad constante v con respecto a S en una direcci on paralela al eje X3 . Las
transformaciones de Lorentz vienen dadas por

x1 = x1 ; x2 = x2

x vt t vx 3
v
p3 c 2
x3 = ;
t = p ; (15.1)
1 2 1 2 c

siendo c la velocidad de la luz en el vaco. Estas leyes de transformaci


on cumplen con las propiedades que las
inspiraron. En particular, cumple con los postulados de la relatividad especial. Por ejemplo, la velocidad de
la luz es la misma en ambos sistemas. Supongamos que con respecto al sistema S se emite una onda esferica
desde el origen en t = 0, la ecuaci
on del frente de onda vista por S es

xi xi = c2 t2

Usando las transformaciones de Lorentz (15.1) vemos que la ecuaci on para el frente de onda transformado (es
decir visto por S ) es tambien esferico y se propaga tambien con velocidad c

xi xi = c2 t2

si hacemos una expansi


on de las Ecs. (15.1)

x1 = x1 ; x2 = x2
    
1 1
x3 (x3 vt) 1 + 2 + . . . ; t t x3 1 + 2 + . . .
2 c 2

a orden cero en = v/c

x1 = x1 ; x2 = x2
x3 x3 vt ; t t

con lo cual se obtienen las transformaciones de Galileo. Al ser el movimiento a lo largo de x3 las coordenadas
x1 y x2 no se ven afectadas como es de esperarse en virtud de la isotropa del espacio. Las ecuaciones de
transformacion son lineales lo cual se puede demostrar a partir del requerimiento del principio de relatividad

361
362 CAPITULO 15. RELATIVIDAD ESPECIAL

restringida, pues si el movimiento uniforme en S debe transformarse en movimiento uniforme en S las trans-
formaciones entre tales sistemas deben ser lineales. Como la transformaci on debe ser igualmente v
alida para

pasar desde S hacia S se puede ver que la inversa de la transformaci 1
on debe ser tal que T (v) = T (v) lo
cual se puede verificar invirtiendo las transformaciones de Lorentz.
La parte espacial de las transformaciones de Lorentz se puede escribir en forma vectorial teniendo en cuenta
que v va en la direcci on x3
! !

 x3 vt x3 vt
x1 , x2 , x3 = x1 , x2 , p = x1 , x2 , x3 x3 + p
1 2 1 2
!
 x3 vt
x1 , x2 , x3 = (x1 , x2 , x3 ) + 0, 0, p x3
1 2
!
x 3 vt
r = r + p x3 u3
1 2

y teniendo en cuenta que u3 = v/v se obtiene


!
x vt v

r =r+ p3 x3
1 2 v

podemos adem
as hacer el reemplazo
v r = vx3
con lo cual la parte espacial se puede escribir en forma enteramente vectorial
! !
vx v 2t v vx v v2 t v
3 3
r = r + p vx3 2
= r + p vx 3 2
p
1 2 v 1 2 v 1 2 v2
!
1 v vt
r = r + vx3 p 1 2
p
1 2 v 1 2
!
v 1 vt
r = r + (v r) 2 p 1 p
v 1 2 1 2

y definiendo
v 1
; p
c 1 2
se obtiene
( r)
r = r + ( 1) ct (15.2)
2
y para la transformaci
on de la coordenada temporal
 
t vx
c 2
3
v r
t = p = t 2
1 2 c


t = t ( r) (15.3)
c
dado que no hay nada especial en la direccion x3 elegida (por la isotropa del espacio) las ecuaciones vectoriales
alidas para direcciones arbitrarias de v siempre que los ejes de S y S sean paralelos.
(15.2, 15.3) son v
Las Ecs. (15.2, 15.3) definen transformaciones lineales en 4 componentes, por tanto podemos utilizar el
formalismo matricial para describir estas transformaciones. Un artificio ideado por Minkowski nos permite
15.1. PROPIEDADES DE LAS TRANSFORMACIONES DE LORENTZ PURAS 363

construir un sistema coordenado cartesiano con cuatro ejes en el cual el cuarto eje coordenado se elije como
x4 ict. El cuadrado del m
odulo de un vector en este espacio se escribe como

x21 + x22 + x23 + x24 = x21 + x22 + x23 c2 t2 (15.4)

recordemos que esta cantidad es invariante debido a la exigencia de que la velocidad de la luz sea invariante. En
consecuencia debemos usar transformaciones ortogonales en cuatro dimensiones1 , por tanto la transformaci on
de Lorentz es una transformacion ortogonal en el espacio de Minkowski.
Dado que la cuarta coordenada es imaginaria, los elementos de la matriz de transformaci on pueden ser com-
plejos. La representaci
on matricial se puede obtener de las ecuaciones vectoriales (15.2, 15.3). Representando
por L a la matriz de transformacion de Minkowski se tiene que

x = Lx (15.5)

siendo L un elemento generico. Las letras griegas representar an a las cuatro coordenadas en tanto que las
letras latinas representar
an solo coordenadas espaciales. Las ecuaciones vectoriales (15.2, 15.3) en componentes
se escriben como
j k xk
xj = xj + ( 1) + ij x4 (15.6)
2
x4 = ik xk + x4 (15.7)

Con lo cual se pueden determinar los elementos de L para una direcci


on arbitraria de
 
j k
xj = jk + 2 ( 1) xk + ij x4


x4 = ik xk + x4 (15.8)

que podemos escribir en la forma

xj = Ljk xk + Lj4 x4
x4 = L4k xk + L44 x4 (15.9)

y comparando (15.8) con (15.9) se obtienen los elementos de L

j k
Ljk = jk + ( 1) ; Lj4 = ij
2
L4k = ik ; L44 = (15.10)

En el caso particular en el cual v va dirigida a lo largo de x3 tenemos que j = j3 y L adopta la forma

2 j3 k3
Ljk = jk + ( 1) = jk + j3 k3 ( 1) ; Lj4 = ij3
2
L4k = ik3 ; L44 = (15.11)

que explcitamente se escribe


1 0 0 0
0 1 0 0
L=
0
(15.12)
0 i
0 0 i
1
Las transformaciones unitarias mantienen invariante la cantidad xi xi en tanto que las transformaciones ortogonales mantienen
invariante la cantidad xi xi . La invarianza de la cantidad expresada en (15.4) es de la forma xi xi con algunas componentes complejas,
en consecuencia las matrices asociadas ser an ortogonales complejas.
364 CAPITULO 15. RELATIVIDAD ESPECIAL

ya hemos visto que en una matriz ortogonal la inversa es igual a la traspuesta. Veamos que ocurre al hacer la
traspuesta de la matriz L () en (15.10)

e jk () = Lkj () = kj + k j [ () 1] = jk + (j ) (k ) [ () 1] = Ljk ()
L
2 ()2
e j4 () = L4j () = ij = i (j ) = Lj4 ()
L
e 4k () = Lk4 () = ik = i (k ) = L4k ()
L ; e 44 () = L44 () = () = () = L44 ()
L

donde hemos usado el hecho de que () = () lo cual es evidente de su definici


on. Tenemos por tanto que
e () = L ()
L

y como la traspuesta es la inversa llegamos a la propiedad esperada de que L1 (v) = L (v).


Notemos que la submatriz inferior 22 en (15.12) se asemeja a una rotaci
on en un plano, la cual se escribira
de la forma  
cos sin
sin cos
en este caso lo que tenemos es una rotaci
on en los ejes x3 x4 del espacio de Minkowski, pero en un a
ngulo
imaginario
cos = ; sin = i (15.13)
podemos definir un
angulo real en la forma i con lo cual

cosh = ; sinh =

y la matriz (15.12) queda



1 0 0 0 1 0 0 0
0 1 0
0 0 1 0 0
L =
0 = (15.14)
0 cos sin 0 0 cosh i sinh
0 0 sin cos 0 0 i sinh cosh

esta parametrizaci on facilita muchas operaciones matriciales. Por ejemplo, si hacemos dos transformaciones
de Lorentz sucesivas en donde ambas poseen velocidades relativas a lo largo de x3 la transformaci on matricial
solo es no trivial en el plano x3 x4 y se puede ver que simplemente se suman los angulos y correspondientes
como ocurre en una rotaci on en el plano, de modo que L ( ) L () = L ( + ). De las Ecs. (15.13) se tiene
que
 tan + tan
tan = i ; tan = tan + =
1 tan tan
i + i
i =
1 (i) (i )

de modo que estas dos transformaciones de Lorentz sucesivas corresponden a una sola transformaci
on de
Lorentz equivalente de la forma
+
= (15.15)
1 +
la Ec. (15.15) corresponde a la ley de adici on de velocidades para velocidades paralelas. En esta ecuaci
on se
ve que la velocidad equivalente no es simplemente la suma de las velocidades de las dos transformaciones en
on en el denominador. Podemos ver adem
virtud del factor de correcci as que incluso tomando valores de
y cercanos a la unidad, se tiene que < 1. Esto indica que no se puede obtener una velocidad mayor que c

con transformaciones de Lorentz sucesivas. No hay manera de que una sistema de referencia vaya m as r
apido
que la luz con respecto a otro.
15.2. TRANSFORMACIONES DE LORENTZ RESTRINGIDAS 365

15.2. Transformaciones de Lorentz restringidas


Aunque hemos visto que las transformaciones de Lorentz son ortogonales, no hemos demostrado que estas
cubran todas la transformaciones ortogonales posibles en el espacio de Minkowski, de por s esto no es cierto
como se puede demostrar con una transformaci on descrita por L44 = 0, L4i = Li4 = 0 y los nueve elementos
restantes formando una submatriz 33 ortogonal en el espacio eucldeo tridimensional. Esta matriz es ortogonal
en el espacio de Minkowski, pero no produce movimiento relativo entre los dos sistemas, su efecto es una rotaci
on
de las coordenadas espaciales. Las rotaciones espaciales son un subconjunto de las transformaciones
ortogonales en el espacio de Minkowski. Similarmente, (15.5) no define la transformaci on de coordenadas
mas general ante la cual deben permanecer invariantes las ecuaciones de la Fsica, pues es claro que una
redefinici
on de origen espacio temporal tampoco debe afectar a las leyes de la Fsica. Debemos ver adem as si
existen otro tipo de transformaciones ortogonales en el espacio de Minkowski. La transformaci on mas general
en el espacio de Minkowski que mantiene invariante la velocidad de la luz es

x = Lx + a (15.16)

donde a representa una traslaci


on del origen en el espacio de Minkowski (i.e. de espacio y tiempo) y L es una
matriz ortogonal. A las transformaciones del tipo (15.16) se les conoce como transformaciones de Poincare o
transformaciones de Lorentz inhomogeneas. La condici on de ortogonalidad
e = LL
LL e = 1 ; L L = o L L = (15.17)

representa diez ligaduras sobre los elementos de L (cuatro condiciones diagonales y seis no diagonales) de
modo que solo hay seis cantidades independientes en L. Por otro lado, vemos que las transformaciones de
Lorentz (15.10) involucran tres grados de libertad (las tres componentes de la velocidad) en tanto que las
rotaciones eucldeas involucran otros tres grados de libertad (e.g. los
angulos de Euler). Esto parece indicarnos
que las transformaciones de Lorentz del tipo (15.10) junto con las rotaciones espaciales (o combinaciones de
ambas) forman el conjunto m as general de transformaciones ortogonales en el espacio de Minkowski. Por otro
lado, para la transformaci on (15.16) existen cuatro grados de libertad adicionales con lo cual la cantidad de
elementos independientes ser a diez. En el presente estudio nos restringimos a las transformaciones de Lorentz
homogeneas de modo que requerimos manejar seis elementos independientes de L

x = Lx

recordemos que las matrices ortogonales tienen determinante 1

(det L)2 = 1

y ya hemos visto que si nos restringimos a las transformaciones contnuas debemos exclur las matrices de
determinante 1. Las matrices L de determinante +1 representan entonces transformaciones de Lorentz
propias. Sin embargo, no hay garanta de que todas las matrices de determinante +1 correspondan a trans-
formaciones contnuas. Efectivamente, en el caso de la inversi
on simult
anea de todas las coordenadas espacio
2
temporales, el determinante sigue siendo +1 . Necesitamos entonces un criterio para excluir las transforma-
ciones propias no contnuas. Examinemos el comportamiento de L44 , usando las Ecs. (15.17) se puede escribir
con = = 4
L4 L4 = 44 L244 + L4j L4j = 1 (15.18)
y como los elementos L4j conectan una coordenada espacial (real) con una temporal (imaginaria), estos ele-
mentos deben ser imaginarios puros. En contraste L44 debe ser real porque conecta al eje imaginario consigo
mismo, estas caractersticas se pueden apreciar en (15.10). En consecuencia L4j L4j debe ser negativo y L244 debe
ser positivo de modo que
|L44 |2 > |L4j L4j | y L244 1 (15.19)
2
Observese que esto se debe al car on del espacio. En R3 las inversiones espaciales producen determinante
acter par de la dimensi
3
(1) = 1 de modo que no hay trasnformaciones discretas con determinante +1 en el espacio cartesiano tridimensional.
366 CAPITULO 15. RELATIVIDAD ESPECIAL

La Ec. (15.19) plantea dos posibilidades: L44 1 que implica una inversi on del tiempo y L44 1 que implica
una transformaci on contnua a partir de la identidad3 . Las transformaciones de Lorentz con L44 1 se denomi-
nan ort ocronas en tanto que las de L44 1 se denominan no ort ocronas. Solamente las transformaciones
ortogonales propias ort ocronas pueden evolucionar en forma contnua a partir de la identidad. De las cuatro
subclases solo las transformaciones propias ort ocronas forman un grupo, las otras tres subclases no.
A las transformaciones de Lorentz propias ort ocronas se les conoce como transformaciones de Lorentz restrin-
gidas, solo ellas pueden generar rotaciones contnuas en el espacio y reducirse a las transformaciones de Galileo
en el lmite de bajas velocidades. En consecuencia, solo trabajaremos transformaciones de Lorentz restringidas
denomin andolas simplemente transformaciones de Lorentz.
A las transformaciones de Lorentz restringidas que corresponden a dos sistemas de ejes paralelos que
se mueven uniformemente uno respecto al otro se les denomina transformaciones de Lorentz puras (o
boosts). La matriz descrita por (15.10) corresponde a una transformaci on de Lorentz pura. La intuicion nos
indica que una transformaci on de Lorentz restringida puede descomponerse en una transformaci on de Lorentz
pura junto con una rotaci on espacial sin movimiento relativo (en uno u otro orden). Veamos como se realizara
tal descomposicion. Descompongamos la transformaci on de Lorentz en un boost seguido de una rotacion

L = RP (15.20)

Las coordenadas del sistema transformado x est


an relacionadas con las coordenadas no primadas por
e x = L x
x = Lx x = L1 x x = Lx (15.21)

nos preguntamos ahora cual es la velocidad del origen de S vista por un observador en S. En el origen de S
tenemos que xj = 0 y las coordenadas del origen de S vistas por el observador en S se obtienen aplicando
(15.21) con xj = 0
xj = L4j x4 ; x4 = L44 x4 (15.22)
de las Ecs. (15.22) vemos que la velocidad relativa (normalizada a unidades de c) del origen de S tiene entonces
las siguientes componentes
xj ixj iL4j x4 iL4j
j = = = = (15.23)
ct x4 L44 x4 L44
combinando las Ecs. (15.18, 15.23) se obtiene
     
2 L4j L4j 2 L4j L4j
L44 1 + = 1 L44 1 i i =1
L244 L44 L44
L244 (1 j j ) = 1 (15.24)

podemos ver que |j | est


a entre cero y uno usando la primera desigualdad en (15.19) aplicada a (15.23)

2
iL4j 2 L4j L4j 2

|j | =
1
L44 L44
donde en el segundo miembro de la ecuaci on no hay suma sobre j pero s la hay en el tercero. Por otra parte,
despejando el valor de L44 en terminos de en (15.24) se obtiene4

L44 = (1 j j )1/2 = (15.25)

por lo tanto, L44 = para cualquier trasnformaci on de Lorentz que sea combinaci on de un boost y una
rotaci
on. construyendo entonces una transformaci
on de Lorentz pura P () asociada al vector velocidad relativa
3
La identidad tiene L44 = 1 como se puede ver de (15.10) con v = 0. Con un argumento similar al que se us o para transfor-
maciones ortogonales impropias en R3 , no es de esperarse que para una transformaci on contnua haya un cambio abrupto desde
la identidad (con L44 = 1) hasta un valor de L44 1 sin pasar por estados intermedios. Por lo tanto, las matrices con L44 1
contienen al menos una transformaci on discreta.
4
N
otese que en (15.25) hemos asumido que L44 1 al tomar la raz cuadrada positiva.
15.2. TRANSFORMACIONES DE LORENTZ RESTRINGIDAS 367

del origen de S Ec. (15.23), vemos que la transformaci


on inversa debe ser P (). Ahora teniendo en cuenta
(15.20) se encuentra entonces que la matriz R se puede despejar

L = RP () LP () = RP () P ()
R = LP () (15.26)

se puede demostrar formalmente que este producto entre P () y L corresponde a una rotaci on en el espacio
usando los elementos matriciales de P () y la ortogonalidad de L. No obstante se puede ver geometricamente
que en la Ec. (15.20), el sistema intermedio de coordenadas definido por P () esta en reposo respecto al sistema
final de ejes de modo que R solo puede girar las coordenadas. Esta descomposici on nos permite deducir que
los parametros independientes siempre ser an las tres componentes de la velocidad relativa entre los sistemas y
los tres grados de libertad de la rotaci
on espacial (por ejemplo los angulos de Euler).
Por otro lado, puede demostrarse que la composici on de transformaciones de Lorentz puras no es en general
otra transformaci on de Lorentz pura a menos que sean paralelas las velocidades relativas de las transformaciones
sucesivas. El caso general es muy complejo y poco ilustrativo, veamos entonces un c alculo sencillo que posee
amplias aplicaciones en Fsica moderna dando origen al efecto llamado precesi on de Thomas.
Tomaremos tres sistemas inerciales con orgenes O1 , O2 , O3 . El sistema O1 es el laboratorio y O2 tiene
velocidad relativa a O1 . O3 se mueve con velocidad relativa a O2 . Sin perdida de generalidad se puede
tomar a en la direcci on de x3 de O1 y a lo podemos tomar sobre el plano x2 x3 de O2 de modo que y
definen el plano x2 x3 de O2 . Supondremos que las componentes de son muy peque nas de modo que solo
las conservamos hasta el menor grado no nulo. Con esto, para la transformaci on entre O2 y O3 se puede
sustitur por la unidad. Con base en lo anterior la matriz L que nos lleva de O1 a O2 tiene la forma dada por
(15.12) y la matriz que nos lleva de O2 a O3 se escribe usando la aproximaci on = 1 en (15.10)

Ljk = jk ; Lj4 = ij ; L4k = ik ; L44 = 1

on 1 = 0, explcitamente queda
y recordando que por construcci

1 0 0 0
0 1 0 i2
L =
0

0 1 i3
0 i2 i3 1

siendo 2 , 3 las componentes de . La matriz producto con la misma aproximaci


on est
a dada por

1 0 0 0 1 0 0 0 1 0 0 0
0 1 0 i 0 1 0 0 0 1 2 i2
L = L L =
0
2

=
0

0 1 i3 0 0 i 0 + 3 i + i3

0 i2 i3 1 0 0 i 0 i2 i i3 + 3

1 0 0 0
2 i2
0
L = L L =
1 (15.27)
0 0 i
0 i2 i

donde se ha despreciado 3 frente a por considerar a peque


na. Se puede ver que (15.27) no representa
una transformacion de Lorentz pura ya que por ejemplo los elementos Lij de las coordenadas espaciales no son
simetricos como lo demandan las Ecs. (15.10) para transformaciones de Lorentz puras. Usando la Ec. (15.23),
podemos ver que las componentes de la velocidad relativa entre O1 y O3 se escriben en la forma

iL42 2
2 = = ; 3 = ; 1 = 0 (15.28)
L44
368 CAPITULO 15. RELATIVIDAD ESPECIAL

dado que ( )2 = (1 )2 + (2 )2 + (3 )2 2 y por tanto , podemos aproximar la transformaci


on de
Lorentz pura asociada a la velocidad relativa reemplazando estas aproximaciones en (15.10)

j k
 j k
Ljk
= jk + 2 1 = jk + 2 ( 1) ; Lj4 = ij
= ij

L4k = ik = ik ; L44 =

= ; (15.29)

y combinando las Ecs. (15.28, 15.29) podemos construr P (). Escribiremos P () que es el que nos interesa

1 0 0 0
0 2
 1 ( 1) i2

P = 2
0 ( 1) i

0 i2 i

y usando la Ec. (15.26) podemos encontrar la matriz de rotaci on correspondiente de los ejes de O3 con respecto
a O1 . Suprimiendo los terminos de orden superior en se obtiene

1 0 0 0
2
 0 1 ( 1) 0

R = L P = (15.30)
0 2 ( 1) 1 0

0 0 0 1

como esta rotacion es a primer orden en 2 se puede comparar con una rotaci on infinitesimal5 . Comparando
entonces la submatriz 33 superior izquierda (15.30) con la matriz infinitesimal (12.42) se obtiene que (15.30)
est
a asociada a una rotaci
on alrededor del eje x1 con un
angulo (peque no) dado por

2 ( 1)
1 = ( 1) = 2
2

este es entonces un ejemplo concreto de dos transformaciones de Lorentz a ejes paralelos sucesivas (boosts de
Lorentz) que dan como resultado la combinaci on de un boost con una rotaci on. Esta paradoja tiene importantes
aplicaciones especialmente en Fsica at omica como veremos a continuaci on.
Consideremos una partcula que se mueve en el laboratorio con una velocidad v no constante, el sistema
en el cual esta partcula est
a en reposo no es inercial y por tanto no es aplicable el formalismo anterior. Para
obviar esta dificultad, consideraremos un conjunto de sistemas inerciales todos coincidentes con el original en
t = 0 y que viajan a diferentes valores de velocidad relativa (todos los valores de velocidad que se requieran).
En consecuencia, la partcula estara en reposo instant aneo con respecto a alguno de estos sistemas de referencia
en cualquier instante de tiempo.
Pensemos que O1 es el sistema del laboratorio y que O2 y O3 son sistemas en los cuales la partcula est a en
reposo instant aneo en dos tiempos t2 y t3 respectivamente. De acuerdo con las Ecs. (15.28), el observador O1
vera en el tiempo t = t3 t2 una variaci on v en la velocidad de la partcula que solo tiene componente x2

de valor 2 c.
c v ( 1) ( 1)
1 = 2 = (v) v
c c v 2 /c2 v2
Dado que el eje x3 se ha tomado a lo largo de v, y que v va alo largo de x2 , la ecuacion anterior se puede
escribir en forma vectorial. El vector asociado a la rotaci
on (peque
na) durante este tiempo se puede escribir

v v
= ( 1)
v2
5
Las ecuaciones desarrolladas en la secci
on (12.8) son v
alidas para matrices infinitesimales pero tambien son aproximadamente
v
alidas para rotaciones finitas suficientemente peque
nas como para permitir mantener solo terminos de primer orden.
15.3. TRANSFORMACIONES DE LORENTZ USANDO ESPACIOS DE RIEMANN DE CUATRO DIMENSIONES

de modo que si la partcula tiene alguna direccion especfica asociada a ella (como un vector de espn), el
sistema del laboratorio observar
a que esta direcci
on experimenta una precesi on de velocidad angular
va
= ( 1) (15.31)
v2
siendo a la aceleraci
on de la partcula vista desde O1 . La Ec. (15.31) aparece con frecuencia en la literatura
en la forma que posee cuando se toma el lmite de velocidad peque na que permite aproximar a
1
= (a v)
2c2
es la frecuencia de precesi
on de Thomas.

15.3. Transformaciones de Lorentz usando espacios de Riemann de cuatro


dimensiones
Una forma alternativa de trabajar el espacio en donde ocurren las transformaciones de Lorentz es asumir
que el espacio tetradimensional es real de modo que la cuarta coordenada (denominada la coordenada cero en
la notaci
on mas usual) se escribe como x0 ct. Debemos por supuesto mantener el postulado fundamental de
que la luz se propague a la misma velocidad en todos los sistemas, lo cual se manifiesta como la invarianza de
la cantidad dada en la ecuaci on (15.4). Para que esta cantidad siga representando el m odulo al cuadrado de
un vector en un espacio real, es necesario que el espacio deje de ser eucldeo y se convierta en un espacio de
Riemann con tensor metrico diagonal definido por

1 0 0 0
0 1 0 0
G= 0 0 1 0
(15.32)
0 0 0 1

donde los ndices 1230 representan las tres coordenadas espaciales y la coordenada temporal. El m
odulo al
cuadrado de un vector en tal espacio viene dado por

eGx = xi xi x20 = xi xi c2 t2
x (15.33)

que nos representa al invariante que queremos. Una transformaci on de Lorentz homogenea es una transforma-
ci
on lineal en este espacio real que mantiene invariante este m odulo de los vectores. Es evidente que la matriz
asociada a estas transformaciones debe ser real en este espacio, de modo que la denotaremos por . La con-
dici
on de invarianza del m odulo de los vectores ante una transformaci
on de Lorentz se escribe matricialmente
en la forma
xe Gx = x
eGx (x)G ] (x) = x eGx x e
eGx =x eGx
y como esto es v
alido para un vector arbitrario en este espacio, la condici
on para las transformaciones de
Lorentz resulta
e
G =G (15.34)
La Ec. (15.34) es una transformacion de congruencia que deja invariante al tensor metrico. Haciendo la analoga
con las matrices ortogonales del espacio eucldeo (donde el tensor metrico cartesiano es 1), podemos decir que
on de ortogonalidad de en el espacio real de Riemann con tensor metrico G6 .
(15.34) es la condici
La relaci
on entre las f
ormulas expresadas en el espacio de Minkowski y las expresadas en el espacio real de
Riemann se logra con las siguientes asociaciones simples

x4 = ix0 ; j0 = iLj4 ; 0k = iL4k


6
Es claro que esta condici
on se reduce a la ortogonalidad usual cuando G = 1.
370 CAPITULO 15. RELATIVIDAD ESPECIAL

en tanto que los dem as elementos no varan, lo cual es de esperarse ya que ambos contienen al subespacio R3
dotado de la misma estructura. A manera de ejemplo, la transformaci on de Lorentz pura con velocidad relativa
a lo largo de x3 correspondiente a la Ec. (15.12), tiene la siguiente representaci
on matricial real en este espacio
de Riemann
1 0 0 0
0 1 0 0
= 0 0


0 0
el producto escalar se escribe usando el tensor metrico

eGy =e
(x, y) x yGx = (y, x)
eGy = x g y
x

donde la igualdad entre (x, y) y (y, x) viene dada por el car


acter real de este producto interno. La condici
on
de ortogonalidad de la Ec. (15.34) garantiza la invarianza del producto escalar ante una transformaci on de
Lorentz .
Es usual escribir estas f
ormulas de manera mas compacta mediante un conveniente cambio de notaci on.
Supongamos que formamos un vector en el espacio de Riemann con los elementos de coordenadas dx y
estudiemos su comportamiento ante una trasnformaci on general de coordenadas del tipo

y = f (x1 , x2 , ...)

se encuentra que las propiedades de transformaci


on de dx son

f y
dy = dx = dx (15.35)
x x

las derivadas son los elementos de la matriz jacobiana de la transformaci on entre (x) e (y). Cuando la trans-
formacion A es lineal, seran simplemente los elementos matriciales A . Por otro lado, las componentes de un
vector gradiente se transforman de acuerdo con la ecuaci on
x
= (15.36)
y y x

notese que en (15.36) los coeficientes corresponden a los elementos de la matriz jacobiana de la transformaci
on
inversa de (y) hacia (x). Los vectores que se transforman de acuerdo con la regla dada por la Ec. (15.35) se
denominan vectores contravariantes y se denotan con suprandices
y
D = D
x

en contraste, los vectores que transforman de la manera prescrita por la Ec. (15.36) se denominan covariantes
y se denotan con subndices
x
F = F
y
El producto de las matrices jacobianas correspondientes a una transformaci on y a su inversa debe ser la matriz
unidad ya que corresponde a pasar de (x) a (y) y volver de nuevo a (x). De aqu se desprende que la contracci
on
entre un vector contravariante y un vector covariante queda invariante ante la transformaci on,
y x
D F = D F = D F = D F
x y

veremos m as adelante que la contracci


on de un vector covariante con otro contravariante equivale al producto
interno entre dos vectores contravariantes. En el caso de espacios cartesianos, no hay diferencia entre vectores
15.3. TRANSFORMACIONES DE LORENTZ USANDO ESPACIOS DE RIEMANN DE CUATRO DIMENSIONES

covariantes y contravariantes ante transformaciones lineales ortogonales. Si la matriz ortogonal A describe la


transformacion, un vector contravariante en el espacio cartesiano, dicha transformaci
on se escribe en la forma

D = A D

en tanto que un vector covariante transforma en la siguiente forma


  
F = A1 F = A e F = A F

de modo que no es necesario distinguir hasta ahora entre los dos tipos de comportamiento ante la transforma-
ci
on. Un argumento similar vale para el espacio de Minkowski con eje temporal imaginario y con la metrica
usual, de modo que en dicho espacio no hay diferencia entre vectores covariantes y contravariantes.
De la misma manera en que definimos tensores cartesianos seg un la prescripci
on (11.134) heredada de la
transformacion de los vectores, uno define las propiedades de transformacion de tensores de cualquier rango
en espacios no eucldeos. Por tanto, un tensor covariante R de segundo ordense transforma con la prescripci
on

x x
R = R
y y

y se puede demostrar que la contraccion de un tensor de segundo rango covariante con un tensor de segundo
rango contravariante (o con dos vectores contravariantes) es invariante ante la transformaci
on. Similarmente,
la contracci
on de un tensor de segundo rango covariante con un vector contravariante transforma como un
vector covariante
R H = s1 R R M = s2 ; R D = F
donde s1 y s2 son invariantes ante la transformaci
on (escalares) y F es un vector covariante. Veamos la
demostraci
on de la tercera ecuaci
on
x x y x x
F = R

D = R D = R D = R D
y y x y y
x
F = F
y

En un espacio de Riemann el tensor metrico se construye a traves de un elemento diferencial de longitud


de arco
(ds)2 = g dx dx
que se construye de tal manera que sea invariante ante las transformaciones de interes. De esto se desprende
que el tensor metrico es covariante. N
otese que en el caso particular de las transformaciones de Lorentz, esto se
puede ver directamente de la condici on de ortogonalidad (15.34) si la escribimos en la forma G = e 1 G1
considerada como transformaci on de congruencia en G.
Vemos entonces que en el espacio de Riemann real de cuatro dimensiones, el producto escalar de dos
vectores contravariantes A , B se puede escribir en la forma

g A B = (g A ) B = A B (15.37)

donde hemos tenido en cuenta el car acter covariante del tensor metrico para obtener el vector covariante A . En
este punto se puede ver con claridad que si la metrica fuera la usual i.e. , los vectores covariantes y contra-
variantes seran identicos. En particular, el cuadrado del m odulo del vector cuadriposicion en el cuadriespacio
real se puede escribir en la forma
x x
de esta forma los productos internos se pueden construir sin aluci on directa al tensor metrico, teniendo en
cuenta que un factor del producto escalar se sustituye por el vector covariante que se obtiene al contraer
con el tensor metrico como se ve en (15.37). Si nos interesa el producto escalar de dos vectores covariantes,
372 CAPITULO 15. RELATIVIDAD ESPECIAL

debemos subir el ndice por contracci on con el inverso del tensor metrico, el cual se puede demostrar que es
contravariante. En el caso del cuadriespacio real donde el tensor metrico es diagonal con elementos 1, el tensor
metrico coincide con su inverso y no hay diferencias entre tensores metricos covariantes y contravariantes.
Es claro que esta no es la u nica forma de construr el tensor metrico, el cual fue dise
nado para generar el
invariante (15.33) por medio del m odulo al cuadrado del vector posici on en tal espacio, podemos en cambio
consturr el invariante en la forma

xG x x G x = xi xi + c2 t2

de modo que el tensor metrico queda



1 0 0 0
0 1 0 0
G =
0
(15.38)
0 1 0
0 0 0 1

es claro que bajo la metrica (15.38) se mantiene invariante la velocidad de la luz y las matrices que describen
a las transformaciones de Lorentz no se modifican. Todo el formalismo permanece inalterado excepto que el
producto interno cambia de signo7 . El tensor G tiene la signatura (+ + +) en tanto que el tensor G tiene
la signatura ( +). Tambien podemos identificarlos por sus trazas T rG = 2, T rG = 2.
El uso del formalismo de Minkowski o de Riemann presenta cada uno sus ventajas y desventajas. En teora
general de la relatividad ser
a necesario usar la metrica de un espacio curvo para lo cual es muy adecuado el uso
de espacios de Riemann, por otro lado en mec anica cuantica donde la funciones de onda o vectores de estado
son complejos, el uso de una coordenada compleja complica la operaci on de conjugaci on compleja. Por otro
lado, cuando nos restringimos al marco de la relatividad especial, las operaciones en el espacio de Minkowski
suelen tener analogas muy cercanas al espacio eucldeo y no es necesaria la distinci
on entre vectores covariantes
y contravariantes, debido a la trivialidad del tensor metrico. En todo caso la mayora de f ormulas presentan
el mismo aspecto en ambos casos o su transici on de uno a otro esquema es muy sencilla. Un aspecto com un
en ambos formalismos es la idea de que elemento de longitud de arco tiene un car acter indefinido, pues (ds)2
puede ser positivo, negativo o cero.

15.4. El concepto de formulaci


on covariante en Fsica
El primer postulado de la relatividad especial nos dice que las leyes de la Fsica deben poseer la misma
forma en todos los sistemas inerciales. Por lo tanto, es de gran importancia poder verificar que las leyes de
la naturaleza sean invariantes en forma bajo las transformaciones de Lorentz. Esta verificaci on se facilita
enormenente con la introducci on del concepto de tensor de Minkowski.
Cuando hablamos de la invarianza ante transformaciones de Lorentz, nos referimos tanto a los boosts
como a las rotaciones en el espacio ordinario. Como la invarianza ante rotaciones tridimensionales nos es m as
familiar podemos usar esta invarianza como modelo para establecer un metodo que se generalice a todas las
transformaciones de Lorentz.
Ya hemos definido los tensores euclidianos y su comportamiento bajo rotaciones. Para satisfacer el re-
querimiento de que una ley de la Fsica sea invariante ante rotaciones tridimensionales es usual escribir las
ecuaciones que expresan esa ley de modo que todos sus terminos sean escalares o todos vectoriales (en el sentido
euclidiano). M
as en general, todos los terminos deben ser tensores del mismo rango y este requisito asegura
de manera autom atica la invarianza de la forma de la ecuaci
on ante una rotaci on de los ejes espaciales. Por
ejemplo una relaci
on escalar tiene la forma general

a=b
7
En ambos casos el tensor G describe una pseudometrica ya que la norma de un vector en este espacio no est
a necesariamente
definida positiva.
COVARIANTE EN FISICA
15.4. EL CONCEPTO DE FORMULACION 373

y dado que los dos miembros de la igualdad por ser escalares euclidianos son invariantes ante rotaciones
espaciales de los ejes, es evidente que la relaci
on ser
a v
alida para todos los sistemas de coordenadas con origen
comun. Una relaci on vectorial ser
a de la forma

F=G

que se puede escribir en terminos de tres relaciones numericas entre las componentes8

Fi = Gi (15.39)

Claramente, estas componentes no son invariantes ante rotaciones espaciales. En general, se transforman a
nuevas componentes Fi , Gi que son las componentes de los vectores transformados (pasivamente) F , G . Pero
como los dos miembros de las ecuaciones se transforman de igual manera, entre las componentes transformadas
se debe cumplir la misma relaci on
Fi = Gi

y por tanto la relaci


on vectorial tambien se preserva con la rotaci
on espacial; en el nuevo sistema coordenado
escribimos
F = G

Es importante enfatizar que la invarianza en la forma se debe a que ambos miembros de la ecuaci on son
vectores. Decimos que los terminos de la ecuaci on son covariantes. Es necesario aclarar que el concepto de
covarianza empleado aqu tiene un significado muy distinto al de la covarianza de vectores en el espacio de
Riemann. La covarianza en espacios de Riemann se refiere a la propiedad seg un la cual algunos vectores
transforman bajo un cambio de coordenadas seg un la matriz jacobiana de la transformacion, en este escenario
el termino se usa por contraposicion a los vectores (o tensores) contravariantes que transforman con el inverso
de la matriz jacobiana bajo el cambio de coordenadas. En el caso que nos ocupa ahora, la covarianza se define
para los terminos de una ecuaci on que expresa alguna ley de la Fsica, para indicar que todos los terminos
involucrados en la ecuaci on (escalares, vectores, tensores) transforman en la misma manera de modo que se
mantiene la forma de la ecuaci on.
La covarianza por supuesto se puede generalizar para ecuaciones que involucran tensores de orden arbitrario,
si tenemos una ecuaci on tensorial de la forma C = D los tensores transformados implicar an la misma igualdad
C = D siempre que los tensores de ambos miembros sean del mismo rango. Por ejemplo, si
una ecuaci on posee terminos que son escalares, otros que son vectores etc, no se podr a mantener invariante
ante una transformaci on ortogonal tridimensional. Podemos concluir que la invarianza de una ley Fsica ante
una rotacion del sistema de coordenadas espaciales, exige la covarianza de los terminos de la ecuaci on ante
transformaciones ortogonales tridimensionales.
Vamos ahora al espacio extendido de Minkowski o espacio de universo. El manejo all es identico una vez que
hemos caracterizado a las transformaciones ortogonales en este espacio y por ende la estructura de sus tensores
de cualquier rango. A los tensores en este espacio los llamamos tensores de Minkowski o tensores de universo,
genericamente escalares de universo, vectores de universo (cuadrivectores), etc. En consecuencia, la invarianza
de una ley Fsica ante transformaciones de Lorentz ser a inmediata si se expresa en forma cuadridimensional
covariante, de modo que todos los terminos son tensores de universo del mismo rango. De lo anterior se
deriva que una teora Fsica en el marco de la relatividad especial solo tiene validez si es covariante ante
transformaciones de Lorentz (boosts y rotaciones espaciales).
Notemos por ejemplo que el producto de un n umero por un cuadrivector solo ser a otro cuadrivector si
el n umero es un escalar de universo. Supongamos que es un n umero que no es escalar de universo, en un
sistema S el producto de este n umero por un cuadrivector es

F = W
8
N
otese que las Ecs. (15.39) son relaciones numericas pero no son relaciones escalares.
374 CAPITULO 15. RELATIVIDAD ESPECIAL

ante una transformaci on de Lorentz, F y W transforman como cuadrivectores con una cierta matriz M de
on, por otro lado transforma en la forma = N siendo N un operador diferente a la identidad
transformaci
(ya que no es escalar de universo). Tenemos entonces

F = (N) (MF) = NM (F) ; W = MW F 6= W

por tanto si W es cuadrivector F no lo es y la ecuaci


on no es covariante de Lorentz. La ecuaci
on se vuelve
covariante si N = 1.
Finalmente, notemos que una ecuaci on pude ser covariante sin ser manifiestamente covariante. Por
ejemplo, supongamos que tenemos una ecuaci on de la forma

F + T + H = R

y supongamos que F , T , H no son tensores de universo pero que R s lo es. En general esta ecuaci on
no ser
a covariante, pero puede ocurrir que la suma de los tres terminos no tensoriales s transforme como
un tensor gracias a ciertos efectos de cancelaci
on, ciertamente si estos terminos no son tensores sera mucho
mas complejo demostrar la covarianza de la ecuacion (si es que es covariante). Esta anotaci
on es u
til, porque
a menudo ocurre que se construye una teora en forma manifiestamente covariante, pero luego para efectos
pr
acticos de c
alculo se transforma a una estructura en donde la covarianza no es evidente.

15.5. Formulaciones covariantes en el espacio de Minkowski


El ejemplo mas simple de cuadrivector de Lorentz es el vector de posici on de un punto en el espacio de
Minkowski o de universo, donde sus componentes se denotan por (x1 , x2 , x3 , x4 ). Las cuatro coordenadas de
un punto de universo nos dice cuando (tiempo) y donde (espacio) ha ocurrido un suceso, a todo punto de este
espacio se le llama entonces un suceso o un evento.
Cuando una partcula en el espacio ordinario sigue una determinada trayectoria, su punto representativo
en el espacio de Minkowski describe una trayectoria conocida como lnea de universo. El cuadrivector dx
representa la variaci on del cuadrivector posici on para un movimiento diferencial a lo largo de la lnea de
universo. Este termino multiplicado por s mismo es un invariante de Lorentz de modo que representa un
escalar de universo denominado d
1
(d )2 = 2 dx dx (15.40)
c
para elucidar el significado Fsico de d evaluaremos (15.40) en un sistema inercial en el cual la partcula este en
reposo instant aneo. En este sistema el cuadrivector transformado dx asociado a esta partcula est a descrito
por (0, 0, 0, icdt ) y el invariante d se escribe
1 
2
(d )2 = dx dx = dt
c2
con lo que se ve que d es el intervalo de tiempo medido por un reloj que se mueva con la partcula, que se
denomina el tiempo propio o tiempo de universo.
Ahora veamos la relaci on entre d y el intervalo de tiempo correspondiente a un cierto sistema inercial dt,
usando la Ec. (15.40)
1 h i 1 h i
(d )2 = 2 (dx1 )2 + (dx2 )2 + (dx3 )2 + (dx4 )2 = 2 (dx1 )2 + (dx2 )2 + (dx3 )2 c2 (dt)2
c v c
u " #
u  2   2   2
1 dx dx dx
d = (dt) t1 2
1 2 3
+ +
c dt dt dt

que se puede escribir en la forma


d
dt = p (15.41)
1 2
15.5. FORMULACIONES COVARIANTES EN EL ESPACIO DE MINKOWSKI 375

debemos tener en cuenta que en este caso nos est a representando la velocidad de una partcula con respecto
a un sistema de referencia inercial S. Este es un uso diferente al que se le ha dado hasta ahora como velocidad
relativa (normalizada a c) de un cierto sistema de referencia inercial S con respecto a otro sistema inercial
S. Por supuesto, se puede pensar en como la velocidad relativa del sistema S (con respecto a S) de tal
modo que la partcula esta en reposo instant aneo con respecto a S . La Ec. (15.41) nos dice que el intervalo
de tiempo medido por el sistema en el cual la partcula no est a en reposo es siempre mayor que el intervalo de
tiempo medido en el sistema en donde la partcula est a en reposo instantaneo. Este fenomeno se conoce como
dilataci on del tiempo y ha sido comprobado experimentalmente en diversas situaciones, particularmente en
la observacion de las vidas medias de partculas elementales inestables. La vida media de estas partculas se
puede medir cuando estas estan en reposo y se compara con su vida media cuando est an en vuelo a velocidades
cercanas a la de la luz.
Hemos visto que el cuadrado del m odulo de un cuadrivector no es necesariamente definido positivo. Los
cuadrivectores cuyo m odulo cuadrado sean positivos se denominan del genero espacial o tambien se denominan
como de espacio o espacialoides. Cuando el m odulo es cero (lo cual no significa necesariamente que el cuadri-
vector sea cero) se denominan como de luz. Finalmente, cuando su m odulo cuadrado es negativo se dice que
es del genero temporal, como de tiempo o temporaloide. Puesto que este m odulo al cuadrado es un escalar de
universo, esta denominaci on no dependera del sistema inercial utilizado. Los nombres se deben a que el m odulo
de un vector espacial tridimensional es definido positivo al igual que el cuadrivector del genero espacial, adi-
cionalmente un cuadrivector de este genero siempre se puede transformar de tal forma que se anule su cuarta
componente (temporal). Por otro lado, un cuadrivector del genero temporal tiene su cuarta componente no
nula, pero se puede transformar de tal forma que se anulen todas sus tres componentes espaciales. A manera
de ilustraci
on veamos el comportamiento del vector diferencia o relativo entre dos puntos de universo. Este
vector relativo puede ser del genero espacial, temporal o de luz, definiremos a este vector relativo como

X x1 x2

donde los subndices 1 y 2 denotan los dos sucesos. El m


odulo de este cuadrivector relativo ser
a

X X = |r1 r2 |2 c2 (t1 t2 )2

de modo que X ser


a del genero espacial si los dos puntos de universo est
an separados de modo que

|r1 r2 |2 > c2 (t1 t2 )2

sera como de luz si se cumple la igualdad

|r1 r2 |2 = c2 (t1 t2 )2

y finalmente ser
a del genero temporal si

|r1 r2 |2 < c2 (t1 t2 )2

la condici
on para que el vector diferencia sea temporal equivale a decir que se puede cubrir la distancia entre
los dos eventos o sucesos mediante una se nal luminosa (e incluso algunas senales mas lentas que la luminosa),
en cuyo caso se habla de sucesos o eventos causalmente conectados. La condici on de cuadrivector del genero
espacial equivale a que estos eventos no podr an conectarse con ninguna onda luminosa o se nal que viaje a
velocidad menor o igual que c, decimos que los eventos est an causalmente desconectados. Finalmente, si el
cuadrivector diferencia es como de Luz, solo una senal que viaje a velocidad c podr
a conectar a estos sucesos (y
no se pueden conectar con senales que viajen a velocidades menores), claramente estos son eventos causalmente
conectados.
Podemos elegir el eje x3 de modo que quede alineado con los ejes espaciales r1 r2 del cuadrivector relativo.
Adicionalmente, podemos asumir sin perdida de generalidad que x3(1) x3(2) > 0. En tal caso se tiene que
376 CAPITULO 15. RELATIVIDAD ESPECIAL

|r1 r2 | = x3(1) x3(2) . Si realizamos una transformaci on de Lorentz pura con velocidad v a lo largo de x3
podemos aplicar las transformaciones dadas en (15.1) para la cuarta componente de X
   
vx vx
t1 c3(1)
2 t2 c3(2)
2
t1 = p ; t2 = p
1 2 1 2
     
vx vx vx vx
t1 c3(1)
2 t2 c3(2)
2 t1 t2 3(1)c2 3(2)
t1 t2 = p p = p
1 2 1 2 1 2
 
 c (t1 t2 ) vc x3(1) x3(2)
c t1 t2 = p (15.42)
1 2
si X es del genero espacial y los sucesos son tales que t1 > t2 nos queda que

c (t1 t2 ) < x3(1) x3(2)

y sera posible encontrar una velocidad v < c de modo que se anule la cuarta componente ic (t1 t2 ) X4 .
Fsicamente la anulaci on de la componente temporal significa que es posible encontrar un sistema inercial
que viaje a velocidad v < c en el cual los dos sucesos sean simult aneos. Adicionalmente, tambien es posible
encontrar valores de v < c que haga que el miembro de la derecha en (15.42) se vuelva negativo lo cual indicara
que t2 > t1 , de modo que encontramos un sistema de referencia inercial en el cual se invierte la secuencia de
los sucesos. El que pueda invertirse la secuencia de sucesos entre eventos del genero espacial no constituye una
violacion de la causalidad ya que estos eventos est an causalmente desconectados y no hay manera de que un
suceso pueda influr en el otro. Por ejemplo, nada de lo que ocurra ahora en la tierra puede afectar a la estrella
alfa centauri dentro de los siguientes cuatro a nos en virtud de su distancia a la tierra de unos cuatro a nos luz.
En contraste, para separaciones del genero temporal entre sucesos, no es posible encontrar una transfor-
maci on de Lorentz que los haga simult aneos y menos a un que pueda invertir el orden temporal de los sucesos.
As debe ser, puesto que estos eventos s estan causalmente conectados y pueden influr el uno sobre el otro.
Esto implica que el antes y el despues, o la causa y el efecto, son conceptos invariantes de Lorentz y se preserva
la causalidad.
Es importante establecer la generalizacion relativista de las cantidades Newtonianas m as importantes. Por
ejemplo la velocidad
dxi
vi =
dt
no puede extrapolarse de manera inmediata para construr un cuadrivector de Lorentz ya que la cantidad
v = dx /dt es el producto de un cuadrivector (dx ) con una cantidad que no es escalar (dt no es invariante de
Lorentz) de modo que el resultado no es un cuadrivector. El invariante m as obvio asociado a dt es el diferencial
de tiempo propio d , de modo que resulta natural definir la cuadrivelocidad u como la variaci on por unidad
de tiempo del vector de posici on de una partcula (medida en un sistema S) con respecto al tiempo propio de
dicha partcula (invariante)
dx dx
u = = p (15.43)
d dt 1 2
cuyas componentes espacial y temporal son
dx vi dx4 ic
ui = p i =p ; u4 = p =p (15.44)
dt 1 2 1 2 dt 1 2 1 2
la cuadrivelocidad (o velocidad de universo) m
odulo cuadrado es invariante de Lorentz
v2 c2
u u = = c2 (15.45)
1 2 1 2
y es adem
as del genero temporal. Por supuesto, la cuadrivelocidad no tiene un significado Fsico directo ya que
para medir dx y d se estan usando en general sistemas de referencia diferentes. Sin embargo, la Ec. (15.44)
15.5. FORMULACIONES COVARIANTES EN EL ESPACIO DE MINKOWSKI 377

nos muestra que la cuadrivelocidad contiene toda la informaci on sobre la velocidad Fsica y tiene la ventaja
de que si escribimos las expresiones en terminos de la cuadrivelocidad, ser a m
as f
acil chequear la covarianza
de las ecuaciones gracias a la naturaleza cuadrivectorial de u .
Otro cuadrivector de enorme importancia es el cuadrivector j formado con la corriente electrica j unida con
la cantidad ic siendo la densidad de corriente electrica. Para obtener esta forma cuadrivectorial comenzamos
con la ecuacion de continuidad

j+ =0
t
que me expresa la conservaci on de la carga, si asumimos que la conservaci on de la carga es v
alida en todos los
sistemas de referencia inerciales, entonces esta ecuaci on debe conservar su forma ante una transformaci on de
Lorentz. Dado que j est a asociado en la ecuacion de continuidad a derivadas en el espacio es razonable pensar
que haga parte de las componentes espaciales de un cuadrivector, similarmente dado que est a asociado a una
derivada temporal resulta razonable pensar que hace parte de la componente temporal del cuadrivector. Para
escribir esta ecuaci
on en forma manifiestamene covariante escrib amosla en componentes
jk jk (ic) j
+ = 0 + =0 =0
xk t xk (ict) x
j = 0 ; j (j1 , j2 , j3 , ic) (15.46)
en primer lugar, es facil ver que el operador cuadrigradiente se transforma en el espacio de Minkowski como
un cuadrivector9
x
= = L = L
x x x x x
donde hemos usado la ortogonalidad de L. Dado que es un cuadrivector, se tiene que j tambien debe serlo
si la ecuaci
on de continuidad ha de ser covariante, es decir si la carga se ha de conservar en todos los sistemas
inerciales. Para ver el car
acter cuadrivectorial de j basta con demostrar que j = 0 u siendo 0 la densidad
de carga en el sistema en el cual las cargas est an en reposo, es decir es la densidad de carga propia. Se deja
esta demostracion como ejercicio al lector.
Vemos pues que la cantidad j es invariante ante una transformaci on de Lorentz (escalar de universo)
ya que es la contraccion de dos cuadrivectores. Este ejemplo nos muestra una forma de escribir una ley Fsica
en una forma manifiestamente covariante.
Veamos otro ejemplo de cuadrivector muy importante en la Fsica. Es bien conocido de la teora cl asica
electromagnetica que los potenciales escalar y vectorial obedecen ecuaciones de onda desacopladas
1 2A 4 1 2
2 A = j ; 2 = 4 (15.47)
c2 t2 c c2 t2
siempre y cuando se imponga la condici
on de Lorentz.
1
A+ =0 (15.48)
c t
Notese que la condicion de Lorentz es semejante en estructura a la ecuaci on de continuidad, por ello usando
un argumento similar al usado para la ecuaci on de continuidad es natural pensar que A est a asociado a
las componentes espaciales de un cuadrivector y a la componente temporal. Esta asociaci on parece estar
reforzada por las Ecs. (15.47) donde A tiene como fuente a j (que a su vez forma parte de la componente
espacial del cuadrivector j ) en tanto que tiene como fuente a (donde este u
ltimo es parte de la componente
temporal de j ). Comencemos por la condici on gauge Ec. (15.48) que se puede reescribir como
   
(i)
i Ai + = 0 = , = , ; A (A, i) (15.49)
(ict) x4 ict
A = 0 (15.50)
9
Recordemos que en la formulaci on de espacios de Riemann, este operador se transforma covariantemente y la ecuacion (15.46)
es el producto escalar de un vector covariante con un contravariante, esto se denota como j = 0. En general los invariantes en
el espacio de Riemann son combinaciones de tensores covariantes con tensores contravariantes, de modo que deben escribirse con
ndice arriba contrado con ndice abajo e.g. j k , k p .
378 CAPITULO 15. RELATIVIDAD ESPECIAL

las Ecs. (15.47) se pueden reescribir en la forma

2A 4 1 2 i 4
2 A + 2 = c j ; 2 i 2 2
= ic (15.51)
(ict) c t c

definimos el operador de DAlembert en la forma

1 2
 2 = 2 + = i i + 4 4
2
c t 2
(ict)2
2
 = (15.52)
x x

las Ecs. (15.51) en el espacio de Minkowski quedan


4 4
A = j ;  (i) = ic
c c
que se puede condensar en una sola ecuaci
on cuadrivectorial con j = (j, ic) y A = (A, i)

4
A = j (15.53)
c
Una vez que se demuestre que la cuadrupla A definida en (15.49) es un cuadrivector de Lorentz, se sigue
que las Ecs. (15.50) y (15.53) estan escritas de manera manifiestamente covariante. Se deja esta demostraci on
como ejercicio al lector. En (15.50) ambos miembros son escalares de universo, en tanto que en (15.53) ambos
miembros son vectores de universo, pues el operador de DAlembert es un escalar de universo. Estas ecuaciones
demuestran que la teora electromagnetica de Maxwell es covariante con respecto a las transformaciones de
Lorentz de modo que est a descrita por la relatividad especial y no por la relatividad de Galileo. El lector puede
verificar que el uso del gauge de Coulomb A = 0 hace mucho m as difcil el proceso de colocar las ecuaciones
de manera manifiestamente covariante.

15.6. Fuerza y momento en relatividad especial


Las leyes de Newton son invariantes de Galileo y por tanto no son invariantes de Lorentz. En consecuencia,
es necesario encontrar una generalizaci on adecuada de fuerza cuya ley fundamental satisfaga los requisitos
de covarianza ante transformaciones de Lorentz. Naturalmente, debemos tambien exigir que las ecuaciones
relativistas se reduzcan a la ecuaci
on din
amica fundamental de Newton en el lmite 0
d
(mvi ) = Fi (15.54)
dt
es facil ver que las componentes espaciales de un cuadrivector forman un vector espacial, ya que las transfor-
maciones de Lorentz contienen a las rotaciones espaciales (L4i = Li4 = 0 y L44 = 1). No obstante, el recproco
no es cierto, las componentes de un vector espacial no se transforman necesariamente como lo haran las
componentes espaciales de un cuadrivector. Por ejemplo, se puede multiplicar a las componentes del trivector
por una funci on cualquiera de y sus propiedades de rotaci on no se alteran. En cambio, esta multiplicaci
on
s alterara las propiedades de transformaci on de las tres componentes espaciales de un cuadrivector ante una
transformaci on de Lorentz. Enp concordancia con esto, las componentes espaciales de la cuadrivelocidad u
forman un vector espacial p v/ 1 2 . Sin embargo, la v no hace parte de ning un cuadrivector, para que lo
sea debe dividirse por 1 . 2

Primero buscaremos una generalizaci on cuadrivectorial del miembro izquierdo en (15.54), es claro que la
cuadrivelocidad definida en (15.44) posee una parte espacial que se reduce a v cuando 0. Tomaremos a m
como un invariante que lo llamaremos la masa en reposo o masa propia de la partcula. En cuanto al tiempo
t, este no es un invariante relativista pero sabemos que el tiempo propio s es un invariante que adem as se
15.6. FUERZA Y MOMENTO EN RELATIVIDAD ESPECIAL 379

reduce a t cuando 0. Los argumentos anteriores sugieren que la generalizaci on de la ley de Newton (15.54)
para una partcula tenga la forma
d
(mu ) = K (15.55)
d
donde K debe ser un cuadrivector llamado fuerza de Minkowski.
N
otese que en general las componentes espaciales de K no tienen que coincidir con las componentes de la
fuerza, salvo por supuesto en el lmite no relativista con 0. Podemos pensar por ejemplo que Ki se puede
construr como el producto de Fi con cierta funci on h () que se reduzca a la unidad en el lmite no relativista.
Para conocer la forma de h () debemos conocer el comportamiento de la fuerza ante una transformaci on de
Lorentz. Utilizaremos dos procedimientos.
En el primer procedimiento, tendremos en cuenta que las fuerzas fundamentales son solo cuatro: las in-
teracciones gravitacional, electromagnetica, nuclear debil y nuclear fuerte. La idea sera expresar las leyes que
gobiernan a estas interacciones de manera covariante. No obstante, no se conoce teoras covariantes para las
fuerzas nucleares, entre otras cosas porque tales interacciones no se pueden modelar cl asicamente en forma
satisfactoria (en la teora cu
antica la fuerza pierde su significado y es reemplazada por la energa potencial). Sin
embargo, en el caso electromagnetico cl asico es de esperarse que podamos construr una expresi on de la fuerza
que nos proporcione una ecuaci on covariante, despues de todo la teora especial de la relatividad fue cons-
truda justamente para que las ecuaciones de Maxwell fueran covariantes de Lorentz. Afortunadamente, esta
construccion sera suficiente ya que las propiedades de transformaci on de las fuerzas deben ser las mismas in-
dependientemente de su origen. Por ejemplo, el hecho de que una partcula este en equilibrio (suma de fuerzas
cero) debe ser independiente del sistema de referencia inercial utilizado y esto solo es posible si las fuerzas
transforman todas igual, incluso si cada una es de diferente naturaleza.
Vimos que a partir de la expresi on para la fuerza de Lorentz escrita en terminos de potenciales en lugar
de campos, la fuerza electromagnetica que se ejerce sobre una partcula cargada viene dada por
   
1 1 dAi
Fi = q vA +
xi c c dt

recordando la definicion del cuadripotencial (15.49), y de la cuadrivelocidad (15.44) podemos escribir la ex-
presi
on (1/c) v A en forma covariante
!  p  p
1 1p ic 1 1 1 2 v
v A = i 1 p 2 vi Ai = A4 2
1 u4 p i Ai
c c 1 2 c c c 1 2
1 1p 1p 1p
vA = 1 2 A4 u4 1 2 ui Ai = 1 2 [A4 u4 + ui Ai ]
c c c c
1 1p
vA = 1 2 u A
c c
y las componentes Fi de las fuerzas son
"  p  #
1 2
1p 2
dAi
Fi = q 1 u A + 1 p
xi c c 1 2 dt
 
qp dAi
Fi = 1 2 (u A ) (15.56)
c xi d
una extensi
on cuadrivectorial del termino entre parentesis es de la forma
dA
(u A )
x d

este termino es claramente un cuadrivector, pues el primer termino es la derivada (operador cuadrivectorial)
de un escalar de universo, el segundo termino es el producto de un cuadrivector dA por un escalar de universo
(d )1 . En consecuencia, la expresi
on en parentesis cuadrados en (15.56) est a asociada a las componentes
380 CAPITULO 15. RELATIVIDAD ESPECIAL

p
espaciales de un cuadrivector. Por tanto, Fi es el producto de 1 2 por la componente espacial de un
cuadrivector, el cual identificamos como la fuerza de Minkowski K . Por tanto la relaci
on entre la fuerza
ordinaria y la de Minkowski esta dada por
p
Fi = Ki 1 2 (15.57)

esta relaci
on debe ser general e independiente del origen de las fuerzas. Para el caso de partculas cargadas
sometidas a un campo electromagnetico, la fuerza de Minkowski se obtiene de la extrapolaci
on de la expresi on
(15.56)
 
q dA
K = (u A ) (15.58)
c x d
En un segundo procedimiento, se define la fuerza como la variaci
on del momento lineal por unidad de
tiempo, en todos los sistemas de Lorentz se tiene entonces que

dpi
Fi = (15.59)
dt
pero para ello ser
a necesario redefinir el momento lineal pi de modo que en el lmite no relativista se reduzca
a mvi . Podemos hallar la forma que toma el momento y el significado de K haciendo que la Ec. (15.55)
se parezca en lo posible a (15.59). A partir de la relaci
on entre y t y de la definici
on de cuadrivelocidad,
podemos escribir las componentes espaciales de (15.55) en la forma
!
d mvi p
p = Ki 1 2 (15.60)
dt 1 2

y comparando (15.60) con (15.59) vemos que el teorema de conservaci on del momento lineal (reemplazante
mas general que la tercera ley de Newton) ser
a invariante de Lorentz si definimos la cantidad de movimiento
en la forma
mvi
pi = p (15.61)
1 2
y que Fi y Ki esten relacionadas como lo indica la ecuaci
on (15.57). N
otese que la ecuaci
on (15.61) se reduce
a mvi cuando 0 como se esperaba. Los dos procedimientos conducen entonces a los mismos resultados.
Comparando (15.61) con la definici on (15.44) de la cuadrivelocidad vemos que pi es la parte espacial del
llamado cuadrivector momento energa
p = mu (15.62)
la ecuaci
on de movimiento generalizada para una partcula se escribe entonces

dp
= K (15.63)
d

15.7. Energa y relaci


on momento-energa en relatividad especial
Hasta ahora solo hemos estudiado la parte espacial de las ecuaciones cuadrivectoriales (15.55, 15.63). Para
obtener informaci
on de la parte temporal hagamos el producto interno de (15.55) por la cuadrivelocidad

d d m 
u (mu ) = u u = K u
d d 2

de (15.45) vemos que u u = c2 y como m es tambien constante, vemos que la expresi


on de la mitad se
anula. Luego
K u Ki ui + K4 u4 = 0
15.7. ENERGIA Y RELACION
MOMENTO-ENERGIA EN RELATIVIDAD ESPECIAL 381

y usando las Ecs. (15.44, 15.57) tenemos


!
Fi vi ic Fv icK4
K u p p + K4 p = 2
+p =0
1 2 1 2 1 2 1 1 2

de modo que la cuarta componente de la fuerza de Minkowski ser


a
i Fv
K4 = p (15.64)
c 1 2

la componente temporal de la Ec. (15.55) se obtiene empleando (15.44) y (15.64)


!
d 1 d ic i Fv
(mu4 ) = K4 p mp = p
d 1 dt
2 1 2 c 1 2

finalmente la cuarta componente de (15.55) queda de la forma


!
d mc2
p =Fv (15.65)
dt 1 2

recordemos ahora el escenario no relativista. En este escenario F v corresponde al trabajo por unidad de
tiempo que se hace sobre la partcula dW/dt. Teniendo en cuenta adem as el teorema fundamental del trabajo
y la energa resulta dW = dT siendo T la energa cinetica. De esto se concluye que
dW dT
Fv = = (lmite no relativista)
dt dt
Extrapolando esta definici
on al caso relativista tenemos que
dT
= F v (escenario relativista) (15.66)
dt
Comparando (15.65) con (15.66) se obtiene la generalizaci
on relativista de la energa cinetica

mc2
T =p (15.67)
1 2

en el lmite 2 << 1 esta ecuaci


on se expande como
 
2 2 1
T = mc 1 + = mc2 + mv 2
2 2
Este valor no coincide con el lmite no relativista esperado. Sin embargo, el valor adicional pareciera a priori ser
irrelevante ya que se puede adicionar una constante a la derecha de (15.67) que no afectara la validez de la Ec.
(15.65). Sin embargo, es preferible mantener este valor y conservar la cantidad T en la forma dada por (15.67),
hay dos buenas razones para mantener esta cantidad: (a) En algunos casos como veremos m as adelante mc2
puede cambiar gracias al cambio en la masa en reposo de las partculas, por ejemplo en colisiones inel asticas.
Esto nos indica que este tipo de energa se puede intercambiar o transferir y por tanto es Fsicamente relevante
y (b) al comparar (15.62) con (15.67) vemos que iT /c es la cuarta componente del cuadrivector momento
energa
mvi imc iT
p = (p1 , p2 , p3 , p4 ) ; pi = mui = p ; p4 = mu4 = p =
1 2 1 2 c
Sin embargo, para usar una terminologa consistente con la newtoniana es preferible definir la energa cinetica
como la parte de esta energa que se reduce correctamente al valor no relativista

K T mc2 = mc2 ( 1)
382 CAPITULO 15. RELATIVIDAD ESPECIAL

no existe una u nica designaci on para T . En ocasiones se le llama energa total (si bien esto solo sera apropiado
para partcula libre) y en otras simplemente energa. En todo caso T posee propiedades interesantes. Por
ejemplo se puede demostrar que la T dada por (15.67) se conserva siempre que se conserve el momento
lineal espacial definido en (15.61). Para verificar este teorema, podemos tener en cuenta que la conservaci on
del momento espacial debe ser invariante ante una transformaci on de Lorentz, en realidad esta invarianza
on de sistema inercial dada por Einstein. Las componentes transformadas pj ser
esta implcita en la definici an
funciones lineales de las pi pero tambien de p4 i.e. de la energa T . En consecuencia, la conservaci on de pj para
todos los sistemas inerciales exige la conservaci on conjunta de todas las componentes de p . Es f acil calcular
el valor del invariante p p
p p = (mu ) (mu ) = m2 u u = m2 c2 (15.68)
por otro lado    
iT iT T2
p p = p, p, = p2 2 (15.69)
c c c
siendo p el trimomento espacial definido en (15.61). Combinando (15.68) y (15.69) se obtiene la relaci
on
cinematica fundamental para la relatividad especial

T 2 = p2 c2 + m2 c4 (15.70)

la Ec. (15.70) es la an aloga a la relacion no relativista T = mv 2 /2 con la diferencia de que en relatividad T


2
incluye la energa en reposo mc . La definici on de T Ec. (15.67) muestra que la energa de una partcula con
energa en reposo finita tiende a infinito cuando v c, es decir que se requiere una energa infinita para llevar
una partcula material desde el reposo hasta una velocidad c. Por tanto la teora predice que no es posible
alcanzar o superar la velocidad de la luz en el vaco partiendo de una velocidad menor que c.
El enunciado anterior no prohbe la existencia de partculas que nazcan con velocidades mayores a las de
la luz (taquiones). De acuerdo con la Ec. (15.67) la masa asociada a esta partcula tendra que ser imaginaria
para tener p una energa real. Esto implica que un taqui on est
a descrito por un par ametro real m de modo que
2 2
T = m c / 1. Las soluciones taqui onicas y en particular sus implicaciones sobre la causalidad han sido
motivo de una amplia especulaci on cientfica. No obstante, no se han observado partculas taquionicas hasta
el momento.
Ya hemos dicho que en relatividad especial la conservaci on del trimomento conduce a la conservaci on
de la cuarta componente del cuadrivector momento energa. Esta situaci on contrasta con la mec anica no
relativista, en la cual la conservaci on del momento lineal y la conservaci on de la energa cinetica son aspectos
independientes. Por ejemplo, en un choque inel astico entre dos partculas se conserva el momento lineal pero no
la energa cinetica, esto se debe a cambios en la energa interna del sistema debido a reconfiguraciones internas.
En el caso relativista, la energa T debe conservarse junto con el momento espacial incluso en choques inel asticos
debido a sus propiedades de transformaci on como cuadrivector. Fsicamente, esto se entiende teniendo en cuenta
que T posee dos terminos, la energa cinetica y la energa en reposo mc2 . En un choque inel astico la energa
cinetica relativista cambia tambien en virtud de reconfiguraciones internas del sistema, pero en este caso estos
cambios en la energa interna se traducen en cambios en la energa en reposo y por tanto de la masa en reposo.
Veamos un ejemplo sencillo del hecho de que la conservaci on de T implica un cambio en la masa en reposo en
colisiones inelasticas. Sean dos partculas identicas en masa que viajan con respecto al laboratorio a velocidades
iguales y opuestas. El momento lineal total es nulo visto por el laboratorio y el cuadrivector momento energa
viene dado por      
iT iT 2iT
P = p (1) + p (2) = p, + p, = 0, (15.71)
c c c
siendo T la energa de cada partcula definida por la Ec. (15.67). Supongamos que el choque es totalmente
inel
astico de modo que las dos masas quedan unidas (como dos bolas de plastilina). Puesto que en el estado
final tenemos una sola partcula y su trimomento es nulo, la partcula resultante debe estar en reposo con
respecto al laboratorio. La energa total del estado final Tf es la energa en reposo del sistema compuesto final,
la cual aplicando (15.70) resulta
Tf = M c2 (15.72)
LAGRANGIANA DE LA MECANICA
15.8. FORMULACION RELATIVISTA 383

siendo M la masa del estado final. es conveniente parametrizar la masa del estado final en la forma

M = 2m + M (15.73)

donde M nos da informaci on sobre la posible perdida o ganancia de masa del estado final (de masa M ) con
respecto a la masa del sistema inicial (de masa 2m). La conservacion de P4 en el choque manifestada en la Ec.
(15.71) muestra que
Tf = 2T (15.74)

la cual combinada con (15.72) nos da


2T = M c2 (15.75)

es claro que se ha perdido energa cinetica en el proceso, la energa cinetica al principio y al final del proceso
est
an dadas por
K0 = 2T 2mc2 ; Kf = 0

y usando (15.74), (15.73) y (15.75)

K0 Kf = 2T 2mc2 = M c2 2mc2 = (2m + M ) c2 2mc2


K0 Kf = (M ) c2

por lo tanto, el choque inel


astico ha convertido toda la energa del movimiento inicial vista por el laboratorio en
un incremento en la masa en reposo del sistema. En esta clase de choque inel astico se suele decir que la energa
cinetica perdida en el choque se convierte en calor. La relatividad restringida nos dice que la masa en reposo o
inercia del sistema aumenta en proporci on al calor que se produce. Este incremento de masa se podra detectar
poniendo al sistema en movimiento a traves de una fuerza conocida, no obstante para sistemas macrosc opicos
estos cambios de masa son muy difciles de detectar ya que un joule de energa posee un equivalente de masa de
aproximadamente 1,1 1017 Kg. No es de extra narse entonces que las evidencias sobre los cambios de la masa
en reposo se hayan visto en sistemas de escala at omica, nuclear o subnuclear. En estos casos no podemos hablar
de producci on de calor sino de cambios en la energa interna del sistema. A la escala subnuclear, estos cambios
en la energa en reposo suelen ser suficientes para permitir la creaci on de una o m as partculas adicionales.
Es de anotar adem as que estos cambios tambien pueden ocurrir en el sentido opuesto: la energa en reposo se
puede convertir en energa en movimiento, fen omeno particularmente visible en las explosiones nucleares, por
supuesto en estas explosiones el valor de T permanece constante durante la explosi on. A pesar de la enorme
energa liberada en estas explosiones, la perdida de masa suele ser del orden del 0,1 % de la masa original.

15.8. Formulaci
on Lagrangiana de la mec
anica relativista
Dado que hemos realizado la generalizaci on adecuada de las leyes de Newton en el marco de la relatividad
restringida, podemos intentar establecer una formulaci on Lagrangiana para la din amica relativista. Vamos
a describir dos procedimientos. En el primero, se pretende reproducir en un sistema inercial particular las
ecuaciones de la forma (15.59), resultando en general una formulaci on que no es manifiestamente covarian-
te. Las fuerzas Fi podran estar o no adecuadamente relacionadas con una fuerza de Minkowski K . El otro
metodo consiste en construr un principio de Hamilton covariante a partir del cual se llega a las ecuaciones
de Lagrange en las cuales el espacio y el tiempo se tratan como coordenadas de un espacio de configuraci on
de cuatro dimensiones. El primer metodo puede presentar problemas cuando las fuerzas no se formulan bien
relativsticamente, pero generalmente las ecuaciones de movimiento as obtenidas son correctas relativstica-
mente en un sistema inercial dado, aunque no sean manifiestamente covariantes. El segundo metodo aunque
formalmente m as correcto, desemboca en grandes dificultades incluso para sistemas de una partcula. Para
sistemas de varias partculas falla casi desde el principio y no hay una formulaci on covariante satisfactoria
para la mec anica cl
asica relativista de muchas partculas. Este sigue siendo un tema activo de investigaci
on.
384 CAPITULO 15. RELATIVIDAD ESPECIAL

15.9. Formulaci
on no manifiestamente covariante
La idea es encontrar una Lagrangiana que nos lleve a las ecuaciones de movimiento relativistas que cons-
tituyeron nuestra generalizaci
on de las Leyes de Newton. Estas ecuaciones ser an obtenidas en funci on de las
coordenadas de un determinado sistema inercial. N otese que el principio de DAlembert resulta poco fructfero
en este caso, ya que aunque tal principio sigue siendo v alido, las deducciones basicas se basaban en el hecho
de que pi = mi vi relaci
on que ya no es v
alida en relatividad restringida. Por lo tanto, elegiremos el camino de
tomar como punto de partida el principio de Hamilton
Z t2
I = L dt = 0 (15.76)
t1

y obtener con base en las ecuaciones de Euler Lagrange ecuaciones de movimiento que concuerden con las
generalizaciones obtenidas para el formalismo Newtoniano Ec. (15.59). Estudiaremos el caso de una partcula
sometida a fuerzas conservativas que no dependen de la velocidad, en cuyo caso escribimos
p
L = mc2 1 2 V (15.77)

on y 2 = v 2 /c2 donde v es la velocidad de la partcula en el


siendo V un potencial que solo depende de la posici
sistema inercial particular que se toma. Veamos que este Lagrangiano nos conduce a las ecuaciones correctas,
partiendo de las ecuaciones de Lagrange
 
d L L
=0
dt vi xi

y teniendo en cuenta la relaci


on
 r   v 
L 2 vk vk mc2 k mvi
= mc 1 2 = q 2 2 ki = p = pi (15.78)
vi vi c 2 1 vk 2vk c 1 2
c

se obtiene
dpi V dpi V dpi
+ =0 = = Fi
dt xi dt xi dt
que concuerda con (15.59). N otese que el lagrangiano NO es de la forma L = T V . No obstante, la expresi on
L/vi sigue siendo el momento lineal como ocurre en la formulaci on no relativista con coordenadas cartesianas
y potencial independiente de las velocidades. En realidad es este hecho lo que garantiza la correccion adecuada
de las ecuaciones de Lagrange. Por tanto, hubieramos podido proceder hacia atr as desde (15.78) para obtener
al menos la dependencia de la velocidad del Lagrangiano.
La generalizaci
on de (15.77) a sistemas de muchas partculas o a sistemas de coordenadas generalizadas qj
es directa. Las cantidades de movimiento can onicas siguen definiendose en la forma

L
pj = (15.79)
qj

de modo que se mantiene la relaci on entre coordenadas cclicas y la conservaci


on de los momentos asociados
a ellas. Adicionalmente, si el Lagrangiano no depende explcitamente del tiempo se sigue manteniendo a la
funcion h como constante de movimiento
h = qj pj L (15.80)
p
hay sin embargo, una diferencia importante con el caso no relativista: debido al factor 1 2 en el Lagran-
giano (15.77), dicho Lagrangiano no es una funcion homogenea de la velocidad, de modo que la demostraci on
realizada en el caso no relativista para llegar a que h es la energa del sistema (en el caso de potenciales
dependientes de la posici
on y coordenadas que no dependen explcitamente del tiempo) no es valida en el caso
NO MANIFIESTAMENTE COVARIANTE
15.9. FORMULACION 385

relativista. Veremos sin embargo que para potenciales que solo dependen de la posici on, h contin
ua siendo la
energa total del sistema
mvi vi p
h = x i pi L = p + mc2 1 2 + V
1 2
p ! !
1 2 mvi mvi p
h = p p + mc2 1 2 + V
m 1 2 1 2
p h pi pi i
h = 1 2 + mc2 + V (15.81)
m
por otro lado de la Ec. (15.70) vemos que

T2
pi pi = p2 = m2 c2 (15.82)
c2
y reemplazando (15.82) en (15.81) resulta
p  2  p
T 2 2 T2
h = 1 2 mc + mc + V = 1 2 +V
mc2 mc2
p  
1 2 2 1
h = T + V = T2 + V
mc2 T

la funci
on energa queda entonces
mc2
h= p +V =T +V =E (15.83)
1 2
de modo que para el caso de potenciales dependientes solo de la posici on, h se conserva y es la energa del
sistema (naturalmente hemos usado coordenadas cartesianas de modo que la transformaci on de coordenadas
a las coordenadas generalizadas es trivial).
La introduccion de potenciales dependientes de la velocidad no conlleva ninguna dificultad particular y se
puede efectuar en forma analoga al caso no relativista. De esta forma, para el caso de una partcula inmersa en
un campo electromagnetico, el lagrangiano se obtiene reemplazando V por el potencial de Lorentz en (15.77)
p q
L = mc2 1 2 q + A v (15.84)
c
puede verse que el momento can onico ya no es mui , pues en este caso hay terminos adicionales debidos a la
parte del potencial que depende de la velocidad
q
pi = mui + Ai (15.85)
c
esta relaci
on es an aloga a la Ec. (5.2) obtenida para el caso no relativista. El Lagrangiano (15.84) no es
manifiestamente covariante pues no est a escrito en terminos de tensores de Lorentz. Sin embargo, en este caso
se espera que estos resultados sean v
alidos en cualquier sistema de referencia inercial en virtud de la covarianza
relativista de la fuerza de Lorentz, de la cual proviene el potencial dependiente de la velocidad que se usa en
(15.84).
De lo anterior se desprende que muchas de las estrategias y propiedades desarrolladas para la mec anica no
relativista se pueden aplicar en un escenario relativista como veremos en los siguientes ejemplos

15.9.1. Movimiento bajo una fuerza constante (hiperb


olico)
Sin perdida de generalidad se puede tomar el eje x1 a lo largo de la fuerza constante. El Lagrangiano tiene
la forma p x
L = mc2 1 2 + max ;
c
386 CAPITULO 15. RELATIVIDAD ESPECIAL

Las ecuaciones de Lagrange quedan


  " r !# ! !
d L d 2 x 2 d mx d m
= mc 1 2 = p =c p
dt x dt x c dt 1 2 dt 1 2
L
= ma
x
y se obtiene ! !
d m d a
c p ma = 0 ; p =
dt 1 2 dt 1 2 c
la primera integraci
on se escribe como
at +
p =
1 2 c
siendo una constante de integraci
on. Podemos despejar de esta ecuacion elevando al cuadrado a ambos
lados
" #
2 (at + )2 2 (at + )2 2
 2 (at + )2 (at + )2
= = 1 1+ =
1 2 c2 c2 c2 c2
" # q 
2
2
2 c + (at + ) (at + )2 2 2
= c + (at + ) = (at + )
c2 c2
at +
=q (15.86)
c2 + (at + )2

la Ec. (15.86) ser


autil para examinar el lmite no relativista, por el momento continuamos manipulando la
expresi
on
x at + at +
=q dx = c q dt (15.87)
c 2 2 2 2
c + (at + ) c + (at + )
on con t entre 0 y t y con x entre x0 y x nos da
Una segunda integraci
Z x Z t
(at + ) dt
dx = c q
x0 0 c2 + (at + )2

da la soluci
on q 
c p
2 2 2 2
x = x0 + c + (at + ) c + (15.88)
a
la velocidad se obtiene de (15.87)
c a + a2 t
x = v = (15.89)
a 2at + c2 + 2 + a2 t2
y al evaluarla en t = 0 tenemos
c
v0 = (15.90)
+ 2 c2
la Ec. (15.90) muestra que est a directamente relacionado con la velocidad inicial. Si la partcula parte del
reposo en el origen las condiciones iniciales quedan x0 = v0 = = 0, y la Ec. (15.88) se puede escribir en la
forma
q  q 
c 2 2 c2 c 2 2
x = c + (at) c x + = c + (at)
a a a
 2  2
c2 c2  2 2 2
 c2 c4
x+ = 2 c +a t x+ c2 t2 = 2
a a a a
NO MANIFIESTAMENTE COVARIANTE
15.9. FORMULACION 387

que describe la ecuaci


on de una hiperbola en el plano x t.
Veamos ahora como se recobra el lmite no relativista. La Ec. (15.86) se puede reescribir como

1
= r 2
c
at+ +1

on [c/ (at + )]2 >>


y como el lmite no relativista corresponde a 0 se ve que esto es equivalente a la condici
1, o lo que es lo mismo at + << c. Reemplazando dicho lmite en (15.88) se obtiene la par abola tpica del
movimiento no relativista y adem as se llega a que v0 .
Este movimiento puede describir por ejemplo, la trayectoria de electrones que se aceleran con un campo
electrico constante y uniforme. Pues las velocidades tpicas de los electrones son al menos del orden de la
velocidad de la luz en el vaco.

15.9.2. Oscilador arm


onico unidimensional relativista
En este caso el Lagrangiano (15.77) toma la forma
p 1
L = mc2 1 2 kx2
2
dado que L no es funci on explcita del tiempo entonces la funci
on energa y por tanto la energa total del
sistema es una constante de movimiento. Si despejamos la velocidad en la Ec. (15.83) teniendo en cuenta que
h es la energa, se tiene

mc2 m2 c4 m2 c4 m2 c4
E=p + V (E V )2 = 1 2
= 2 2
= 1
1 2 1 2 (E V ) (E V )2
 2
1 dx m2 c4
=1 (15.91)
c2 dt (E V )2
podemos generalizar un poco antes de entrar en el potencial del oscilador armonico. Sea un potencial tal que
V (x) = V (x) y tal que V (0) es un mnimo local. Si la energa E est a entre V (0) y el m
aximo de V el
movimiento ser
a oscilatorio entre los lmites x = b donde b est
a determinado por

V (b) = E

el periodo del movimiento oscilatorio se puede obtener a partir de (15.91)



  s 2 4
1 dx m c 1 dx = dt
= 1 2 c
q
c dt (E V ) 2 4
1 m c 2 (EV )

un periodo consistira en ir y volver desde b hasta b. Por simetra esto se puede escribir como cuatro veces la
integral entre 0 y b
Z
4 b dx
= q (15.92)
c 0 1 m c 2
2 4
[EV (x)]

cuando (15.92) se aplica al potencial de Hooke, se puede expresar en terminos de integrales elpticas. No
obstante, ser
a mas ilustrativo examinar las correcciones relativistas de primer orden cuando V (x) << mc2 .
Escribiremos la energa total E de la forma

E = mc2 (1 + E)
388 CAPITULO 15. RELATIVIDAD ESPECIAL

con lo cual se tiene que

E V (x) mc2 (1 + E) 12 kx2 k


= = 1 + E x2 ;
mc2 mc2 2mc2
E V (x)  E
= 1 + b2 x2 ; b2
mc2
y el termino en el interior del radical en (15.92) resulta
 2  2
m2 c4 1 1 + b2 x2 1 2 b2 x2 + 2 b2 x2
1 = 1 = =
[E V (x)]2 [1 + (b2 x2 )]2 [1 + (b2 x2 )]2 [1 + (b2 x2 )]2

2 b2 x2
=
[1 + (b2 x2 )]2
2
Donce hemos conservado terminos hasta orden b2 . El periodo es aproximadamente
Z b Z b
4 dx 4 dx  

= r = p 1 + b2 x2
c 0 2(b2 x2 ) c 0 2 (b2 x2 )
[1+(b2 x2 )]2

???????????????????
??????????????????
en (15.92) el periodo se escribe como
Z b  
4 dx 3 2 

= p 1 b x2 (15.93)
c 0 2 (b2 x2 ) 4

la integral (15.93) se puede evaluar con el cambio de variable x = b sin resultando


  r    
2 1 3 2 m 3kb2 3kb2
= 1 b = 2 1 = 0 1
c 2 8 k 16mc2 16mc2

donde 0 es el periodo en el caso no relativista. Vemos entonces que las correcciones relativistas introducen
una dependencia con la amplitud, dada aproximadamente por

3 kb2 3
= = 2
= E (15.94)
0 0 16 mc 8

15.9.3. Movimiento de partcula cargada en un campo magn


etico
Este problema se puede trabajar aplicando el Lagrangiano (15.84) usando = 0 y el potencial vecto-
rial adecuado para un campo magnetico constante A = 1/2 (r B). No obstante, es mas sencillo emplear
directamente el formalismo Newtoniano de fuerzas y escribir
q
F= (v B) (15.95)
c
con lo cual la ecuaci
on de movimiento es
dp q q
= (v B) = (p B)
dt c mc

La expresi
on (15.95) nos garantiza que la fuerza de Lorentz magnetica no efectua trabajo sobre la partcula
de modo que F v = 0. Este hecho junto con las Ecs. (15.65, 15.66) nos dice que T permanece constante, en
tanto que la expresi
on (15.70) nos dice que p y tambien lo son. Adicionalmente, (15.95) nos indica que F es
15.10. FORMULACIONES LAGRANGIANAS COVARIANTES 389

perpendicular a B de modo que la componente del momento a lo largo de B se debe conservar. Finalmente,
la ortogonalidad entre F y v nos indica que la partcula no cambia su rapidez.
Por lo anterior ser
a posible sin perdida de generalidad asumir que x3 es la direcci
on de B y que el movimiento
es en el plano x1 x2 . Descompondremos a p en la forma p = p3 u3 + p . Con base en lo anterior sabemos que
p3 es constante ascomo el m odulo de p. Por tanto, el m odulo de p es claramente constante de modo que p
realiza una precesion alrededor de la direcci on del campo magnetico con una frecuencia dada por
qB
= (15.96)
mc
al ser constante se deduce que la proyecci
on de la velocidad en el plano x1 x2 tiene modulo constante y gira
con la misma frecuencia. La partcula se mueve entonces en un plano y describe una orbita circular uniforme
con velocidad angular . De esto se obtiene el modulo de p
p = mr
siendo r el radio de la circunferencia. Si combinamos esta ecuaci
on con (15.96) obtenemos el radio de la
circunferencia en funci
on del momento lineal
p
r= (15.97)
qB/c
el radio de curvatura solo depende de las propiedades de esta a traves del factor pc/q (= Br), que se
conoce como la rigidez magnetica de la partcula. Se puede ver que aunque presenta correcciones relativistas
contenidas en el factor , la relaci
on entre radio y momento es la misma que en el caso no relativista (justamente
porque el momento a su vez se redefine con el mismo factor ). Debe tenerse en cuenta que aunque r solo
depende de p , en el calculo de debe usarse tanto la componente perpendicular como la paralela a B a fin
de calcular .

15.10. Formulaciones lagrangianas covariantes


El metodo abordado en la seccion anterior predice correctamente las ecuaciones de movimiento relativistas
de los problemas en cuesti on pero no es clara la covarianza de las ecuaciones de la mec anica. En particular
el parametro tiempo se ha tratado como par ametro totalmente distinto de las coordenadas espaciales, en
tanto que una formulaci on covariante exige que el espacio y el tiempo se traten como cordenadas an alogas
del espacio de universo. Esto implica que en lugar del tiempo, se debe utilizar alg un parametro invariante
para trazar el punto figurativo que nos muestra la evoluci on de un sistema en el espacio de configuracion. Es
necesario partir de un principio de Hamilton manifiestamente covariante. Ahora, si el parametro de integracion
es un invariante de Lorentz entonces el Lagrangiano debe ser un escalar de universo en cualquier formulaci on
covariante. Finalmente, en vez de ser funciones de xi y x i el lagrangiano debe ser funci
on de las coordenadas
del espacio de Minkowski y de sus derivadas respecto al par ametro invariante.
Veamos el caso de un partcula. La eleccion natural del parametro invariante es aparentemente el tiempo
propio de la partcula. Sin embargo, las componentes de la velocidad generalizada, deben entonces cumplir la
relaci
on
u u = c2 (15.98)
que demuestra que no todas sus componentes son independientes. Por lo tanto, supondremos que el par ametro
invariante es m as bien una funci
on que crece mon otonamente a medida que el punto de universo evoluciona a
lo largo de la lnea de universo de la partcula y que es ademas invariante de Lorentz. La derivada con respecto
al parametro y con respecto al par ametro t ser an simbolizadas en la forma
dx dx
x
; x
d dt
Un principio covariante debe ser entonces del tipo
Z 2
I = (x , x
) d (15.99)
1
390 CAPITULO 15. RELATIVIDAD ESPECIAL

siendo un escalar de universo. N


otese que la dependencia explcita del tiempo est
a contenida en el hecho
de que depende de x4 . Las ecuaciones de Euler Lagrange que surgen de aplicar el principio de Hamilton a
(15.99) son
 
d
=0 (15.100)
d x x
de modo que debemos encontrar un tal que las Ecs. (15.100) sean equivalentes a las Ecs. (15.55). Una manera
de hacerlo es partir de la integral de acci
on usual con par
ametro t y transformando dicha integral de modo
que el par ametro tiempo sea reemplazado por el par ametro invariante y el tiempo en cambio aparezca no
como par ametro sino como otra coordenada generalizada. Como debe ser funci on monotona de t medida en
cierto sistema inercial, se tiene

dxi dxi d dxi /d x


i dt d (ict) i dx4 i
= = ic ; dt = d = d = d = x4 d
dt d dt dt/d x
4 d icd c d c

con lo cual la integral de acci


on usual (con par
ametro t) se transforma de la manera siguiente
Z t2 Z 2  
i xj
I= L (xj , t, x j ) dt = L x , ic 4 d
x (15.101)
t1 c 1 x4

esto nos muestra que una receta adecuada para el lagrangiano transformado sera de la forma
 
i
x4 xj
(x , x
) = L x , ic (15.102)
c x4

este lagrangiano tiene una caracterstica no vista hasta ahora en los lagragianos, depende del cociente entre
derivadas de las coordenadas generalizadas x j /
x4 y de un factor global x
4 . La primera caracterstica hace
que sea una funcion homogenea de primer grado de las velocidades generalizadas independientemente de la
forma funcional de L
(x , a
x ) = a (x , x
) (15.103)

este no es un fenomeno de la fsica relativista como tal sino de la forma en que se ampla el espacio de
configuraci
on para incluir a t como coordenada generalizada y usar otro par ametro para seguir la evoluci on
del punto figurativo de la partcula en el espacio de universo. Un Lagrangiano de la forma (15.103) recibe el
nombre de Lagrangiano homogeneo y el correspondiente problema homogeneo del c alculo de variaciones exige
un tratamiento especial. La dificultad m as seria surge en la formulacion Hamiltoniana, en particular puede
notarse que como consecuencia de esta homogeneidad, la funci on energa h definida en (5.13) es identicamente
nula, como se puede apreciar aplicando el teorema de Euler Ec. (5.16). Al ser homogenea de primer grado
en x
se tiene que

=x
x

podemos entonces demostrar que la funci
on satisface la relaci
on
   
d
x
= 0 (15.104)
d x
x

la cual nos indica que si se satisfacen tres de las Ecs. (15.100) entonces la cuarta se satisface autom aticamente.
Notese que esto es consecuencia de la homogeneidad de .
Veamos como se escribe esta transformaci on para una partcula libre. La Ec. (15.77) nos indica la expresi
on
no covariante para el Lagrangiano de una partcula libre
p
L = mc c2 x i x i
15.10. FORMULACIONES LAGRANGIANAS COVARIANTES 391

on (15.102) resulta una posible Lagrangian covariante10


y aplicando la transformaci
p
= mc x x
(15.105)

con la cual las ecuaciones de Euler Lagrange equivalen a


 
d mcx
=0
d
x x

como el par
ametro deber ser funci on mononota del tiempo propio , las derivadas respecto a est
an rela-
cionadas con las derivadas en funci
on de a traves de la expresi
on
dx d dx d
x
= = u
d d d d
y las ecuaciones de Lagrange quedan de la forma
 
d mcu d (mu )
= =0
d u u d

que coincide con las Ecs. (15.55) aplicadas a una partcula libre. La cuarta de estas ecuaciones no es indepen-
diente lo cual tambien se vio anteriormente ya que esta ecuaci on nos manifiesta la conservaci on de la energa
cinetica lo cual puede deducirse de las tres ecuaciones anteriores.
Notese que este metodo resulta laborioso incluso para una partcula libre. Una forma mas directa y pr
actica
propuesta por Dirac, evita la introducci on del parametro y permite trabajar con el tiempo propio . Para
ello basta con observar que la relaci on que nos previene de usar el tiempo propio como par ametro invariante
Ec. (15.98) no es una verdadera ligadura din amica de movimiento sino una consecuencia geometrica del modo
de definir , esta ecuaci
on nos dice basicamente que hay una regi on permitida en el espacio u y que no todos
los puntos de esta regi on son accesibles, la region accesible es una hipersuperficie de 3 dimensiones. A las
Ecs. del tipo (15.98) Dirac las denomina ecuaciones debiles. Podemos en consecuencia, trabajar las u como
cantidades sin ligaduras y solo despues de efectuar todas las operaciones de derivaci on necesitaremos imponer
la ligadura (15.98). Este procedimiento se puede aplicar al Lagrangiano libre. En cuyo caso se podra haber
hecho igual a desde el principio y se aplica la Ec. (15.98) solo en el u ltimo paso. De esta forma se puede
escribir directamente en funci on de las ecuaciones de Lagrange covariantes
 
d
=0
d u x
por otro lado, no es necesario que la integral de acci on del principio de Hamilton deba tener el mismo valor
cuando se expresa en funcion de t que cuando se expresa en funci on de o de , de modo que el Lagrangiano no
tiene que estar descrito por la Ec. (15.102). Solo se le exige a que sea un escalar de universo y que conduzca
a las ecuaciones de movimiento correctas, despues de todo el principio de Hamilton se escribi o con esta idea.
no tiene que ser necesariamente homogenea de primer grado en la velocidades generalizadas. Por ejemplo,
una Lagrangiana adecuada para partcula libre es la siguiente
1
= mu u (15.106)
2
y mas en general puede tener la forma mf (u u ) donde f (y) es una funci
on arbitraria con la condici
on de
que
f 1
=
y y=c2 2
10
Para llegar a (15.105) hay una ambig
uedad de signo
qque debe fijarse para que L dt tenga el mismo valor que d. El paso
p 2
p
2 2
final se escribe en la forma = imc x4 + x
j x
j = mc (i) x 4 + xj x
j

= mc x x

392 CAPITULO 15. RELATIVIDAD ESPECIAL


notese que las funciones f (u u ) = 12 u u y f (u u ) = c u u cumplen esta condici
on y conducen a los
Lagrangianos (15.105) y (15.106) respectivamente. De aqu en adelante, usaremos la Ec. (15.105) para la parte
de la energa cinetica del Lagrangiano.
Si la partcula no es libre, es necesario introducir terminos escalares de universo que den cuenta de la
interaccion con el exterior correspondientes a ciertas fuerzas de Minkowski. Usualmente estos terminos ser an
la contraccion de un cuadrivector exterior con un cuadrivector del sistema que representan la interaccion de la
partcula con un campo exterior. Por ejemplo, si el termino de interacci on es de la forma x siendo un
cuadrivector exterior y si adem as en algun sistema de referencia 1 = ma y las demas componentes son nulas,
tendramos un ejemplo de fuerza constante. La forma concreta depender a de la formulaci
on covariante que se
utilice para la teora del campo. Ya tenemos a mano un ejemplo cual es la interacci on de una carga puntual
con un campo electromagnetico, para el cual, un Lagrangiano adecuado es
1 q
(x , u ) = m u u + u A (x )
2 c
y las ecuaciones de Lagrange asociadas son
d q dA q 
(mu ) = + u A
d c d x c
que corresponden a las ecuaciones de movimiento generalizadas (15.55) donde la fuerza de Minkowski K
esta dada por la Ec. (15.58). Como antes, el cuadri momento lineal p es diferente del momento can
onico
asociado a x que denotaremos por P

q q
P = = mu + A = p + A (15.107)
u c c

las tres primeras componentes corresponden a las dadas en la Ec. (5.2). La cantidad can onica asociada a
x4 viene dada por
iT iq i
P = + = E
c c c
siendo E = T + q la energa total de la partcula. Una vez m as, el momento conjugado a la coordenada
tiempo es proporcional a la energa total11 . la relaci
on entre el modulo del momento lineal y la energa T sigue
estando dada por (15.70). Es notable el hecho de que dado que p y A son trivectores euclidianos entonces las
tres componentes espaciales de P dadas por

~ = p + qA
P
c
forman un trivector euclidiano (recordemos que en general los momentos can onicos no forman vectores). Por
esta raz
on es u
til escribir la Ec. (15.70) en terminos del trivector can ~
onico P
 2
~ q A + m2 c4
T 2 = P (15.108)
c

relaci
on muy u til entre la energa T y el momento can ~ El ejemplo de la carga en campo electromagnetico
onico P.
es un ejemplo de interacci on con un campo vectorial. Podramos tener por ejemplo interacci
on con un campo
escalar (x ) usualmente acoplado a alguna cantidad escalar del sistema, tales como q (x ) o m (x ) siendo
m masa propia y carga respectivamente, hay por supuesto otras posibilidades como la contracci on de dos
tensores (uno externo y otro interno) de la forma F K etc. La u nica restricci
on es que los terminos de
interacci
on formen un escalar de universo. La forma explcita de estos terminos depende entonces de la teora
de campo especfica que se est a considerando.
11
En el caso no relativista, esta relaci
on de conjugaci
on era mas bien artificial ya que el tiempo era un par
ametro y no una
coordenada generalizada. En el caso relativista, el tiempo se convierte en coordenada y por tanto podemos hablar en firme de su
momento conjugado.
Captulo 16

Teora can
onica de perturbaciones

Es un hecho que la mayora de problemas fsicos reales no poseen soluciones matem aticas exactas. A
manera de ilustraci on el problema de Kepler para dos cuerpos es soluble de manera exacta, pero para el
movimiento cl asico de tres cuerpos puntuales bajo interacci
on gravitacional no ha sido posible una soluci
on
analtica exacta. Lo anterior nos motiva a estudiar tecnicas que permitan encontrar soluciones aproximadas
analticas o numericas.
Por otro lado, ocurre con frecuencia que el Hamiltoniano del problema que no se puede resolver de forma
exacta, difiere solo ligeramente de un Hamiltoniano que se puede resolver rigurosamente. Escribimos entonces

H (q, p, t) = H0 (q, p, t) + H (q, p, t) (16.1)

siendo H0 el Hamiltoniano no perturbado del cual conocemos su soluci on exacta, H es el Hamiltoniano


perturbado del cual queremos conocer una soluci on aproximada y H es el Hamiltoniano de perturba-
ci
on. La hip otesis de trabajo b
asica de la tecnica de perturbaciones es la peque nez de H con respecto a H0 .
Genericamente decimos que el problema m as complicado es una perturbaci on del sistema soluble.
Vale la pena tener en cuenta que incluso cuando el Hamiltoniano de perturbaci on H sea peque no con
respecto al Hamiltoniano no perturbado H0 , el efecto de la perturbaci on sobre la solucion puede ser conside-
rable. Por ejemplo, para un oscilador bidimensional isotr opico i.e. de frecuencas iguales en x e y, la trayectoria
es una curva cerrada simple, m as especficamente una elipse. Supongamos que aplicamos una perturbaci on
que cambie ligeramente la constante de rigidez en la direcci on y de tal forma que las frecuencias son ahora
diferentes e inconmesurables. Como consecuencia de esta peque na perturbaci on de H, la trayectoria ya no
sera cerrada y en el transcurso del tiempo llenar a todo el espacio conformado por el rect angulo que se forma
con las amplitudes en x e y. Otro ejemplo ilustrativo es el efecto gravitatorio debido al achatamiento de la
tierra visto como desviacion del problema no perturbado con la tierra perfectamente esferica, las peque nas per-
turbaciones producidas por este achatamiento producen un cambio apreciable en la trayectoria de un satelite
puntual. En particular el campo central sin perturbar produce un movimiento en un plano en tanto que toda
perturbaci on cuadrupolar gravitatoria por peque na que sea hace que el movimiento se salga del plano inicial
a menos que el eje del cuadrupolo sea perpendicular a dicho plano.
La mayor parte del desarrollo formal de la teora cl asica de perturbaciones se realiz o para la mec anica
celeste. Por ejemplo, el efecto gravitacional del sol sobre la luna se puede considerar una perturbaci on con
respecto a la interaccion gravitacional dominante debida a la tierra. La necesidad de predecir con precisi on las
orbitas de satelites ha impulsado fuertemente el desarrollo de metodos perturbativos.

En general podemos dividir la teora de perturbaciones en dos tipos de teora: teora de perturbaciones
dependiente del tiempo e independiente del tiempo. Buena parte de las tecnicas aqu desarrolladas poseen
analoga con la teora de perturbaciones para la mec anica cuantica, si bien la teora de perturbaciones cl
asi-
ca es mucho m as complicada que su contraparte cu antica. En general, la teora de perturbaciones cl asica se
puede tratar con cualquiera de los formalismos desarrollados hasta ahora: Newtoniano, Lagrangiano y Hamil-
toniano. Sin embargo, la formulaci on mas conveniente es la de Hamilton Jacobi. Comenzaremos con la teora
de perturbaciones dependiente del tiempo que es la forma m as simple

393
394 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

16.1. Metodo de variaci


on de constantes para perturbaciones dependien-
tes del tiempo
Sea H0 (q, p, t) el Hamiltoniano no perturbado cuya soluci on exacta se conoce. El Hamiltoniano perturbado
H (q, p, t) ser
a la suma del Hamiltoniano no perturbado H0 (q, p, t) m as el Hamiltoniano de perturbaci on
H (q, p, t) como se aprecia en la Ec. (16.1). Supongamos que hemos obtenido la soluci on para el problema no
perturbado mediante la funci on principal de Hamilton Ec. (9.4)
 
S S S
H0 q1 . . . qn ; ,..., ;t + =0
q1 qn t
recordemos que la soluci on S (q, , t) de esta ecuacion representa la funci
on generatriz de tipo 2 que genera una
transformacion can onica que nos lleva del Hamiltoniano original H0 a un Hamiltoniano nulo K0 = 0, de modo
que todas las nuevas variables can onicas seran constantes. Las nuevas variables can onicas (, ) son entonces
constantes en el problema no perturbado.
Ya se ha mencionado que el car acter canonico de una transformaci on es independiente del problema i.e. de
la forma especfica del Hamiltoniano, lo cual se puede ver por ejemplo de la condici on simplectica Ec. (7.51) la
cual solo depende de la transformaci on en s y no del Hamiltoniano al cual se le aplique esta transformacion.
De lo anterior se deduce que la transformaci on definida por

(q, p) (, )

generada por S (q, , t) sigue siendo una transformacion canonica para el problema perturbado. No obstante,
en general esta transformacion canonica no hara que el nuevo Hamiltoniano perturbado sea nulo y las nuevas
variables can
onicas no seran constantes en el problema perturbado. Teniendo en cuenta las Ecs. (16.1) y (9.2)
el nuevo Hamiltoniano perturbado ser a
S
K (, , t) = H0 + H + (16.2)
t
por supuesto que H0 , H y S se deben escribir como funciones de , , t. Las ecuaciones de Hamilton para las
nuevas variables can
onicas del sistema perturbado vienen dadas por

K (, ) K (, , t)
i = ; i = (16.3)
i i
las ecuaciones (16.3) son formalmente exactas de modo que no hemos hecho ninguna aproximaci on aun. Tales
ecuaciones nos dan formalmente los valores de i , i en funci on del tiempo. Por otro lado, las ecuaciones
de transformaci on desde (q, p) hacia (, ) nos permitir an a su vez encontrar a q, p en funci on del tiempo a
traves del inverso de dicha transformaci on, lo cual resuelve el problema completo. No obstante, la soluci on
para el nuevo Hamiltoniano perturbado K (, , t) no es usualmente m as sencilla que la del Hamiltoniano
perturbado original H (q, p, t), la razon es que aunque la transformaci on se mantiene can onica, ya no trivializa
las ecuaciones de Hamilton como lo haca con el Hamiltoniano no perturbado, por lo tanto no es claro que tal
transformaci on can onica simplifique el problema perturbado. De lo anterior se desprende que las Ecs. (16.3)
no ser an especialmente fructferas si buscamos una soluci on exacta.
Sin embargo, estas ecuaciones ser an de gran utilidad para obtener soluciones aproximadas si tenemos en
cuenta que H debe ser peque no con respecto a H0 . Es de esperarse entonces que los valores de y
en el nuevo problema no difieran significativamente de su valor constante original de modo que no varen
r
apidamente, al menos en comparaci on con la dependencia explcita de K con respecto al tiempo. Una primera
aproximaci on a la dependencia temporal de (, ) se obtendr a entonces asumiendo la validez de las ecuaciones
(16.3) pero con los miembros derechos de cada ecuaci on evaluados en los valores constantes no perturbados 0i
y 0i . Denotando 1i y 1i las soluciones de primer orden en teora de perturbaciones para i , i tenemos
que
K (, ) K (, , t)
1i = ; 1i =
(16.4)
i i =0i , i =0i i i =0i , i =0i
16.2. TEORIA DE PERTURBACION
DEPENDIENTE DEL TIEMPO EN TERMINOS

DE LOS PARAMETROS D

de modo que despues de la derivaci on se deben sustitur las variables , por sus valores constantes no
perturbados. Como estas son ecuaciones de Hamilton, se pueden escribir matricialmente en forma simplectica
como en (6.25)
K (, t)
1 = J ; e1 (11 , 12 , . . . , 1n , 11 , 12 , . . . , 1n ) (16.5)
= 0
donde la matriz J est
a definida por la Ec. (6.23). Las Ecs. (16.4) o (16.5) se pueden integrar directamente para
obtener la dependencia temporal de las 1i , 1i en aproximaci on de primer orden. Usando las ecuaciones de
transformaci
on se obtiene la dependencia temporal para la correspondiente aproximaci on de primer orden en
las q, p.
Ahora bien, si queremos proceder a la aproximaci on de segundo orden, debemos utilizar la aproximaci on
de primer orden de la dependencia temporal de y en los miembros de la derecha de las Ecs. (16.3)

K (, ) K (, , t)
2i = ; 2i = (16.6)
i i =1i , =1i i i =1i , =1i
en general, si queremos proceder a la aproximaci on de orden m, debemos utilizar la aproximacion de orden
m 1 de la dependencia temporal de y en los miembros de la derecha de las Ecs. (16.3), en notaci on
matricial simplectica esto se escribe como

K (, t)
m = J ;
em (m1 , m2 , . . . , mn , m1 , m2 , . . . , mn ) (16.7)
=m1

16.2. Teora de perturbaci


on dependiente del tiempo en t
erminos de los
par
ametros de movimiento
Las variables transformadas (, ) contienen informaci on sobre los par
ametros del movimiento sin pertur-
bar. En general, los par ametros de movimiento suelen ser m as convenientes que los valores de y para
trabajar desde el punto de vista te orico y/o experimental. A manera de ejemplo, en el problema de Kepler en
tres dimensiones sin perturbar con el formalismo de variables acci on
angulo, las variables y corresponden a
las variables de acci
on constantes Ji y las variables angulares correspondientes wi (usualmente conocidas como
variables de Delauney). Por otro lado, las variables de Delauney est an relacionadas de manera sencilla con los
parametros del sistema que son m as f
acilmente observables o medibles: semieje mayor, excentricidad, inclina-
ci
on etcetera (ver seccion 10.15). La teora de perturbacion que se construyo anteriormente permite encontrar
a cualquier orden las correcciones a los valores de y . Ahora bien, si pretendemos relacionar las cantidades
y perturbados con los valores de los par ametros de movimiento perturbados, podemos encontrarnos con
la dificultad de que la perturbaci on puede alterar no solo los valores de las y sino tambien la relaci on
funcional de estas con los par ametros de movimiento.
Por lo anterior, sera deseable construr una teora de perturbaciones en la cual se obtenga la aproximacion
a cierto orden de los par ametros de movimiento directamente, sin recurrir a la determinaci on de los y
como paso intermedio. Esto es posible a traves del formalismo de los corchetes de Poisson. Sea ci un conjunto
de 2n funciones de las constantes (, ) del sistema sin perturbar siendo todas las ci independienes entre s1
ci = ci (, ) ; i = 1, ..., 2n (16.8)
las ci son arbitrarias desde el punto de vista matem atico excepto por la exigencia de que sean independientes e
invertibles. Desde el punto de vista fsico es usualmente deseable que una o m as de dichas funciones representen
los parametros de movimiento usados. Como cualquier funci on del espacio de fase ci (, ) obedece a la ecuaci
on
de movimiento (8.25) y asumiendo que las ci no son funciones explcitas del tiempo, se tiene que
ci = [ci , K] (16.9)
1
N
otese que las ci no se pueden interpretar en general como nuevas coordenadas can onicas puesto que la transformaci
on (16.8)
no es necesariamente can onica. Solo pedimos que el jacobiano de la transformaci
on sea no nulo para garantizar la independencia
de las funciones ci y la invertibilidad del sistema de ecuaciones.
396 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

por otro lado, las inversas de las ecuaciones (16.8) permiten a su vez considerar a K (, , t) como funci
on de
los ci y el tiempo i.e. K = K (ci , t)
ci K ci K cj
[ci , K] J = J
cj
K
[ci , K] = [ci , cj ]
cj
donde hay suma sobre el ndice repetido j. Reemplazando esta ecuaci
on en (16.9) se tiene
K
ci = [ci , cj ] (16.10)
cj

al igual que las ecuaciones de Hamilton (16.3) las ecuaciones (16.10) son exactas y no se ha realizado todava
ninguna aproximaci on. De manera an aloga a la teora de perturbaciones para los , , el c alculo de primer
orden consiste en evaluar a la derecha de la ecuaci on (16.10) incluyendo los corchetes de Poisson con los valores
de los parametros correspondientes al movimiento no perturbado. En la aproximaci on de orden m, se hacen
todas las derivadas a la derecha de (16.10) luego de lo cual se reemplazan las expresiones resultantes, por los
valores de los parametros obtenidos en la perturbaci on de orden m 1.
 
K
cmi = [ci , cj ] , i = 1, ..., 2n (16.11)
cj ci =cm1,i

esta ecuaci
on es el an
alogo de (16.7). En mec anica celeste aparece a menudo la Ec. (16.11) en terminos de
corchetes de Lagrange. Multipliquemos la Ec. (16.10) por el corchete de Lagrange {ck , ci } y sumamos sobre
ndices repetidos
K
{ck , ci } ci = {ck , ci } [ci , cj ] (16.12)
cj
usando la propiedad (8.15) se tiene
K
= {ck , ci } ci (16.13)
cj
de nuevo en la terminologa de la mec
anica celeste es usual definir R K de modo que la Ec. (16.13) queda
en la forma
R
= {ck , ci } ci (16.14)
cj
las ecuaciones (16.11) o sus formas equivalentes (16.13, 16.14) se conocen como ecuaciones de perturbaci
on
de Lagrange.

16.3. Variaci
on peri
odica y variaci
on secular de una perturbaci
on
Un aspecto implcito en la formulacion perturbativa es que los parametros de movimiento del sistema no
perturbado nos sirven para describir al sistema perturbado. En general el efecto de una perturbaci on es hacer
variar los parametros del sistema con el tiempo. Si el movimiento no perturbado es peri odico y la perturbaci
on
es peque na, la variaci
on de los par ametros durante un periodo del movimiento no perturbado tambien
sera pequena2 . La teora de perturbaciones dependiente del tiempo (variaci on de constantes) implica una
imagen en la cual el sistema perturbado se mueve en intervalos cortos de tiempo en una trayectoria de igual
forma funcional que el sistema sin perturbar, aunque los par ametros de la trayectoria variar
an con el tiempo.
La orbita no perturbada a lo largo de la cual viaja instant aneamente el sistema perturbado se denomina
usualmente orbita osculatriz, la cual en posici
on y direcci
on de la tangente coincide instantaneamente con
la trayectoria verdadera.
2
En la mayora de los casos la periodicidad exacta se perder a con el movimiento perturbado, raz
on por la cual la cuasi
periodicidad del sistema usualmente tendr
a como referente el periodo del movimiento no perturbado.
16.4. EJEMPLOS DEL USO DE LA TEORIA DE PERTURBACION
DEPENDIENTE DEL TIEMPO 397

Hay dos maneras en las cuales pueden variar los par ametros en una orbita osculatriz visto en el esquema
perturbativo. Es posible que haya una variaci on periodica en la cual el par ametro vuelve a su valor inicial
en un intervalo de tiempo que en primera aproximaci on suele ser el periodo de la orbita no perturbada. En
contraste, es posible que se mantenga un incremento (o decremento) neto del valor del par ametro al final de
cada periodo orbital sucesivo. En el primer caso hablamos de una variaci on peri odica en tanto que en el
segundo caso se habla de una variaci on secular. Cuando la variaci on de un par ametro dado es peri odica, su
valor promediado sobre un periodo suele ser muy similar a su valor no perturbado, y si todos los par ametros
tienen variaci on peri
odica la trayectoria perturbada tiene un aspecto muy similar a la no perturbada. Si en
cambio la variacion es secular, por peque na que sea la desviaci
on en cada periodo, los valores de los par ametros
pueden diferir fuertemente respecto a los valores no perturbados para un n umero suficientemente grande de
periodos. Correspondientemente, la perturbaci on llevara a una trayectoria muy diferente a la no perturbada
para tiempos mucho mayores al periodo. Por esta raz on, para m ultiples propositos suele eliminarse los efectos
peri 3
odicos y quedarse solo con los efectos seculares en los c alculos perturbativos.
Vale la pena mencionar que el uso de la orbita osculatriz requiere de rectificaciones en periodos de tiempo
determinados por el problema especfico, ya que para tiempos suficientemente grandes la orbita no perturbada
y la perturbada pueden diferir significativamente, en especial si hay efectos seculares. En consecuencia se suele
rectificar la
orbita osculatriz de referencia pasando a otra orbita osculatriz y tal vez otro tipo de rectificaciones
a medida que transcurre el tiempo.

16.4. Ejemplos del uso de la teora de perturbaci


on dependiente del tiem-
po
16.4.1. Oscilador arm
onico como perturbaci
on de la partcula libre
Consideremos como sistema no perturbado el movimiento libre unidimensional de una partcula puntual m.
Aunque el ejemplo es trivial, nos permitir a ilustrar las principales caractersticas del metodo. El Hamiltoniano
no perturbado es
p2
H0 = (16.15)
2m
para este sistema el momento lineal p se conserva, denominaremos a su valor constante. La ecuaci on de
Hamilton Jacobi para este sistema es
 2
1 S S
+ =0
2m x t
dado que x es cclica y el Hamiltoniano no depende explcitamente del tiempo, la funci on principal de Hamilton
queda en la forma
2
S (x, , t) = W (x, ) Et = x t (16.16)
2m
elegiremos al nuevo momento can onico P como la constante de integraci on (tal como en la Ec. 9.7). La nueva
coordenada viene dada por la Ec. (9.9)
S t
Q= =x
m
que se puede escribir en la forma
t
x= + (16.17)
m
que es la soluci
on bien conocida para el movimiento unidimensional libre de fuerzas. En sntesis, la transfor-
maci
on can onica para la partcula libre (sistema no perturbado) es
t
(p, x) (, ) ; p= ; x= + (16.18)
m
3
Dependiendo del grado de aproximacion requerido se pueden aproximar los par
ametros de variaci
on peri
odica a su valor no
perturbado o a su promedio sobre un periodo no perturbado.
398 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

Aunque la soluci
on es inmediata, el uso de la tecnica de Hamilton Jacobi nos garantiza que y son variables
canonicas.
Ahora agregaremos una interacci on tipo Hooke que consideraremos como perturbaci on. El Hamiltoniano
de perturbaci
on ser
a entonces
m 2 x2
H = (16.19)
2
siendo una constante. El Hamiltoniano perturbado ser a
1 
H = H0 + H = p 2 + m 2 2 x2
2m
Debemos proceder ahora a calcular el nuevo Hamiltoniano perturbado K, en terminos de , , t, para lo
cual sustitumos las ecuaciones (16.15), (16.16), (16.19), en (16.2)

S 2 m 2 x2 2
K (, , t) = H0 + H + = +
t 2m 2 2m
m 2 x2
K (, , t) =
2
y usamos (16.17) para escribir el miembro derecho en terminos de , , t
 2
m 2 t
K (, , t) = + (16.20)
2 m

para este caso muy particular es posible obtener la soluci


on exacta sustituyendo el Kamiltoniano (16.20) en
las Ecs. (16.3)    
2 t 2 t
= m + ; = t + (16.21)
m m
derivando la primera de las Ecs. (16.21) con respecto al tiempo resulta
 
2 2 t


= m + (16.22)
m

y sustituyendo las dos Ecs. (16.21) en (16.22) se tiene


     
t t t
= 2 m 2 2 t
+ m 2 +
m m m
= 2

lo cual nos da una variaci


on armonica simple con el tiempo para en el sistema perturbado. Reemplazando
(16.17) en la primera de las ecuaciones (16.21) resulta


= m 2 x x =
m 2
que facilmente se puede ver que conduce a la soluci on arm onica exacta. Es importante enfatizar en que este
es un caso excepcional en el cual se puede obtener la soluci on exacta usando la transformacion can onica
obtenida del sistema no perturbado. El punto es que aunque esta misma transformaci on can
onica no trivializa
al Hamiltoniano perturbado, lo deja con una estructura suficientemente simple.
Veamos ahora como se obtendran las soluciones aproximadas en cada orden en teora de perturbaciones.
Vale decir que para poder tratar a esta interacci on como perturbaci on, es necesario que la energa potencial
armonica (H) sea mucho menor que la energa cinetica de la partcula (H0 ). Es claro que esto implicara que
el metodo podra fallar por ejemplo en los instantes en los cuales la elongaci
on es muy cercana a la amplitud, ya
que en estos casos la energa cinetica es muy pequena. Veremos sin embargo que para este caso muy particular,
16.4. EJEMPLOS DEL USO DE LA TEORIA DE PERTURBACION
DEPENDIENTE DEL TIEMPO 399

la soluci
on completa se podr
a obtener via teora de perturbaciones, aunque esto constituye de nuevo un caso
excepcional.
Para la aproximaci
on de primer orden, procedemos a escribir las Ecs. (16.4)

K (, ) K (, , t)
1 = ; 1 =
0 , 0 0 , 0

donde los subndices 0 , 0 son los valores no perturbados. Por simplicidad tomemos x0 = 0 lo cual seg
un la
Ec. (16.17) implica que 0 = 0 4 . Para el Kamiltoniano (16.20) resulta
   
t t
1 = m 2
+ ; 1 = 2 t +
m 0 , 0 m 0 , 0
0 t2
1 = 2 0 t ; 1 = 2
m
estas ecuaciones tienen soluciones inmediatas

2 0 t2 0 2 t3
1 = 10 ; 1 = + 10 (16.23)
2 3m
donde 10 y 10 denotan los valores iniciales de 1 y 1 . Debemos tener en cuenta que las condiciones iniciales
son las mismas para el sistema perturbado que para el sistema sin perturbar. La diferencia es que en el sistema
sin perturbar estos valores iniciales 0 , 0 permanecen inalterados en el tiempo, en tanto que en el sistema
perturbado ellos evolucionaran en el tiempo. En consecuencia, los valores iniciales de los y en cualquier
orden en teora de perturbaciones corresponden a los valores sin perturbar, por tanto

n0 = 0 ; n0 = 0 = 0

con lo cual la Ec. (16.23) queda


2 0 t2 0 2 t3
1 = 0 ; 1 = (16.24)
2 3m
las soluciones para x y p a primer orden se obtienen de la transformaci
on can
onica para el sistema no perturbado
(partcula libre) descrito por la Ec. (16.18). Por tanto, tenemos a primer orden
 
2 0 t2
2 0 t2 1 0 2 0 2 t3 0 2 0 t3 0 2 t3
p1 = 1 = 0 ; x1 = t + 1 = t+ = t +
 2
 m
  m 3m m 2m 3m
2 t2 0 3 t3
p1 = 0 1 ; x1 = t
2 m 6

ahora escribamos la soluci


on de segundo orden, para lo cual usamos las ecuaciones (16.6)


K (, ) K (, , t)
2 = ; 2 =
1 , 1 ,
   1 1
t t
2 = m 2 + ; 2 = 2 t +
m , m 1 , 1
 1 1  
1 t 1 t
2 = m 2 + 1 ; 2 = 2 t + 1 (16.25)
m m
4
N
otese que el subndice 0 en x0 y 0 tiene significados muy diferentes. x0 indica la posici
on del sistema en t = 0 en tanto
que 0 indica el valor de en el sistema no perturbado i.e. el valor de para la perturbaci
on de orden cero.
400 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

y reemplazando los valores de (16.24) en (16.25) resulta


     
2 2 0 t2 t 0 2 t3 2 2 0 t2 t 0 2 t3
2 = m 0 + ; 2 = t 0 +
2 m 3m 2 m 3m
 2 3  2 3  2  2 4  2 4 
t t 0 t t
2 = 0 2 t + ; 2 = t2 +
2 3 m 2 3
 2 3
 2
 2 4

t 0 t
2 = 0 2 t ; 2 = t2
6 m 6

cuyas soluciones son  


2 0 t2 4 0 t4 0 2 t3 2 t5
2 = 0 + ; 2 =
2 24 m 3 30
para las soluciones a segundo orden en x y p recurrimos nuevamente a las transformaciones can
onicas derivadas
del Hamiltoniano no perturbado

2 t
p2 = 2 ; x2 = + 2
m    
2 0 t2 4 0 t4 2 0 t2 4 0 t4 t 0 2 t3 2 t5
p2 = 0 + ; x2 = 0 + +
2 24 2 24 m m 3 30
     3 3 
2 t2 4 t4 0 3 t3 5 t5 0 t 5
t 5
p2 = 0 1 + ; x2 = t + +
2 24 m 2 24 m 3 30
   
2 t2 4 t4 0 3 t3 5 t5
p2 = 0 1 + ; x2 = t +
2! 4! m 6 120

finalmente reescribimos x y p a segundo orden en la forma


" # " #
(t)2 (t)4 0 (t)3 (t)5
p2 = 0 1 + ; x2 = t +
2! 4! m 3! 5!

con estos terminos es suficiente para observar la secuencia que nos lleva a la contribuci
on del termino nesimo,
aunque la demostraci on formal debe realizarse por inducci on. En las expresiones a segundo orden vemos que
los terminos entre corchetes para p2 y x2 son los tres primeros terminos en la expansi on de coseno y seno
respectivamente. En el lmite de orden infinito en la perturbacion resulta claramente
0
lm pn = 0 cos t ; lm xn = sin t
n n m
que son las soluciones exactas compatibles con la condiciones iniciales.

16.4.2. P
endulo plano con amplitud finita
Un pendulo con peque nas oscilaciones se considera como un oscilador arm onico simple, este sistema tiene
la propiedad de ser isocrono, es decir el periodo es independiente de la amplitud. No obstante, en el regimen
de amplias oscilaciones la energa potencial del sistema se aleja del valor del potencial armonico y puesto que
la soluci
on del sistema arm onico simple es exacta, es l
ogico considerar que el problema no perturbado sea el
pendulo con potencial arm onico de modo que la perturbaci on correspondera a la desviaci
on del potencial del
pendulo con respecto al potencial arm onico. Deduciremos el cambio en la frecuencia debido a esta perturbaci on
a traves de la variaci
on temporal del angulo de fase perturbado. Un pendulo plano consistente en una masa
puntual m situado al extremo de una varilla sin peso de longitud l posee el Hamiltoniano

p2
H= + mgl (1 cos ) (16.26)
2ml2
16.4. EJEMPLOS DEL USO DE LA TEORIA DE PERTURBACION
DEPENDIENTE DEL TIEMPO 401

siendo p el momento conjugado a , (p tiene unidades de momento angular). Este es el Hamiltoniano perturbado
ya que incluye el efecto de amplias oscilaciones. Podemos obtener una forma simplificada aunque aproximada
del Hamiltoniano de perturbaci on, realizando una expansi on en serie de Taylor del cos en el Hamiltoniano
    2 
p2 2 4 6 p2 4 6
H = + mgl 1 1 + + ... = + mgl + ...
2ml2 2! 4! 6! 2ml2 2 24 720
 
p2 mgl 2 2 4
H = + 1 + ... (16.27)
2ml2 2 12 360
el lmite de pequenas oscilaciones se obtiene manteniendo solo el primer termino de la expansi on de la energa
potencial en (16.27), con lo cual se ve claramente un potencial de tipo arm onico. Es claro que el Hamiltoniano
es la energa del sistema incluso para el problema perturbado. En el momento de m axima altura i.e. cuando
se alcanza el valor de la amplitud angular 1 , la energa cinetica se anula, por tanto en el regimen de peque nas
oscilaciones se tiene que:
mgl12
H0 = E0 =
2
Lo cual sugiere que 1 se pueda usar como par ametro adimensional para analizar el efecto de los terminos
perturbativos. Usaremos dos par ametros para realizar dicho an alisis

2E0 12 E0
12 = ; = = (16.28)
mgl 6 3mgl
usando (16.28) el Hamiltoniano (16.27) se escribe entonces en la forma
"  2 2  2 2 #
p2 mgl 2 1 4
H = + 16 + 62 1
...
2ml2 2 6 1212 6 360 14
"     #
p2 mgl 2 2 2 4
H = + 1 + ... (16.29)
2ml2 2 2 1 10 1

recordemos que 1 es la amplitud angular m axima de oscilacion cuando E y por tanto la amplitud son pe-
quenas. Por tanto el cociente /1 es del orden de uno para valores de cercanos a 1 i.e. de la amplitud
maxima. En consecuencia, el orden de magnitud del factor ser a el que regule la convergencia de la serie
(16.29)5 . Si conservamos solo el primer termino de correcci on y trabajamos perturbaciones a primer orden,
solo se introduciran en los c
alculos terminos del orden de . La perturbaci on a segundo orden con el mismo
Hamiltoniano de perturbaci 2
on introduce terminos de orden , por lo tanto para obtener una correcci on cohe-
rente hay que calcular una perturbaci on de segundo orden en el termino proporcional a del Hamiltoniano y
una perturbaci on de primer orden en el termino 2 de dicho Hamiltoniano.
A continuacion realizaremos un c alculo perturbativo de primer orden. El Hamiltoniano no perturbado lo
podemos escribir en la forma
 
p2 mgl 2 p2 mgl 2 2
 p2 1 mgl 2 p2 1
H0 = 2
+ = 2
+ 2
ml = + I = + 22I
2ml 2 2 (ml ) 2 (ml ) 2I 2 I 2I 2
1 2  mgl g
H0 = p + I 222 ; I ml2 ; 2 = (16.30)
2I I l
donde I y denotan el momento de inercia del pendulo y su frecuencia angular respectivamente. Como ya
vimos en la secci on 9.8.1, un sistema adecuado de variables canonicas que nos conduce a un K0 completamente
cclico es el sistema de variables accion
angulo (J, w) definido por
2E
w = vt + ; v= ; J= (16.31)
2
5
De (16.28) podemos observar que 1 y son peque
nos cuando la energa total E es mucho menor que la energa potencial
m
axima 2mgl que podra alcanzar el pendulo.
402 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

en el sistema no perturbado la variable canonica J es constante y la variaci


on temporal de w es lineal, lo cual se
traduce en que las cantidades J, v, son constantes en el sistema no perturbado. Lo que hace el Hamiltoniano
de perturbacion es introducir una variacion temporal para estas cantidades. En el presente an alisis vamos a
absorber toda la modificaci
on de la dependencia temporal de w en el par ametro con lo cual escribiremos6

w 1 = v 1 t + v1 + 1 v + 1 (16.32)

de modo que estudiaremos la variaci on temporal generada por la perturbacion de J y del termino de fase ,
el cual reescribiremos de aqu en adelante como puesto que el cambio de notacion ya no es relevante.
Las Ecs. (9.81) nos daban la transformaci on can
onica entre las variables originales q, p y las finales J y
w del oscilador armonico unidimensional. Hay no obstante una diferencia sutil entre el Hamiltoniano (9.77) y
el Hamiltoniano (16.26) ya que en el primero las coordenadas q, p tienen dimensiones de longitud y momento
lineal en tanto que en el segundo las coordenadas , p tienen unidades de angulo (adimensional) y momento
angular. Para escribir adecuadamente las transformaciones can onicas basta con reemplazar m I = ml2
como se ve comparando los Hamiltonianos (16.26) y (16.30), de esta forma la transformaci on canonica (9.81)
queda r r
J IJ
= sin 2w ; p= cos 2w ; w = vt + (16.33)
I
estas son ecuaciones exactas para el sistema no perturbado. Ahora bien, dentro de la filosofia de la teora de
perturbaciones dependiente del tiempo (variaci on de constantes), la transformaci
on can
onica contin
ua siendo
valida pero los valores de J y w adquieren una dependencia temporal.
El nuevo Hamiltoniano no perturbado K0 se puede extraer de las Ecs. (9.79, 9.80) de modo que K0 = Jv.
Por otro lado, el nuevo Hamiltoniano perturbado coincide numericamente con el Hamiltoniano perturbado
original puesto que la funcion generatriz W no depende explcitamente del tiempo, solo hay que escribirlo en
terminos de las nuevas variables can
onicas J, w. Usando el Hamiltoniano (16.29) hasta orden se obtiene
     2
mgl 2 2 mgl 2 12 2 mgl 4 mgl J
K = K0 + K ; K = = = = sin4 2w
2 2 1 4 6 1 24 24 I
 2
mgl J 4 gJ 2 4 gJ 2
K = sin 2w = sin 2w = sin4 2w
24 ml2 24 2 ml3 2 24 2 ml3 (g/l)

donde hemos usado (16.28), con lo anterior queda finalmente

J2
K = K0 + K ; K0 = Jv ; K = sin4 2w ; w = vt + (16.34)
24 2 ml2
ahora aplicamos las Ecs. (16.4, 16.32) para obtener

K (J, w) K (J, w)
J1 = ; w 1 = v + 1 = (16.35)
w J0 , w0 J J0 , w0

con lo que obtenemos


   
J2 J0

1 = Jv sin 2w
4
v = v 4
sin 2w v
J 2
24 ml 2 12 2 ml2
J0 , w0

hemos usado la notaci


on J0 y 0 para enfatizar que corresponde a los valores no perturbados, la expresi
on

para 1 queda
J0
1 = sin4 2 (vt + 0 ) (16.36)
12 2 ml2
6
Esto equivale a usar la frecuencia del sistema no perturbado para los c
alculos en el sistema perturbado.
16.4. EJEMPLOS DEL USO DE LA TEORIA DE PERTURBACION
DEPENDIENTE DEL TIEMPO 403

la ecuaci
on (16.36) nos dice que en primera aproximaci on 1 vara a lo largo del ciclo de la oscilaci
on sin
perturbar. Notese sin embargo que 1 posee un valor promedio no nulo a lo largo de un periodo no perturbado,
haciendo el cambio de variable x = 2vt + 20
Z 1/v Z 2+20
J0 1 4 J0 1 1
1 = sin 2 (vt + 0 ) dt = sin4 x dx
12 2 ml2 (1/v) 0 12 2 ml2 (1/v) 2v 20
Z 2  
J0 4 J0 3
1 = sin x dx =
24 3 ml2 0 24 3 ml2 4

quedando finalmente
J0
1 = (16.37)
32 2 ml2
por lo cual la variaci
on de 1 corresponde a una perturbaci on secular, el incremento por periodo se da a una
razon constante dada por la Ec. (16.37). Para tiempos mucho mayores a un periodo no perturbado, la variacion
temporal de 1 se puede aproximar en la forma

1 1 t + 0 (16.38)

insertando (16.38) en la Ec. (16.33) obtenemos


r   r  
J1 IJ1
sin 2 vt + 1 t + 0 ; p= cos 2 vt + 1 t + 0 (16.39)
I
con lo cual vemos que al menos en promedio la solucion de primer orden sigue siendo arm
onica simple con
frecuencia
v = v + 1 (16.40)
otese que v es una correcci
n on para la frecuencia, pero no para el par
ametro v. N
otese que adem
as J1 introduce
una ligera modificaci on en las amplitudes en (16.39). Usando la tercera de las Ecs. (16.31)
2E0 E0 l
J0 = = 2
2 g
que al reemplazar en (16.37) resulta

2E0 l E0 2vE0 v 2E0 v 2


1 = 2 2
= = = = 1
32g ml 16mgl 16mgl 16 mgl 16
donde hemos usado (16.28). La variaci on relativa de primer orden de la frecuencia para una amplitud finita 1
esta dada por
v v v 2
= = 1 = 1 (16.41)
v v v 16
a partir de la Ec. (16.34) y de la primera de las Ecs. (16.35), se puede obtener la variaci on temporal de J en
primera aproximaci on
 
K (J, w) J2 4J02
J1 =
= Jv 2 2
sin 4
2w
= 2 2 ml2
sin3 2w0 cos 2w0
w J0 , w0 w 24 ml J0 , w0 24

J02
J1 = sin3 2 (vt + 0 ) cos 2 (vt + 0 )
3ml2
se ve de inmediato que la variaci
on de J1 es periodica y no secular ya que su valor promedio se anula incluso
para medio periodo. Fsicamente esto era de esperarse puesto que J es una medida de la amplitud de las
oscilaciones y dado que la perturbaci
on no es de naturaleza disipativa (o donativa), esta no sera tal que
produzca una disminucion o aumento sistem atico de la amplitud en cada periodo.
404 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

16.4.3. Perturbaciones en el problema de Kepler acotado


Cuando al potencial Kepleriano se le agrega un potencial proporcional a 1/r 2 puede demostrarse que la
orbita resultante es una elipse con respecto a un sistema coordenado rotante. La elipse gira y su peri
apside
presenta precesion. Encontraremos la velocidad de precesi
on usando teora de perturbaciones de primer orden
para potenciales de la forma 1/r n con n entero y n 2. El potencial y el Hamiltoniano de perturbaci on se
escribir
an en la forma
p2r p2 k h h
H= + +V ; V = n ; H = ; n2
2m 2mr 2 r r rn
donde h posee un valor peque no tal que el segundo termino sea mucho menor al primero y se pueda considerar
una perturbaci on. Nuevamente, consideremos el problema de Kepler no perturbado en el lenguaje de las
variables acci
on angulo. En el problema no perturbado la posici on angular del peri
apside en el plano de la
orbita viene dada por la constante = 2w2 (ver Ec. 10.116). La perturbaci
on genera una dependencia
temporal para que generar a la precesi on del peri
apside, esta dependencia temporal se determina a traves de
las ecuaciones
K 1 K
w 2 = = =
2 J2 J20 ,0 2 l J20 ,0
donde hemos usado la relaci on J2 = 2l. En la practica el valor de es muy peque
no de modo que la variacion
de cambia de manera casi imperceptible a lo largo de un periodo. Por lo tanto, resulta m as interesante medir
la variaci
on secular de tomada sobre muchos periodos y es de poco interes el valor instant
aneo de la variaci
on
de . De lo anterior se sigue que la cantidad de interes es el promedio de realizada sobre un periodo de la
orbita no perturbada.
Z
1 K
dt
0 l
la derivada se puede sacar de la integral puesto que solo es funci on de J3 como se ve en las Ecs. (9.123,
9.125), en tanto que la derivaci
on es con respecto a l = J2 /2. Por tanto
 Z 
1 K
= K dt =
l 0 l

ahora bien, el promedio temporal del Hamiltoniano de perturbaci


on es
  Z
1 h dt
H = h n =
r 0 rn

usamos ahora la conservaci on del momento angular en la forma de la Ec. (10.84) l dt = mr 2 d escribimos
entonces la integral en terminos de
Z   Z
mh 2 d mh mk n2 2  n2
H = n2
= 2
1 + cos d (16.42)
l 0 r l l 0

donde hemos escrito a r en funci on de usando la ecuaci on de la


orbita (10.68). Solo los terminos que
contengan potencias pares de la excentricidad dar an contribuciones no nulas a la integral. Vale decir ademas
que la derivada con respecto a l tambien contiene potencias de puesto que solo es funcion de J2 y J3 .
Hay dos casos particularmente interesantes para los posibles valores de n, el primero es el caso en el cual
n = 2. Reemplazando n = 2 en (16.42), el promedio del Hamiltoniano de perturbaci on es

2mh
H = ; n=2
l
y la velocidad de precesi
on secular es
2mh
= ; n=2
l2
16.5. TEORIA DE PERTURBACION
INDEPENDIENTE DEL TIEMPO A PRIMER ORDEN CON UN GRADO D

Otro caso de interes es n = 3 para el cual las cantidades anteriores estan dadas por
  Z 2
mh mk 

H = 1 + cos d
l l2 0

2m2 hk 6m2 hk
H = ;
= (16.43)
l3 l4
este caso es de gran interes ya que la teora de la relatividad general predice una correccion del movimiento
Newtoniano con un potencial asociado de la forma h/r 3 . M as especficamente, corresponde a la soluci
on
esfericamente simetrica de Schwarzchild de las ecuaciones de campo de Einstein, la cual corresponde a un
Hamiltoniano de perturbaci on para el problema de Kepler de la forma

h kl2
H = ; h= (16.44)
r3 m2 c2
reemplazando este resultado en (16.43) se obtiene

6k2
= (16.45)
l2 c2
veamos una estimaci
on numerica para la precesi
on secular de un cuerpo que gira alrededor del sol, en tal caso
k = GmM y utilizamos la ecuacion (10.80) para la elipse no perturbada

l2 = mka 1 2

con lo cual la Ec. (16.45) queda en la forma


 
6 R
= (16.46)
(1 2 ) a

donde R es el llamado radio gravitatorio del sol


GM
R= = 1,4766 km
c2
para el planeta Mercurio el valor numerico de (16.46) se estima en

= 42,98/siglo
la precesion secular de este planeta es mas de 100 veces mayor que este valor, la raz on estriba en que el efecto
dominante es la precesi on de los equinoccios ( 90 %), seguido por el efecto perturbativo de los otros planetas
( 10 %), el efecto aqu calculado debido a la relatividad general equivale a 1 % del efecto total.
Vale la pena aclarar que al hallar no hemos puesto a actuar sobre h la derivada con respecto a l tal como
lo sugerira la Ec. (16.44). La raz
on es que h no depende funcionalmente de l como momento canonico, lo que
nos dice la Ec. (16.44) es como se determina el valor de la constante h en funcion del valor del par
ametro orbital
l. El potencial de perturbaci on es funci
on de las variables din
amicas solo a traves de r, no debe construirse de
forma dependiente de la velocidad.

16.5. Teora de perturbaci


on independiente del tiempo a primer orden
con un grado de libertad
En la teora de perturbaci
on dependiente del tiempo, resolvemos el problema no perturbado por el metodo
de Hamilton Jacobi, generando unas constantes de movimiento. La filosofa general era tener en cuenta que en
el problema perturbado estas cantidades ser an ahora dependientes del tiempo y se determina su dependencia
temporal.
406 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

En contraposici on, la teora de perturbaci


on independiente del tiempo tiene como objetivo buscar las
cantidades que ser an constantes en el sistema perturbado. Este formalismo es solo aplicable a sistemas que
sean conservativos, separables y periodicos tanto en el estado perturbado como en el no perturbado. A pesar de
estas restricciones, hay un gran n umero de problemas que se pueden tratar con este formalismo. Por ejemplo,
las trayectorias planetarias son corregidas por las interacciones conservativas de los otros planetas y en general
no se pierde la naturaleza peri odica del movimiento. Es frecuente que la perturbaci on no altere la naturaleza
periodica del movimiento.
Por simplicidad, comenzaremos con un solo grado de libertad para la teora a primer orden. Describiremos
el sistema periodico no perturbado con variables acci on angulo (w0 , J0 ) y un Hamiltoniano H0 (J0 ). Sabemos
que la frecuencia no perturbada y el valor de la variable angular est an dadas por las ecuaciones (9.74, 9.75)

H0 (J0 )
v0 = ; w0 = v0 t + 0 (16.47)
J0

recordemos que en este formalismo cuando se completa un periodo completo, la variable w0 aumenta en la
unidad. Esta periodicidad permite desarrollar a q y a p en una expansi
on de Fourier (ver Ec. 9.96)

X
q= Ak (J0 ) e2ikw0 (16.48)
k=

y similarmente para p. Agreguemos ahora una perturbaci


on de la forma

H = H0 (J0 ) + H1 (16.49)

siendo un parametro peque no que podemos variar contnuamente a partir de cero. Dado que el sistema
perturbado sigue siendo peri
odico, la idea es encontrar un nuevo conjunto de variables acci
on
angulo (w, J)
para tal sistema con H = H (J), que cumplan relaciones an alogas a (16.47)

H (J)
v= ; w = vt + (16.50)
J
debemos tener en cuenta que de todas maneras (w0 , J0 ) siguen siendo variables can onicas para el sistema per-
turbado, puesto que la transformaci on (q, p) (w0 , J0 ) es canonica independientemente de la forma particular
del Hamiltoniano como ya se ha mencionado en varias ocasiones. No obstante J0 ya no es constante y w0 ya
no es funcion lineal del tiempo. Sin embargo, la relaci on (16.48) sigue siendo v alida en el sistema perturbado
ya que esta ecuacion expresa la transformaci on canonica (q, p) (w0 , J0 ), simplemente los valores de w0 y J0
deben ser modificados apropiadamente. En conclusi on, q sigue siendo funci on periodica de w0 con lo cual se
deduce que cuando q realiza un periodo completo del movimiento tanto w como w0 deben avanzar una unidad.
El hecho de que los dos conjuntos (w0 , J0 ) y (w, J) formen variables can onicas para el problema perturbado,
significa que deben estar conectados por una transformaci on canonica con funci on generatriz W (w0 , J) que
se puede hallar mediante la ecuaci on de Hamilton Jacobi para la funci on caracterstica de Hamilton. El hecho
de que el Hamiltoniano de perturbaci on sea peque no se debe manifestar en que la transformaci on canonica
generada por W (w0 , J) solo se desve en una peque na cantidad con respecto a la identidad, de la funci on
generatriz tipo 2 para la identidad Ec. (7.18), podemos escribir entonces a primer orden en

W (w0 , J) = w0 J + W1 (w0 , J) (16.51)

la frecuencia perturbada v se puede calcular simplemente encontrando H como funci on de J y aplicando


(16.50) sin resolver el problema del movimiento completo como es caracterstico del formalismo en variables
acci
on
angulo. La ecuacion de Hamilton Jacobi para la funci
on caracterstica de Hamilton Ec. (9.30) queda en
la forma  
W
H (w0 , J0 ) = H w0 , = (16.52)
w0
16.5. TEORIA DE PERTURBACION
INDEPENDIENTE DEL TIEMPO A PRIMER ORDEN CON UN GRADO D

H ser
a en general funci
on de J y de , de modo que podemos escribir a primer orden en

H = (J, ) = 0 (J) + 1 (J) (16.53)

usando (16.49) y (16.53) en (16.52), la ecuaci


on de Hamilton Jacobi queda en la forma
   
W W
H0 + H1 w0 , = 0 (J) + 1 (J) (16.54)
w0 w0
otese sin embargo, que H0 y H1 siguen dependiendo de a traves de la funci
n on generatriz W , como se aprecia
en (16.51), es necesario tener en cuenta que si el miembro derecho de la Ec. (16.54) es una aproximaci on a
primer orden, debemos conservar terminos hasta primer orden tambien en el miembro izquierdo, lo cual implica
expandir H0 hasta primer orden y H1 hasta orden cero en . Teniendo en cuenta (16.51) esto implica que
     
W [w0 J + W1 (w0 , J)] W1 W1 H0 (J)
H0 = H0 = H0 J + H0 (J) +
w0 w0 w0 w0 J
W1 H0 (J0 + J1 ) W1
H0 (J) + H0 (J) + v0
w0 J0 w0
     
W [w0 J + W1 (w0 , J)] [w0 J]
H1 w0 , = H1 w0 , H1 w0 , = H1 (w0 , J)
w0 w0 w0
usando estas expansiones en (16.54) se obtiene
W1
H0 (J) + v0 + H1 (w0 , J) = 0 (J) + 1 (J)
w0
igualando potencias en resulta

H0 (J) = 0 (J) (16.55)


W1
v0 + H1 (w0 , J) = 1 (J) (16.56)
w0
la ecuaci
on (16.55) se puede obtener tambien tomando el lmite cuando 0. N
otese que en la Ec. (16.56)
el miembro de la izquierda depende de J y w0 en tanto que el de la derecha depende solo de J, por lo cual
debe existir una cancelaci
on de la dependencia funcional con w0 en el miembro izquierdo. La ecuaci on de
transformacion que determina a w (ver Ec. 9.73) es
W W1
w= = w0 +
J J
donde hemos usado (16.51). De acuerdo con esta ecuaci on y el requerimiento de que w y w0 avancen en la
unidad cuando se completa un periodo, es necesario que W1 sea funci
on peri
odica de w0

X
W1 (w0 , J) = ak (J) e2ikw0 (16.57)
k=

en realidad la forma de W1 dada por (16.57) es la que nos garantiza que la nuevas variables (w, J) tambien
sean del tipo acci
on
angulo. Notese que de (16.57) se observa que el termino de la derivada de W1 respecto a
w0 para k = 0 es decir el termino constante debe anularse. Si denotamos por H 1 el valor de H1 promediado
sobre un periodo completo de w0 tenemos que naturalmente este promedio ya no depender a de w0 i.e.

H1 (w0 , J) H 1 (J)

sumando y restando H 1 en (16.56) resulta


 
 W1
1 (J) = H1 (w0 , J) H 1 H1 v0
w0
408 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

la cantidad entre corchetes debe anularse si 1 es solo funci


on de J. Por lo tanto obtenemos dos relaciones

1 (J) = H1 (w0 , J) (16.58)


W1 H 1 H1
= (16.59)
w0 v0
teniendo en cuenta las Ecs. (16.49, 16.53), se observa que la Ec. (16.58) nos dice como completar la depen-
dencia funcional de H con respecto a J a primer orden en . El Hamiltoniano de perturbaci on se expresa en
on de las variables sin perturbar (w0 , J0 ) y se promedia para un periodo completo de movimiento. La
funci
restante dependencia de J0 es la misma (hasta ese orden) que la de J correspondiente a 1 . La nueva frecuencia
se escribe usando (16.50, 16.53)

(J) 0 (J) 1 (J) 0 (J0 ) 1


v = = + +
J J J J0 J
1
v = v0 + (16.60)
J
por otro lado, la Ec. (16.59) nos permite encontrar la funci on generatriz y por lo tanto la transformaci
on
canonica que nos lleva de (w0 , J0 ) a (w, J) con lo cual el problema queda completamente resuelto a primer
orden en . Especficamente, la dependencia de q y p con el tiempo se hallara por medio de las Ecs. (16.48,
16.50). Recordemos sin embargo, que si solo nos interesa la frecuencia perturbada basta con solucionar la
Ec. (16.58) y no necesitamos resolver el problema completo Ec. (16.59) como es tpico en las variables acci
on
angulo. En la teora de perturbaciones para mec
anica cu
antica se encuentra un fen
omeno an alogo ya que la
energa del sistema (valor propio de un operador Hamiltoniano) se puede calcular sin tener que encontrar la
funci
on de onda perturbada (que equivale a resolver el problema completo).

16.5.1. P
endulo plano con oscilaci
on finita usando m
etodo de perturbaci
on independiente
del tiempo
Ya habamos escrito el Hamiltoniano de perturbaci on de este problema en la ecuaci on (16.34), que lo
reescribimos en la forma
J2
H1 (w0 , J) = sin4 2w0
24 2 ml2
donde l corresponde a la longitud del pendulo. Lo m as conveniente para la asignaci on del parametro es la
2
cantidad 1 que representa el cuadrado de la amplitud angular de oscilaci on en el caso no perturbado. El valor
medio de este Hamiltoniano promediado sobre un periodo es
Z 1/v0  
J2 4 J2 3
1 (J) = H 1 = 2 2 2
sin 2 (v0 t + 0 ) dt = 2 2 2
24 1 ml 0 24 1 ml 8

J2
1 (J) = H 1 = (16.61)
6412 2 ml2
v v0 1 J
= = (16.62)
J 32 2 ml2 12

con el fin de calcular v v0 hasta primer orden en , podemos sustitur J por J0 . Por otro lado, de las Ecs.
(9.79) y (16.28) se deduce que
2E mgl12
J0 = = = 2 2 ml2 12 v0
0 0
con lo cual la Ec. (16.62) se escribir
a en la forma
1 v0
=
J 16
16.6. TEORIA DE PERTURBACION
INDEPENDIENTE DEL TIEMPO PARA ORDEN SUPERIOR AL PRIMER

con lo cual la variaci


on relativa de v ser
a
v v v0 2
= 1
v0 v0 16
lo cual concuerda con la Ec. (16.41).
Por supuesto, es necesario extender el presente formalismo al caso en que hay varios grados de libertad.
Adicionalmente, las perturbaciones a orden superior a uno pueden ser de gran importancia, bien porque se
requiera una gran precisi
on en los calculos o bien porque las contribuciones a primer orden sean nulas (este es
el caso del oscilador anarmonico como veremos m as adelante). Por estas razones, procederemos a estudiar el
caso de ordenes superiores para sistemas de varios grados de libertad.

16.6. Teora de perturbaci


on independiente del tiempo para orden supe-
rior al primero y varios grados de libertad
Las condiciones son naturalmente las mismas de la secci
on anterior: sistemas conservativos peri odicos y
separables (en realidad la condici
on de separabilidad solo es no trivial para el caso con varios grados de
libertad). Para el sistema no perturbado tenemos el conjunto de variables acci
on angulo (w0i , J0i ) de modo
que
H = H (J0i ) ; w0i = v0i t + i
la qk debe ser funci
on peri
odica m
ultiple de las w0i lo cual en forma compacta se puede escribir en la forma
X (k)
qk = Aj (J0 ) e2ijw0
j

siendo j, w0 , J0 vectores ndimensionales de los ndices enteros, variables acci on y coordenadas angulares
respectivamente. Nuevamente el conjunto (w0 , J0 ) sigue siendo can onico en el sistema perturbado. El Ha-
miltoniano perturbado en funci on de estas variables se puede desarrollar en serie con respecto al par ametro

H (w0 , J0 , ) = H0 (J0 ) + H1 (w0 , J0 ) + 2 H2 (w0 , J0 ) + . . . (16.63)


de nuevo buscamos una transformaci on canonica que nos lleve desde el conjunto (w0 , J0 ) hasta el conjunto
(w, J) de modo que las J sean constantes y las w sean lineales en el tiempo. En este nuevo sistema, el
Hamiltoniano perturbado solo es funci
on de las J y
(J, ) = 0 (J) + 1 (J) + 2 2 (J) + . . . (16.64)
con los valores de 0 , 1 , 2 etc. se pueden hallar las frecuencias perturbadas hasta un orden dado de
1 2
v = v0 + + 2 + ... (16.65)
J J
la funci
on generatriz de la transformaci onica (w0 , J0 ) (w, J) se escribe como W (w0 , J, ) y su
on can
desarrollo en potencias de se escribe
W (w0 , J, ) = w0 J + W1 (w0 , J) + 2 W2 (w0 , J) + . . .
esta funci
on generatriz naturalmente es soluci
on de la ecuaci
on de Hamilton Jacobi adecuada
 
W
H w0 , , = (J, ) (16.66)
w0
posteriormente se expanden los dos miembros de (16.66) en potencias de y se igualan coeficientes de las
mismas potencias en . Ilustremos el caso de segundo orden para el cual la expansi
on de ambos miembros en
(16.66) se escribe
     
W W 2 W
H0 + H1 w0 , + H2 w0 , = 0 (J) + 1 (J) + 2 2 (J) (16.67)
w0 w0 w0
410 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

nuevamente cada termino del miembro izquierdo depende de a traves de W/w0

W W1 W2
J0 = =J+ + 2
w0 w0 w0
ahora desarrollamos los terminos Hi en serie de Taylor en torno a J0 = J conservando en H0 los terminos
hasta 2 , en H1 los terminos hasta orden y en H2 los terminos de orden cero, lo u
ltimo equivale a sustitur
J0 J en H2 . Escribamos H0 y H1 en notaci on matricial
       
W W1 2 W2 H0 1 W1 2 H0 W1 
H0 = H0 (J) + + + + O 3
w0 w0 w0 J 2 w0 J J w0
 
W W1 H1 
H1 w0 , = H1 (w0 , J) + 2 + O 3
w0 w0 J
 
2 W 
H2 w0 , = 2 H2 (w0 , J) + O 3 (16.68)
w0

reemplazando (16.68) en el miembro izquierdo de (16.67) y agrupando las potencias de se tiene

W1 H0 W2 H0
H0 (w0 W ) + H1 (w0 , w0 W ) + 2 H2 (w0 , w0 W ) = H0 (J) + + H1 (w0 , J) + 2
w0 J w0 J
2
W1 H1 1 2 W1 H0 W1
+2 + + 2 H2 (w0 , J)
w0 J 2 w0 J J w0
Introduciendo estas expansiones en (16.67) e igualando potencias en se obtiene

0 = H0 (J) (16.69)
W1
1 = v0 + H1 (w0 , J) (16.70)
w0
W2
2 = v0 + 2 (w0 , J) (16.71)
w0
W1 H1 1 W1 2 H0 W1
2 (w0 , J) H2 (w0 , J) + + (16.72)
w0 J 2 w0 J J w0
nuevamente la ecuaci
on que relaciona a w con w0 est
a dada por
W W1 W2
w= = w0 + + 2 + ...
J J J
para que el sistema (q, p) tenga periodicidad multiple tanto en w0 como en w con periodo 1, todos los terminos
Wk deberan ser funciones peri odicas de w0 por tanto
X (k)
Wk (w0 , J) = Bj (J) e2ijw0 (16.73)
j

de modo que todas las derivadas de Wk carecer an de termino constante y los primeros terminos a la derecha
en (16.70, 16.71) no contribuyen a la dependencia con respecto a J. Sumando y restando los promedios de
H1 , 2 sobre periodos completos de todas las w0 las Ecs. (16.69, 16.70, 16.71, 16.72) se pueden escribir en la
forma

0 = H0 (J) (16.74)
 
W1
1 = v0 H 1 + H1 (w0 , J) + H1 (w0 , J) (16.75)
w0
 
W2
2 = v0 2 + 2 (w0 , J) + 2 (w0 , J) (16.76)
w0
16.6. TEORIA DE PERTURBACION
INDEPENDIENTE DEL TIEMPO PARA ORDEN SUPERIOR AL PRIMER

como antes, los terminos entre parentesis cuadrados deben anularse y se obtiene

0 (J) = H0 (J) ; 1 (J) = H1 (w0 , J) ; 2 (J) = 2 (w0 , J) (16.77)


W1 W2
v0 = H 1 H1 (w0 , J) ; v0 = 2 2 (w0 , J) (16.78)
w0 w0
en forma unificada, estas ecuaciones se pueden escribir en la forma

i (J) = i (w0 , J) ; 0 H0 ; 1 H1 (16.79)


Wi
v0 = i i (w0 , J) ; i = 1, 2 (16.80)
w0
las Ecs. (16.80) son periodicas en w0 con media nula. Observese que las ecuaciones (16.69, 16.77, 16.79) se
reducen a la forma que se obtuvo para un grado de libertad a primer orden excepto por el hecho de que
contienen todas las frecuencias del movimiento no perturbado.
La Ec. (16.65) nos muestra que la perturbaci on de segundo orden en para la frecuencia depende de
2 . Por otro lado, 2 viene dado por las Ecs. (16.71, 16.72), tales ecuaciones poseen terminos con derivadas
de W1 con respecto a w0 multiplicados por funciones peri odicas en w0 . Si bien las propias derivadas de W1
tienen media nula, cuando est an multiplicadas por funciones periodicas en w0 la media del producto no tiene
porque anularse. Esto nos da como consecuencia que en la perturbaci on de segundo orden los terminos en
W1 no necesariamente se anulan en la media. Por lo tanto, para hallar la correcci on de segundo orden en las
frecuencias, ser
a necesario conocer la transformacion canonica a primer orden. En principio los coeficientes
(1)
Bj que definen a W1 a traves de la ecuaci on (16.73) se pueden hallar directamente de (16.80) con i = 1.

W1
v0 = H 1 H1 (w0 , J) (16.81)
w0
Ahora bien, dado que W1 es funci on peri
odica de las w0 seg
un (16.73), tenemos que w0 W1 tambien es funci on
peri
odica de las w0 con coeficiente constante nulo como ya se discutio. Por tanto, el miembro derecho de (16.81)
se puede desarrollar en serie de Fourier similar a la Ec. (16.48) o a la Ec. (16.73) pero sin termino constante
X
H 1 H1 = Cj (J) e2ijw0 (16.82)
j6=0

reemplazando la Ec. (16.73) con k = 1 en (16.81), tenemos que el producto matricial a la izquierda de (16.81)
se puede escribir como
W1 X (1)
v0 = 2i Bj (J) (j v0 ) e2ijw0 (16.83)
w0
j6=0

de acuerdo con las Ecs. (16.81, 16.82) y (16.83), tenemos que


X X (1)
Cj (J) e2ijw0 = 2i Bj (J) (j v0 ) e2ijw0 ; j 6= 0
j6=0 j6=0

(1)
y recurriendo a la independencia lineal de los exponenciales, tenemos que los coeficientes Bj de la expansi
on
de W1 se escriben como
(1) Cj (J)
Bj = , j 6= 0 (16.84)
2i (j v0 )
vemos que no hemos obtenido el termino constante i.e. con j = 0, pero en las expresiones para las i Ecs.
(16.69, 16.70, 16.71, 16.72) solo intervienen las derivadas de W1 y estas no contendran terminos constantes.
Para
ordenes superiores al segundo el procedimiento es an alogo, aunque las transformaciones algebr
aicas
seran mas complejas. En general, para la transformaci on de orden kesimo podemos escribir k en la forma
Wk
k (J) = v0 + k (w0 , J) (16.85)
w0
412 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

donde el primer termino a la derecha de (16.85) viene del termino de primera derivada del desarrollo de Taylor
de H (J0 ) alrededor de J0 = J donde todos los terminos de la diferencia J0 J se conservan hasta orden k . Wk
solo aparece en este termino de modo que k solo podr a contener las funciones generatrices Wm para ordenes
menores que k. Por los razonamientos hechos para primer y segundo orden el primer termino del miembro
derecho en (16.85) tiene media nula cuando se promedia para ciclos completos de w0 y por tanto las Ecs.
(16.79, 16.80) seran v ordenes. Es claro que para k > 2, k se vuelve mucho m
alidas a todos los as complicado
que la Ec. (16.72), y contiene a todas las funciones encontradas en los c alculos de los
ordenes precedentes.
Veremos m as adelante que en presencia de degeneraci on de las frecuencias del sistema no perturbado,
aparecen problemas con esta formulaci on. De momento veamos un ejemplo sencillo.

16.6.1. Oscilador anarm


onico unidimensional
Consideremos un termino de la forma q 3 que se agrega al potencial armonico. Un termino de este tipo se
encuentra cuando se expande un potencial alrededor del mnimo hasta tercer orden en serie de Taylor, y se
conoce como primer termino anarmonico. El Hamiltoniano se escribe de la forma
   r
1 2 2 2 2 q k
H= p + m 0 q 1 + ; 0 = 2v0 = 2
2m q0 m

siendo 0 la frecuencia no perturbada y q0 es una amplitud de referencia que se puede fijar posteriormente y
es un par
ametro adimensional peque no. Separando las potencias en se obtienen los terminos

1  2  m02 q 3
H = H0 + H1 ; H0 = p + m2 02 q 2 ; H1 = ; Hi = 0 para i 2
2m 2q0

usaremos como variables can


onicas las variables acci
on angulo (J0 , w0 ) del sistema sin perturbar, los terminos
no nulos de H se pueden ecribir en virtud de las Ecs. (9.81), en la forma
 3/2
m02 J0
H0 (w0 , J0 ) = J0 v0 ; H1 (w0 , J0 ) = sin3 2w0 (16.86)
2q0 m0

y las dos primeras Ecs. (16.77) nos dan las contribuciones de orden cero y uno para (J)
 3/2
m02 J
0 (J) = Jv0 ; 1 = H1 (w0 , J) = sin3 2w0 = 0
2q0 m0

la anulaci
on de 1 es inmediata debido al car acter impar del integrando. Vemos que no hay contribucion de
primer orden, de tal forma que la primera correcci on con respecto al caso no perturbado aparece a segundo
orden. Para obtener la contribucion de segundo orden 2 (J) se tiene en cuenta que como H0 es lineal en J y
H2 se anula, el valor de 2 en la Ec. (16.72) se reduce a

W1 H1
2 =
w0 J

la anulaci
on de 1 = H 1 implica que la Ec. (16.81) adquiere la forma

W1 H1
=
w0 v0

combinando estos dos resultados se llega a

H1 H1 1 H12
2 = =
v0 J 2v0 J
16.6. TEORIA DE PERTURBACION
INDEPENDIENTE DEL TIEMPO PARA ORDEN SUPERIOR AL PRIMER

y usando la segunda de las Ecs. (16.86)


 3
m2 04 J 0 J 3 2v0 J 3
H12 (w0 , J) = 2 sin6 2w0 = 2 3 sin6 2w0 = sin6 2w0
4q0 m0 4q0 m 4q02 3 m
v0 J 3
H12 (w0 , J) = sin6 2w0
2 2 mq02

con lo cual se obtiene


3J 2
2 (w0 , J) = sin6 2w0 (16.87)
4 2 mq02
reemplazando (16.87) en la tercera de las Ecs. (16.77) nos queda

3J 2
2 (J) = sin6 2w0
4 2 mq02

y teniendo en cuenta que el valor medio de sin6 x es 15/48 se obtiene

15J 2
2 (J) = (16.88)
64 2 mq02

y la frecuencia perturbada hasta segundo orden en se obtiene a partir de (16.65)

1 2 15J
v = v0 + + 2 = v0 2 (16.89)
J J 32 2 mq02

recordando que q0 es una amplitud de referencia, es natural tomarla como la amplitud m


axima que tendra el
oscilador con una energa dada E0 en el sistema sin perturbar i.e.

m02 q02 m02 q02 J0


= E0 = H0 = Jv0 =
2 2 2
de modo que para el orden m
as bajo
J
mq02 =
0
con esta amplitud de referencia las Ecs. (16.88, 16.89) quedan

150 J 2 150 J
2 (J) = =
64 2 J 64
15 0 J 150 15 (2v0 )
v = v0 2 2
= v0 2 = v0 2
 32 J 32 32
15
v = v0 1 2 (16.90)
16

con esta amplitud de referencia, podemos decir a partir de la Ec. (16.90) que la variaci
on relativa de segundo
orden de la frecuencia est
a dada por
 
v v v0 v0 1 2 15
16 v0
= =
v0 v0 v0

quedando finalmente
v 15
= 2
v0 16
414 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

16.7. Teora de perturbaciones independiente del tiempo en presencia de


degeneracion
En presencia de degeneraci on, la primera dificultad obvia que aparece es la anulaci on exacta o aproximada
de j v0 en el denominador de la Ec. (16.84). En realidad los c alculos en presencia de degeneracion son muy
complejos y contin uan siendo tema de investigaci on, por tanto solo se mencionar an los aspectos cualitativos
mas relevantes.
Se dice que la degeneracion es exacta o propia cuando las frecuencias sin perturbar v0 son tales que existan
uno o m as conjuntos de enteros j para los cuales j v0 = 0 (ver secci on 9.9.4). En la secci on 9.9.4 veamos
que se puede pasar del conjunto can onico (w0 , J0 ) a otro conjunto de variables tipo acci on
angulo para el
cual las antiguas frecuencias degeneradas corresponden a nuevas frecuencias nulas y las nuevas frecuencias sin
perturbar no nulas no son degeneradas. Al introducir la perturbaci on se remueve la degeneraci on de manera
que las frecuencias nulas del sistema no perturbado adquirir an un peque no valor y por lo tanto corresponden a
periodos grandes. Las variables angulo asociadas se denominan variables lentas en contraste con las variables
angulares correspondientes a frecuencias no degeneradas que se denominan variables r apidas. Los terminos
de periodo largo pueden aparecer como terminos seculares sobre intervalos de tiempo restringidos, a manera
de ejemplo sin 2vt se puede considerar funci on lineal de t siempre que vt << 1.
En el caso de degeneraci on exacta, comenzamos usando las variables can onicas (w0 , J0 ) y el Hamiltoniano
no perturbado es funci on solamente de las variables J0i no degeneradas, de modo que aunque la Ec. (16.63)
sigue siendo valida, no aparecer an en ella las J0i degeneradas. Se realiza entonces la transformacion can onica
del calculo de la perturbacion pero solo para las variables no degeneradas dejando inalteradas las variables
degeneradas. El nuevo Hamiltoniano (Ec. 16.64) tiene la forma
  
J, J0 , w0 , = 0 (J) + 1 J, J0 , w0 + 2 2 J, J0 , w0 + . . .

donde w0 representa las m variables degeneradas que tiene valor cero en el problema no perturbado y J0 son
naturalmente sus momentos conjugados. Las variables no primadas est an entonces asociadas a las variables no
degeneradas. Se ve entonces que la transformaci on canonica elimina a las variables r apidas de modo que todo
queda en funcion de las variables lentas. Por otro lado, puesto que es cclica en w, los momentos transformados
J son verdaderas constantes de movimiento y se puede considerar (J, J0 , w0 , ) como un Hamiltoniano de un
sistema con m grados de libertad. Adicionalmente, dado que 0 (J) es constante, y por tanto independiente
de las dem an necesarias las ecuaciones de movimiento de (w0 , J0 ) y se podr
as variables, no ser an suprimir en
. En consecuencia, el nuevo Hamiltoniano efectivo es de orden , el Hamiltoniano no perturbado es

1 J, J0 , w0

y en este problema no perturbado w0 ya no consiste en valores nulos. Si solo hay una condicion de degeneraci
on,
el problema efectivo es de un solo grado de libertad y formalmente integrable. Con la presencia de m as de
una degeneracion se suele buscar una segunda transformaci on can
onica para eliminar los terminos de variables
lentas de forma similar a como se eliminaron las variables r apidas, este procedimiento es muy complejo en la
practica.
Puede aducirse a partir de la Ec. (16.84) que incluso cuando las frecuencias no son degeneradas, aparecer an
inevitablemente valores peque nos del divisor j v0 a medida que los ndices j se hacen m as grandes. Este
fenomeno se conoce como resonancia, e implica que la amplitud de uno de los terminos de Fourier se haga muy
grande. Sin embargo, esto no supone un gran problema para la mayora de Hamiltonianos de perturbaci on que
se usan en la pr
actica. Para ver esto, notemos que en (16.84) lo que cuenta es el factor completo
Cj
(16.91)
j v0
donde Cj es el coeficiente de Fourier del Hamiltoniano de perturbaci on H1 como se ve en (16.82). En mec
anica
celeste ocurre que la mayora de Hamiltonianos de perturbaci on poseen la caractersitca de DAlembert
que en terminos eursticos nos dice que cuando los valores de los enteros en j son mayores que el exponente en
16.8. ALGUNOS ASPECTOS CUALITATIVOS GENERALES DE LA TEORIA CLASICA
DE PERTURBACIONE

el Hamiltoniano, las magnitudes de Cj caen r apidamente, usualmente en forma exponencial, cuando aumentan
los valores de los ndices j. Los cocientes del tipo dado en (16.91) no crecen entonces demasiado y la expansi
on
converge cuando las frecuencias v0 satisfacen una condici on de irracionalidad.
El comportamiento resonante cuando se tiene la caracterstica de DAlembert o en general cuando Cj / (j v0 ) <

O ( ) se conoce como resonancia superficial. Estas resonancias en general no son un problema para la ex-

pansion perturbativa. En ocasiones sin embargo, el anterior cociente se hace grande, i.e. mayor que O ( ) en
cuyo caso hablamos de resonancias profundas. Cuando aparecen resonancias profundas se requiere de tecnicas

especiales tales como el desarrollo de Bohlin en el cual se expande en potencias de en lugar de potencias
de . Un estudio profundo de este tema requiere un tratamiento exhaustivo de los fen omenos de resonancia en
oscilaciones alineales.

16.8. Algunos aspectos cualitativos generales de la teora cl


asica de per-
turbaciones
Hemos mencionado que la teora de perturbaciones ha evolucionado junto con la mec anica celeste desde
los tiempos de Newton. De otra parte, la exploraci on espacial y la tecnologa desarrollada alrededor de esta,
junto con el r apido desarrollo de los recursos computacionales, ha impulsado enormemente el desarrollo de los
metodos perturbativos. A manera de ejemplo, la correcci on de la relatividad general estudiada en la secci on
(16.4.3) resulta lo suficientemente grande para la precisi on requerida en los sistemas de posicionamiento global
satelital (GPS).
A grandes rasgos se distingue entre los metodos perturbativos generales que conducen a f ormulas analticas
y metodos de perturbaci on especiales, que nos llevan a respuestas numericas correspondientes al sistema
perturbado. Hay tambien metodos mixtos de modo que esta clasificaci on es en realidad aproximada. Los
metodos numericos solo alcanzaron un desarrollo considerable con el desarrollo de las calculadoras y m as
adelante de los computadores.
Vale mencionar sin embargo, que las soluciones numericas no pueden resolver cuestiones referentes a la
estabilidad a largo plazo de los sistemas perturbados. En esa direcci on, un debate de gran interes concierne a
la estabilidad del sistema solar. Por ejemplo, las perturbaciones podran llevar a colisiones interplanetarias o
a que un planeta abandone el sistema solar. Por esta raz on, desde el principio del desarrollo de los metodos
perturbativos existi o un gran interes en estudiar los terminos perturbativos seculares. Por ejemplo, si se iden-
tifica un termino de perturbaci on secular para el semieje mayor de la trayectoria de un planeta, se concluira
que el planeta abandonar a el sistema solar o colapsar a hacia el sol. Si bien al principio se demostr o que no
existan terminos seculares a primer orden, los trabajos de Poincare en donde demuestra que las series de
Fourier multiperi odicas que aparecen a orden superior solo son semiconvergentes llev o a una indeterminaci on
en el problema de la estabilidad.
La cuestion de la estabilidad solo se aclar
o a raz de la aplicaci
on mas bien reciente de tecnicas matem aticas
avanzadas. Por medio del uso de la topologa diferencial es posible examinar el comportamiento global de las
posibles orbitas en el espacio de fase. Con base en estos estudios se demostr o que es posible el movimiento
acotado estable de un sistema de n cuerpos bajo interacci on exclusivamente gravitatoria. Especficamente un
grupo de medida finita de orbitas est
an confinadas a regiones concretas del espacio de fase y permanecen
as indefinidamente en movimiento cuasi peri odico. Debe decirse sin embargo, que aunque algunas orbitas
(un conjunto de medida finita) mantienen un movimiento cuasiperi odico permanente, la inmensa mayora de
condiciones iniciales conducen a movimientos erg odicos es decir que llenan completamente una cierta regi on
del espacio de fase, de modo que la trayectoria en el espacio de fase para por un punto dado en el interior de
esta region en uno o m as instantes de tiempo.
De lo anterior se deduce que el problema de la estabilidad no est a del todo resuelto puesto que solo un
conjunto de condiciones iniciales permite este movimiento estable y adicionalmente las fuerzas disipativas y
otras fuerzas no gravitatorias (e.g. interacci on magneticos entre los planetas y el sol) no han sido tenidas en
cuenta en tal estudio. El sistema puede ser adem as muy sensible a las condiciones iniciales o a efectos de
cuerpos fuera del sistema solar.
416 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

16.9. Invariantes adiab


aticos
Consideremos una lenteja que se suspende de modo que la cuerda pasa por un agujero que se practica
en el techo, y le damos el impulso necesario para que forme un pendulo plano. Ahora comenzamos a tirar
de la cuerda muy lentamente hacia arriba o hacia abajo, de modo que a lo largo de un periodo hay una
ligera variaci on de la longitud de la cuerda. La energa del pendulo no se conserva ya que el agente externo
realiza trabajo sobre el sistema (o lo extrae de el) al cambiar la longitud de la cuerda. Un an alisis sencillo
muestra que si la variaci on de la longitud es muy lenta (i.e. adiab atica) el cociente entre la energa y la
frecuencia de oscilaci on E/ permanece constante. Este cociente ser a precisamente la variable de acci on J de
una formulaci on en variables acci
on angulo. Decimos entonces que J es invariante adiab atico y extenderemos
este fen omeno a otros sistemas Fsicos y diremos que hay invarianza adiab atica de las variables de acci on
cuando dicha cantidad permanece constante (al menos a primer orden) cuando ocurre una variaci on lenta de
los par ametros del sistema. Esta propiedad era de gran interes para los pioneros de la mec anica cuantica, ya
que los primeros procesos de cuantizaci on involucraban la cuantizaci on de la variable de accion para describir
estados de sistemas at omicos. Por otro lado, ya se saba que la variaci on lenta de perturbaciones externas,
por ejemplo de los campos electromagneticos que rodean al atomo, no inducen transiciones entre estados. La
invarianza adiabatica resultaba entonces una propiedad muy importante para explicar este fen omeno.
El concepto de invarianza adiab atica tiene m ultiples aplicaciones en temas como Fsica del plasma, ace-
leradores de partculas, astronoma gal actica etc. Este constituye un tema de interes e investigaci on actual y
aqu solo daremos los fundamentos de este desarrollo.
Consideraremos por simplicidad sistemas de un solo grado de libertad que contengan un par ametro a que se
variara adiab aticamente. Implcitamente asumimos que el sistema es inicialmente conservativo con a constante
en el tiempo. En un cierto tiempo, se enciende la variaci on temporal de a, es necesario aclarar que a se
asumir a como funcion exclusivamente del tiempo y no depender a por ejemplo de posiciones o velocidades. Una
vez encendida la variaci on temporal de a este variar a lentamente por mucho tiempo y llegar a a tener de nuevo
un valor constante. Cuando a sea constante, el movimiento ser a peri
odico y la variaci
on lenta del par ametro
no alterar a la naturaleza periodica del movimiento. Incluso si las variaciones son peque nas en un periodo
completo, pueden haber cambios apreciables para tiempos suficientemente largos. La variaci on temporal de a
se considera entonces una perturbaci on y buscamos variaciones seculares del movimiento.
Cuando el par ametro a es constante en el tiempo, el sistema se describe por variables acci on angulo
(w0 , J0 ) y el Hamiltoniano es funcion de J0 y a, H = H (J0 , a). Es conveniente considerar que el par (w0 , J0 ) vie-
ne de una transformaci on can on generatriz que denotamos por W (q, w0 , a),
onica a partir de (q, p) con una funci
esta funci on generatriz es de tipo 1. Si la transformaci on can
onica se obtiene por Hamilton Jacobi, lo que se
obtiene es una funci on generatriz de tipo 2 que denotamos por W (q, J0 , a) y que est a conectada con W por
una transformacion de Legendre Ec. (7.17)

W (q, w0 , a) = W (q, J0 , a) J0 w0 (16.92)

la conveniencia de usar una funci on de tipo F1 en lugar de la funcion tipo F2 que sale de la solucion de

Hamilton Jacobi, proviene del hecho de que W es funci on periodica de w0 como veremos mas adelante.
Cuando a vara en el tiempo (w0 , J0 ) contin
uan siendo variables can
onicas pero la funci
on generatriz ahora
depende explcitamente del tiempo por medio de la dependencia temporal de a. Por tanto el Hamiltoniano
perturbado para el sistema (w0 , J0 ) ser
a
W a W
K (w0 , J0 , a) = H (J0 , a) + = H (J0 , a) +
t t a
W
K (w0 , J0 , a) = H (J0 , a) + a (16.93)
a
n
otese que en el u
ltimo paso hemos usado el hecho de que a solo depende del tiempo. Ahora J0 no es constante
y w0 ya no es funci on lineal del tiempo. El segundo termino a la derecha de (16.93) es un Hamiltoniano de
perturbacion. Notese que hemos usado la misma transformaci on canonica para generar dos Hamiltonianos
diferentes a partir del mismo Hamiltoniano original H (q, p). Primero usando la transformacion can
onica con

16.9. INVARIANTES ADIABATICOS 417

a constante llegamos de H (q, p, a) a H (J0 , a); ambos Hamiltonianos coinciden numericamente ya que la
Funcion caractersitica no depende explcitamente del tiempo. Posteriormente, usamos la misma transformaci on
canonica pero ahora con a variable en el tiempo para ir desde H (q, p, a (t)) hacia K (w0 , J0 , a (t)), en este caso
los Hamiltonianos no coinciden numericamente ya que W adquiere dependencia explcita con el tiempo7 por
medio de a (t). De lo anterior se concluye que la relaci on entre los Hamiltonianos K (w0 , J0 , a) y H (J0 , a) en
(16.93) no proviene de una transformaci on can
onica sino m as bien de la diferencia entre la misma TC cuando
a se considera constante y cuando a se considera variable en el tiempo.
La dependencia temporal de J0 viene regida por una de las ecuaciones de Hamilton
 
K W
J0 = = a (16.94)
w0 w0 a

y al igual que en el metodo de variacion de constantes, la derivada entre parentesis al igual que K se expresa
en terminos de J0 es decir del valor de J a orden cero en perturbaciones. Dentro de un desarrollo perturbativo
a primer orden buscaremos un termino secular, que sera el valor medio de J0 a lo largo de un periodo del
movimiento no perturbado para un valor apropiado de a. La variaci on adiab
atica de a, nos permite considerar
al parametro a como una constante a lo largo de un periodo y el valor medio se puede escribir en la forma
Z   Z  
1 W a W 
J0 = a dt = dt + O a 2 , a
(16.95)
0 w0 a 0 w0 a

De la Ec. (9.15) recordamos que W se puede ver como una acci


on abreviada indefinida
Z
W = p dq

de modo que en un periodo de w0 la funci on generatriz W aumenta en una cantidad J0 . Similarmente, J0 w0


tambien aumenta en J0 puesto que w0 aumenta en la unidad. En consecuencia, los terminos a la derecha en
on en un periodo, con lo cual se obtiene que W es funci
la Ec. (16.92) cancelan su variaci on periodica de w0
y tanto ella como su derivada con respecto a a, pueden expresarse como expansi on de Fourier
W X
= Ak (J0 , a) e2ikw0 (16.96)
a
k

con lo cual el valor medio de J0 se escribe


Z
a X 
J0 = 2ik Ak (J0 , a) e2ikw0 dt + O a 2 , a

0
k6=0

la integral se anula puesto que el integrando no tiene ning


un termino constante. Se obtiene entonces finalmente

J0 = O a 2 , a

de modo que J0 no tendr


a variaci
on secular de primer orden en a,
por tanto tenemos la propiedad de invarianza
adiab
atica a primer orden.

16.9.1. Invarianza adiab


atica del oscilador arm
onico
Veamos como se traduce el anterior formalismo para el caso del oscilador arm
onico
1 
H= p 2 + m2 2 q 2
2m
7
Podra decirse que la dependencia temporal de W es en realidad implcita por medio de a (t). No obstante, dado que a (t) no
es una variable canonica, esta dependencia se considera explcita para efectos en las Ecuaciones de Hamilton.
418 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

consideraremos que puede ser funci on del tiempo, lo cual en el ejemplo que se explic o en la secci
on 16.9
equivale a la variaci
on de la longitud del pendulo. Por tanto, ser
a nuestro par
ametro a de variaci
on adiabatica.
La transformaci on canonica que lleva desde (q, p) hasta (w0 , J0 ) viene dada por las Ecs. (9.81)
r r
J0 mJ0
q= sin 2w0 ; p = cos 2w0
m
alculo de W
las cuales reescribiremos de forma que faciliten el c

J0 mq 2
q2 = sin2 2w0 J0 = (16.97)
m sin2 2w0
s  
m mq 2
p = cos 2w0 (16.98)
sin2 2w0

que finalmente se escribe en la forma

W
J0 = mq 2 csc2 2w0 = (16.99)
w0
W
p = mq cot 2w0 = (16.100)
q

donde hemos tenido en cuenta las ecuaciones parciales para funciones generatrices tipo 1 Ecs. (7.12). W se
puede hallar por integraci
on directa de (16.99, 16.100) excepto por constantes irrelevantes, pues recordemos
que lo que importa es hallar una soluci
on y no se necesita que tal soluci
on sea u
nica (y no lo es).

mq 2
W (q, w0 , ) = cot 2w0
2
W mq 2
= cot 2w0
2
y reemplazando la primera de las Ecs. (16.97) obtendremos a W en funci on de w0 , J0 y
 
W m J0 2 J0 cos 2w0
= sin 2w0 cot 2w0 = sin2 2w0
2 m 2 sin 2w0
W J0 J0 sin 4w0
= sin 2w0 cos 2w0 =
2 2 2
W J0
= sin 4w0 (16.101)
4
podemos obtener los coeficientes de Fourier de esta derivada reescribiendo el seno y usando la Ec. (16.96)

W J0 e4iw0 e4iw0 J0  2i(2)w0  X


= = e e2(2)iw0 = Ak (J0 , ) e2ikw0
4 2i 8i
k
J0
Ak (J0 , ) = (k2 k,2 )
8i

es decir su expansi on para J0 se obtiene reemplazando


on de Fourier consta de solo dos terminos. La expresi
(16.101) en la Ec. (16.94)
   
W J0
J0 = = sin 4w0
w0 w0 4


J0 = J0 cos 4w0 (16.102)


16.9. INVARIANTES ADIABATICOS 419

que no posee ningun termino constante como ya se predijo. La Ec. (16.102) es formalmente exacta. Similarmen-
te, la depedencia temporal exacta de w0 la determina la ecuacion de Hamilton para w0 usando el Hamiltoniano
perturbado (16.93)
   
K H W J0
w 0 = = + = v0 + sin 4w0
J0 J0 J0 J0 4

w 0 = + sin 4w0 (16.103)
2 4
si queremos calcular un valor medio de J0 que incluya una correcci on no nula, debemos hacer algunas apro-
ximaciones. En primer lugar, asumamos que para un periodo del movimiento perturbado el cociente definido
por

(16.104)

es constante y cumple la relacion << 1. La Ec. (16.104) tiene una soluci on de la forma
= = 0 et 0 (1 + t) (16.105)
donde t se mide desde el inicio del intervalo donde se mide el periodo y (0) = 0 . Reemplazando (16.104) y
(16.105) en (16.103) resulta
0 (1 + t)
w 0 = + sin 4w0 + sin 4w0 (16.106)
2 4 2 4
cuya soluci
on a orden cero es
0 (0) (0)
w 0 = 2w0 = 0 t
2
donde se ha hecho cero la constante de integraci
on a traves de una elecci
on adecuada de la fase inicial. Con
esta elecci
on de fase se tiene que
4w0 = 4v0 t = 20 t
on en la Ec. (16.106), obtenemos w0 a primer orden en
Reemplazando esta expresi
(1) 0 (1 + t)
w 0 = + sin 20 t
2 4
(1)
2 w 0 = 0 + 0 t + sin 20 t
2
cuya soluci
on es  
(1) 2 1 cos 20 t
2w0 = 0 t + 0 t + (16.107)
2 20
de nuevo hemos elegido nula la constante de integracion por simplicidad.
on para J0 . De la Ec. (16.102) tenemos que
Veamos ahora la soluci
J0 d ln J0
= cos 4w0 = cos 4w0 (16.108)
J0 dt
donde hemos usado (16.104). Ahora reemplazamos (16.107) en la segunda de las Ecs. (16.108) con lo cual se
obtiene    
d ln J0 4 2 1 cos 20 t
= cos 0 t + 0 t +
dt 2 2 20
on a segundo orden para J0
lo cual nos da la ecuaci

  
d ln J0 2 1 cos 20 t
= cos 20 t + 0 t +
dt 20
d ln J0 1 cos 20 t
= cos [x + y] ; x 20 t ; y 0 t2 +
dt 20
420 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

expandiendo el coseno en serie y usando a como par


ametro peque
no de primer orden, se obtiene

d ln J0    
= cos [x + y] = sin x sin (y) cos x cos (y) = ( sin x) y + O 3 cos x 1 + O 2
dt
d ln J0 
= 2 y sin x cos x
dt
y recordando las definiciones de x e y se tiene que
 
d ln J0 2 2 1 cos 20 t
= cos 20 t + 0 t + sin 20 t
dt 20

como se indico en el formalismo general, el comportamiento secular se obtiene promediando esta ecuaci
on
sobre un periodo de movimiento es decir desde t = 0 hasta 2/0 . En el miembro derecho solo sobrevive el
termino proporcional a t2 una vez que se hace el promedio.
  Z Z 0 /2
d ln J 1 2 2 0 2
= 0 t sin 20 t dt = 0 t2 sin 20 t dt
dt 0 2 0
 
d ln J 2 2 2 ( )2 0 ( )2 0 2
= = = = ; << 1
dt 0 0 2 0 (2/0 )2 4 4

de modo que es la variacion relativa de a lo largo de un periodo completo . La variaci


on secular relativa
de J se calcula en la forma
J 2
= (16.109)
J 2
que nos dice que la variaci
on secular de la variable de accion es de segundo orden tal como se vi o en el
2
formalismo general. Solo considerando terminos del orden 2 = (/)
podemos encontrar variaciones de J a
largo plazo.

16.9.2. Variaci
on asint
otica de J para el oscilador arm
onico (opcional)
Una de las enormes utilidades del oscilador arm onico consiste en que todos los fen omenos de oscilaciones
pequenas en torno a un punto estacionario se pueden aproximar a un oscilador arm onico. Por lo anterior es de
mucho interes conocer la variaci
on de J para el oscilador arm onico para variaciones lentas y no tan lentas de
un parametro. Esto no solo posee aplicaciones en Fsica sino incluso en la soluci
on de ecuaciones diferenciales
con coeficientes que dependen del tiempo.
Introduzcamos una variable temporal t = t siendo un par ametro peque no, es claro que

d d
= =
d (t) dt

el par
ametro temporal reescalado nos mide si vara lenta o r apidamente. Consideraremos el cambio de J no
sobre un periodo de movimiento sino a lo largo de su valor inicial y final asint otico es decir desde t hasta

t . En cada estado asint otico se asume que J adquiere valor constante. Es posible llegar al sorprendente

resultado de que para (t ) bien comportado, la variaci on entre los estados asintoticos es mucho menor de lo
que se podra esperar en la Ec. (16.109). M as especficamente se ha demostrado que si (t ) es real, acotada
y analtica sobre y en torno al eje real, la variaci
on de J es exponencialmente decreciente con en la forma

J (+) J ()  
O ed/
J (+)

siendo d un n
umero real positivo, que est
a relacionado con la anchura de la franja de analiticidad de en el
plano t complejo.

16.9. INVARIANTES ADIABATICOS 421

16.9.3. Un invariante exacto del oscilador arm


onico con frecuencia dependiente del tiem-
po (opcional)
Es interesante ver que el oscilador arm onico con frecuencia dependiente del tiempo, posee un invariante
exacto que en el lmite de variaci
on lenta se reduce a la variable de acci
on J. Supongamos un oscilador arm
onico
lineal con Lagrangiano y Hamiltoniano dados por
m 2  1  2 
L= x 2 (t) x2 ; H= p + m2 2 (t) x2 (16.110)
2 2m
el invariante que mencionamos tiene la forma
 
1 x2 2
I= + (r x xr)
(16.111)
2 r2
siendo r (t) una funci
on que satisface la ecuaci
on diferencial

r + 2 (t) r r 3 = 0 (16.112)

la deducci
on matem atica de la invarianza de I es m as bien compleja y resulta mas ilustrativo hacer algunas
consideraciones que nos den su significado fsico y la razon de porque es constante. Consideremos el movi-
miento del oscilador arm onico unidimensional con frecuencia constante, como la proyecci on sobre x de un
oscilador bidimensional is
otropo. Esta consideracion permanece v alida incluso cuando depende del tiempo.
Consideremos entonces un potencial central de tipo arm onico8 pero dependiente del tiempo
m 2
V = (t) r 2 (16.113)
2
su Lagrangiano es
mh 2 i m    
L= r + r 2 2 2 (t) r 2 = x 2 2 (t) x2 + y 2 2 (t) y 2 (16.114)
2 2
en coordenadas cartesianas esto se desdobla en dos osciladores armonicos lineales independientes con la misma
frecuencia. Cada uno de ellos cumple con la estructura dada por la Ec. (16.110). En coordenadas polares planas
se ve que L es cclica en de modo que se sigue conservando el momento angular con = (t), de esto se
sigue que una de las ecuaciones de movimiento se reduce a9
l
r 2 = h (16.115)
m
donde hemos introducido la constante de movimiento h. Con esto podemos seguir considerando al oscilador
lineal como la proyecci
on en x de un oscilador bidimensional is otropo donde h nos da su momento angular por
unidad de masa. La ecuaci on radial asociada al Lagrangiano (16.114) resulta
 
d L L
= m r ; = mr 2 mr 2 (t)
dt r r
r 4 2
mr + m 2 r mr 2 = 0 r + 2 r r 2 = 0 r + 2 r 3 = 0
r
y teniendo en cuenta la Ec. (16.115) resulta
h2
r + 2 r =0 (16.116)
r3
8
N
otese que en nuestro invariante I la variable r (t) no se refiere a posici on en el tiempo, es simplemente la soluci on de la
ecuacion diferencial (16.112). Por otro lado, en la Ec. (16.113) s estamos considerando a r (t) como una posici
on para el problema
de la fuerza central equivalente.
9
otese que en este caso es independiente de (t). La primera se refiere a la variaci
N on de la coordenada angular de posici
on
del problema bidimensional, la segunda se refiere al coeficiente de restituci on que puede ser variable en nuestro problema. Mas
exactamente, el coeficiente de restitucion es k (t) = m 2 (t) como se aprecia en la Ec. (16.113).
422 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

y usando la conservaci
on de h se puede construr una constante de movimiento dada por
 
1 h2 x2 2
I = + (r x
x r)
(16.117)
2 r2
para conocer el valor de esta constante hagamos x = r cos de lo cual resulta
 
r x xr = r r cos r sin r r cos = r 2 sin
r x xr = h sin
y reemplazando en (16.117) tenemos
 
1 h2 r 2 cos2 2 2 1 2 2 2 2

I = + h sin = h cos + h sin
2 r2 2
h 2
I =
2
por otro lado, dada la arbitrariedad en la amplitud inicial de y y de la fase inicial del movimiento bidimensional
en x e y es posible escoger estos valores de tal manera que h tenga el valor numerico unidad. Para ver esto,
supongamos que durante un cierto periodo de tiempo permanece constante con valor 0 , en este intervalo
la dependencia temporal de x e y est a dada por
x = x0 sin 0 t ; y = y0 cos (0 t + )
y usando la definici
on de h
Lz m |(r v)z |
h = = = xy y x = [x0 sin 0 t] [0 y0 sin (0 t + )] [y0 cos (0 t + )] [0 x0 cos 0 t]
m m
h = 0 y0 x0 sin 0 t [sin 0 t cos + cos 0 t sin ] 0 x0 y0 [cos 0 t cos sin 0 t sin ] cos 0 t
 
h = 0 y0 x0 sin2 0 t cos 0 x0 y0 cos2 0 t cos = 0 y0 x0 cos sin2 0 t + cos2 0 t
h = 0 x0 y0 cos
ahora hacemos variar con el tiempo, en tal caso h conservar a su valor inicial que se puede hacer igual a
la unidad eligiendo adecuadamente y0 o para un valor dado de x0 , es decir para un valor especfico de la
amplitud del movimiento unidimensional real. De esto se concluye que siempre es posible asociar a cualquier
oscilador unidimensional dependiente del tiempo, un oscilador is otropo bidimensional con h = 1. N otese que
para este problema asociado, la ecuaci on de movimiento radial (16.116) se reduce a la Ec. (16.112) cuando
h = 1. De la misma forma I de la Ec. (16.117) se convierte en el invariante I de la Ec. (16.111) cuando se
toma h = 1.
De lo anterior vemos que Fsicamente la invarianza exacta de la cantidad I asociada a un oscilador uni-
dimensional y expresada en la Ec. (16.111), es una manifestaci on de la conservaci on del momento angular en
el problema del oscilador isotropo bidimensional asociado, que tiene como proyecci on en x al oscilador unidi-
mensional en cuesti on. A su vez, la conservaci on del momento angular en el oscilador bidimensional is otropo
est
a relacionada con el hecho de que el car acter central de la fuerza no se modifica cuando se introduce la
variaci
on temporal de .
Veamos ahora la relaci on de I con la variable de acci on J. Si es constante una soluci on posible para
la ecuacion radial (16.116) con h = 1 es r = 1/2 que es obviamente constante. Esto corresponde a una
trayectoria circular en el problema bidimensional asociado. Dado que en este caso r = 0, la ecuaci on (16.111)
nos da
" #  
1 x2  2 1 x 2 m  E J0 v0
2 2
I = 2 +
1/2
x = x + = x 2 + 2 x2 = =
2 1/2 2 2m m 2mv0
J0
I =
2m
de modo que en la aproximaci on de orden cero el invariante exacto es proporcional a la variable de acci on J,
la cual es invariante solo a primer orden en un proceso adiab atico.

16.9. INVARIANTES ADIABATICOS 423

16.9.4. Invariantes adiab


aticos de partculas cargadas en campos electromagn
eticos
Supongamos que tenemos un electr on que se mueve en un campo magnetico uniforme y constante. Es bien
conocido que la partcula cargada describir
a una circunferencia o un helicoide alrededor de una lnea de campo
magnetico. Empleando segunda ley de Newton y fuerza de Lorentz resulta

dv qB
=v (16.118)
dt mc
la Ec. (16.118) nos dice que v es perpendicular a su raz on de cambio y por tanto la rapidez es constante.
En particular si v y B son perpendiculares en un instante dado, el movimiento se realizar a en un plano
perpendicular a las lneas de campo. En tal caso veremos que el vector v gira alrededor de una lnea de campo
magnetico con velocidad angular
qB
c = (16.119)
mc
Elijamos uz a lo largo de B y escribamos en coordenadas cilndricas

+ zu dv    
B = Buz ; v = ru
r + r u z ; a= = r r 2 ur + 2r + r u + zuz
dt
la Ec. (16.118) queda
    q h i q q
r r 2 ur + 2r + r u + zuz = ru + zu
r + r u z Buz = rBu
+ r
Br u
mc mc mc
q q
r r 2 = Br ; 2r + r = rB
; z = 0
mc mc
q q
r r 2 Br = 0 ; 2r + r + rB
= 0 ; z = 0 (16.120)
mc mc
antes de analizar las soluciones veremos que el problema lo podemos plantear en el marco de la mec
anica
lagrangiana usando el siguiente Lagrangiano no relativista para el sistema

mv 2
L= +MB (16.121)
2
siendo M el momento dipolar magnetico de la partcula en movimiento. En terminos del momento angular
esto se escribe
qL
M= (16.122)
2mc
usando coordenadas cilndricas con el eje z a lo largo de B, el vector M se escribe como
q q q   q  2 
M= rp= rv = (rur + zuz ) ru + zu
r + r u z = r uz r zu
+ z ru r
rz u
2mc 2c 2c 2c
la componente Mz es entonces
qr 2
Mz = (16.123)
2c
con lo cual el Lagrangiano (16.121) queda
m 2 
L = r + r 2 2 + z 2 + Mz B
2
m 2  q
L = r + r 2 2 + z 2 + Br 2
2 2c
es cclica de modo que se conserva su momento conjugado

qBr 2
p = mr 2 + (16.124)
2c
424 CAPITULO 16. TEORIA CANONICA
DE PERTURBACIONES

la ecuaci
on de movimiento radial se obtiene de la ecuaci on de Lagrange para r
   
d L L qB qB
= mr ; = mr +
2
r m r r m + =0
dt r r c c
 
qB
r r + =0 (16.125)
mc
la cual coincide con la primera de las Ecs. (16.120). La segunda de las Ecs. (16.120) se obtiene de la ecuacion
de Lagrange para o combinando las Ecs. (16.124, 16.125).
Una solucion de movimiento estacionario para las Ecs. (16.120) consiste en tomar r constante10 , con lo cual
la segunda de las Ecs. (16.120) nos conduce a c constante. Reemplazando r y constantes en la primera
de las Ecs. (16.120) se obtiene
q  q 
rc2 Brc = 0 c + B c = 0
mc mc
de modo que el valor de ser
a
qB
= c (16.126)
mc
que coincide con (16.119). De la tercera de las Ecs. (16.120), podemos ver que la ecuaci on para la coordenada
z est
a totalmente desacoplada y que la velocidad en z es constante. Si z = 0 el movimiento es circular uniforme
con frecuencia c dada por (16.126), si z 6= 0 el movimiento ser
a un helicoide con la misma frecuencia angular
y las mismas ecuaciones para r y .
Reemplazando (16.126) en (16.124) vemos que p adquiere el valor

qB qBr 2 qBr 2 1 qBr 2


p = mr 2 + = +
mc 2c c 2 c
qBr 2
p =
2c
ahora calcularemos la variable de acci on asociada a , como esta coordenada es cclica tiene movimiento
peri
odico de rotaci
on en el espacio de fase y su periodo natural ser
a 2 (ver discusi
on de la Ec. 9.85) con lo
cual I
qBr 2
J = p d = (16.127)
c
si asumimos que z = 0, el movimiento es circular y el momento angular (y por tanto el momento dipolar
magnetico) va a lo largo de z, de modo que Mz = M . Usando adem
as (16.123), podemos escribir

qr 2 c qr 2 2M
M= =
2c c c
con lo cual la variable can
onica J puede escribirse en la forma
2M B 2mc
J = = M (16.128)
c q
donde hemos usado (16.126). El teorema de invarianza adiab atica dice que ante una variacion lenta del campo
magnetico, J permanece constante al menos a primer orden. La Ec. (16.128) nos dice adem as que el momento
magnetico M tambien es un invariante adiab atico. A partir de la Ec. (16.127), este hecho se puede enunciar de
forma alternativa diciendo que el producto del campo por el area encerrada por la orbita se mantiene constante.
Es posible que aparezca una variaci on adiabatica de B si permanece est atica la configuracion del campo
magnetico pero este es ligeramente no uniforme. Si por ejemplo el campo depende de z y la partcula tiene una
peque
na componente z de la velocidad, esta se desplazar a lentamente a regiones con valor diferente de B. Las
10
Esto implica que la proyecci
on de la velocidad en el plano XY es totalmente transversal.

16.9. INVARIANTES ADIABATICOS 425

Ecs. (16.122, 16.126) nos dicen que la energa cinetica transversal, es decir la correspondiente al movimiento
alrededor de las lneas de B viene dada por
  
1 2 mr 2 2 1 2 1 1 2M mc qB
T = mv = = mr = |L| |c | =
2 2 2 2 2 q mc

T = M B (16.129)
supongamos que la partcula cargada es llevada hacia una direcci on en donde B crece, la Ec. (16.129) nos
dice que en tal caso la energa cinetica transversal aumenta. Ahora bien, dado que la energa cinetica total se
conserva (puesto que la rapidez es constante como se puede ver de la Ec. 16.118), es necesario que disminuya
la componente de la velocidad que va a lo largo de las lneas de fuerza i.e. la componente radial, tambien puede
haber variaci
on de la componente en z pero si asumimos que esta velocidad es muy peque na, la mayor parte de
la variaci
on ser
a en las velocidades radial y transversal. La componente radial de la velocidad se ve entonces
disminuda hasta anularse, luego de lo cual se invierte el sentido radial del movimiento. Adicionalmente, si
hacemos que B crezca en sentido contrario, la partcula cargada quedar a confinada, moviendose en uno y
otro sentido entre los extremos, fen omeno que se conoce como confinamiento especular. Hay en realidad
varios efectos adicionales debidos por ejemplo a la radiaci on de ciclotron y a efectos inductivos debido a la
no uniformidad y posible variaci on temporal de los campos. Sin embargo, esta descripci on simplificada da un
buena idea de las implicaciones Fsicas de la invarianza adiab atica de M .
Captulo 17

Formulacion Lagrangiana y Hamiltoniana


para Sistemas Contnuos y Campos

La formulacion que se ha trabajado hasta el momento inclua un n umero finito (o a lo mas infinito numerable
y discreto) de grados de libertad. No obstante, algunos problemas mec anicos como la vibraci on de un s
olido
elastico, involucran sistemas contnuos. Cada punto del s olido toma parte en la oscilaci on, y el movimiento
completo puede ser descrito solo si especificamos los desplazamientos de las partculas con respecto al equilibrio
en todos los puntos. La extensi on a un sistema contnuo se puede realizar partiendo de un sistema discreto,
resolviendo el problema para luego hacer un paso al lmite apropiado. El paso al contnuo nos lleva de manera
natural al concepto de campo y a la teora de campos, siendo un campo una funci on que asigna a cada punto
del espacio tiempo una cantidad escalar, vectorial, tensorial, etc. con lo cual hablamos de campos escalares,
vectoriales, tensoriales etc. Vale decir ademas que el concepto de campo es de gran utilidad en muchas ramas de
la Fsica incluso en escenarios mas all
a de la mec
anica, quizas el lector ya este familiarizado con campos tales
como la densidad de carga, la densidad de masa, el potencial electrico, campos de temperaturas, de presiones
etc. los cuales son campos escalares, entre los campos vectoriales se destacan el campo gravitacional, el campo
electrico, el campo magnetico, el potencial vectorial magnetico, la densidad de corriente electrica etc.
Antes de hacer un estudio detallado del paso al contnuo que nos lleva a la teora de campos, es conveniente
recapitular algunos aspectos de la ecuaci on de continuidad, la cual jugar a un papel vital en esta formulaci on.

17.1. Ecuaci
on de continuidad
Existen muchos principios de conservacion que nos son u tiles en la comprensi
on de la naturaleza. No obs-
tante, en general es deseable que estos principios de conservacion se puedan expresar en la forma de ecuaciones
diferenciales. Asumiremos la existencia de un principio de conservaci on para una carga generalizada que es
simplemente una cantidad escalar a la cual le podemos asociar una densidad (cantidad de carga generalizada
por unidad de volumen) y una propiedad de transporte que se manifiesta en una densidad de corriente
generalizada (carga generalizada por unidad de area por unidad de tiempo, en la direcci on de propagacion
de la carga generalizada). Hay muchas cantidades escalares a las cuales se les puede asociar un principio de
conservacion as como una densidad y una densidad de corriente, los ejemplos m as comunes son: carga electri-
ca, energa, masa de un fludo etc. De aqu en adelante usaremos simplemente los terminos carga, densidad
de carga y densidad de corriente, sobreentendiendo que estamos trabajando con estos conceptos en forma
generalizada.
Si tenemos una region cerrada la carga que sale (entra) se debe manifestar como una disminuci on (aumento)
de la carga en el interior, de no ser as significa que se esta creando o destruyendo carga neta de manera
espont anea. Queremos en primer lugar calcular la carga que sale por unidad de tiempo del volumen V . Para
ello necesitamos conocer el flujo sobre la superficie S que delimita a V . Veamos primero el flujo definido sobre
un elemento diferencial de superficie dS. Definimos dS como un vector normal al elemento de superficie dS que
apunta hacia afuera y cuya magnitud es el area dS del elemento diferencial, denotando los vectores unitarios

426
DE CONTINUIDAD
17.1. ECUACION 427

normal y tangencial a la superficie como uN , uT se tiene que

dS = dS uN ; J = JN uN + JT uT

n
otese que la componente normal de J es la u nica que cruza la superficie, ya que la componente tangencial
va a lo largo de esta. En particular si la corriente es puramente tangencial, la carga se propagara a lo largo
de la superficie pero sin cruzarla y por lo tanto esta carga no abandonar a el volumen. De lo anterior es claro
que la cantidad de carga que sale del volumen en la unidad de tiempo estar a definida por la componente de la
densidad de corriente que cruza dicha superficie, es decir la componente normal de J. Dado que J es la cantidad
de carga por unidad de tiempo que cruza una superficie unidad perpendicular a la direcci on de propagacion,
se tiene que la cantidad de carga por unidad de tiempo que cruza la superficie dS estar a dada por

JN dS = J dS

Notese que si esta cantidad es negativa, significa que la componente normal de J va en direccion uN es
decir, est
a entrando al volumen. Por tanto, la carga neta que sale por unidad de tiempo del volumen V que
a delimitado por la superficie cerrada S es1
est
I
J dS
S

y esta cantidad debe ser igual a la disminuci


on de carga en el interior por unidad de tiempo
I
dqint
J dS = (17.1)
dt
S

siendo J la densidad de corriente y qint la carga contenida en el volumen V . El signo menos se puede entender
teniendo en cuenta que cuando la carga sale (entra) el signo de la integral de superficie es positivo (negativo),
esto implica que la carga en el interior debe disminuir (aumentar) es decir debe ser una funci on decreciente
(creciente) del tiempo y por lo tanto su derivada debe ser negativa (positiva). Por tanto, el signo menos
garantiza que ambos miembros tengan el mismo signo en ambas circunstancias. La carga en el interior se
puede escribir en la forma Z
dqint d
= (r, t) dV
dt dt
siendo (r, t) la densidad de carga en el punto r y en el instante t. La integral de volumen se realiza en un
instante fijo de tiempo y la derivada depende de este valor evaluado en t y en t + dt. Sin embargo, el volumen
y un cierto punto x, y, z dentro de este son fijos en el proceso, de modo que esta es realmente una derivada
parcial en el tiempo.
Z I Z I Z
dqint
= dV J dS = dV J dS + dV = 0
dt t t t
S S

y aplicando el teorema de la divergencia se obtiene


Z  

J+ dV = 0
t
como el volumen en cuesti
on es arbitrario en forma tama
no y ubicaci
on, llegamos a la ecuaci
on diferencial

J+ =0 (17.2)
t
1
Por supuesto los signos de JdS pueden ser diferentes en cada elemento diferencial. Cuando la integral cerrada es positiva
(negativa) es porque sale (entra) m
as carga de la que entra (sale) en la unidad de tiempo, de modo que el flujo neto es hacia afuera
(adentro).
428CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

esta ecuaci
on diferencial se conoce como ecuaci on de continuidad y expresa la conservaci on de la carga
generalizada en procesos donde existen corrientes que pueden incluso depender del tiempo. Cuando fluye una
cierta cantidad de carga hacia afuera (adentro) del volumen, la cantidad de carga disminuye (aumenta) a la
misma rata en que tal carga sale (entra). Vale la pena reiterar que la ecuacion diferencial (17.2) es v
alida para
expresar la conservacion de muchas cantidades escalares a las que se les pueda definir una densidad y una
densidad de corriente.
Por otro lado, tambien existen principios de conservaci
on asociados a cargas vectoriales generalizadas,
la conservaci
on del momento es quiz as el mayor ejemplo en esta direcci
on. En tal caso definimos las componentes
de esta carga vectorial en coordenadas cartesianas de la forma

q = (q1 , q2 , q3 )

y cada componente se debe conservar por separado, es decir habr a una ecuaci
on de continuidad para cada
escalar qi por separado. Para ello es necesario definir una densidad para la componente iesima de la carga
vectorial generalizada i y una densidad de corriente asociada Ji . La ecuaci
on de continuidad se escribe para
cada i en la forma
i
Ji + =0
t
y denotando la componente kesima de Ji en la forma Ji k podemos escribir esta ecuaci
on en componentes,
con lo cual queda (suma sobre ndices repetidos)

i
k Ji k + =0 (17.3)
t
n
otese entonces que hay en total tres corrientes, una por cada componente conservada. Podemos formar un
tensor Ji k que nos da cuenta de las tres corrientes (denotadas por el ndice i) y sus componentes (denotadas
por k). Por ejemplo J1 2 denota que la cantidad escalar conservada q1 se puede propagar en la direcci on x2 .
En otras palabras, cuando el vector q se propaga en la direccion x2 su primera componente q1 puede cambiar.
Puede formularse la conservacion de un tensor de un rango arbitrario n y las corrientes asociadas se pueden
organizar en un tensor de rango n + 1. Por ejemplo, es m as u
til organizar al momento angular en un tensor
antisimetrico de segundo rango que en un vector.
Debemos observar que el numero de componentes del vector es arbitrario en realidad. Por ejemplo, ocurre
con frecuencia que tenemos un vector y un escalar conservados y resulta c omodo construir un vector de 4
componentes que de cuenta de todas las cargas conservadas

q = (q0 , q1 , q2 , q3 ) (17.4)

tendremos cuatro ecuaciones de continuidad



k J k + = 0 ; = 0, 1, 2, 3 ; k = 1, 2, 3 (17.5)
t
esta ecuaci
on se puede escribir en una notaci
on m
as compacta si definimos

(t , 1 , 2 , 3 ) ; J , J 1 , J 2 , J 3 (17.6)

J = 0 ; , = 0, 1, 2, 3 (17.7)

esta formulacion es c
omoda por ejemplo para inclur la conservacion de la energa y el momento lineal en un solo
arreglo. Por supuesto, la Ec. (17.7) tambien puede estarme expresando la conservaci on de cuatro cantidades
escalares independientes que no forman ning un vector. En ese sentido la cantidad J no necesariamente
expresa un tensor, aunque para la mayora de casos pr acticos, se buscaran cantidades vectoriales y tensoriales
para construr ecuaciones de continuidad.
Si una cantidad escalar determinada se conserva, entonces es claro que si definimos un volumen V delimitado
por una superficie S tal que la carga generalizada no cruza la superficie i.e. est a completamente contenida en
DE CONTINUIDAD
17.1. ECUACION 429

el volumen, entonces la carga total dentro del volumen qint se conserva ya que no hay perdidas por radiaci
on
dentro de este volumen. Similarmente ocurre para cada componente de un arreglo vectorial que se conserve,
esto se escribe en la forma Z
q = dV = K (constante) (17.8)
V
Vale la pena observar que la conservaci on de esta cantidad tambien se puede ver invirtiendo los pasos que
hemos seguido hasta ahora, es decir partimos de la formulaci on diferencial y llegamos a la forma integral.
Integrando la Ec. (17.5) sobre el volumen V resulta
Z   Z Z
k
k J + dV = 0 J dV + dV = 0
V t V V t
Z Z
d
J dS + dV = 0 (17.9)
S dt V
donde hemos usado el teorema de la divergencia. Ahora bien, dado que la carga generalizada no cruza la
superficie, el valor del flujo J dS sobre cada elemento diferencial de area se anula2 , con lo cual la integral de
superficie se anula de modo que Z Z
d
dV = 0 dV = cte (17.10)
dt V V
una anotaci on de terminologa es pertinente en este punto, hemos visto que si tenemos una carga generalizada
q que se conserva en el sentido de que no se puede crear espont aneamente, la ecuacion de continuidad se puede
escribir en forma sintetica usando una configuraci on de cuatro componentes
J (, J) J = 0
es usual llamar a la configuraci on J una corriente conservada. No obstante, este es un termino un tanto
desafortunado ya que lo que se conserva es una propiedad global cual es la carga total cuando se encierra en
una superificie donde la carga generalizada no cruza la frontera. El termino corriente conservada parece sugerir
en forma err onea que las densidades de carga y corriente son constantes de movimiento. Con esta aclaraci on
utilizaremos el termino corriente conservada de aqu en adelante.
Por otro lado, ocurre con frecuencia que la carga y corriente generalizadas est an presentes en todo el espacio
pero tienden a cero en el infinito. En tal caso ser a necesario calcular la integral de volumen de la densidad
de carga generalizada en todo el espacio para asegurar que la carga generalizada total dentro del volumen se
conserva. Sin embargo, a un integrando sobre todo el espacio puede ocurrir que la integral de superficie en 17.9
no se anule, ya que aunque J tienda a cero la superficie crece como el cuadrado de la distancia, si J decrece
m apido que 1/r 2 la integral de superficie tender
as r a a cero, pero si por ejemplo J decrece como 1/r 2 la integral
puede dar un valor finito incluso si se integra sobre todo el espacio. Esto implica que la carga generalizada no
se conserva para ning un volumen y que por tanto se presenta perdida de carga generalizada por radiaci on.
Un ejemplo notable del fen omeno de radiaci on ocurre en electrodin amica cuando tenemos cargas electricas
aceleradas. Tomemos a la densidad de energa asociada al campo electromagnetico como nuestra densidad
de carga generalizada, la densidad de corriente generalizada ser a entonces la cantidad de energa por unidad
de area por unidad de tiempo en la direccion de propagaci on de la onda electromagnetica, que sera tambien
la direccion de propagaci on de la energa transportada por el campo, esta densidad de corriente de energa
asociada al campo se conoce como vector de Poynting. Puede demostrarse que para sistemas de cargas
electricas aceleradas la integral de superficie del vector de Poynting en el infinito no es nula. Esto significa que
parte de la energa asociada al campo se aleja indefinidamente de la carga electrica sin regresar, hay tambien
una fracci on de la energa asociada al campo que se transporta junto con la carga sin alejarse indefinidamente
de ella, es decir solo una fracci
on de la energa electromagnetica se pierde por radiaci
on. Es importante enfatizar
que en este caso hemos considerado que la carga generalizada es la energa asociada al campo y NO la carga
electrica. Efectivamente si la carga electrica est a en un volumen finito, dicha carga se conserva aunque no se
conserve nuestra carga generalizada.
2
Esto no significa necesariamente que no haya corriente sobre la superficie, pero si tal corriente existe, es totalmente tangencial
de modo que la corriente evaluada en la superficie va a lo largo de esta sin cruzarla y por
a la superficie en todos los puntos de S,
tanto sin abandonar el volumen, de modo que el flujo es nulo.
430CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

17.2. Transici
on de un sistema discreto a un sistema contnuo

Figura 17.1: Sistema discreto de masas identicas puntuales conectadas por resortes identicos. Utilizaremos este
sistema para estudiar el paso al contnuo en una vara el
astica.

Utilizaremos como ejemplo ilustrativo, las vibraciones longitudinales de una varilla infinita. Partiremos
entonces del sistema discreto que consiste en una cadena infinita de masas iguales espaciadas una distancia
a, y conectadas a traves de resortes sin masa y uniformes (ver Fig. 17.1), todos con la misma constante de
restituci
on k, la infinitud de la cadena nos evita por el momento trabajar el problema de las condiciones en
los extremos. Asumiremos que las masas puntuales solo se pueden mover a lo largo de la cadena, en peque nas
oscilaciones alrededor del equilibrio. Denotando i al desplazamiento de la iesima partcula a partir de su
posici
on de equilibrio, la energa cinetica es

1X
T = m i2
2
i

donde m es la masa de cada partcula. La energa potencial correspondiente, resulta ser la suma de las energas
potenciales de cada resorte, que surgen como resultado del estiramiento o compresi on de los resortes

1X
V = k (i+1 i )2
2
i

el Lagrangiano queda entonces

1 Xh 2 i
L=T V = m i k (i+1 i )2
2
i

que tambien se puede escribir como

"   # X
1X m 2 i+1 i 2
L= a ka = aLi (17.11)
2 a i a
i i

donde a es la distancia entre los puntos de equilibrio. Obtengamos las ecuaciones de movimiento de Lagrange
DE UN SISTEMA DISCRETO A UN SISTEMA CONTINUO
17.2. TRANSICION 431

correspondientes a las coordenadas i


 
L d L
= m k = mk
k dt k
( ) ( )
L 1 X  k X 
= m i2 k i+1
2
+ i2 2i+1 i = 2
i+1 + i2 2i+1 i
k 2 k 2 k
i i
X  
k
= 2i+1 i+1,k + 2i ik 2 (i+1 i )
2 k
i
 
kX i i+1
= 2i+1 i+1,k + 2i ik 2i+1 2i
2 k k
i
kX
= [2i+1 i+1,k + 2i ik 2i+1 ik 2i i+1,k ]
2
i
X
= k [(i+1 i ) i+1,k + (i i+1 ) ik ] = k [(k k1 ) + (k k+1 )]
i

usando las ecuaciones de Lagrange para las coordenadas generalizadas k se tiene


 
d L L
= 0 mk + k [(k k1 ) + (k k+1 )] = 0
dt k k
k k (k+1 k ) + k (k k1 ) = 0
m

y dividiendo por a esta ecuaci


on, las ecuaciones de movimiento de Lagrange correspondientes a las coordenadas
i son    
m i+1 i i i1
i ka + ka =0 (17.12)
a a2 a2
las ecuaciones (17.11, 17.12) se escogieron de esa forma con el fin de obtener una f acil interpretaci
on de los
parametros en el lmite cuando a 0. Es claro por ejemplo, que m/a se reduce en el contnuo a la densidad
lineal de masa que denotaremos por . No obstante, el lmite de ka no es tan directo. Para una varilla el astica
que obedece la ley de Hooke, la elongaci on de la varilla por unidad de longitud es proporcional a la fuerza o
tensi
on ejercida a lo largo de esta, lo cual de puede escribir como

F =Y

donde es la elongaci
on por unidad de longitud y Y es el modulo de Young. Por otro lado, la elongaci
on de
un segmento a, por unidad de longitud del sistema discreto en cuesti
on, se escribe como

(i+1 i )
=
a
la fuerza necesaria para estirar el resorte en esta cantidad es
 
i+1 i
F = k (i+1 i ) = ka
a

con lo cual se ve que ka debe corresponder al m odulo de Young de la varilla contnua. Al ir del sistema
discreto al contnuo, el ndice i, que identifica a una masa puntual especfica, se convierte en una coordenada
contnua de posicion x; en vez de la variable discreta i ahora tendramos una variable de campo contnua
(x). Adicionalmente, la cantidad

i+1 i (x + a) (x) d
lm = lm =
a0 a a0 a dx
432CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

de modo que a hace el rol de dx. Finalmente, la suma sobre el ndice discreto i se convierte en una integral
sobre x a lo largo de la longitud de la varilla. El Lagrangiano (17.11) queda
Z "  2 # Z
1 d
L= dx 2 Y dx L (17.13)
2 dx
en el lmite cuando a 0, los u
ltimos dos terminos de (17.12) quedan
       
i i1 i+1 i Y i i1 i+1 i
Y Y =
a2 a2 a a a
   
Y (x) (x a) (x + a) (x)

a a a
escribiendo explcitamente el lmite resulta
    
Y d d (x) (x a) d2
lm = Y lm = Y 2
a0 a dx xa dx x a0 a dx
por lo tanto, la extension al contnuo de (17.12), es decir la ecuaci
on de movimiento para la varilla el
astica
contnua es
d2 d2
2 Y 2 =0 (17.14)
dt dx
es decir la ecuacion de onda unidimensional, correspondiente a una velocidad de propagacion
s
Y
v= (17.15)

la Ec. (17.15) corresponde a la bien conocida expresi on para la velocidad de las ondas longitudinales el asticas.
Este ejemplo sencillo ilustra la mayor parte de las caractersticas generales que presenta el paso al contnuo.
Un aspecto muy relevante es el papel de la coordenada de posici on x. Esta variable no representa una
coordenada generalizada, es simplemente el ndice contnuo que reemplaza a i. As como cada diferente
valor de i corresponde a una coordenada generalizada diferente i del sistema discreto, de la misma forma hay
una coordenada generalizada (x) por cada valor de x en el sistema contnuo. Dado que tambien es en general
funci
on del parametro contnuo tiempo debemos escribir (x, t), esto indica que x al igual que el tiempo se
puede considerar como un par ametro que entra en el Lagrangiano. Si el sistema contnuo fuera tridimensional
en lugar de unidimensional, las coordenadas generalizadas se rotularan con tres ndices contnuos x, y, z, y las
coordenadas generalizadas se escribiran como (x, y, z, t).
Vale la pena enfatizar que en la formulaci on en el contnuo, las cantidades x, y, z, t son completamente
independientes unas de otras, y solo aparecen como variables explcitas en . Por lo tanto, las derivadas de
con respecto a cualquiera de ellas se pueden escribir como derivadas totales sin ninguna ambig uedad3 . Por
otro lado la Ec. (17.13) nos muestra que el Lagrangiano aparece como una integral sobre el ndice contnuo
x, hemos denotado al integrando como L, en el correspondiente caso tridimensional el Lagrangiano tendra la
forma Z Z Z Z
L= L dx dy dz = L dV (17.16)

donde L es conocido como densidad Lagrangiana. De acuerdo con (17.13), la densidad Lagrangiana asociada
a las vibraciones longitudinales de la varilla viene dada por
"    2 #
1 d 2 d
L= Y (17.17)
2 dt dx
que corresponde al paso al lmite contnuo de la cantidad Li que aparece en la Ec. (17.11). Como veremos m as
adelante, para los sistemas contnuos la densidad Lagrangiana ser a de mucha mas utilidad que el Lagrangiano.
3
La independencia de los par
ametros x, y, z, t se puede ver teniendo en cuenta que ellos representan lugares geometricos (espacio
temporales) en el espacio euclidiano, y no posiciones de una determinada partcula. Es decir las variables de posici on no tienen
ninguna dinamica en esta formulaci
on.
LAGRANGIANA EN UNA DIMENSION
17.3. FORMULACION PARA SISTEMAS CONTINUOS CON UNA SOL

17.3. Formulaci
on Lagrangiana en una dimensi
on para sistemas contnuos
con una sola variable de campo
De la Ec. (17.17) se observa que L para la varilla elastica depende de /t, pero tambien de /x.
Esto indica que x y t juegan un rol similar como par ametros de la densidad Lagrangiana. Si hubiera fuerzas
locales presentes adem as de las interacciones entre vecinos, podemos tener un L que dependa de como tal,
adem as del gradiente espacial de y su derivada temporal. En el caso m as general la densidad Lagrangiana
puede ser tambien funci on explcita de x, t por ejemplo si hay un campo externo que no sea constante ni
uniforme. De tal manera que la densidad Lagrangiana para un sistema contnuo unidimensional aparece como
una funcion de la variable de campo en la forma
 
d d
L = L , , , x, t (17.18)
dx dt

el Lagrangiano total es de acuerdo con (17.16), la integral de L sobre el rango de x que define al sistema. Por
otra parte, el principio de Hamilton Ec. (4.2) en el lmite de sistemas contnuos unidimensionales se escribe
como Z Z t2 x2
I = L dx dt = 0 (17.19)
t1 x1

Si el principio de Hamilton para un sistema contnuo ha de ser de alguna utilidad, entonces debe ser posible
obtener el lmite contnuo de las ecuaciones de movimiento a partir de dicho principio, como por ejemplo la
Ec. (17.14). Las ecuaciones de movimiento deben obtenerse haciendo una variaci on de la integral (ahora doble)
de L en (17.19). El procedimiento es muy similar al caso discreto. La variaci on se hace solo sobre y sus
derivadas; los par ametros x, t no son afectados por la variaci on ni directamente ni a traves de los lmites de
on4 . As como la variaci
integraci on de se toma como nula en los extremos temporales t1 y t2 , as mismo la
variaci
on de en los extremos x1 , x2 de la integraci on en x tambien se tomar a como cero, en otras palabras
tenemos condicion de extremo fijo en los par ametros. Al igual que en la seccion 3.2 una familia de caminos
variados muy conveniente en el espacio de las se obtiene escogiendo a a partir de una familia uniparametrica
de posibles funciones
(x, t; ) = (x, t; 0) + (x, t) (17.20)

donde (x, t; 0) denota la funci


on correcta que satisface el principo de Hamilton, y es cualquier funci on bien
comportada que se anula en los puntos extremos de x y t. Si I se considera una funci on de , de tal modo que
tenga un extremo en (x, t; 0) la derivada de I con respecto a se anula en = 0. A traves de la diferenciaci
on
directa se obtiene5

Z t2 Z x2    
dI L L d L d
= dx dt +   +   (17.21)
d t1 x1 d dt d dx
dt dx

puede verse que a pesar de que L puede depender tambien explcitamente de x y t, estos terminos no aparecen
en (17.21) en virtud de que x/ = t/ = 0 ya que los par ametros no cambian cuando se hace una
variaci
on de la coordenada (x, t). Ahora bien, debido a que la variaci
on de es decir , se anula en los
extremos de ambos par ametros, una integraci
on por partes en x y t nos da las relaciones

Z t2   Z t2
L d d L
  dt =   dt
t1 d
dt
dt t1 dt d
dt

4
Recordemos que los par ametros espaciales son solo lugares geometricos de modo que no se ven afectados por la variaci
on de
una coordenada , adem as al igual que en el caso discreto el camino variado no implica variaci
on en el par
ametro temporal.
5
N
otese que este es un problema variacional multiparametrico, ya que involucra a los parametros x y t.
434CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

y
Z x2   Z x2
L d d L
  dx =   dx
x1 d
dx
dx x1 dx d
dx

el principio de Hamilton se puede escribir entonces



Z t2 Z x2  
L d L d  
L
dx dt   =0
t1 x1 dt d dx d 0
dt dx

y por los mismos argumentos usados en la secci on 3.2 la naturaleza arbitraria de los caminos variados implica
que el termino entre parentesis cuadrados debe anularse

d L d L L
  +   =0 (17.22)
dt d dx d
dt dx

las ecuaciones de Euler Lagrange definidas por (17.22) corresponden a las ecuaciones de movimiento que se
derivan del principio de Hamilton Ec. (17.19).
Un sistema de n grados de libertad posee n ecuaciones de Lagrange, sin embargo, pareciera que para un
sistema contnuo solo tuvieramos una ecuaci on de Lagrange!. Debe recordarse sin embargo que en el discreto
on de movimiento para cada i es una ecuaci
la ecuaci on diferencial que solo involucra al tiempo, en tal sentido
la Ec. (17.22) nos da una ecuaci on de movimiento para cada valor del ndice contnuo x. La naturaleza
contnua de x se manifiesta en que la Ec. (17.22) es una ecuaci on diferencial parcial en x y t, cuya solucion
es de la forma (x, t). De lo anterior se desprende adem as que la dimensi on del espacio de configuraciones
corresponde a la cardinalidad del espacio real (en una dos o tres dimensiones) ya que cada ndice contnuo x
corresponde a un eje en el espacio de configuraciones.
Para el ejemplo especfico de las vibraciones longitudinales de la varilla el
astica, la forma de la densidad
Lagragiana (17.17) conduce a las relaciones

L  = d ; L  = Y d ; L = 0 (17.23)
d dt d dx
dt dx

de modo que se obtiene la consistencia deseada puesto que al reemplazar (17.23) en las Ecs. (17.22) llegamos
efectivamente a las relaciones (17.14).

17.4. Formulacion Lagrangiana en tres dimensiones para sistemas contnuos


con un n
umero arbitrario de variables de campo (Teora cl
asica de
campos)
La formulacion Lagrangiana desarrollada aqu debe ser extendida a situaciones en dos y tres dimensiones,
como es el caso de un s olido el
astico tridimensional. Adicionalmente, en lugar de un solo campo podramos
tener varias de estas cantidades. A manera de ejemplo, en tres dimensiones un desplazamiento arbitrario con
respecto a la posici
on de equilibrio se describira por un vector espacial de campo con tres componentes, en
la formulacion de Lagrange esto implica tres campos ya que las coordenadas generalizadas deben ser escalares.
La extension a m as dimensiones o m as campos no presenta dificultades significativas. Sin embargo, la
notaci
on se vuelve altamente engorrosa cuando pasamos por ejemplo a tres dimensiones. Podemos notar sin
embargo que el principio de Hamilton (17.19) y las ecuaciones de Euler Lagrange (17.22) presentan una alta
simetra con respecto a las variables de espacio y tiempo, las variables espaciales y el tiempo parecen cumplir
el mismo rol y los campos son funciones tanto de las coordenadas espaciales como del tiempo y todas ellas
LAGRANGIANA EN TRES DIMENSIONES PARA SISTEMAS CONTINUOS CON UN N
17.4. FORMULACION

deben ser tratadas como variables independientes. No hay por ejemplo, variaci on de los campos en los lmites
de integraci on en el principio de Hamilton tanto sobre el espacio como sobre el tiempo. Debe tenerse en cuenta
sin embargo, que aunque en esta formulaci on las coordenadas espaciales y temporales entran en forma m as
simetrica, el tiempo NO corresponde a un ndice para la coordenada generalizada (r, t), esto se puede ver
del hecho de que en el sistema discreto el campo i (t) est a rotulado por el ndice i pero no por la variable
temporal, la cual simplemente mide la evoluci on de una coordenada generalizada especfica i .
En consecuencia de lo anterior, es conveniente introducir una notaci on en terminos de un espacio de cuatro
0 1 2 3
dimensiones con coordenadas x = ct, x = x, x = y, x = z. Esta notaci on no tiene ning un significado
Fsico adicional. El factor c en x0 es la velocidad de la luz en el vaco y es usada solo con el fin de que x0
tenga las mismas unidades que xi . El tensor metrico g es el correspondiente a una geometra Euclidiana,
donde las transformaciones del grupo de Galileo son las transformaciones de coordenadas permitidas sobre las
componentes del espacio con el tensor metrico restringido por gij = ij . Las letras latinas en los suprandices
indicaran ndices que involucran solo a las variables espaciales en tanto que las letras griegas como subndices
o suprandices se referiran a todas las cuatro coordenadas. Se retomar a la convencion de suma sobre ndices
repetidos. Las variables de campo se rotular an con el subndice , que puede barrer una multitud de formas.
En algunas ocasiones simbolizar a un ndice simple de dos tres, cuatro o m as valores, pero tambien puede
simbolizar un conjunto de m ultiples ndices. Por ejemplo, si la variable de campo es un tensor espacial de
segundo rango, entonces realmente se refiere a dos subndices. Finalmente, una derivada de las variables de
campo con respecto a cualquiera de las cuatro coordenadas x se denotar a por el subndice separado de
por una coma. Si solo hay una variable de campo, el ndice no aparecer a. Algunos ejemplos son los siguientes
d d d2 i
, ; ,j ; i, =
dx dxj dx dx
solo las derivadas de las variables de campo ser
an simbolizadas de esta manera. En esta notaci
on la densidad
Lagrangiana m as general que consideraremos se escribe como

L = L ( , , , x )

el Lagrangiano es una integral sobre el espacio tridimensional de la forma


Z
L = L ( , , , x ) dxi ; dxi dx1 dx2 dx3

y el principio de Hamilton se escribe como una integral en el espacio tiempo


Z
I = L ( , , , x ) dx = 0 ; dx dx0 dx1 dx2 dx3 (17.24)

donde la variacion de se anula sobre la hipersuperficie que delimita a la regi


on de integraci
on en el
espacio y el tiempo. La derivacion de las ecuaciones de Euler Lagrange se obtiene haciendo las extensiones
adecuadas. Se considera un conjunto uniparametrico de funciones variadas que se reducen al valor correcto de
(x ) cuando va a cero. Una familia de estas funciones se puede construr como

(x , ) = (x , 0) + (x )

las funciones (x ) son funciones de clase C 2 en todos los par


ametros. Dichas funciones se deben anular sobre
la hipersuperficie que delimita a la region de integraci
on. La anulaci
on del variacional de I, es equivalente
a establecer que la derivada de I con respecto a sea cero.
Z  
dI L L ,
= + (dx )
d ,
integrando por partes se obtiene
Z    Z  
dI L d L d L
= (dx ) + (dx ) (17.25)
d dx , dx ,
436CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

la segunda integral se elimina cuando se va para cero, lo cual se puede ver de varias formas: si miramos
on para el x particular para cada termino de derivada, se ve que
termino a termino, al realizar la integraci
estos terminos se tienen que ir porque la derivada con respecto a es cero en los extremos. Por otro lado,
la integral se puede transformar por medio de un teorema de la divergencia en 4 dimensiones en una integral
sobre la hipersuperficie que delimita la region de integraci
on en el cuadriespacio (euclidiano). La integral de
superficie tambien se anula porque la variacion de en la vecindad de la funcion de campo correcta es cero
sobre la superficie. Para ver esto calculemos la segunda integral a la derecha en (17.25). Recordando que la
derivada total en x es equivalente a una derivada parcial podemos escribir el segundo termino en la forma
Z   Z   Z  
d L L L
(dx ) = (dx ) (dx )
dx , x , ,
lo cual es basicamente una cuadridivergencia del termino entre parentesis. La aplicaci on del teorema de la
divergencia en el espacio de 4 dimensiones convierte la integral de volumen en una integral sobre la hipersu-
perficie delimitadora donde la variaci
on del termino entre parentesis es cero. En smbolos, la variacion relevante
se escribe como Z   Z  
d L L
(dx ) = d = 0
dx , ,
donde d representa las componentes de un elemento de hipersuperficie (en el espacio Euclidiano de cuatro
dimensiones) orientado a lo largo de la direcci
on de la normal hacia afuera (para las tres dimensiones espaciales).
Por lo anterior, en el lmite 0, la Ec. (17.25) se reduce a
  Z     
dI L d L
= (dx ) = 0 (17.26)
d 0 dx , 0
nuevamente, la naturaleza arbitraria de la variaci on de cada significa que la Ec. (17.26) se satisface solo si
se anula el termino entre parentesis cuadrados.
 
d L L
=0 (17.27)
dx ,
la Ec. (17.27) representa un conjunto de ecuaciones diferenciales parciales para las variables de campo, el
numero de ecuaciones est a determinado por los valores posibles de . Vale la pena enfatizar de nuevo que dado
que cada xi corresponde a un ndice para las variables de campo, cada una de las Ecs. (17.27) para fijo,
corresponde a un conjunto completo de ecuaciones diferenciales de movimiento de Lagrange en el caso discreto.
Es sencillo ver que las Ecs. (17.27) se reducen al caso particular (17.22) en el caso unidimensional (es decir
con un solo parametro espacial x), con una sola variable de campo (i.e. = 1). Comparando las dos ecuaciones
se puede apreciar la ventaja de la notaci on introducida (y a un mas si se introducen las tres dimensiones). Es
necesario insistir que a pesar de la similitud de la notacion con aquella usada en relatividad especial, en este
caso estamos trabajando en el regimen no relativista con espacio y metrica Euclidianos.
En sistemas discretos, el Lagrangiano tiene un grado de arbitrariedad ya que se puede adicionar una
derivada total en el tiempo de una funci on arbitraria de las coordenadas generalizadas y el tiempo sin alterar
las ecuaciones de movimiento. Con sistemas contnuos, la densidad Lagrangiana posee una simetra gauge
similar bajo la adici
on de un termino de la forma
dF ( , x )
L = L + (17.28)
dx
recordando de nuevo que la derivada total en x es equivalente a una derivada parcial, podemos escribir el
segundo termino en (17.28) en la forma
dF ( , x ) F ( , x )
= F
dx x
con convenci
on de suma sobre ndices repetidos. Este termino se puede ver como la extensi on de una divergencia
en 4 dimensiones (en tres dimensiones la divergencia es i Fi ). F son cuatro funciones arbitrarias de las variables
17.5. EL TENSOR ESFUERZO ENERGIA Y TEOREMAS DE CONSERVACION
ASOCIADOS 437

de campo y las coordenadas x . La aplicaci


on del teorema de la divergencia en el espacio de 4 dimensiones
convierte la integral de hipervolumen en una integral sobre la hipersuperficie donde la variaci
on de F es
nula Z Z

dF ( , x )
(dx ) = F ( , x ) d = 0
dx
Con lo cual el segundo termino a la derecha en (17.28) no contribuye a la variaci on de la acci on y por
tanto, tampoco contribuye a las ecuaciones de movimiento. Esto nos indica que la expresi on (17.28) es una
transformaci on gauge para la densidad Lagrangiana. N otese adem as que esta es una extensi on natural del
gauge (2.25) para el discreto, con las asignaciones qi (t) (x ) , L L, F , t x la u
ltima
asignacion tiene que ver con el hecho de que el problema discreto es uniparametrico (solo el tiempo es un
parametro) y el problema en el contnuo es multiparametrico (con par ametros t, xi ).
La formulacion Lagrangiana para un conjunto contnuo de coordenadas ha sido desarrollado con el fin de
trabajar sistemas mec anicos contnuos tales como s
olidos el
asticos en oscilaci
on longitudinal, o un gas vibrando
de tal forma que se formen ondas ac usticas. Lo interesante consiste en que la formulaci on se puede emplear
para trabajar sistemas no mec anicos que describan ecuaciones que gobiernan a un campo o campos. Ma-
tem aticamente un campo es simplemente un conjunto de una o m as funciones del espacio y el tiempo que
son independientes entre s, observese que esta definici on es compatible con la de coordenada generalizada,
simplemente extendiendo la posibilidad de que dichas coordenadas puedan depender de m as de un par ametro
(parametros espacio temporales en vez de solo el par ametro temporal). No es necesario el requerimiento de que
el campo este relacionado con alg un sistema mecanico. Este rompimiento de conecci on entre la formulaci on La-
grangiana en el contnuo y la descripcion de campos puramente mec anicos es semejante al proceso hist orico que
ocurrio con la descripci
on de las ondas electromagneticas que originalmente fueron descritas como oscilaciones
el
asticas del misterioso eter. Mas adelante, se hace una formulaci on de campos que permite la ondulaci on sin
la presencia del medio el astico. De la misma manera reconocemos que los procedimientos variacionales desa-
rrollados aqu se pueden independizar de la noci on de campos asociados a medios mec anicos contnuos. Los
campos pueden entonces describir cualquier funci on del espacio y el tiempo que pueda ser u til en Fsica (e.g.
campos electromagneticos, potenciales, campos termicos, campos de presi on, densidades generalizadas etc.).
En efecto, el principio de Hamilton es una descripci on compacta y conveniente para describir la din amica de
los campos generalizados que nos lleva a ecuaciones de campo.
Adicionalmente a las ecuaciones para los campos, la densidad Lagrangiana nos puede dar mas informaci on
sobre la naturaleza de los campos. Hemos visto que en los sistemas discretos la estructura del Lagrangiano
esta fuertemente ligada a las cantidades conservadas asociadas al sistema. An alogamente, veremos que en la
mec anica del contnuo hay algunos teoremas de conservaci on asociados a la densidad Lagrangiana.

17.5. El tensor esfuerzo energa y teoremas de conservaci


on asociados
Un analogo a la conservaci
on de la integral de Jacobi (funcion energa) para mec
anica puntual estudiada
en la secci
on (5.1) se puede derivar para medios contnuos. El factor adicional que aparece es que ademas del
i
tiempo, aparecen las coordenadas x como par ametros en la formulaci on, ya que todos ellos son par
ametros
independientes en L. Por tanto en vez de comenzar con un derivada temporal en L, usaremos una derivada
total con respecto a x
dL L L L
= , + , +
dx , x

usando las ecuaciones de movimiento (17.27), esta derivada se escribe


  
dL d L L d, L
= , + +
dx dx , , dx x
 
dL d L L
= , +
dx dx , x
438CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

despejando L/x , esto se puede escribir


 
d L L

, L = (17.29)
dx , x
supongamos ahora que L no depende explcitamente de x . Esto usualmente significa que L representa un
sistema de campos libres, es decir que no contiene fuentes o sumideros de interaccion con campos o partculas
externas al sistema en un punto explcito del espacio y con una dependencia temporal dada. Por ejemplo si
mi sistema es tal que incluye a todos los campos que intervienen en el problema, esto significa no interacci on
entre los campos y las partculas puntuales que se mueven en el espacio y el tiempo a traves de tales campos,
tambien puede por supuesto significar la ausencia de dichas partculas. Bajo estas condiciones, la Ec. (17.29)
toma la forma de un conjunto de condiciones de divergencia.
dT
= T T , = 0 (17.30)
dx
donde hemos definido
L
T , L (17.31)
,
el cual tiene la forma de un 4-tensor de segundo rango, n otese que dado que T tiene la forma de un tensor
de segundo rango, la divergencia sera de la forma de un vector en el 4-espacio. Enfatizamos en que la ex-
presi
on tiene la forma de un tensor de segundo rango pero no necesariamente lo es, dado que el 4-espacio
no tiene todava propiedades de transformaci on, el espacio y el tiempo son todava distintos y no tenemos
requerimientos para la transformaci
on de T . Sin embargo, las porciones espaciales de estas cantidades se
comportan como vectores y tensores en el espacio ordinario (Euclidiano), es decir Tij son componentes de un
tensor tridimensional de segundo rango. Antes de considerar las transformaciones posibles, determinemos el
significado Fsico de T . Para ello podemos notar que la Ec. (17.30) se puede comparar en forma directa con
la ecuacion de continuidad para cargas generalizadas vectoriales Ecs. (17.6, 17.7)

J = 0 (17.32)

y teniendo en cuenta las Ecs. (17.4, 17.6) vemos que J0 0 es 0 , es decir la densidad del escalar q0 que se
conserva, J0 i representa la iesima componente de la corriente asociada con la propagaci on de 0 . Ji 0 es i
k
i.e. la densidad de una de las componentes del vector que se conserva, y Ji es la kesima componente del
vector densidad de corriente asociado a i .
De lo anterior es claro que la Ec. (17.30) me est
a expresando la conservacion de cuatro cantidades escalares
(posiblemente un escalar y un trivector). Veamos la interpretaci on fsica de estas cargas generalizadas que se
conservan.

17.5.1. on fsica de T0 : densidad de energa y vector de Poynting


Interpretaci
on de T Ec. (17.31) y la integral de Jacobi (funci
La similaridad entre la definici on energa), Ec. (5.13) es
obvia, especialmente cuando tomamos la componente T0 0
L
T0 0 = L (17.33)

es logico pensar entonces que esta es la densidad de funci on energa en la mec
anica del contnuo. En muchos
sistemas mec anicos, la densidad Lagrangiana tiene la forma L = T V, es decir la diferencia entre una densidad
de energa cinetica y una densidad de energa potencial. Adicionalmente, para muchos de ellos la funcion energa
es la energa del sistema de modo que T + V es la densidad de energa del sistema. En consecuencia, por el
mismo argumento usado en la mec anica discreta, T0 0 se puede identificar como la densidad de la energa total.
Veremos que en particular esta interpretaci on es correcta cuando usamos la densidad Lagrangiana de la varilla
el
astica Ec. (17.17)
1 2 2

L= Y ,x (17.34)
2
17.5. EL TENSOR ESFUERZO ENERGIA Y TEOREMAS DE CONSERVACION
ASOCIADOS 439

usando (17.33) calculemos T0 0


L 1 2 
T0 0 = L = 2
Y ,x
2
1 2 1
T0 0 = + Y ,x 2
=T +V
2 2

Figura 17.2: Ilustraci


on de las fuerzas sobre un punto x de la varilla el
astica, con el cual se realiza el c
alculo
de la densidad de corriente de energa en la varilla.

Con base en lo anterior, es de esperarse que el vector T0 con componentes T0 i , juegue el rol de una densidad
de corriente de energa. Nuevamente recurrimos al ejemplo del campo que describe la vibraci on longitudinal
de una varilla elastica. Dividamos la varilla por medio de un corte imaginario en el punto x (ver figura 17.2).
A partir de las consideraciones que nos llevaron al Lagrangiano (17.13) la fuerza ejercida por la parte derecha
de la varilla para alargar la parte izquierda del corte es
d
Fder = Y
dx
por tanto hay una tensi on en x en la porci
on izquierda de igual magnitud pero direcci
on opuesta Ften = Fder .
Adem as, la porcion izquierda est
a siendo estirada por una cantidad que en x vale (x), y la rata a la cual esta
extensi
on cambia en el tiempo es . Por tanto, la rata de trabajo que la tensi
on ha hecho en el corte es
dW d
= Ften = Y (17.35)
dt dx
la cual es en consecuencia la rata a la cual la energa esta siendo transferida desde la izquierda hacia la derecha
por unidad de tiempo. Reemplazando (17.34) en (17.31) podemos calcular T0 1 y verificar que coincide con el
valor dado en (17.35)
L d
T0 1 ,t Ltx = Y ,x = Y
,x dx
Lo cual nos muestra la consistencia de definir T0 i como la componente iesima de la densidad de corriente
de energa. En la mec
anica ondulatoria en tres dimensiones, el vector que representa la propagaci
on de energa
por unidad de area por unidad de tiempo se conoce como vector de Poynting. Este vector correspondera
entonces a las componentes T0 i .

17.5.2. on fsica de Ti j : densidad de momento lineal y tensor de esfuerzos


Interpretaci
Para poder identificar las otras componentes del tensor, es conveniente escribir (17.30) de la siguiente forma
dT 0 dT j
+ =0 (17.36)
dt dxj
440CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

o
dT 0
T, = + T = 0 (17.37)
cdt
donde T cuyas componentes son T son un conjunto de 4 vectores en el 4-espacio. Ya vimos que T0 contiene la
densidad de energa y la densidad de corriente de energa. Las Ecs. (17.36, 17.37) son ecuaciones de continuidad,
que nos dicen que la rata de cambio en el tiempo de la densidad T 0 mas la divergencia de la densidad de
corriente T es nula.
Para extraer el significado Fsico de las componentes de Ti 0 examinamos de nuevo las vibraciones de la
varilla el
astica. Si las partculas en la varilla se mueven todas en la misma cantidad a lo largo de esta, el
movimiento ser a como una traslaci on de un cuerpo rgido, de modo que no hay oscilaciones. El cambio neto de
masa en una longitud dx de la varilla como resultado del movimiento ser a claramente cero, dado que pasa la
misma cantidad de masa por x+dx que la que pasa por x. Habr a sin embargo, una densidad de momento lineal
neta v para esta traslaci on rgida, siendo v la velocidad de traslaci on de la barra6 . Por otro lado, cuando
tiene lugar el movimiento ondulatorio, existe un cambio neto de masa en el segmento dx, que para un cierto
tiempo viene dada por
d
dm = [ (x) (x + dx)] = dx
dx
el momento adicional en el intervalo, que resulta del movimiento ondulatorio es por tanto
d
dP = dm = dx
dx
de modo que una densidad adicional de momento (densidad lineal en este caso), mas all
a de la que surge del
movimiento estacionario, puede ser identificada como la onda o densidad del campo de momento
dP d
p =
dx dx
veamos ahora que esta cantidad es justamente T1 0 para la densidad Lagrangiana dada por (17.17).
L d
T1 0 = ,x + Lxt =
,x =
,t dx

Esto nos lleva a identificar Ti 0 como las componentes del campo de densidad de momento.
Las ecuaciones de continuidad, (17.37) sugieren entonces que Ti debe representar la densidad de flujo
vectorial para la iesima componente del campo de densidad de momento. Ascribimos una propiedad de
vector a Ti porque puede haber por ejemplo, un flujo en la direcci on y de la componente x de la densidad de
momento, que se determinara por Tx y T1 2 . Una interpretaci on alternativa de Ti j proviene de considerar
el campo de desplazamiento de un s olido tridimensional elastico. Es bien sabido que en un s olido de este tipo
hay tambien fuerzas de cizalladura tangenciales a la superficie (adem as de las fuerzas de compresion normales a
la superficie) a lo largo del elemento de superficie. El ensamble completo de fuerzas se puede describir diciendo
que la fuerza dF que act ua sobre un elemento de area dA se expresa en terminos de un tensor de esfuerzos
T de modo que
dF = T dA
que explcitamente se escribe

T1 1 T1 2 T1 3 dA1
(dF1 , dF2 , dF3 ) = T2 1 T2 2 T2 3 dA2 (17.38)
T3 1 T3 2 T3 3 dA3
dAi es un elemento de
area en la direcci
on de xi de modo que

|dA1 | = dx2 dx3 ; |dA2 | = dx1 dx3 ; |dA3 | = dx1 dx2


6
Notese que en este caso no hay estiramientos ni encogimientos de los segmentos de modo que nuestros campos son todos
nulos en este caso. Por tanto, aunque el segmento dx transporta momento, este momento no est
a asociado al campo.
17.5. EL TENSOR ESFUERZO ENERGIA Y TEOREMAS DE CONSERVACION
ASOCIADOS 441

en consecuencia la fuerza neta digamos en la direcci on x1 , sobre un elemento de volumen rectangular dx1 dx2 dx3
tiene contribuciones que provienen de las fuerzas sobre las superficies paralelas a los planos x2 x3 , x1 x3 y x1 x2 .
Calculemos primero la contribuci on en la direcci
on x1 que proviene de las fuerzas sobre las dos superficies
paralelas al plano x2 x3 . Estos planos poseen coordenadas x1 y x1 + dx1 respectivamente (ver figura 17.3).
Para el plano asociado a la coordenada x1 el elemento de area (que apunta hacia afuera del volumen) va en la
on ux1 con lo cual tenemos que para este plano la Ec. (17.38) queda en la forma
direcci
1
T1 (x1 ) T1 2 (x1 ) T1 3 (x1 ) dx2 dx3
(dF1 (x1 ) , dF2 (x1 ) , dF3 (x1 ))(23) = T2 1 (x1 ) T2 2 (x1 ) T2 3 (x1 ) 0
1 2 3
T3 (x1 ) T3 (x1 ) T3 (x1 ) 0
(23)
dF1 (x1 ) = T1 1 (x1 ) dx2 dx3

para el plano paralelo a x2 x3 con coordenada x1 + dx1 , el elemento de area apunta hacia +ux1 de modo que
la suma de las dos contribuciones de los planos paralelos a x2 x3 nos da

Figura 17.3: Fuerza en la direcci


on x1 sobre un elemento de volumen dx1 dx2 dx3 de un s
olido el
astico.

(23) (23)   dT1 1


dF1 (x1 ) + dF1 (x1 + dx1 ) = T1 1 (x1 + dx1 ) T1 1 (x1 ) dx2 dx3 = dx1 dx2 dx3 (17.39)
dx1
veamos ahora las contribuciones de los dos planos paralelos a x1 x3 . Estos planos est
an asociados a las coorde-
nadas x2 y x2 + dx2 como se aprecia en la Fig. 17.3, para el plano inferior de coordenada x2 el vector de area
es dx1 dx3 ux2 de modo que la Ec. (17.38) nos queda en la forma


T1 1 (x2 ) T1 2 (x2 ) T1 3 (x2 ) 0
(dF1 (x2 ) , dF2 (x2 ) , dF3 (x2 ))(13) = T2 1 (x2 ) T2 2 (x2 ) T2 3 (x2 ) dx1 dx3
T3 1 (x2 ) T3 2 (x2 ) T3 3 (x2 ) 0
(13)
dF1 (x2 ) = T1 2 (x2 ) dx1 dx3

para la superficie paralela a x1 x3 con coordenada x2 + dx2 el vector de area es dx1 dx3 ux2 . Por tanto, la
contribuci
on proveniente de las dos superficies paralelas al plano x1 x3 da

(13) (13)   dT1 2


dF1 (x2 ) + dF1 (x2 + dx2 ) = T1 2 (x2 + dx2 ) T1 2 (x2 ) dx1 dx3 = dx1 dx2 dx3 (17.40)
dx2
442CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

y similarmente para las superficies paralelas a x1 x2 .

(12) (12)   dT1 3


dF1 (x3 ) + dF1 (x3 + dx3 ) = T1 3 (x3 + dx3 ) T1 3 (x3 ) dx1 dx2 = dx1 dx2 dx3 (17.41)
dx3
la fuerza infinitesimal resultante es entonces la suma de los terminos en las Ecs. (17.39, 17.40, 17.41)
 
dT1 1 dT1 2 dT1 3
dFx1 = + + dV
dx1 dx2 dx3

on x1 es entonces7
la densidad de fuerza resultante en la direcci
dFx1 dT1 1 dT1 2 dT1 3
f x1 = + +
dV dx1 dx2 dx3
La segunda ley de Newton por unidad de volumen podemos escribirla como
dp
f x1 =
dt
y recordando que la densidad de momento es p = T1 0 tenemos que la segunda ley de Newton por unidad de
volumen se puede escribir como
dT1 1 dT1 2 dT1 3 dT1 0
+ + =
dx1 dx2 dx3 c dt
o en notaci
on sintetica
T1 = 0
que es precisamente la componente x1 de la Ec. (17.37). Para este campo particular Ti j puede identificarse como
los elementos del tensor de esfuerzos tridimensional, de all el origen del termino tensor de esfuerzo-energa
para T .
En sntesis, usando consideraciones para medios contnuos mec anicos, hemos podido asociar a cada una
de las componentes del tensor de esfuerzo-energa, una interpretaci on fsica que se resume en el cuadro 17.1.
Adicionalmente, como se vi o de la discusi
on que sigui
o a la Ec. (17.37), T0 y Ti forman vectores 4-espaciales
cada uno de los cuales es una corriente conservada similar a el 4- vector densidad de carga-densidad de corriente
de la teora electromagnetica, y los denominamos 4-corrientes. En casi todos los casos el tensor tridimensional

Componentes de T Interpretaci
on Fsica
T0 0 campo de densidad de energa dividido por c
trivector T0 con componentes T0 j campo de densidad de corriente de energa
componente iesima del campo
Ti 0
de densidad de momento
densidad de corriente para la iesima com-
trivector Ti con componentes Ti j
ponente del campo de densidad de momento
Ti j tensor de esfuerzos tridimensional

Cuadro 17.1: Interpretaci


on fsica de las componentes del tensor de esfuerzo energa.

T es simetrico. Esto no solo es fsicamente deseable sino que es una caracterstica casi necesaria para la parte
espacial del tensor de esfuerzo energa.
Debemos recordar que aunque el ejemplo y la nomenclatura provienen de un sistema mec anico, este for-
malismo es extendible a muchas configuraciones de campos sin importar su naturaleza u origen. Una teora
7
Para la contribucion a la fuerza a lo largo de x1 , las contribuciones de los planos paralelos a x2 x3 son de compresi
on y las
otras contribuciones son de cizalladura.
17.5. EL TENSOR ESFUERZO ENERGIA Y TEOREMAS DE CONSERVACION
ASOCIADOS 443

cl
asica de campos se puede construr para las vibraciones el asticas de un solido, campos electromagneticos,
campos termicos, campos de presi on, la funci
on de onda de Schrodinger etc. Debe tenerse presente sin embargo,
que en el caso m as general, las cuatro ecuaciones de continuidad dadas por (17.30) expresan la conservaci on
de cuatro cargas generalizadas que podran ser independientes entre s. N otese que la interpretacion de estas
cuatro cargas como energa y momento implican que las cuatro cargas est an organizadas como un escalar y
un trivector euclidiano (en el caso relativista usualmente representar an un cuadrivector de Lorentz), pero no
hay nada en el formalismo general que me garantice este nivel de organizaci on.
Por otro lado, recordemos que en el caso m as general la densidad Lagrangiana puede depender de los
parametros x en la Ec. (17.29) con lo cual la Ec. (17.32) se convierte en una ecuaci on de continuidad con
fuentes
L
J =
x
lo cual corresponde a tener campos adicionales externos al sistema de campos en cuesti on, o partculas puntuales
interactuando con los campos. Cuando se encuentran ecuaciones de continuidad con fuentes no se conserva
la carga generalizada asociada. No obstante, ocurre con frecuencia que es posible extender el sistema Fsico
para inclur los campos o partculas que act uan de fuentes y sumideros a fin de llegar a una nueva ecuaci on
de continuidad que sea homogenea y que por tanto me conduzca a una carga generalizada conservada. Este
es el caso con el campo electromagnetico (aunque para las Ecs. de Maxwell se debe usar una formulaci on
relativista), cuando se considera la densidad lagrangiana para el sistema del campo electromagnetico se llega
a ecuaciones de continuidad para la energa y el momento con fuentes, que corresponden al hecho de que las
cargas que interact uan con el campo pueden absorber o transferir energa y momento al campo. Sin embargo,
el sistema extendido de cargas y campos s conserva estas cantidades.

17.5.3. Energa y momento total del sistema


Como ya se discutio, la ecuaci
on de continuidad implica la conservacion de algunas cantidades integrales
(ver Ec. 17.8) siempre que el volumen del campo sea finito, es decir la variable de campo toma valor cero por
fuera de cierto volumen acotado8 , en tal caso se definen cantidades integrales R como
Z
R = T 0 dV (17.42)

donde el volumen de integraci on es tal que el campo est a completamente contenido en el, y los flujos de
los campos y de todas sus derivadas se anulan en la superficie que delimita al volumen. Es debido a estos
teoremas de conservaci on, derivados a partir de (17.30), que los cuatro arreglos de la forma T , = 0, 1, 2, 3
se conocen como corrientes conservadas, en analoga con las ecuaciones de conservaci on para las corrientes
electromagneticas.
Si T0 0 es una densidad de energa, entonces la cantidad R0 definida por
Z
R0 = T 0 dV
V

se puede identificar como la energa total en el campo siempre que T0 i se anule en la superficie de delimitaci
on,
esto es si el sistema no rada energa al exterior.
Con base en la interpretaci on de las componentes Ti 0 es claro que la conservaci on de las otras cargas
generalizadas Z

Ri = Ti 0 dV
V
nos dicen que para un sistema cerrado no interactuante el momento lineal total del campo Ri se conserva
como se esperaba.
8
En realidad el volumen podra tomarse en el infinito cuando los campos no estan acotados. Pero se requiere que los campos
y todas sus derivadas tiendan a cero en el infinito m
as r
apido de lo que crece la superficie de integraci
on, a fin de que la integral
(17.9) se anule para que sea v
alida la Ec. (17.10).
444CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

17.5.4. Densidad de momento angular y momento angular total


Por otro lado, debe tambien existir un teorema correspondiente a la conservaci
on del momento angular
total del campo. Es sencillo construr una cantidad que actue como densidad de momento angular. Dado que
el momento angular es un vector axial, se espera que las componentes de una densidad de momento angular
on de Ti 0
sean elementos de un tensor antisimetrico de segundo rango. Teniendo en cuenta la interpretaci
como la densidad de la componente iesima del momento lineal, una forma adecuada para este tensor es

Mi j = xi Tj 0 xj Ti 0 (17.43)
donde el momento angular total del campo viene dado por
Z
Mi j = Mi j dV

teniendo en cuenta que t y xi son completamente independientes, la rata de cambio de Mi j es


Z  0
dMi j i dTj
0
j dTi
= x x dV
dt dt dt
o, a partir de las ecuaciones de continuidad (17.36)
Z  
dMi j dTj k Ti k
= xi k xj k dV
dt dx dx
una integraci
on por partes convierte esta expresi
on en
Z Z
dMi j d  i k j k
 
= x Tj x Ti dV Ti j Tj i dV (17.44)
dt dxk
la primera integral a la derecha tiene la forma de una integral de volumen de una divergencia, con lo cual se
puede convertir en una integral sobre la superficie que delimita tal volumen, la cual se anula para un sistema
cerrado que no rada. Finalmente, si T ij = T ji , la segunda integral tambien es cero. Por lo tanto, el momento
angular total del sistema de campos se conserva si T es simetrico y el sistema no rada por la superficie. Por
supuesto es posible a un que la segunda integral de volumen en (17.44) se anule sin que el tensor sea simetrico
pero sera menos ntido para demostrar.
En algunos casos resulta que el tensor de esfuerzo (tridimensional) no es simetrico. No obstante, podemos
usualmente usar la ambig uedad en la definici
on de este tensor para restaurar esta simetra. As como en el
caso del Lagrangiano, la forma del tensor esfuerzo-energa, Ec. (17.31), se escogi o para que satisfaciera ciertas
condiciones de divergencia (Ecs. 17.30). Por tanto T est a indeterminado puesto que podemos agregar una
funci
on cuya 4-divergencia se anule. N otese que esto conduce por ejemplo al hecho de que la densidad de energa
y el vector de Poynting de una onda electromagnetica esten definidas salvo cantidades que son divergencias
espaciales. La adicion de estas cantidades no contribuye a los observables tales como la energa total o la
corriente total de energa. Un termino de cuadridivergencia nula se puede parametrizar en forma general en la
forma
d
Z
dx
donde es un conjunto de funciones de las variables de campo que cumplen la condici
on de antisimetra
=
al calcular la cuadridivergencia los smbolos y se vuelven ndices mudos y la cuadridivergencia consta de
pares de la forma (no hay convenio de suma)
d2 d2
Z = +
dx dx dx dx
que se anulan a causa de la condici on de antisimetra. Esta ambig
uedad nos permite usualmente simetrizar el
tensor esfuerzo energa lo cual se hace a menudo cuando se construye teoras de campos cl
asicos.
HAMILTONIANA PARA MEDIOS CONTINUOS
17.6. FORMULACION 445

17.6. Formulaci
on Hamiltoniana para medios contnuos
Es posible obtener una formulacion Hamiltoniana para medios contnuos de una manera muy similar al
caso discreto. Retornaremos al ejemplo de la cadena unidimensional de masas acopladas. Partimos entonces
de la definici
on de momento canonicamente conjugado a una variable de campo i
L Li
pi = =a (17.45)
i i
donde el Li esta definido para la cadena de masas acopladas a traves de la Ec. (17.11). El Hamiltoniano para
el sistema es entonces
Li
H pi i L = a i L
i
X  Li 
H = a i Li
i
i

recordando que en el lmite a 0, que nos lleva al contnuo, se tiene que Li L, a dx, y la suma se
convierte en integral Z  
L
H = dx L (17.46)

Por otro lado, los momentos can
onicos individuales pi dados por (17.45), tienden a cero en el lmite contnuo,
pero podemos definir una densidad de momento que permanece finita
pi L
lm = (17.47)
a0 a
la Ec. (17.46) nos muestra que el Hamiltoniano tambien viene dado por una integral de tal forma que se puede
definir una densidad Hamiltoniana H
H L (17.48)
aunque la formulaci on Hamiltoniana es f acil de introducir para campos cl
asicos, es de anotar que el procedi-
miento le otorga a la variable tiempo, un tratamiento diferente a los parametros de espacio9 , en contraste con
la formulaci
on Lagrangiana en la cual los par ametros espacio temporales aparecen en forma muy simetrica.
Por esta raz
on el formalismo Hamiltoniano al menos como se describe aqu, no es muy adecuado para trabajar
una formulaci on covariante relativista de los campos. El metodo Hamiltoniano no es entonces tan fructfero
como el Lagrangiano para trabajar sistemas contnuos relativistas.
La ruta obvia para generalizar a campos en tres dimensiones, consiste en definir las densidades de momento
canonico (17.47) para un cierto campo xi , t de la forma
L
(x ) = (17.49)

 
las cantidades xi , t , xi , t definen el espacio de fase infinito dimensional que describe los campos
cl
asicos y su evoluci
on en el tiempo. Por otro lado, existe una ley de conservaci on asociada a muy similar a
la que se obtiene en el caso discreto. Si el campo no esta contenido explcitamente en L, es decir es una
variable de campo cclica, entonces la ecuacion de Lagrange (17.27) asociada a este campo, se asemeja a una
ecuacion de continuidad que describe una corriente conservada
     
d L d L d L
= 0 + i =0
dx , dt dx ,i
 
d d L
+ i = 0
dt dx ,i
9
Esto proviene del hecho de que la definici
on de densidad de momento Ec. (17.47), solo depende de y no de las derivadas de
con respecto a las coordenadas espaciales.
446CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

se sigue de aqu que si es cclica, hay una integral que define una cantidad conservada
Z

= dV xi , t

es importante enfatizar que no es el que se conserva, sino su variable global asociada . La generalizaci
on
de la Ec. (17.48) sera  
H , ,i , , xi L (17.50)

donde se asume que la dependencia funcional sobre se puede eliminar por inversi on de la ecuaci on de
definici
on (17.49) tal como en el caso discreto. A partir de la definici
on (17.50) y usando (17.49) se sigue que

H L

= + = (17.51)

La otra mitad de las ecuaciones can onicas de campo son menos directas de obtener. Cuando se expresa en
terminos de variables can onicas, H es una funcion de a traves de la dependencia explcita de L, as como a
traves de , (n
otese que al despejar la Ec. 17.49 tenemos como funcion de , , ,i y x ). Por tanto,

H L L L
= = (17.52)

donde hemos usado (17.49). Ahora usando las Ecuaciones de Lagrange en el contnuo Ecs. (17.27) esto queda
   
H d L d L
= = i (17.53)
dx , dx ,i

debido a la presencia de L esta forma no es todava util. No obstante una derivaci


on paralela de (17.50) muestra
que
H L L L
= = (17.54)
,i ,i ,i ,i ,i
donde de nuevo hemos usado (17.49). Podemos escribir entonces la segunda mitad de ecuaciones de campo
reemplazando (17.54) en (17.53) resultando
 
H d H
i = (17.55)
dx ,i

las Ecs. (17.51) y (17.55) se pueden colocar en una notacion en la cual su apariencia se asemeja mas a la de
las ecuaciones de Hamilton en el discreto. Para ello introducimos la noci
on de funcional derivativa definida
por
d
i (17.56)
dx ,i
on de ,i , las Ecs. (17.51) y (17.55) se pueden escribir como
y teniendo en cuenta que H no es funci

H H
=
; = (17.57)

n
otese que en esta notaci
on las Ecuaciones de Lagrange en el contnuo (17.27), quedan de la forma
 
d L L
=0
dt

la u
nica ventaja de la funcional derivativa sin embargo es la similaridad de las ecuaciones (tanto de Hamilton
como de Lagrange) con respecto a aquellas en el discreto. Sin embargo, en el caso de las Ecs. de Lagrange, esta
notaci
on destruye la simetra con la que las coordenadas del espacio y el tiempo aparecan en esta formulaci
on.
HAMILTONIANA PARA MEDIOS CONTINUOS
17.6. FORMULACION 447

17.6.1. Propiedades b
asicas de H
Podemos obtener otras propiedades de H haciendo la derivada con respecto al tiempo de (17.50), teniendo
en cuenta que hay que considerar a como funciones de , , ,i y x , con lo cual se obtiene

dH d d L d L d L d,i L
= +
dt dt dt dt dt ,i dt t

el segundo y cuarto termino a la derecha se cancelan entre s en virtud de la definici


on (17.49) quedando

dH L L d,i L
= (17.58)
dt ,i dt t

por otra parte cuando consideramos H en terminos de sus momentos can onicos, en cuyo caso los argumentos
de H son , , ,i y x la derivada temporal total adquiere la forma

dH H H H d,i H
=
+ + + (17.59)
dt ,i dt t

comparando (17.58) con (17.59), se ve que los primeros terminos a la derecha de estas, son iguales en virtud del
primer conjunto de ecuaciones de Hamilton Ecs. (17.51), los segundos terminos a la derecha tambien coinciden
debido a (17.52), finalmente los terceros terminos coinciden en virtud de (17.54). Por lo tanto, los u ltimos
terminos deben coincidir
H L
= (17.60)
t t
que es el equivalente de (6.11) cuando el medio es discreto, y nos dice que cuando L no contenga explcitamente
al tiempo tampoco lo contendr a H y viceversa.
Por otro lado, la analoga de la ecuacion (6.26) no se cumple, es decir, las derivadas temporales parcial y
total de la densidad Hamiltoniana no coinciden. Para calcular la relaci on que hay entre ellas partimos de la
Ec. (17.59) y usamos las Ecuaciones de movimiento de Hamilton (17.51, 17.55)
       
dH H d H H H H H d d H
= + + +
dt dxi ,i ,i dxi dt t
  
dH H d H H d H
= i
+ +
dt dx ,i ,i dxi t

hemos intercambiado las derivadas sobre el campo en xi y el tiempo dado que las derivadas totales del campo
con respecto a los par
ametros coinciden con las derivadas parciales. Usando de nuevo (17.51) resulta
  
dH d H H d H
= i
+ +
dt dx ,i ,i dxi t
 
dH d H H
= + (17.61)
dt dxi ,i t

de modo que las derivadas temporales total y parcial de H no coinciden como se predijo10 . Recordando que el
elemento T0 0 del tensor de esfuerzo energa se interpretaba como densidad de la funci
on energa (y por tanto
con la densidad Hamiltoniana) podemos identificar a H con T0 0 . Por otro lado, usando la Ec. (17.54) se deduce
que
H L
= = T0 i
,i ,i
10
Es importante notar que las derivadas parciales y totales con respecto a x solo coinciden para funciones que solo dependan de

x como ocurre con los campos y sus derivadas. En contraste, cantidades tales como las densidades Lagrangiana y Hamiltoniana
dependen no solo de x sino tambien de campos y derivadas de los campos, de modo que sus derivadas totales y parciales con
respecto a x no coinciden en general.
448CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

Si asumimos que H no depende explcitamente del tiempo, la Ec. (17.61) se reduce a


dT0 0 dT0 i
+ =0
dt dt
que es la ecuaci on de la corriente T0 . Ya vimos que la existencia de una corriente
on asociada a la conservaci
conservada implica la conservaci on de una cantidad integral que es la integral de volumen de la componente
cero de la 4-corriente (que corresponde a una densidad). En este caso
Z
P0 H = H dV

observese que a
un en el caso en el cual H no depende explcitamente del tiempo, la cantidad que se conserva
es H y no H. N otese que al contrario del caso Lagragiano, aqu primero definimos las densidades y luego las
cantidades totales. Debe tenerse presente que el volumen de integraci on debe contener a todos los campos.
Finalmente, notemos que en el caso en el cual el Hamiltoniano no sea la energa del sistema, lo que se conserva
es el Hamiltoniano y no la energa, pues T0 0 realmente corresponde a la densidad de la funci on energa que
numericamente es el Hamiltoniano.

17.6.2. Densidades generalizadas y corchetes de Poisson


El Hamiltoniano total H es solo un caso particular de funciones que se obtienen integrando densidades
en el volumen. Veamos entonces el formalismo general para estas cantidades integrales. Consideremos cierta
on de las coordenadas (, ) del espacio de fase as como de sus gradientes espaciales
densidad U que sea funci
y posiblemente x
U = U ( , ,i , , ,i , x )
la cantidad integral correspondiente la denotamos por U
Z
U (t) = U dV (17.62)

donde la integral se realiza sobre un volumen fuera del cual y se deben anular (tambien deben ser nulas
estas cantidades en el contorno que define al volumen). Derivando U respecto al tiempo resulta
Z  
dU U U U U U
= dV + ,i + + ,i + (17.63)
dt ,i ,i t
consideremos un termino tal como
Z Z
U U d
dV ,i = dxi
,i ,i dxi
integrando por partes
U d
u= ; dv = dxi i
,i dx
Z Z  
i U d U d U
dx = i
dx
,i dxi ,i S dxi ,i
y recordando que y las derivadas se anulan en la superfice del contorno, tenemos
Z Z  
U d U
dV ,i = dV
,i dxi ,i
y para el termino con ,i se hace una reducci on an
aloga. Con lo cual la Ec. (17.63) queda en la forma
Z      
dU U d U U d U U
= dV + +
dt dxi ,i dxi ,i t
Z       
dU U d U U d U U
= dV + + (17.64)
dt dxi ,i dxi ,i t
HAMILTONIANA PARA MEDIOS CONTINUOS
17.6. FORMULACION 449

ahora introduciendo la notaci


on de derivada funcional descrita por (17.56), la Ec. (17.64) se reduce a
Z  
dU U U U
= dV + + (17.65)
dt t

por u
ltimo introducimos las ecuaciones de Hamilton en notaci on de derivadas funcionales Ecs. (17.57), con lo
cual la Ec. (17.65) queda Z   Z
dU U H H U U
= dV

+ dV (17.66)
dt t
La primera integral tiene la forma de un corchete de Poisson aunque reemplazando al operador derivada
ordinaria por la derivada funcional. Si U y W son dos funciones densidad cualquiera, lo anterior nos sugiere
definir como los corchetes de Poisson a las siguientes cantidades integrales
Z  
U W W U
[U, W ] dV (17.67)

definimos el significado de la derivada parcial en el tiempo de U en la forma evidente


Z
U U
= dV
t t

con lo cual la Ec. (17.66) se puede escribir en la forma

dU U
= [U, H] + (17.68)
dt t
que es el an
alogo a la Ec. (8.25) para sistemas discretos, aunque debe tenerse en cuenta que los corchetes de
Poisson han sido redefinidos en forma integral y con la derivada funcional. Haciendo U = H en (17.68) y tenien-
do en cuenta que por definici
on el corchete de Poisson de H consigo mismo es nulo, se obtiene inmediatamente
que
dH H
= (17.69)
dt t
que es la forma integral de (17.61)11 y la versi
on en teora de campos de (6.26). N otese que aunque las derivadas
total y parcial no coinciden para la densidad Hamiltoniana, s coinciden para el Hamiltoniano total.
Se ve entonces que el formalismo de los corchetes de Poisson aparece como consecuencia de la formulaci on
de Hamilton. Sin embargo, no se puede desarrollar una teora de campos en terminos de corchetes de Poisson
de tal manera que guarde una analoga pasa a paso con la de los sistemas discretos. Por ejemplo, aqu definimos
los corchetes de Poisson solo en funcion de un par de densidades. Por tanto no se puede con facilidad plantear
corchetes de Poisson fundamentales como lo hacamos en sistemas discretos. Esto se debe a que aunque es
una densidad, no lo es. Adem as si xi desempe na el papel de ndices contnuos de las variables mec
anicas,
los corchetes de Poisson fundamentales contendran funciones para diferentes valores de xi , lo cual no se
introduce facilmente en la presente formulaci on. Por esta razon las transformaciones can onicas no son muy
usadas en teoras de campos cl asicos a pesar de ser tan fructferas en sistemas discretos. Tambien es difcil
en este formalismo seguir los pasos de la cuantizaci on, que requieren cambiar los corchetes de Poisson por
conmutadores cuanticos.

17.6.3. Formulaci
on por corchetes de Poisson utilizando descomposici
on de Fourier
Hay una forma alternativa que nos va a permitir trabajar casi todo el formalismo de Hamilton y de corchetes
de Poisson para campos cl asicos, que ya conocemos para el caso discreto. La idea de este tratamiento consiste
en sustituir la variable espacial contnua o el ndice contnuo, por un ndice discreto numerable. Retomemos
11
La integraci
on del primer termino a la derecha de la Ec. (17.61) se anula al tomar un volumen que contenga todos los campos
y derivadas, como se puede ver aplicando el teorema de la divergencia.
450CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

una vez mas el ejemplo de la varilla el


astica. Supongamos que dicha varilla posee una longitud L = x2 x1 .
Pondremos como condici on de contorno que se anule en los extremos, lo cual se logra colocando a la varilla
con sus extremos en contacto con dos paredes rgidas. La amplitud de la oscilacion se podr
a escribir en una
descomposicion de Fourier discreta
X
2n (x x1 )
(x) = qn sin (17.70)
2L
n=0

en lugar del ndice contnuo x aqu tenemos el ndice discreto n. Esta representaci
on solo es v
alida si (x) es
una funcion regular, lo cual usualmente se cumple.
Para el caso general, supondremos por simplicidad, que hay solo una cantidad de campo real que se puede
desarrollar en serie de Fourier tridimensional
1 X
(r, t) = qk (t) eikr (17.71)
V k

donde k es un vector de onda que solo puede tomar m odulos y direcciones discretos de modo que en una
dimension lineal dada solo encaje un n umero entero (o tal vez semientero) de longitudes de onda. Decimos
que k tiene un espectro discreto. El ndice escalar k representa entonces una ordenaci on del sistema de ndices
enteros que se utiliza para enumerar los valores discretos de k, y V es el volumen del sistema que act ua como
un factor de normalizaci
on. Como este factor es real se tiene que qk = qk .
La ortogonalidad de las exponenciales en el volumen se manifiesta como
Z
1
ei(kk )r dV = k,k (17.72)
V
en realidad los valores permitidos de k son aquellos para los que se cumple la condici on de ortogonalidad. Los
coeficientes de la expansion se pueden calcular con base en la ortonormalidad de la siguiente forma
Z Z
1 ikr 1
qk (t) = e (r, t) dV e (k, r, t) dV ; e (k, r, t) eikr (r, t)
V V
donde e (k, r, t) es la funci
on densidad correspondiente a la variable global qk , como se puede ver por com-
paraci
on con la Ec. (17.62). De manera an aloga, la densidad de cantidad de movimiento se puede escribir
como
1 X
(r, t) = pk (t) eikr (17.73)
V k
donde tambien se cumple que pk = pk . Los coeficientes pk (t) tambien se obtienen por ortonormalidad
Z Z
1 ikr 1
pk (t) = e (r, t) dV e (k, r, t) dV ; e (k, r, t) eikr (r, t)
V V
siendo
e (k, r, t) la funci on densidad asociada a pk (t). Tanto qk como pk son cantidades integrales de la
forma descrita por (17.62). Podemos entonces calcular los corchetes de Poisson de dichas cantidades. Como
las exponenciales no contienen variables de campo, tenemos en virtud de la definici on (17.67)
Z  
e (k , r, t) e
(k, r, t) e (k , r, t) e
(k, r, t)
[qk , pk ] = dV

Z  
1
[qk , pk ] = dV ei(k k)r
V
Z
1
[qk , pk ] = dV ei(k k)r
V
y usando la ortonormalidad (17.72)
[qk , pk ] = kk (17.74)
HAMILTONIANA PARA MEDIOS CONTINUOS
17.6. FORMULACION 451

usando la definici
on de corchetes de Poisson, se puede verificar que

[qk , qk ] = [pk , pk ] = 0 (17.75)

por tanto, los corchetes de Poisson de qk , pk forman un conjunto de corchetes fundamentales con las mismas
propiedades que aparecen en el discreto Ecs. (8.3). Esto nos sugiere considerar a estas cantidades como coor-
denadas can onicamente conjugadas. Vale la pena entonces estudiar las ecuaciones de movimiento que surgen
para estas coordenadas. Empleando la Ec. (17.68), la evoluci on temporal de qk (t) se escribe como
Z   Z  
e
(k, r, t) H H e (k, r, t) 1 H H
qk (t) = [qk , H] = dV = dV eikr
V
Z
1 H
qk (t) = dV eikr (17.76)
V
por otra parte, tenemos Z Z
H H H
= dV = dV (17.77)
pk pk pk
donde hemos tenido en cuenta que H no es funci on del gradiente de y por tanto su derivada parcial con
respecto a coincide con su derivada funcional. Teniendo en cuenta (17.73) resulta
1
= eikr
pk V
con lo cual (17.77) coincide con (17.76) resultando
H
qk = (17.78)
pk
veamos ahora como se obtiene la ecuaci
on de movimiento para pk . Los pasos son similares
Z  
1 H H
p k (t) = [pk , H] = dV eikr
V
Z
1 H
p k (t) = dV eikr (17.79)
V
y calculamos Z  
H H H ,j
= dV + (17.80)
qk qk ,j qk
la diferencia fundamental con el c
alculo anterior es que H no depende del gradiente de pero s depende del
gradiente de . El termino que contiene las componentes del gradiente de se integra por partes,
Z   Z   
H ,j j H d
dV = dx
,j qk ,j dxj qk
 
H d
u = ; dv = dxj j
,j dx qk
Z   Z  
H ,j H j d H
dV = dx
,j qk ,j qk S qk dxj ,j
la integral de superficie se anula de modo que la integral (17.80) queda
Z    Z   
H H d H H d H
= dV = dV
qk qk qk dxj ,j dxj ,j qk
la cual se puede reducir a otra que contenga la derivada funcional
Z
H H
= dV
qk qk
452CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

y teniendo en cuenta (17.71)


1
= eikr
qk V
quedando finalmente
Z
H 1 H ikr
= dV e (17.81)
qk V
igualando (17.79) con (17.81) se encuentra que

H
p k (t) = (17.82)
qk

las cantidades qk y pk obedecen entonces las ecuaciones de movimiento de Hamilton. En general k denota un
conjunto de ndices enteros.
Notese que en el captulo se comenz o con un sistema discreto (coordenadas generalizadas numerables)
para el cual se estudio el paso al contnuo (coordenadas generalizadas no numerables). Posteriormente, hemos
descrito al sistema contnuo mediante un sistema de coordenadas discreto y numerable que posee una estrucutra
matem atica similar a la del sistema discreto del cual se parti
o. Debido a esta correspondencia entre qk , pk
con las variables can onicamente conjugadas en el discreto, estas cantidades son buenos candidatos para la
cuantizacion cuando pasemos a una teora cu antica de campos. Las qk corresponden a lo que se denomina
numero de ocupaci on para el campo.
La raz on por la cual se pudo describir el sistema contnuo por medio de coordenadas discretas, es que
el tama no finito del sistema y las condiciones de contorno permiten un desarrollo de Fourier discreto12 . El
desarrollo presente se efectu o sobre un espectro discreto de ondas planas. Dado que el vector de onda k es
en mecanica cu antica directamente proporcional a la cantidad de movimientode la partcula asociada a la
onda plana, los desarrollos que hemos utilizado reciben a veces el nombre de representaci on por cantidad de
movimiento. Sin embargo, este desarrollo se puede realizar en cualquier conjunto ortonormalizable y numerable
de funciones que cumplan la propiedad de completez en el volumen en cuesti on. Las ondas planas son solo un
caso particular de estas funciones. El empleo de otras bases para estas expansiones puede ser mas conveniente,
dependiendo del problema a estudiar, pero el procedimiento es an alogo al aqu expuesto.

17.7. Ejemplos de teoras de campos


17.7.1. Un modelo juguete
Consideremos un campo de dos componentes 1 y 2 cuyas ecuaciones de movimiento fuesen

d1 d2 1
a2 1 + b c 2 = f 2
dt dt
d2 d2 2
a2 2 b c 2 = g1 (17.83)
dt dt

el siguiente paso natural es encontrar una densidad Lagrangiana que a traves de las ecuaciones de Euler-
Lagrange Ecs. (17.27) me genere las ecuaciones de campo (17.83), recordemos que esta densidad Lagrangiana
no es u
nica, una de ellas es

b 1 
L = c 1 2 + ( 1 2 1 2 ) a1 2 f 22 + g12
2 2
12
Por ejemplo, si el sistema no es acotado la descomposici
on de Fourier se vuelve en general contnua. Por otro lado, la anulaci
on
del campo en los extremos permiti o que las sumatorias fueran desde n = 0 hasta . En general estas sumatorias ir an desde
hasta .
17.7. EJEMPLOS DE TEORIAS DE CAMPOS 453

para esta densidad Lagrangiana, las componentes del tensor esfuerzo energa son
1 
T00 = c 1 2 + a1 2 + f 22 + g12
 2
d2 d1
T0i = a 1 + 2
dxi dxi
   
d2 d1 b d1 d2
Ti0 = c 1 + 2 + 2 1
dxi dxi 2 dxi dxi
 
d1 d2 d1 d2
Tij = a + Lij
dxi dxj dxj dxi
observese que en este ejemplo, el tensor tridimensional Tij es simetrico.

Hagamos los calculos explcitos. Podemos escribir la densidad lagrangiana en una notaci
on m
as conveniente
b 1 
L = c 1 2 + ( 1 2 1 2 ) a (i 1 ) (i 2 ) f 22 + g12
2 2
b 1 
L = c 1 2 + ( 1 2 1 2 ) a1,i 2,i f 22 + g12
2 2
Usando las ecuaciones de Lagrange para el contnuo
 
d L L

=0
dx ,
tenemos que para el campo 1    
d L d L L
+ k =0
dt 1 dx 1,k 1
   
L b b d L b
= c 1 2 + 1 2 = c 2 + 2 2 + 2
= c
1 1 2 2 dt 1 2
 
L d L
= [a1,i 2,i ] = aik 2,i = a2,k k = a2,kk
1,k 1,k dx 1,k
 
L b 1 2 b
= (1 2 ) g1 = 2 + g1
1 1 2 2 2
la ecuaci
on de Lagrange es
b b
c
2 + 2 a2,kk + 2 + g1 = 0
2 2
d2 2 d2
a2 2 + c 2 + b + g1 = 0
dt dt
similarmente se obtiene la ecuaci
on de Lagrange para 2
   
d L d L L
+ k =0
dt 2 dx 2,k 2

   
L b b d L b
= c 1 2 (1 2 ) = c 1 1 = c1 1
2 2 2 2 dt 2 2
 
L d L
= [a1,i 2,i ] = aik 1,i = a1,k k = a1,kk
2,k 2,k dx 2,k
 
L b 1 2 b
= 1 2 f 2 = 1 + f 2
2 2 2 2 2
454CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

la ecuaci
on de Lagrange es

b b
c
1 1 a1,kk 1 + f 2 = 0
2 2
d2 d
1 1
a2 1 + c 2 b + f 2 = 0
dt dt
finalmente la densidad de energa se obtiene recordando la definici
on del tensor esfuerzo energa

L L L
T , L T0 0 ,0 L00 = L
, ,0
L L
T0 0 = 1 + 2 L
2
 1     
b b b 1 
T0 0 = c 2 + 2 1 + c 1 1 2 c 1 2 + ( 1 2 1 2 ) a1,i 2,i 2 2
f 2 + g1
2 2 2 2

b b b 1 
T0 0 = c 2 1 + 2 1 + c 1 2 1 2 c 1 2 ( 1 2 1 2 ) + a1,i 2,i + f 22 + g12
2 2 2 2
b b b 1 
T0 0 = c 2 1 c 1 2 + c 1 2 + 2 1 1 2 ( 1 2 1 2 ) + a1 2 + f 22 + g12
2 2 2 2
1 
T0 0 = c 2 1 + a1 2 +
f 22 + g12
2
De la misma forma se pueden calcular los otros elementos del tensor esfuerzo energa. N
otese que si podemos
encerrar todos los campos y sus derivadas en un volumen, podemos garantizar que
Z
R0 = T0 0 dV = cte

para saber que volumen es adecuado para incluir la carga conservada generalizada (hay cuatro estrictamente),
sera necesario conocer el comportamiento del campo y sus condiciones de frontera. Por otro lado, para esta
teora de campo es posible que T0 0 no este asociado a una densidad de energa, ni que las otras cargas
conservadas esten asociadas a momentos. Todo lo que podemos afirmar es que hay cuatro cargas generalizadas
conservadas que incluso pueden ser totalmente independientes unas de otras. Cualquier interpretaci
on adicional
depende del modelo de campo especfico.

17.8. Teora de campos relativista


Hemos visto en la secci on 15.10 que una formulaci on Lagrangiana o Hamiltoniana manifiestamente cova-
riante de Lorentz resulta particularmente difcil de implementar en la mec anica de partculas puntuales. Esta
dificultad est
a principalmente relacionada con el hecho de que la formulaci on no relativista de la mec anica
del punto es muy asimetrica en su tratamiento de la variable espacial y la temporal. Las variables espaciales
son cantidades mec anicas en tanto que el tiempo es un par ametro que se recorre en forma mon otona. En
contraste, la mecanica no relativista de medios contnuos presenta las coordenadas de espacio tiempo de una
forma mucho m as simetrica, al menos en la formulacion Lagrangiana. Ello permitir a realizar una formulacion
que sea manifiestamente covariante de Lorentz con algunos peque nos cambios de la versi on no relativista.
Hay tres aspectos que deben trabajarse para llegar a esta formulacion manifiestamente covariante de Lorentz
(1) la estructura y metrica del espacio tiempo, (2) las propiedades de transformaci
on de los campos, densidades
lagragianas etc. cuando se realiza una transformaci on de Lorentz, (3) la descripci
on covariante de los lmites
de integracion.
En lo que respecta al primer punto, es posible trabajar en el espacio tiempo usando la metrica usual pero
con coordenada temporal imaginaria (espacio de Minkowski) o por otro lado, trabajar con el espacio tiempo
17.8. TEORIA DE CAMPOS RELATIVISTA 455

usual pero con metrica no trivial (metrica de Minkowski, ver cap. 15). Al igual que en el cap. 15 trabajaremos
en el espacio de Minkowski con la metrica usual. Como hasta ahora, los ndices latinos indican coordenadas
espaciales y los ndices griegos nos denotan las coordenadas espacio temporales, pero en este caso la coordenada
temporal se escribir a como x4 = ict. En primer lugar vemos que las Ecuaciones 17.27 de Lagrange en el contnuo
no se afectan por este cambio, ya que el termino
 
d L
dx ,

ametros x , poe ejemplo para x4 tenemos


queda invariante ante un cambio de escala de cualquiera de los par
que
   
d L d L d L
=   = 0
dx4 ,4 idx0 d dx ,0
idx0

y por otro lado el otro termino en las ecuaciones de Lagrange no contiene coordenadas. En lo que respecta
al principio de Hamilton, el cambio de espacio no lo afecta dado que simplemente se introduce una constante
multiplicativa.
Z
I = L ( , , , x ) dx = 0 ; dx dx0 dx1 dx2 dx3 = idx4 dx1 dx2 dx3
Z ix4,2 Z
I = i L ( , , , x ) dx = 0 ; dx dx4 dx1 dx2 dx3
ix4,1 V

el cambio de variable x4 = ix4 saca otra constante multiplicativa de modo que el principio variacional
permanece inmodificado.
Los campos y las cantidades relacionadas con estos deben formar tensores de Lorentz de determinado rango
para que se puedan escribir ecuaciones de campo manifiestamente covariantes. Si tenemos varios campos cada
uno de ellos puede ser un tensor de rango diferente, lo imporante es que las ecuaciones de movimiento sean
manifiestamente covariantes. Las densidades lagrangiana y Hamiltoniana tambien deben ser covariantes. En
el principio de Hamilton el elemento de cuadrivolumen es invariante de Lorentz. Si hemos de asumir que la
acci
on es escalar de Lorentz (ya que es un escalar euclidiano en el regimen no relativista) esto implica que las
densidades Lagrangiana y Hamiltoniana sean escalares de Lorentz. De lo anterior se desprende que el tensor
de esfuerzo energa en la Ec. (17.31) debe ser un tensor de Lorentz de segundo rango. No obstante, el cambio
de espacio implica que las componentes de tal tensor pueden cambiar su valor. Es claro que para la misma
densidad Lagrangiana, el cambio de (t, x1 , x2 , x3 ) a (x1 , x2 , x3 , ict) no altera a las componentes Ti j . Para las
otras componentes el cambio en su valor se puede obtener de las Ecs. (17.31, 17.33)

L
T , L
,

   
0 L L d L d
T0 L =   L=   L
d
dt dt d
d(ict) d (ict)
 
L d
=   4
L T4 4
dx4
d dx

L L d L d L d T 4
Tj 0 = ,j =   j =   j =   j = j
dt dx
d d
ic d(ict) dx ic dx4 dx
d ic

icTj 0 = Tj 4
456CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

L d L d
T0 j =   = ic   = icT4 j

d dt
d d (ict)
dxj dxj

en resumen las equivalencias quedan en la forma13


i
Ti j Ti j ; T4 4 T0 0 ; Tj 4 icTj 0T4 j T0 j
; (17.84)
c
la densidad lagrangiana est
a definida excepto por una constante multiplicativa. Este factor multiplicativo suele
tomarse de tal manera que T44 o su forma simetrizada coincidan con la densidad de energa del campo. En el
cuadriespacio de Minkowski las cantidades conservadas de la Ec. (17.8) que aqu denotamos como R , quedan
en la forma Z
R = T 4 dV (17.85)

definamos ahora los factores P asociados a estas cantidades como


Z
i i
P R = T 4 dV (17.86)
c c
de (17.84) y de la interpretacion de Ti 0 como la componente iesima de la densidad de momento del campo,
se concluye que Pi son las componentes del momento total del campo y P4 es iE/c, siendo E la energa
total del campo. Esto sugiere que el arreglo P puede representar al cuadrivector energa momento definido
en la secci
on 15.7. Para esto es necesario demostrar que R y por tanto P se transforman como vectores
de universo (cuadrivectores) bajo una transformaci on de Lorentz. Como estas expresiones son integrales en
tres dimensiones, requeriremos examinar el significado de la integraci on tridimensional en una formulaci on
covariante y estudiar la forma en que se deben tratar los lmites de integraci
on.
La covarianza en los lmites de integraci
on sera de particular importancia en el principio de Hamilton
Z
I = L ( , , , x ) dx = 0 ; dx dx0 dx1 dx2 dx3 (17.87)

si la densidad Lagrangiana es un escalar de universo, la integral (17.87) ser a claramente covariante de Lorentz
pero no as los lmites de integracion. La integracion espacial se realiza sobre un volumen fijo del espacio
tridimensional seguido de una integraci on en el tiempo entre los lmites t1 y t2 . Pero la integraci on sobre
un volumen extendido para tiempo fijo no es un concepto covariante puesto que la simultaneidad no es un
concepto invariante de Lorentz. Por otro lado, si tenemos en cuenta que la conexi on causal s es un invariante de
Lorentz (eventos del genero espacial del genero temporal y como de luz), una descripci on covariante adecuada
sera decir que la integraci
on se hace sobre una hipersuperficie de tres dimensiones del g enero espacial, es
decir una superficie en la cual todos los vectores de universo contenidos en ella sean del genero espacial. Los
vectores normales a dicha superficie son del genero temporal. En particular, los vectores que unan dos puntos
de universo en una superficie de tiempo constante ser an del genero espacial ya que se anula su componente
x4 . Aunque la anulaci on de x4 no permanece cuando se hace una transformaci on de Lorentz (no se conserva la
simultaneidad) el vector continuar a siendo del genero espacial. Por tanto, una superficie de tres dimensiones a
tiempo constante es un tipo particular de superficie del genero espacial. An alogamente, lo que en un sistema
especfico es una integraci
on en el tiempo para un punto espacial fijo, se puede describir covariantemente por
una integraci on extendida a una superficie del genero temporal.
En un sistema unidimensional en el espacio fsico, la integraci on en el principio de Hamilton descrita en
(17.19) se extiende al rectangulo que se ilustra en la Fig. 17.4a. Una transformacion de Lorentz es una rotaci on
en el espacio de Minkowski y los lados paralelos a los ejes originales ya no lo ser an en los ejes del sistema
transformado, pero los lados horizontales seguir an siendo del genero espacial y los lados verticales seguir an
siendo del genero temporal. Por tanto, en todos los sistemas de Lorentz podremos describir la integraci on como
extendida a una regi on del cuadriespacio contenida entre dos hipersuperficies del genero espacial limitadas por
superficies del genero temporal que cortan a las anteriores.
13
En algunas ocasiones se usa en el regimen no relativista la coordenada x0 ct. En tal caso las equivalencias son las indicadas
en (17.84) pero omitiendo el factor c.
17.8. TEORIA DE CAMPOS RELATIVISTA 457

Figura 17.4: (a) Regi


on de integraci
on para el principio de Hamilton en un sistema unidimensional relativista.
(b) Volumen de integracion esquem atico en el espacio tiempo de Minkowski.

Veamos ahora la descripci


on covariante de cantidades del tipo P descritas por las Ecs. (17.85, 17.86). Una
forma apropiada para esta descripci
on covariante es de la forma
Z
i
P = T dS (17.88)
c S
en donde la integraci
on se realiza sobre una hipersuperficie del genero espacial para la cual los vectores que
describen los elementos de superficie y que son normales a esta son los dS . T debe ser un tensor de universo de
segundo orden para garantizar la covarianza de P es decir que P defina un vector de universo o cuadrivector.
Veremos a continuacion que las componentes de P en (17.88) se reducen a integrales de volumen en el espacio
ordinario tridimensional del tipo descrito en (17.86) siempre que la divergencia del tensor T sea nula

T = 0

para ilustrarlo tomemos una regi on volumetrica V4 del cuadriespacio definida por tres superficies (ver Fig.
17.4b); S1 y S2 son del genero espacial y S3 es del genero temporal. Usando el teorema de la divergencia en
cautro dimensiones, podemos escribir
Z   Z
dT

dx = T dS (17.89)
V4 dx S1 +S2 +S3

la integral sobre S3 es con respecto al tiempo a r constante. Tomando el volumen suficientemente grande, la
integral extendida a esta superficie mantendra a r fuera del sistema, en donde se anulan todas las cantidades
de campo. Por tanto Z   Z
dT

dx = T dS (17.90)
V4 dx S1 +S2
Nuestra hipotesis de nulidad de la divergencia de T hace que tambien se anule el miembro izquierdo de
(17.90). Por tanto, si tomamos en el mismo sentido las normales a la superficie del genero espacial resulta
Z Z
T dS = T dS (17.91)
S1 S2

en la Fig. 17.4b, hemos tomado a S1 como una superficie del genero espacial arbitraria en tanto que S2 es una
superficie con tiempo constante es decir con x4 constante. En consecuencia, el vector normal a un elemento
de superficie de S2 es un vector del genero temporal que solo tiene componente en x4 i.e. dS = 4 dS2 y
recordando que S2 es una hipersuperficie tridimensional, la integraci
on sobre esta superficie es una integral de
volumen a tiempo constante. De lo anterior, se ve que la Ec. (17.91) queda
Z Z
T dS = T 4 dV

S1
458CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

es claro que el miembro izquierdo se transforma como cuadrivector si T es un tensor de segundo rango, por
tanto el segundo miembro tambien transforma como vector de universo. Teniendo en cuenta (17.85) vemos por
tanto que R transforma como cuadrivector bajo la condici on de que el tensor T tenga divergencia nula. Si
adicionalmente las dos superficies S1 y S2 son superficies a tiempos constantes t1 y t2 respectivamente la Ec.
(17.91) conduce a
R (t1 ) = R (t2 )
que corresponde a la forma covariante de demostrar que R se conserva en el tiempo.
En consecuencia, sera posible con un poco de cuidado utilizar las cantidades conservadas ya obtenidas en
el regimen no relativista. Sin embargo, la correspondencia detallada no siempre es posible, pero en la mayora
de los casos es suficiente que la integraci
on de volumen se refiera a un sistema de Lorentz especfico en el cual
la hipersuperficie del genero espacial sea una region en el espacio de tres dimensiones a tiempo constante, ya
que siempre que tenemos eventos del genero espacial es posible encontrar un sistema de referencia en donde
los eventos son simult aneos.
Para la densidad de momento angular, notemos que el an alogo covariante de Mi j Ec. (17.43) es un cua-
dritensor de tercer rango
i 
M = x T x T (17.92)
c
el cual es antisimetrico en , . La integral conservada es
Z
M = M dS (17.93)

y la integraci
on se extiende a lo largo de una hipersuperficie del genero espacial. Si en particular se toma un
sistema de Lorentz en el cual la hipersuperficie sea a t constante se obtiene
Z
M M 4 dV

que corresponde a la definicion en el regimen no relativista. Por tanto, el razonamiento hecho en la secci
on 17.5.4
sobre la conservaci j
on de Mi para tensores esfuerzo-energa simetricos (o simetrizados) puede extrapolarse
considerando el sistema de Lorentz particular con hipersuperficie a tiempo constante.
Ya mencionamos en la secci on 17.6 que la formulaci on Hamiltoniana distingue las coordenadas espaciales
y temporales de forma explcita. Esto no significa que no se pueda construr una teora covariante de Lorentz,
simplemente implica que la formulaci on no ser
a manifiestamente covariante. Podemos imaginar la formulaci on
Hamiltoniana en el tiempo como la que ve cada observador particular. Si los campos y sus derivadas transforman
adecuadamente, es posible que la formulacion sea compatible con la relatividad especial en cada sistema de
Lorentz particular.
Otro punto importante se refiere a la descripci on de sistemas fsicos que involucran un conjunto de campos
que pueden interactuar entre s. En este caso la densidad Lagrangiana usualmente consistir a en sumas de
densidades Lagrangianas que representan a los campos libres m as terminos que describen la interacci
on entre
los campos. Ya habamos mencionado que parte de la dificultad para realizar una formulaci on relativista de la
mec anica del punto tena que ver con el hecho de que la acci on a distancia no es compatible con la relatividad
especial. La ventaja de las formulaciones de campo es que las interacciones entre campos pueden ser de
naturaleza local, es decir pueden tener lugar en un punto lo cual facilita la construcci on de una formulaci on
covariante. M as a
un, se puede trabajar interacciones de tipo local (en un punto del espacio tiempo) para
campos interactuando con partculas. Por tanto, tambien es factible una formulaci on relativista de partculas
inmersas en uno o m as campos y que interact uan con estos. Un ejemplo notable es la interaccion de cargas
electricas puntuales con campos electromagneticos.

17.9. Algunas teoras de campos relativistas


Estudiaremos algunos ejemplos de teoras relativistas que forman parte de teoras reales de la naturaleza.
17.9. ALGUNAS TEORIAS DE CAMPOS RELATIVISTAS 459

17.9.1. Campo escalar complejo


Un campo complejo est a constitudo por dos grados de libertad independientes que se pueden tomar como
la parte real y la parte imaginaria del campo o cualquier transformaci on de estos grados de libertad mediante
una matriz no singular, por ejemplo
        
A 1 i Re Re + iIm
= = =
B 1 i Im Re iIm

por tanto y se pueden tomar como variables de campo independientes. Tomando entonces a y
como las variabels independientes, la densidad Lagrangiana y todas las funciones asociadas las escribiremos en
terminos de estas dos variables de campo. Cada uno de estos campos sera un escalar de universo. Mas adelante
veremos que los campos complejos conducen de forma natural a una densidad asociada de carga y de corriente
y esta es la principal raz
on para considerar este tipo de campos.
Tomaremos en este caso la siguiente densidad Lagrangiana

L = c2 , , 20 c2 (17.94)

donde 0 es una constante. Observese que si los campos son escalares de universo, esta densidad Lagrangiana
tambien lo ser
a como se requiri
o en la secci
on 17.8. Expresando esta densidad Lagrangiana en terminos de
espacio y tiempo separados nos queda
2

2

L = c2 2 2
0 c
= c c 20 c2
x x x4 x4 xi xi

L = c2 c2 20 c2
(ict) (ict)

quedando finalmente
L = c2 20 c2 (17.95)
on de Lagrange asociada al campo
encontremos la ecuaci
 
L 2 d L L
= c , ; = c2 , ; = 20 c2
, dx ,
, 20 = 0 (17.96)

que en notaci
on m
as explcita queda
X d2   X 2

20 =0 + 20 = 0

dx2 (ict) (ict) x2k
k

1 d2
2 20 = 0 (17.97)
c2 dt2
y recordando la definici
on del operador DAlembertiano Ec. (15.52) pag. 378, la ecuaci
on de campo se puede
reescribir en forma manifiestamente covariante en la forma

2 20 = 0 (17.98)

la ecuaci
on de Lagrange asociada al campo se puede encontrar inmediatamente en virtud de la simetra de
L con y 
2 20 = 0 (17.99)
A las Ecs. (17.98, 17.99) se les conoce como ecuaciones de Klein Gordon. N otese que estas ecuaciones se
reducen a ecuaciones de onda cuando 0 = 0. En la literatura, es usual encontrar dichas ecuaciones con un
signo positivo en el termino proporcional a 20 , esto se debe a la utilizaci
on de la metrica de Minkowski definida
460CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

en (15.32) que produce un cambio de signo en el DAlembertiano. La ecuaci on de Klein Gordon es en realidad
el analogo relativista de la ecuacion de Schrodinger para una partcula cargada de espn cero y masa en reposo
0 .
Veamos la forma del tensor esfuerzo energa definido en la Ec. (17.31), explcitamente se escribe para este
caso
L L L
T , L = , + L
, , , ,

= c2 , , c2 , , c2 , , 20 c2

T = c2 , , c2 , , + c2 , , + 20 (17.100)
otese que L no depende explcitamente de los x lo cual nos dice que esta
el cual es claramente simetrico. N
densidad Lagrangiana describe un campo libre sin interacci
on con el resto del universo. Adicionalmente, la no

dependencia de L con x nos dice que se cumplen los teoremas de conservaci on expresados por la Ec. (17.30).

Formulaci
on Hamiltoniana para el campo escalar complejo
Para introducir la formulaci
on Hamiltoniana debemos distinguir entre coordenadas espaciales y temporales
en un sistema de Lorentz particular. Los momentos can onicamente conjugados a las variables de campo est
an
dados por (17.49) que al aplicarlos a la densidad Lagrangiana 17.95 nos dan
L L
= = ; = = (17.101)


y la densidad Hamiltoniana definida en (17.50) y que tiene la misma magnitud de T44 est a dada por

H = + L = + c2 , , 20 c2

H = 2 + c2 + c2 ,i ,i + 20 c2
(ict) (ict)
H = 2 + c2 + 2 c2 = 2 + c2 + 2 c2
0 0
2

H = + c +
20 c2 (17.102)
las Ecuaciones de Hamilton en el contnuo Ecs. (17.57) nos dan
 
H d H H H
= = i H= = ; = = =
dx ,i
 
H d 
= = i + c2 ,k ,k + 20 c2
dx ,i
d 
= 20 c2 + i c2 ,i = c2 ,ii 20 c2 = c2 2 20 c2
dx
H

= = c 20 c2
2 2

las ecuaciones de Hamilton nos dan entonces
= ; = ; = c2 2 20 c2 ; = c2 2 20 c2 (17.103)
las dos primeras ecuaciones de Hamilton reproducen las Ecs. (17.101). Si derivamos las dos primeras ecuaciones
(17.103)
= ; =
y reemplazamos en las dos u
ltimas de las Ecs. (17.103)
= c2 2 20 c2 ; = c2 2 20 c2
1 1
2 + 2 20 = 0 ; 2 + 2 20 = 0
c c
17.9. ALGUNAS TEORIAS DE CAMPOS RELATIVISTAS 461

y usando de nuevo el DAlambertiano, vemos que estas corresponden a las ecuaciones de Klein Gordon.
Veamos ahora la representaci on de Fourier de momentos can onicos totales. Para ello se introducen las
expansiones de Fourier (17.71, 17.73)

1 X 1 X
(r, t) = qk (t) eikr ; (r, t) = pk (t) eikr
V k V k
en la densidad Hamiltoniana. Debe tenerse en cuenta que como el campo no es real, no se cumple la condici
on
qk = qk . En este caso qk y qk representan dos conjuntos independientes de coordenadas discretas (de la
misma forma en que y se consideran independientes). El Hamiltoniano total es la integral de volumen de
la densidad Hamiltoniana dada por (17.102)
Z

H= + c2 + 20 c2 dV

e introduciendo las expansiones de Fourier el Hamiltoniano queda


!
Z X X X
1
H = pk (t) pj (t) eikr eijr + c2 ikqk (t) eikr (ij) qj (t) eijr
V
k,j k j

X
+20 c2 qk (t) qj (t) eikr eijr dV

k,j

X  Z  X  Z 
1 i(jk)r 2 1 i(kj)r
H = pk (t) pj (t) e dV + c (k j) qk (t) qj (t) e dV
V V
k,j k,j
X  Z 
1
+20 c2 qk (t) qj (t) ei(kj)r
dV
V
k,j

y utilizando la ortonormalida de las ondas planas Ec. (17.72) se obtiene


X X X
H = pk (t) pj (t) jk + c2 (k j) qk (t) qj (t) jk + 20 c2 qk (t) qj (t) jk
k,j k,j k,j
2 2 2 2
H = pk pk +c k qk qk + 0 c qk qk

que finalmente se puede escribir en la forma

H = pk pk + k2 qk qk ; k2 c2 k2 + 20 c2 (17.104)

donde se usa suma sobre ndices repetidos. N otese que este Hamiltoniano tiene la forma de una suma de
osciladores arm onicos desacoplados de masa unidad y con frecuencia angular k . Esto se puede ver en forma
explcita utilizando las ecuaciones de Hamilton globales dadas por (17.78, 17.82)

H H
qj = = pj ; qj = = pj
pj pj
H H
p j = = j2 qj ; p j = = j2 qj (no suma)
qj qj

derivando con respecto al tiempo las dos primeras ecuaciones resulta

qj = p j ; qj = p j
462CAPITULO 17. FORMULACION
LAGRANGIANA Y HAMILTONIANA PARA SISTEMAS CONTINUOS Y C

y reemplazando en las dos u


ltimas

qj = j2 qj ; qj = j2 qj (no suma)

que son ecuaciones de oscilador arm onico para cada coordenada discreta qj . Por lo tanto, en la representaci
on
por expansi on de Fourier en ondas planas se sustituyen los campos y por sistemas discretos de osciladores
arm onicos. Un proceso similar se realiza cuando el campo sonoro en un s olido finito se construye como una
superposicion discreta de fonones. El espectro discreto de vibraciones de nuestro campo cargado escalar
viene dado por la Ec. (17.104) que act ua como una relaci on de dispersi on. Es muy sencillo hacer una
teora cu
antica (conocida como segunda cuantizaci on) de estos campos cuando se trabaja con el formalismo de
expansi on de Fourier pues en este caso cada oscilador se cuantiza como se cuantizan los osciladores arm onicos
en la mec anica cu
antica del discreto.

17.9.2. Ecuaci
on de seno Gordon
Tomemos el campo anterior como real de modo que = y limitemonos al caso unidimensional. La
densidad Lagrangiana (17.95) se reduce a
"  2 #
c2 2 2 2
L= 0 (17.105)
2 c2 x

donde se ha introducido un factor 1/2 por conveniencia, pues claramente este factor no altera las ecuaciones de
movimiento. La ecuaci on de campo asociada (ecuaci on de Klein Gordon unidimensional para partcula neutra)
es
2 1 2
= 20 (17.106)
x2 c2 t2
esta es una ecuaci
on lineal en el campo (x, t). Podemos considerar la densidad Lagrangiana en (17.105) como
una aproximacion de campo debil de la densidad Lagrangiana dada por
"  2 #
c2 2
L= 2
20 2 (1 cos )
2 c x

cuya ecuaci
on de campo es
2 1 2
= 20 sin (17.107)
x2 c2 t2
a la expresi
on (17.107) se le conoce como ecuaci on de seno Gordon. Vale resaltar que la ecuaci on de seno
Gordon (17.107) tiene similitud al pedulo de amplias oscilaciones (por esta raz on se le denomina tambien
ecuaci
on del pendulo) en tanto que la Ec. (17.106) se asemeja al oscilador arm onico y por tanto, al pendulo
de pequenas oscilaciones.
Para este escenario unidimensional el tensor esfuerzo-energa solo posee cuatro componentes. Como la
densidad Lagrangiana no depende explcitamente de los par ametros x, t los elementos del tensor satisfacen dos
4
ecuaciones de continuidad. La densidad de energa T4 es de especial interes
( "  2 # )
L c2 2
T4 4 = L = 20 2 (1 cos )
2 c2 x
( "  2 # )
1
T4 4 = 2 + c2 + 20 2 (1 cos )
2 x

que naturalmente coincide con la magnitud de la densidad Hamiltoniana


"  2 #
1 2
H= + c2 + 20 c2 (1 cos ) ; (x, t) =
2 x
17.9. ALGUNAS TEORIAS DE CAMPOS RELATIVISTAS 463

por otro lado, la representaci


on por expansi
on de Fourier en ondas planas del campo de Klein Gordon real
unidimensional conduce a la relaci
on
qk (t) = A0 (k) ei(krk t)
donde k y k estan enlazadas por la relaci
on de dispersion dada por la segunda de las Ecs. (17.104). Para un
campo que sea solucion de la ecuaci
on de seno Gordon es mucho m as difcil construr una representacion por
expansi
on de Fourier debido al termino cos en la densidad Hamiltoniana. Sin emabrgo, la relaci on de seno
Gordon se puede resolver con una estrucutra similar a una onda progresiva. Una soluci on de la Ec. (17.107)
que tenga la forma de una perturbaci on que se propaga con velocidad v, pero que por lo dem as conserva su
forma, debe ser funci
on exclusiva de = t x/v (n
otese la similitud con las soluciones generales de la ecuaci on
de onda). Con base en lo anterior la Ec. (17.107) queda en la forma

d2 20 c2 v 2
A sin = 0 ; A
d 2 c2 v 2
y en funci on de lo que resulta es la ecuaci on de un pendulo simple con amplitud finita. Si la amplitud
es peque na sabemos que describe un movimiento arm onico simple en con dado por la segunda de las
Ecs. (17.104) para un n umero separado de onda k = /v independiente de la amplitud. Si la amplitud es
finita sabemos que el pendulo deja de ser is ocrono, es decir la frecuencia comienza a depender de la amplitud,
aun cuando nuestra contin ue siendo periodica. La relaci
on de dispersion tambien depender a entonces de la
amplitud. Esto es caracterstico de la ecuaciones alineales, ya que en particular la ecuaci on de seno Gordon es
no lineal. Por otro lado, la ecuaci on de Klein Gordon s es lineal pero la relaci
on de dispersion en (17.104) es
alineal puesto que k no es funci on lineal de k y solo se vuelve lineal cuando 0 se anula, es decir cuando la
ecuacion de Klein Gordon se convierte en la ecuaci on de onda lineal.
De lo anterior se ve que la ecuacion de seno Gordon es alineal y con relaci
on de dispersi
on alineal no is
ocrona.
Un estudio m as detallado muestra que esta ecuaci on admite soluciones de caractersticas muy peculiares incluso
entre las ecuaciones alineales. Estas soluciones peculiares son del tipo onda progresiva que pueden interactuar
entre s atraves
andose unas a otras y que emergen sin variar su forma salvo por un posible cambio de fase.
Estas ondas solitarias que conservan su forma incluso a traves de interacciones se denominan solitones, los
cuales tienen amplias aplicaciones especialmente en Fsica de Partculas Elementales y en Fsica del Estado
Solido.
Bibliografa

[1] Physics Vol. I-Mechanics. Marcelo Alonso, Edward Finn. Addison-Wesley Publishing Co. Inc. Massa-
chusetts (1967).

[2] An introduction to Mechanics. Daniel Kleppner, Robert Kolenkow. McGraw-Hill International Edi-
tions, (1973).

[3] On the transformation of torques between the laboratory and center of mass reference frames.
Rodolfo A. Diaz, William J. Herrera. Revista Mexicana de Fisica, vol. E51 #2 p.112 - 115 (2005).

[4] Work and energy in inertial and noninertial reference frames. Rodolfo A. Daz, William J. Herrera,
Diego A. Manjarres. American Journal of Physics 77(3), 270-273 (2009).

[5] Normal Forces Can do Work. Diego A. Manjarres, Rodolfo A. Daz, William J. Herrera,
http://demonstrations.wolfram.com/NormalForcesCan DoWork.

[6] The physical meaning of Lagrange multipliers. Hasan Karabulut. European Journal of Physics 27,
709 (2006).

[7] Moments of inertia for solids of revolution and variational methods. Rodolfo A. Diaz, William
J. Herrera, R. Martinez. European Journal of Physics 27, 183 (2006).

464

Você também pode gostar