Escolar Documentos
Profissional Documentos
Cultura Documentos
Gradientes y hessianos
El gradiente. Suponga que se tiene una función en dos dimensiones f (x, y). Un
ejemplo podría ser su altura sobre una montaña como una función de su
posición. Suponga que usted está en un lugar específico sobre la montaña (a,
b) y quiere conocer la pendiente en una dirección arbitraria. Una forma de
definir la dirección es a lo largo de un nuevo eje h que forma un ángulo q con el
eje x (figura 14.6). La elevación a lo largo de un nuevo eje puede entenderse
como una nueva función g(h). Si usted define su posición como el origen de
este eje (es decir, h = 0), la pendiente en esta dirección podría designarse
como g′(0). Está pendiente, que se llama derivada direccional, se puede
calcular a partir de las derivadas parciales a lo largo de los ejes x y y mediante.
∇f = 4i + 8j
Este vector puede bosquejarse en un mapa topográfico de la función, como en
la figura 14.7. Esto inmediatamente nos indica que la dirección que debe tomarse
es
42 + 82 = 8.944
Observe que para cualquier otra dirección, digamos q = 1.107/2 = 0.5235, g′(0)
= 4 cos (0.5235) + 8 sen (0.5235) = 7.608, que es menor.
FIGURA 14.8
Un punto silla (x = a y y = b). Observe que al ser vista la curva a lo largo de las
direcciones x y y, parece que la función pasa por un mínimo (la segunda
derivada es positiva); mientras que al verse a lo largo del eje x = y, es cóncava
hacia abajo (la segunda derivada es negativa).
Ya sea que ocurra un máximo o un mínimo, esto involucra no sólo a las primeras
derivadas parciales con respecto a x y y, sino también a la segunda derivada
parcial respecto a x y y. Suponiendo que las derivadas parciales sean continuas
en y cerca del punto que se habrá de evaluar, se puede calcular la siguiente
cantidad:
Por otro lado, usted practicará con frecuencia la opción de calcular estas
cantidades internamente mediante procedimientos numéricos. En muchos
casos, el comportamiento será el adecuado y se evitará el problema de
numerosas derivaciones parciales. Tal podría ser el caso de los optimizadores
utilizados en ciertas hojas de cálculo y paquetes de software matemático (por
ejemplo, Excel). En dichos casos, quizá no se le dé la opción de introducir un
gradiente y un hessiano derivados en forma analítica. Sin embargo, para
problemas de tamaño pequeño o moderado esto no representa un gran
inconveniente.
Método de máxima inclinación
Una estrategia obvia para subir una colina sería determinar la pendiente máxima
en la posición inicial y después comenzar a caminar en esa dirección. Pero
claramente surge otro problema casi de inmediato. A menos que usted realmente
tenga suerte y empiece sobre una cuesta que apunte directamente a la cima, tan
pronto como se mueva su camino diverge en la dirección de ascenso con
máxima inclinación.
Por ahora, el método del ascenso con máxima inclinación usa el gradiente como
su elección para la “mejor” dirección. Se ha mostrado ya cómo se evalúa el
gradiente en el ejemplo 14.1. Ahora, antes de examinar cómo se construye el
algoritmo para localizar el máximo a lo largo de la dirección de máxima
inclinación, se debe hacer una pausa para explorar el modo de transformar una
función de x y y en una función de h a lo largo de la dirección del gradiente.
Comenzando en x0 y y0 las coordenadas de cualquier punto en la dirección del
gradiente se expresan como
Métodos avanzados del gradiente
Método de Newton.