Você está na página 1de 119

Notas sobre Cálculo

en varias variables
Version 1.0

Basadas en los libros:

APEX Calculus Version 3.0

Gregory Hartman y otros.


Department of Applied Mathematics
Virginia Military Institute

Matemáticas Empresariales
Marı́a Álvarez y Miguel Ángel Fortes
Departamento Matemática Aplicada
Universidad de Granada

Matemáticas para la
Economı́a
Josefa Garcı́a, Clotilde Martı́nez y Miguel L. Rodrı́guez
Departamento Matemática Aplicada
Universidad de Granada
Copyright c 2016 Miguel L. Rodrı́guez
Licencia pública bajo Creative Commons
Attribution-Noncommercial 4.0 International
Public License
Índice general

Tabla de contenidos III

Agradecimientos V

1. Funciones de varias variables 1


1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Lı́mites y continuidad de funciones de varias variables . . . 9
1.3. Derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . 24
1.4. Diferenciabilidad y la diferencial total . . . . . . . . . . . . 35
1.5. Regla de la cadena . . . . . . . . . . . . . . . . . . . . . . . 50
1.6. Derivada direccional . . . . . . . . . . . . . . . . . . . . . . 59

2. Optimización 69
2.1. Introducción a la optimización . . . . . . . . . . . . . . . . 69
2.2. Formulación de programas matemáticos . . . . . . . . . . . 70
2.3. Teorema de Weierstrass . . . . . . . . . . . . . . . . . . . . 73
2.4. El método gráfico . . . . . . . . . . . . . . . . . . . . . . . . 77
2.4.1. Condiciones de tangencia . . . . . . . . . . . . . . . 81
2.5. Introducción a los programas sin restricciones . . . . . . . . 84
2.6. Formulación de los programas sin restricciones . . . . . . . 85
2.7. Condición necesaria de primer orden de extremo local . . . 87
2.8. Condiciones de segundo orden . . . . . . . . . . . . . . . . . 90
2.9. Extremos globales . . . . . . . . . . . . . . . . . . . . . . . 93
2.9.1. Programas convexos . . . . . . . . . . . . . . . . . . 93
2.10. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
2.11. Método de sustitución . . . . . . . . . . . . . . . . . . . . . 100
2.12. Condiciones necesarias de extremo local . . . . . . . . . . . 103
2.13. Condiciones suficientes de extremo local . . . . . . . . . . . 107
2.13.1. Criterio de la hessiana orlada . . . . . . . . . . . . . 107
2.14. Condición suficiente de extremo global . . . . . . . . . . . . 110
Índice general

2.14.1. Convexidad . . . . . . . . . . . . . . . . . . . . . . . 111

Notas:

iv
Agradecimientos

Estas notas han sido elaboradas para impartir el módulo de “‘Cálculo


en varias variables” para los alumnos de la Universidad Pedagógica de
Mozambique, en Maputo, en el marco de un proyecto de cooperación con
la Universidad Complutense.
La inmensa parte de las notas han sido elaboradas basándome en los tres
manuales siguientes: Calculus, de Gregory Hartman y otros, Matemáticas
Empresariales, de Marı́a Álvarez y Miguel Ángel Fortes y Matemáticas
para la Economı́a, manual que escribı́ junto a Josefa Garcı́a y Clotilde
Martı́nez. Gracias a todos ellos por haberme facilitado el trabajo y poder
usar las fuentes originales de partes de su texto o el texto entero.
Doy las también gracias a los profesores Joaquı́n Jódar, de la Universidad
de Jaén y Ana Martı́n Caraballo de la Universidad Pablo de Olavide por
haberme facilitado ejercicios para completar estas notas.
Agradecer a Begoña Vitoriano, coordinadora del proyecto, que me haya
dado la oportunidad de impartir este módulo.
Y finalmente, agradecer a todos los que me ayudaron de una u otra forma
a realizar este trabajo y que no cabrı́an en tan pocas lı́neas, y sobre todo
a las personas que a diario hacen cosas por los demás desinteresadamente.
Estas notas son solo una primera versión. Espero que a la finalización de las
clases, con la ayuda de los alumnos, se puedan mejorar. Estoy convencido
de que tendré que aumentar esta sección.

Licencia Creative Commons


Estas notas estn disponible como un .pdf libre y gratuito y está protegido
por una licencia Creative Commons Atribucin - No comercial 4.0 de dere-
chos de autor. Esto significa que se puede distribuir el .pdf, imprimirlo en
cualquier forma, e incluso editar el contenido original y redistribuirlo. Si
hace esto ltimo, no se puede vender la obra editada por dinero y se debe
citar explı́citamente la obra Calculus de Gregory N. Hartman y otros.
1: Funciones de varias
variables
Una función de la forma y = f (x) es una función de una sola variable;
dado un valor de x, podemos encontrar un valor y. En las funciones de
varias variables que vamos a estudiar hay varias variables y la salida será
un número, aunque también puede ser un vector.
Hay muchas situaciones en las que una cantidad deseada es una función
de dos o más variables. Por ejemplo, la sensación térmica se mide por
conociendo la velocidad del viento y la temperatura; el volumen de un gas
se puede calcular conociendo la presión y la temperatura del gas, etc.
En este capı́tulo estudiamos funciones multivariadas, es decir, funcio-
nes donde hay más de una variable independiente.

1.1. Introducción

Definición 1 Función de dos variables


Consideremos D un subconjunto de R2 . Una función f de dos
variables es una aplicación que asigna a cada par (x, y) en D un
valor z = f (x, y) en R. Llamaremos a D dominio de f ; el conjunto
de todas las salidas de f es la imagen o rango de f .

Ejemplo 1 Evaluando funciones de dos variables


Sea z = f (x, y) = x2 − y. Evaluar f (1, 2), f (2, 1) y f (−2, 4). Encontrar el
dominio y el rango de f .

Solución Usando la definición f (x, y) = x2 − y, tenemos:

f (1, 2) = 12 − 2 = −1, f (2, 1) = 22 − 1 = 3, f (−2, 4) = (−2)2 − 4 = 0.

Como el dominio no se especifica, debemos considerar todas las parejas


posibles de R2 para las cuales f está definida. En este ejemplo f tiene
sentido para todos los pares (x, y) del plano. Por tanto, el dominio D de
f es R2 .
Capı́tulo 1 Funciones de varias variables

Puesto que para cualquier número real r, f (0, r) = r, deducimos que el


y
rango de f es R.
5
x2 y2
+ =1 Ejemplo 2
9 4 r Evaluando funciones de dos variables
x2 y2
x Sea f (x, y) = 1 − − . Encuentra el dominio y el rango de f .
−5 5
9 4

Solución El dominio son todos los pares (x, y) admisibles como en-
−5 trada para la función f . Debido a la raı́z, serán posibles todos aquellos
. (x, y) tales que:
Figura 1.1: Dominio de f (x, y) del
Ejemplo 2. x2 y2
0≤1− −
9 4
La ecuación anterior describe el interior de una elipse, como se muestra
en la Figura 1.1; en notación de conjuntos, podemos escribir

x2 y2
D = {(x, y) ∈ R2 | + ≤ 1}.
9 4
El rango es el conjunto de todos los posibles valores de salida. La raı́z
asegura que toda la salidas son ≥ 0. Podemos comprobar que el rango de
R es el intervalo [0, 1].

Gráficas de funciones de dos variables


El grafo de una función f de dos variables es el conjunto de todos los
(a) puntos de x, y, f (x, y) tales que (x, y) está en el dominio de f . Este
conjunto genera una superficie en el espacio.
Como puede verse en este ejemplo, en general una gráfica de superficie se
puede asemejar a un paisaje lleno de accidentes: cumbres, valles, puertos,
etc. Para poder identificar ciertas caracterı́sticas de las funciones de dos
variables debemos introducir el concepto de curvas de nivel.

Curvas de nivel
Puede ser sorprendente encontrar que el problema de representar una su-
perficie tridimensional en el papel es familiar para la mayorı́a de nosotros
pero simplemente no nos damos cuenta de ello. Los mapas topográficos,
como el que se muestra en la Figura 1.3, representan la superficie de la
Tierra. En ellos, es usual unir los puntos con la misma elevación mediante
(b) curvas de nivel.
Figura 1.2: Representación gráfica de
una función de dos variables.

Notas:

2
1.1 Introducción

Dada una función z = f (x, y), podemos dibujar un mapa topográfico de


f dibujando curvas de nivel. Una curva de nivel en z = c es una curva
en el plano tal que para todos los puntos (x, y) de la curva se tiene que
f (x, y) = c.
Ejemplo 3 r Curvas de nivel
x2 y2
Sea f (x, y) = 1− − . Dibuja varias curvas de nivel de f para
9 4
diferentes valores de c.

Solución Consideramos c = 0. La curva de q nivel para c = 0 es el


2
conjunto de todos los puntos de (x, y) tal que 0 = 1 − x9 − y4 , esto es,
2

Figura 1.3: Mapa topográfico.


x2 y2 Ejemplo tomado de la dirección web
+ = 1, http://topmaps.usgs.gove/drg/.
9 4
cuya gráfica es una elipse de centro (0, 0), eje horizontal de longitud 6 y eje y

vertical de longitud 4. Por lo tanto, cualquier punto (x, y) de esta curva c = 0.6
2
verifica que f (x, y) = 0.
1
Consideramos la curva de nivel para c = 0,2
c=1
r x
x2 y2 x2 y2 −3 −2 −1 1 2 3
0,2 = 1 − − ; 0,04 = 1 − −
9 4 9 4 −1
x2 y2 x2 y2
+ = 0,96; + = 1. −2
9 4 8,64 3,84 .
√ √ (a)
También es una elipse, donde a = 8,64 ≈ 2,94 y b = 3,84 ≈ 1,96. En
general, para z = c, la curva de nivel es:
r
x2 y2 x2 y2
c= 1− − ; c2 = 1 − −
9 4 9 4
x2 y2 x 2
y2
+ = 1 − c2 ; + = 1,
9 4 9(1 − c2 ) 4(1 − c2 )

que son elipses que disminuyen en tamaño conforme c aumenta. Un caso


particular se da para c = 1 para el cual la elipse se reduce al punto (0, 0).
Las curvas de nivel se muestran en la Figura 1.4(a). Nótese cómo las curvas
de nivel de c = 0 y c = 0,2 son muy próximas entre sı́: esto indica que f
crece rápidamente a lo largo de esas curvas.
En la Figura 1.4(b), se dibujan las curvas en un gráfico de f en el espacio. (b)
Podemos observar que las curvas están espaciadas uniformemente. A partir
Figura 1.4: Representación gráfica de
las curvas de nivel en el ejemplo3.

Notas:

3
Capı́tulo 1 Funciones de varias variables
y
c = 0.2 de las curvas de nivel de c = 0 y c = 0,2 observamos el crecimiento de f.
4
c = 0.4
2 Ejemplo 4 Análisis de curvas de nivel
x+y
x Dibuja varias curvas de nivel de la función f (x, y) = .
−5 5 x2 + y 2 + 1
−2

c=0 Solución De la expresión algebraica de la función deducimos que


−4
. x+y
. = c; x + y = c(x2 + y 2 + 1).
(a) x2 + y 2 + 1
Operando:
 2  2
1 1 1
x− + y− = 2 − 1,
2c 2c 2c
 p
que es un cı́rculo centrado en 1/(2c), 1/(2c) y radio 1/(2c2 ) − 1, donde
|c| ≤ √12 . Las curvas de nivel para c = ±0,2, ±0,4 y ±0,6 se esbozan en
la Figura 1.5(a). Para ayudar a ilustrar la “elevación ” hemos utilizado
lı́neas más gruesas para c valores cercanos a 0, y las lı́neas discontinuas
indican dónde c < 0 .
Hay una curva de nivel “especial”, que se obtiene para c = 0. La recta
(b) x + y = 0 es esa curva de nivel.
Las curvas de nivel nos ayudan a
comprender las gráficas de funciones.
En la Figura 1.5(b) observamos la gráfica de la superficie.

Figura 1.5: Curvas de nivel para el Funciones de tres variables


Ejemplo 4. Extendemos nuestro estudio de funciones de varias variables a las funcio-
nes de tres variables. Obviamente podemos hacer una función de tantas
variables como deseemos puesto que el funcionamiento y los conceptos no
tienen cambios significativos para las funciones de dos variables en ade-
lante. Para este curso limitamos nuestro estudio a funciones de dos y tres
variables.

Definición 2 Funciones de tres variables


Sea D un subconjunto de R3 . Un función f de tres variables es
una regla que asigna a cada punto del espacio (x, y, z) ∈ D un valor
w = f (x, y, z) en R. Llamaremos a D dominio de f y al conjunto
formado por todas las imagenes de f se demonima conjunto imagen
o rango.

Notas:

4
1.1 Introducción

Nótese cómo esta definición es similar a la Definición 1.

Ejemplo 5 Comprensión de una función de tres variables


x2 + z + 3 sin y
Sea f (x, y, z) = . Evaluar f en el punto (3, 0, 2) y encontrar
x + 2y − z
el dominio y el rango de f .

32 + 2 + 3 sin 0 2
Solución f (3, 0, 2) = = .
3 + 2(0) 11
Como no se especifica el dominio de f , lo tomamos como el conjunto de
todas las ternas (x, y, z) para las cuales f (x, y, z) está definida. Ya que no
podemos dividir por 0, nos encontramos con el dominio D es el conjunto

D = {(x, y, z) ∈ R3 : x + 2y − z 6= 0}.

El conjunto de todos los puntos de R3 que no pertenecen a D es un plano


en el espacio que pasa por el origen y tiene como vector normal h1, 2, −1i).
El rango de la función es R, es decir, todos los números reales son posibles
valores de f . No hay un método claro para establecer este conjunto.

Funciones de varias variables

Generalizamos las definiciones realizadas hasta ahora.

Definición 3 Llamamos función real de varias variables


reales a una aplicación f : D ⊂ Rn −→ R que a cada n
valores reales (x1 , x2 , . . . , xn ) ∈ D les asigna un valor real.
Esto es:
f: D ⊂ Rn −→ R
x = (x1 , x2 , . . . , xn ) 7−→ f (x) = f (x1 , x2 , . . . , xn )

Llamaremos
. Dominio de f , y lo representaremos por Dom(f ), al conjunto D.
. Imagen de (x1 , x2 , . . . , xn ) ∈ D al número real f (x1 , x2 , . . . , xn ).

Notas:

5
Capı́tulo 1 Funciones de varias variables

. Dominio maximal de f , y lo representaremos por Dommax (f ), al


mayor de los subconjuntos de Rn en el que tiene sentido considerar
la función f .
Sean f, g : D ⊂ Rn −→ R dos funciones reales de varias variables reales.
Se define:
. Función suma de f y g como la función (f + g) : D → R definida
por (f + g)(x) = f (x) + g(x).
. Función producto de f y g como la función (f g) : D → R definida
por (f g)(x) = f (x)g(x).
. Función producto de un número real λ por f como la función (λf ) :
D → R definida por (λf )(x) = λf (x).
 
f f
. Función cociente de f y g como la función definida por (x) =
g g
f (x)
. Esta función está definida en D − {x ∈ Rn : g(x) 6= 0}.
g(x)
Superficies de nivel

Es difı́cil ”visualizar” un gráfico significativo de una función de tres varia-


bles. Una función deuna variable es uncurva en 2 dimensiones; una función
de dos variables es una superficie en 3 dimensiones; una función detres
variables es una hipersuperficie en 4 dimensiones. Hay algunas técnicas
que se pueden emplear para tratar la “imagen” en un gráfico de tres va-
riables. Una de ellas es análoga a la de las curvas de nivel y se denominan
superficies de nivel. Dada w = f (x, y, z), la superficie de nivel en w = c
es la superficie en el espacio formada por todos los puntos (x, y, z) donde
f (x, y, z) = c.

Ejemplo 6 Superficies de nivel


Si una fuente puntual S está irradiando energı́a, la intensidad I en un
punto dado P en el espacio es inversamente proporcional al cuadrado de
la distancia entre S y P . Es decir, cuando S = (0, 0, 0), para alguna
constante k se tiene que

k
I(x, y, z) = .
x2 + y 2 + z 2

Si k = 1, hallar las superficies de nivel de I.

Notas:

6
1.1 Introducción

Solución Podemos responder utilizando el siguiente argumento: si


c r
la energı́a en forma de luz está emanando desde el origen, su intensidad 16. 0.25
será la misma en todos los puntos equidistantes del origen. Por tanto en 8. 0.35
cualquier punto de la superficie de una esfera centrada en el origen, la 4. 0.5
intensidad debe ser la misma. Ası́, las superficies de nivel son esferas. 2. 0.71
1. 1.
Lo resolvemos analı́ticamente. La superficie de nivel I = c se define como
0.5 1.41
1 1 0.25 2.
c= x2 + y 2 + z 2 = . 0.125 2.83
x2 + y2 + z2 c
0.0625 4.
Ası́, dada una intensidad c, la superficie de nivel I = c es una esfera de
1 Figura 1.6: Tabla de valores de c y su
radio √ , centrada en el origen. correspondiente radio r de las esferas
c
de valor constante en el ejemplo 6.
La Figura 1.6 muestra una tabla de los radios de las esferas de valores
dado c.
Nótese cómo cada vez que la intensidad se reduce a la mitad, la distancia
necesaria para alejarse crece. Llegamos a la conclusión de que cuanto más
cerca está de la fuente, más rápidamente cambia la intensidad.

En la siguiente sección se aplican los conceptos de lı́mite de funciones de


dos o más variables.

Notas:

7
Ejercicios 1.1
Términos y conceptos 15. f (x, y) = 3x − 2y; c = −2, 0, 2

1. Indica dos ejemplos de situaciones del “mundo real” que 16. f (x, y) = x2 − y 2 ; c = −1, 0, 1
estén expresadas mediante funciones multivariables.
17. f (x, y) = x − y 2 ; c = −2, 0, 2
2. La gráfica de una función de dos variables es una
. 1 − x2 − y 2
18. f (x, y) = ; c = −2, 0, 2
2y − 2x
3. Las curvas de nivel son conocidas por un gran número
de personas que utilizan los mapas . 2x − 2y
19. f (x, y) = ; c = −1, 0, 1
x2 + y 2 + 1
4. T/F: En una curva de nivel, el valor de la función no
varı́a . y − x3 − 1
20. f (x, y) = ; c = −3, −1, 0, 1, 3
x
5. El concepto análogo a curvas de nivel para funciones en
p
tres dimensiones se denomina de nivel. 21. f (x, y) = x2 + 4y 2 ; c = 1, 2, 3, 4

6. ¿Qué significa el que dos curvas de nivel estén cercanas? 22. f (x, y) = x2 + 4y 2 ; c = 1, 2, 3, 4
¿y alejadas?

En los ejercicios 23 – 26, calcular el dominio y la imagen


de las siguientes funciones de tres variables.
Problemas
x
23. f (x, y, z) =
x + 2y − 4z
Para los ejercicios 7 – 14, calcular el dominio y la ima-
gen de las funciones maultivariadas dadas.
1
24. f (x, y, z) =
2 2 1 − x2 − y 2 − z 2
7. f (x, y) = x + y + 2
p
25. f (x, y, z) = z − x2 + y 2
8. f (x, y) = x + 2y

26. f (x, y, z) = z 2 sin x cos y


9. f (x, y) = x − 2y

En los ejercicios 27 – 30, describeir las superficies de


1
10. f (x, y) = nivel de las siguientes fucniones.
x + 2y

1 27. f (x, y, z) = x2 + y 2 + z 2
11. f (x, y) = 2
x + y2 + 1
28. f (x, y, z) = z − x2 + y 2
12. f (x, y) = sin x cos y
x2 + y 2
29. f (x, y, z) =
13. f (x, y) =
p
9 − x2 − y 2 z

z
1 30. f (x, y, z) =
14. f (x, y) = p x−y
x + y2 − 9
2

31. Comparar las curvas de nivel de los Ejercicios 21 y 22.


En los ejercicios 15 – 22, describir y esbozar un esque- Cada surperficie es cuaádrica; describe cómo son las cur-
ma de las curvas de nivel de las funciones dadas para vas de nivel con lo que sabes acerca de este tipo de
diferentes valores de c. superficies.

8
1.2 Lı́mites y continuidad de funciones de varias variables

1.2. Lı́mites y continuidad de funciones de


y
varias variables P1

Después de definir un nuevo tipo de función, aplicamos las ideas de cálculo


a la misma. En la sección anterior hemos definido funciones de dos y tres P2
variables; en esta sección estudiaremos lo que significa que estas funciones
sean “continuas”.
Comenzamos con una serie de definiciones. Sabemos de los “intervalos
x
abiertos,” tales como (1, 3), que representa el conjunto de todos los x tales
que 1 < x < 3, e “intervalos cerrados,” tales como [1, 3], lo que representa .
el conjunto de todos los x tales que 1 ≤ x ≤ 3. Necesitamos definiciones (a)
análogas para los conjuntos abiertos y cerrados en el plano. y

P1

Definición 4 Topologı́a en R2
Un disco abierto B en R2 centrado en (x0 , y0 ) y radio P2

r es el conjunto de todos los puntos de (x, y) tales que


p
(x − x0 )2 + (y − y0 )2 < r.
x
Sea S un conjunto de puntos en R2 . Un punto P en R2 es un
punto frontera de S si todos los discos abiertos centrados en P .
(b)
contienen puntos en S y puntos que no están en S. AL conjunto
de todos los puntos fronteras lo denominamos frontera de S. y

P1
Un punto P en S es un punto interior de S si existe un
disco abierto centrado a P que contiene sólo puntos de S.
P2
S es abierto si cada punto en S es un punto interior.

S es cerrado si contiene a todos sus puntos frontera.


x
S es acotado si existe M > 0 de tal manera que el disco
.
abierto, centrado en el origen de radio M , contiene S. Un (c)
conjunto que no está acotado es no acotado.

La Figura 1.7 muestra varios conjuntos en el plano. La lı́nea continua in- Figura 1.7: Conjuntos abiertos y ce-
dica que los puntos frontera pertenecen al conjunto y la linea discontinua rrados en el plano.
indica que la frontera no pertenece al conjunto. Para el conjunto repre-
sentado en (a), observamos que P1 pertenece a la frontera del conjunto ya
que todos los discos abiertos centrados en él contienen puntos que perte-

Notas:

9
Capı́tulo 1 Funciones de varias variables

necen al conjunto S y puntos que no. Por el contrario, el punto P2 es un


punto interior porque podemos encontrar un disco abierto centrado en él
que está en su totalidad contenido dentro del conjunto.
También podemos observar que conjunto representado en la Figura 1.7(a)
es un conjunto cerrado, ya que contiene todos sus puntos frontera. El con-
junto representado en (b) es abierto, ya que todos sus puntos son interiores
(o, equivalentemente, no contiene ninguno de sus puntos de frontera). El
conjunto representado en (c) no es ni abierto ni cerrado, ya que contiene
y algunos de sus puntos frontera.
Ejemplo 7 Clasificación de conjuntos q
x2 y2
Determinar si el dominio de la función f (x, y) = 1 − 9 − 4 es abierto,
cerrado o no, y si está acotado.
x

Solución El dominio de esta función lo estudiamos en el Ejemplo


x2 y2
2 y era D = {(x, y) ∈ R2 | + ≤ 1}. Dado que la región incluye
9 4
. la frontera (ya que contiene el signo -”), el conjunto contiene todos sus
puntos frontera y por lo tanto es cerrado. La región está acotada por un
Figura 1.8: Esbozo del dominio en el
Ejemplo 8.
disco de radio 4, centrado en el origen y, por tanto, es acotada.

Ejemplo 8 Clasificación de conjuntos


1
Estudiar topológicamente el dominio de f (x, y) = .
x−y

Solución Como no podemos dividir por 0,

D = {(x, y) ∈ R2 | x − y 6= 0}.

En otras palabras, el dominio es el conjunto de todos los puntos (x, y) que


no pertenecen a la recta y = x.
El dominio se esboza en la Figura 1.8. Observamos cómo podemos con-
seguir un disco abierto alrededor de cualquier punto del conjunto que se
encuentre en su totalidad dentro del propio conjunto. Podemos observar
también que los únicos puntos frontera del dominio son los puntos de la
recta y = x. Ası́, el dominio es un conjunto abierto. Además el conjunto
está acotado.

Notas:

10
1.2 Lı́mites y continuidad de funciones de varias variables

Lı́mites

Recordemos la aproximación al concepto de lı́mite en un punto para fun-


ciones de una variable: lı́m f (x) = L significa que si x está ‘cerca”de c,
x→c
entonces f (x) está ”cerca de L”. Una aproximación análoga es válida para
funciones de dos variables:

lı́m f (x, y) = L
(x,y)→(x0 ,y0 )

significa “si el punto (x, y) es realmente cerca del punto (x0 , y0 ), entonces
f (x, y) está cerca de L.” Damos a continuación la definición formal.

Definición 5 Lı́mite de una función de dos variables


Sea S un conjunto abierto que contiene a (x0 , y0 ), y sea f una función de dos variables
definidas en S, excepto quizás en (x0 , y0 ). Diremos que el lı́mite de la función f en el
punto (x0 , y0 ) es L, y lo notaremos por

lı́m f (x, y) = L,
(x,y)→(x0 ,y0 )

p
si ∀ > 0, ∃δ > 0 tal que si (x, y) ∈ S, (x − x0 )2 + (y − y0 )2 < δ, entonces |f (x, y)−L| <
.

Definición 6 Lı́mite de una función de dos variables (II)


Sea S un conjunto abierto que contiene a (x0 , y0 ), y sea f una función de dos variables
definidas en S, excepto quizás en (x0 , y0 ). Diremos que el lı́mite de la función f en el
punto (x0 , y0 ) es +∞, y lo notaremos por

lı́m f (x, y) = +∞,


(x,y)→(x0 ,y0 )

p
si ∀K > 0 ∃ δ > 0 tal que si (x, y) ∈ S, (x − x0 )2 + (y − y0 )2 < δ, entonces f (x, y) > K.

Notas:

11
Capı́tulo 1 Funciones de varias variables

Definición 7 Lı́mite de una función de dos variables


(III)
Sea S un conjunto abierto que contiene a (x0 , y0 ), y sea f una
función de dos variables definidas en S, excepto quizás en (x0 , y0 ).
Diremos que el lı́mite de la función f en el punto (x0 , y0 ) es −∞,
y lo notaremos por

lı́m f (x, y) = −∞,


(x,y)→(x0 ,y0 )

p
si ∀k < 0, ∃ δ > 0 tal que si (x, y) ∈ S, (x − x0 )2 + (y − y0 )2 < δ,
entonces f (x, y) < k.

La Definición 5 la “visualizamos” en la Figura 1.9. Dado  > 0, encontrar


δ > 0 tal que si (x, y) es cualquier punto en el disco abierto centrado en
(x0 , y0 ) en el plano con radio δ, entonces f (x, y) debe distar de L menos
que . El siguiente resultado nos permite evaluar lı́mites más fácilmente.

Teorema 1 Propiedades de lı́mites


Sean b, x0 , y0 , L, KR y n ∈ N. Sean f, g funciones con lı́mites:

lı́m f (x, y) = L y lı́m g(x, y) = K.


(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )

Entonces se verifica que:


1. Constantes: lı́m b=b
(x,y)→(x0 ,y0 )
2. Identidad lı́m x = x0 ; lı́m y = y0
(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )

3. Sumas: lı́m f (x, y) ± g(x, y) = L ± K
(x,y)→(x0 ,y0 )
Figura 1.9: Ilustración de la defi- 4. Multiplicación por escalar: lı́m b · f (x, y) = bL
(x,y)→(x0 ,y0 )
nición de lı́mite.
5. Productos: lı́m f (x, y) · g(x, y) = LK
(x,y)→(x0 ,y0 )
f (x, y)
6. Cocientes: lı́m = L/K, (K 6= 0)
(x,y)→(x0 ,y0 ) g(x, y)
7. Potenciación: lı́m f (x, y) = Ln
n
(x,y)→(x0 ,y0 )

Notas:

12
1.2 Lı́mites y continuidad de funciones de varias variables

Criterios para el cálculo de lı́mites

Sea f : D ⊂ R2 −→ R una función real de dos variables reales y a =


(a1 , a2 ) ∈ Ac(D).
Definimos:
Lı́mites reiterados de f en el punto a como:
   
lı́m lı́m f (x, y) y lı́m lı́m f (x, y) .
x−→a1 y−→a2 y−→a2 x−→a1

Lı́mites direccionales (según rectas) de f en a:


La ecuación de las rectas que pasan por el punto a = (a1 , a2 ) es:

y − a2 = m(x − a1 ).

Los lı́mites direccionales (según rectas) son de la forma

lı́m f (x, y) = lı́m f (x, a2 + m(x − a1 )).


x−→a1
(x, y) −→ (a1 , a2 )
y − a2 = m(x − a1 )

Lı́mites direccionales (según otras curvas) de f en a:

lı́m f (x, y) = lı́m f (x, λ xn ).


x−→a1
(x, y) −→ (a1 , a2 )
n
y = λx

Nota:
Si los dos lı́mites reiterados existen y son distintos, entonces el lı́mite
global lı́mx→a f (x) no existe.
Si dos lı́mites direccionales por direcciones distintas existen y no
coinciden, entonces el lı́mite global no existe.
Si algún lı́mite reiterado es distinto de algún lı́mite direccional, en-
tonces el lı́mite global no existe.
Sin embargo, el que no se verifique alguna de las situaciones des-
critas en los puntos anteriores no asegura que exista lı́m f (x). Por
x−→a
ejemplo, pueden existir y coincidir los lı́mites reiterados y no existir
lı́m f (x). También puede suceder que exista lı́m f (x) y no exista
x−→a x−→a
alguno de los lı́mites reiterados (o ninguno de ellos).

Notas:

13
Capı́tulo 1 Funciones de varias variables

Lo que sı́ sucede es que si algún lı́mite direccional o reiterado existe


y vale l, entonces, el lı́mite global, si existe, también vale l.
Ejemplo 9 Evaluando lı́mites
Evaluar los siguientes lı́mites:
y 3xy
1. lı́m + cos(xy) 2. lı́m
(x,y)→(1,π) x (x,y)→(0,0) x2 + y 2

Solución
y
1. Los teoremas mencionados nos permiten evaluar + cos(x) cuando
x
x = 1 y y = π. Si al calcular un lı́mite obtenemos una indetermina-
ción, tenemos que hacer más trabajo para evaluar el lı́mite; de otro
modo, el resultado es, directamente, el lı́mite. Por lo tanto
y π
lı́m + cos(xy) = + cos π = π − 1.
(x,y)→(1,π) x 1

2. Al sustituir por 0 x e y, obtenemos una indeterminación del tipo


“0/0. ” Para resolver este lı́mite, debemos desarrollar algunos con-
ceptos más.
Cuando se trataba de funciones de una sola variable, también se conside-
raban los lı́mites laterales:

lı́m f (x) = L si, y solo si, lı́m f (x) = L y lı́m f (x) = L.


x→c x→c+ x→c−

Es decir, el lı́mite es de L si y sólo si f (x) se aproxima a L cuando x


aproxima a c bien la por la izquierda o por la derecha.
En el caso del plano, hay infinitas direcciones para acercarnos (x0 , y0 ).
De hecho, no debemos limitarnos a una dirección en particular, e inclu-
so podemos aproximarnos a (x0 , y0 ) a lo largo de un camino que no es
una recta recta. De esta forma, serı́a posible obtener a diferentes valores
mediante estas aproximaciones a (x0 , y0 ). Si esto sucediera, diremos que
lı́m f (x, y) no existe. Esto es análogo a cuando los lı́mites por la
(x,y)→(x0 ,y0 )
izquierda y por la derecha en funciones de una variable funciones no eran
iguales.
Los resultados establecidos indican que podemos evaluar la mayorı́a de
lı́mites de forma simple, sin tener que preocuparnos acerca del camino
elegido. Cuando surgen indeterminaciones, puede, o no, existir el lı́mite.
Si existe, puede ser difı́cil probar la existencia de lı́mite ya que tenemos

Notas:

14
1.2 Lı́mites y continuidad de funciones de varias variables

que demostrar que el mismo valor lı́mite se obtiene independientemente


del camino elegido. El caso en el que no existe el lı́mite es más sencillo de
tratar, ya que con un poco de práctica se pueden escoger dos caminos en
los que el lı́mite es diferente.

Ejemplo 10 Ejemplo de no existencia de lı́mite

3xy
1. Probar que lı́m no existe estudiando los lı́mites a lo
(x,y)→(0,0) x2 + y 2
largo de y = mx.
sin(xy)
2. Probar que lı́m no existe estudiando los lı́mites a lo
x+y
(x,y)→(0,0)
largo del camino y = − sin x.

Solución
3xy
Evaluar lı́m a lo largo de y = mx significa sustituir y por
x2 + y 2
(x,y)→(0,0)
mx y evaluar el lı́mite:
3x(mx) 3mx2 3m 3m
lı́m = lı́m = lı́m 2 = 2 .
(x,mx)→(0,0) x2 + (mx)2 x→0 x2 (m2 + 1) x→0 m + 1 m +1
El lı́mite existe para cada elección de m, pero es diferente para cada valor
de m. Es decir, a lo largo de diferentes rectas obtenemos diferentes valores
lı́mite, y por tanto, no existe el lı́mite.
sin(xy)
Sea f (x, y) = . Hemos de demostrar que lı́m f (x, y) no existe
x+y (x,y)→(0,0)
encontrando el lı́mite a lo largo de la recta y = − sin x. En primer lugar
calculamos el lı́mite a lo largo de las rectas de y = mx como antes,

sin x(mx) sin(mx2 ) sin(mx2 ) 1
lı́m = lı́m = lı́m · .
(x,mx)→(0,0) x + mx x→0 x(m + 1) x→0 x m+1
Mediante la regla de L’Hôpital, se prueba que este lı́mite es 0 excepto
cuando m = −1, es decir, en la recta y = −x. Como esta recta no está en
el dominio de f , hemos encontrado que a lo largo de cada recta y = mx
en el dominio de f , lı́m f (x, y) = 0.
(x,y)→(0,0)

Consideremos ahora el lı́mite a lo largo del camino y = − sin x:


 
sin − x sin x sin − x sin x
lı́m = lı́m
(x,− sin x)→(0,0) x − sin x x→0 x − sin x

Notas:

15
Capı́tulo 1 Funciones de varias variables

Aplicando la regla de L’Hôpital dos veces



cos − x sin x (− sin x − x cos x)
= lı́m (“ = 0/0”)
x→0 1 − cos x
− sin − x sin x (− sin x − x cos x)2 + cos − x sin x (−2 cos x + x sin x)
 
= lı́m
x→0 sin x
= “2/0” ⇒ el lı́mite no existe.

Recapitulamos lo que acabamos de demostrar. A lo largo de cualquier


recta y = mx en el dominio de f (x, y), el lı́mite es de 0. Sin embargo, a
lo largo del camino y = − sin x, que se encuentra en el dominio de f (x, y)
con x 6= 0, no existe el lı́mite. Dado que el lı́mite no es el mismo a lo largo
sin(xy)
de todos los caminos que van a (0, 0), lı́m no existe.
(x,y)→(0,0) x + y

Ejemplo 11 Cálculo de lı́mites


5x2 y 2
Sea f (x, y) = 2 . Calcular lı́m f (x, y).
x + y2 (x,y)→(0,0)

Solución Es relativamente fácil demostrar que a lo largo de cualquier


recta y = mx, el lı́mite es de 0.
Esto no es suficiente para probar que el lı́mite existe, como se ha demos-
trado en el ejemplo anterior, pero nos indica que si existe el lı́mite entonces
debe ser 0.
Para probar el lı́mite es 0, aplicamos
p la Definición 5. Sea  > 0. Queremos
encontrar δ > 0 tal que si (x − 0)2 + (y − 0)2 < δ, entonces |f (x, y) −
0| < .
5y 2

p
Sea δ < /5. Tenemos en cuenta que 2 < 5 para todos (x, y) 6=
p x + y2 p
(0, 0), y que si x2 + y 2 < δ, entonces x2 < δ 2 . Sea (x − 0)2 + (y − 0)2 =
p
x2 + y 2 < δ, entonces:

5x2 y 2 5y 2

2 
|f (x, y) − 0| = 2

2
− 0 = x · 2

2
< δ 2 · 5 < · 5 = .
x +y x +y 5
p
Ası́, si (x − 0)2 + (y − 0)2 < δ → |f (x, y) − 0| < , que es lo que
5x2 y 2
querı́amos demostrar. Ası́ lı́m = 0.
(x,y)→(0,0) x2 + y 2

Notas:

16
1.2 Lı́mites y continuidad de funciones de varias variables

Paso a coordenadas polares.


Los anteriores tipos de lı́mites sirven para indicarnos cuando un lı́mite de
una función en un punto no existe (se dará cuando, existiendo lı́mites por
dos subconjuntos, los lı́mites sean distintos). Sin embargo, si estos lı́mites
especiales existen y coinciden, no podemos asegurar que nuestro lı́mite
exista, pues tendrı́amos que hacerlo también por los infinitos caminos que
hay en R2 para llegar al punto.
Un método que sı́ nos permitirá tanto afirmar como negar la existencia de
lı́mite de una función en un punto será el paso a coordenadas polares (dada
la correspondencia biunı́voca entre coordenadas cartesianas y polares) y,
además, nos convertirá nuestro lı́mite de una función de dos variables en
un lı́mite en una variable:
Ası́, el cambio a coordenadas polares dado por:

x = x0 + ρ cos θ
y = y0 + ρ sin θ
convierte
lı́m f (x, y)
(x,y)→(x0 ,y0 )

en
lı́m F (ρ, θ),
ρ→0

de manera que si este último lı́mite no depende del ángulo θ con el que
nos acerquemos al punto, dicho lı́mite y, por tanto, el original, existirá; en
caso contrario, no existirá.
Ejemplo 12 Cálculo de lı́mites
x2 y 2
Calcular, si existe, lı́m
(x,y)→(x0 ,y0 ) (x2 + y 2 )3/2

Solución

x2 y 2
 
x = 0 + ρ cos θ = ρ cos θ
lı́m =
(x,y)→(x0 ,y0 ) (x + y 2 )3/2
2 y = 0 + ρ sin θ = ρ sin θ
ρ2 cos2 θρ2 sin2 θ
= lı́m = lı́m ρ cos2 θ sin2 θ = 0.
ρ→0 ρ3 ρ→0

Ejemplo 13 Cálculo de lı́mites


x2 + y 3
Calcular, si existe, lı́m
(x,y)→(0,0) x2 + y 2

Notas:

17
Capı́tulo 1 Funciones de varias variables

Solución
x2 + y 3
 
x = 0 + ρ cos θ = ρ cos θ
lı́m =
(x,y)→(0,0) x2 + y 2 y = 0 + ρ sin θ = ρ sin θ
ρ2 cos2 θ + ρ3 sin3 θ
= lı́m
ρ→0 ρ2
= lı́m [cos θ + ρ sin3 θ] = cos2 θ
2
ρ→0

x2 + y 3
con lo cual no existe lı́m pues depende del ángulo θ con que
(x,y)→(0,0) x2 + y 2
nos acerquemos al punto.
Por tanto, el paso a coordenadas polares será uno de los métodos más
efectivos para calcular lı́mites.
Observaciones:
1. Se puede trasladar el estudio del lı́mite en un punto (x0 , y0 ) al origen
(0, 0) sin más que hacer una traslación de ejes (cambio de variables):
 0 
x = x − x0
lı́m f (x, y) = = 0 lı́m f (x0 , y 0 )
(x,y)→(x0 ,y0 ) y 0 = y − y0 (x ,y 0 )→(0,0)

2. Las propiedades de lı́mites de funciones escalares de dos variables


son, en su mayorı́a, análogas a las de funciones escalares de una sola
variable, ya conocidas. Ası́mismo, también algunas técnicas emplea-
das en el cálculo de una variable se extienden a dos variables, como
es el caso de los infinitésimos equivalentes:
x3 sin(y 2 − 4)
lı́m =[como sin x ∼ x cuando x → 0 en-
(x,y)→(0,−2) (y + 2) sin x
tonces sin(y 2 − 4) ∼ (y 2 − 4) cuando y → −2; análogamente
sin x ∼ x pues x → 0.] Por tanto,
x3 (y 2 − 4)
lı́m = lı́m x2 (y − 2) = 0.
(x,y)→(0,−2) (y + 2)x (x,y)→(0,−2)

(1 − cos xy) sin x 2


lı́m =[como 1 − cos x ∼ x2 cuando x →
(x,y)→(0,0) x2 + y 2
2
0 entonces 1 − cos(xy) ∼ (xy)2 cuando (x, y) → (0, 0); análoga-
mente sin x ∼ x pues x → 0]. Por tanto,

(xy)2
2 x x3 y 2
lı́m = lı́m = 0.
(x,y)→(0,0) x + y 2
2 (x,y)→(0,0) 2(x2 + y 2 )

Notas:

18
1.2 Lı́mites y continuidad de funciones de varias variables

Continuidad

Ya hemos estudiado lo que significa el ser continua para una función de


una variable. Indicábamos que la gráfica de la función no debı́a tener,
agujeros, saltos, etc.
Definimos la continuidad de funciones de dos variables de una manera
similar a como lo hicimos para funciones de una variable.

Definición 8 Continuidad
Sea una función f (x, y) definida en un disco B abierto que contiene
el punto (x0 , y0 ). Diremos que
1. f es continua en (x0 , y0 ) si lı́m f (x, y) = f (x0 , y0 ).
(x,y)→(x0 ,y0 )
2. f es continua en B si f es continua en todos los puntos en
B. Si f es continua en todos los puntos de R2 , decimos que f
es continua.

Ejemplo 14 ( Continuidad de una función de dos variables


cos y sin x
si x 6= 0
Sea f (x, y) = x . Estudiar si f continua en (0, 0) y
cos y si x = 0
si lo es f en su dominio.

Solución Para determinar si f es continua en (0, 0), tenemos que


comparar lı́m f (x, y) con f (0, 0). Por la definición de f , vemos que
(x,y)→(0,0)
f (0, 0) = cos 0 = 1. Ahora consideramos el lı́mite de lı́m f (x, y).
(x,y)→(0,0)
Sustituyendo 0 de x y y en cos yxsin x obtenemos una indeterminación del
tipo ”0/0 ”, por lo que tenemos que operar más para evaluar este lı́mite.
Consideramos los siguientes dos lı́mites relacionados:

sin x
lı́m cos y lı́m .
(x,y)→(0,0) (x,y)→(0,0) x

El primero no depende de x, y como cos y es una función continua,

lı́m cos y = lı́m cos y = cos 0 = 1.


(x,y)→(0,0) y→0

Notas:

19
Capı́tulo 1 Funciones de varias variables

El segundo lı́mite no depende de y y su valor es 1. Ası́:


sin x sin x
lı́m = lı́m = 1.
(x,y)→(0,0) x x→0 x
Por último, el Teorema 1 de esta sección establece que podemos combinar
ambos lı́mites:
 
cos y sin x sin x
lı́m = lı́m (cos y)
(x,y)→(0,0) x (x,y)→(0,0) x
  
sin x
= lı́m cos y lı́m = 1.
(x,y)→(0,0) (x,y)→(0,0) x

cos y sin x
Figura 1.10: Gráfica de f (x, y) en el
Ası́ pues lı́m = f (0, 0), por lo que f es continua a (0, 0).
(x,y)→(0,0) x
Ejemplo 14.
Un análisis similar muestra que f es continua en todos los puntos de
R2 . Si x 6= 0, podemos evaluar el lı́mite directamente y si x = 0, un
análisis similar indica que el lı́mite es de cos y. Por tanto f es continua en
R2 . La gráfica de f se observa en la Figura 1.10. El siguiente resultado
proporciona formas de combinar las funciones continuas para crear otras
funciones continuas.

Teorema 2 Propiedades de las funciones continuas


Sean f y g sean continuas en un disco abierto B, c un número real,
y sea n un entero positivo. Las siguientes funciones son continuas
en B donde tengan sentido.
1. Suma: f ±g
2. Multiplicación por ctes.: c·f
3. Producto: f ·g
4. Cociente: f /g (si g 6= 0 en B)
n
5. Potenciación: f

n
6. Radicación: f
(si n es par entonces f ≥ 0 on B; si n es impar, entonces es
verdadero para todos los valores de f en B.)
7. Composición: g ◦ f = g(f (x, y))
Para que tenga sentido f debe ser continua en B y J, imagen de
f, debe estar contenida en B; además g debe ser continua en J y
g ◦ f será continua en B.

Notas:

20
1.2 Lı́mites y continuidad de funciones de varias variables

Ejemplo 15 Continuidad de funciones


Sea f (x, y) = sin(x2 cos y). Probar que f es continua.

Solución Vamos a aplicar el Teorema 2. Sea f1 (x, y) = x2 . Como


esta función no depende de y y las funciones polinómicas son continuas,
f1 es continua. De forma similar obtenemos la continuidad de f2 (x, y).
El apartado 3 del teorema 2 asegura que F3 = f1 · f2 es continua y el
apartado 7 asegura que la composición del seno con F3 es continua: es
decir, sin(F3 ) = sin(x2 cosy) es continua.

Ejemplo 16 Estudiar la continuidad de la función

√ xy
(
si (x, y) 6= (0, 0)
f (x, y) = x2 +y 2
0 si (x, y) = (0, 0)
en todos los puntos de su dominio.

Solución El dominio en que está definida la función es todo R2 con


lo cual estudiamos la continuidad de f en todo punto.
1. Si (x0 , y0 ) 6= (0, 0): Alrededor de (a, b) podemos encontrar un en-
torno que no incluya al (0, 0) y, en consecuencia, en todo él, f (x, y) =
xy
p , que es una función continua en todo dicho entorno de
x2 + y 2
(x0 , y0 ) por ser cociente y composición de funciones continuas con
denominador distinto de cero. Por tanto f será continua en (x0 , y0 ).
2. Si (x0 , y0 ) = (0, 0) no existe ningún tal entorno, con lo cual recu-
rrimos a la definición. Como (0, 0) es un punto de acumulación de
f (D = R2 y, por tanto, D0 = R2 ), lo que habremos de comprobar
será:
a) existe f (0, 0) = 0
b) existe lı́m (x, y) :
(x,y)→(0,0)

xy ρ cos θρ sin θ
lı́m (x, y) lı́m p = lı́m = 0.
(x,y)→(0,0) (x,y)→(0,0) x2 + y2 ρ→0 ρ

c) lı́m (x, y) = f (0, 0), que por los dos apartados anteriores
(x,y)→(0,0)
es cierto. Ası́, tenemos también que f es continua en (0, 0).

Notas:

21
Capı́tulo 1 Funciones de varias variables

En conclusión: f es continua en todo su dominio de definición, R2 .

Funciones de tres variables

Las definiciones y teoremas dados se pueden extender de forma natural


a las resultados análogos para funciones de tres (o más) variables. Sus
análogos a varias dimensiones no son complicados de extender.

Definición 9 Bolas abiertas, lı́mite, continuidad


1. Una bola abierta en R3 centrada en (x0 , y0 , z0 ) de radio r
3
p el conjunto de todos los puntos (x, y, z) ∈ R tales que
es
(x − x0 )2 + (y − y0 )2 + (z − z0 )2 < r.
2. Sea D un conjunto abierto en R3 que contiene a (x0 , y0 , z0 ), y sea
f (x, y, z) una función de tres variables definida en D, salvo quizás
en (x0 , y0 , z0 ). Diremos que el lı́mite de f (x, y, z) cuando (x, y, z)
tiende a (x0 , y0 , z0 ) es L, y lo denotamos

lı́m f (x, y, z) = L,
(x,y,z)→(x0 ,y0 ,z0 )

si para todo  > 0, existe δ > 0 tal que si (x, y, z) 6= (x0 , y0 , z0 ) y


(x, y, z) pertenece a la bola abierta con centro (x0 , y0 , z0 ) y radio
δ, entonces |f (x, y, z) − L| < .
3. Sea f (x, y, z) definida en una bola B abierta que contiene
(x0 , y0 , z0 ). Diremos que f es continua en (x0 , y0 , z0 ) si

lı́m f (x, y, z) = f (x0 , y0 , z0 ).


(x,y,z)→(x0 ,y0 ,z0 )

El Teorema 2 también se puede aplicar a funciones de varias variables, lo


que nos permite afirmar que la función
2 p
ex +y y 2 + z 2 + 3
f (x, y, z) =
sin(xyz) + 5
es continua.
En nuestro estudio actual de funciones de varias variables, hemos estudia-
do lı́mites y continuidad. En la siguiente sección se estudia la derivación,
lo que ya sı́ que conllevará cambios ya que estamos en un contexto multi-
variable.

Notas:

22
Ejercicios 1.2
Términos y conceptos (c) Estudiar si D está acotado o no.

p
1. Describe con tus propias palabras la diferencia entre 11. f (x, y) = 9 − x2 − y 2
punto frontera y punto interior.
p
12. f (x, y) = y − x2
2. Describe intuitivamente lo que significa
lı́m f (x, y) = 17.
(x,y)→(1,2) 1
13. f (x, y) = p
y − x2
3. Dar un ejemplo de un conjunto cerrado y acotado.
x2 − y 2
14. f (x, y) =
4. Dar un ejemplo de un conjunto cerrado y no acotado. x2 + y 2

5. Dar un ejemplo de un conjunto abierto y acotado. En los ejercicios 15 – 20, se considera un lı́mite. Evaluar
el lı́mite a través de los caminos dados y concluir que
los lı́mites no existen.
6. Dar un ejemplo de un conjunto abierto y no acotado.
x2 − y 2
15. lı́m
(x,y)→(0,0) x2 + y 2

Problemas a) A lo largo del camino y = 0.


b) A lo largo del camino x = 0.
En cada uno de los ejercicios 7 – 10, se indica el con-
junto S. x+y
16. lı́m
x−y
(x,y)→(0,0)

(a) Cuando sea posible, calcular un punto frontera y a) A lo largo del camino y = mx.
uno interior de S.
(b) Estudiar si S es abierto, cerrado o ninguno de los xy − y 2
17. lı́m
dos. (x,y)→(0,0) y 2 + x

(c) Estudiar si S está acotado o no. a) A lo largo del camino y = mx.


b) A lo largo del camino x = 0.
(x − 1)2 (y − 3)2
 
7. S = (x, y) + ≤ 1 sin(x2 )
4 9 18. lı́m
(x,y)→(0,0) y
a) A lo largo del camino y = mx.
8. S = (x, y) | y 6= x2

b) A lo largo del camino y = x2 .

9. S = (x, y) | x2 + y 2 = 1

x+y−3
19. lı́m
(x,y)→(1,2) x2 − 1
10. S = {(x, y)|y > sin x} a) A lo largo del camino y = 2.
b) A lo largo del camino y = x + 1.
En los ejercicios 11 – 14:
sin x
20. lı́m
(a) Encontrar el dominio D de la función. (x,y)→(π,π/2)cos y
(b) Estudiar si D es abierto, cerrado o ninguno de los a) A lo largo del camino x = π.
dos. b) A lo largo del camino y = x − π/2.

23
Capı́tulo 1 Funciones de varias variables

1.3. Derivadas parciales

En esta sección compararamos de nuevo lo que vamos a estudiar en varias


variables con el caso de una variable. Supongamos que y es una función
dy
de x. La derivada de y con respecto a x, dx , mide la velocidad a la que
varı́a y con respecto a x. Consideramos ahora z = f (x, y). Tiene sentido
saber cómo son los cambios de z con respecto a x y/o y.

Consideremos la función z = f (x, y) = x2 + 2y 2 , que se muestra en la


Figura 1.11(a). Podemos fijar y = 2.. Estos puntos forman una curva en
el espacio: z = f (x, 2) = x2 + 8 que es una función de una variable. Ahora
(a) tendrı́a sentido calcular la ecuación de la recta tangente en un punto y
otros elementos.

Si tomamos y constante podemos estudiar los cambios de z con respecto


a x. Y podemos hacer lo mismo con la variable x. Este es el principio
subyacente de las derivadas parciales. A continuación, tras introducir
la definición formal de derivada parcial utilizando el concepto de lı́mite, a
continuación, mostramos cómo calcular estas derivadas parciales de forma
directa.

Definición 10 Derivada parcial

(b)
Sea D un subconjunto abierto de R2 , sea (x0 , y0 ) un punto de D y
sea f : D → R una función.
Figura 1.11: Fijado y = 2, la superfi- 1. Se denomina derivada parcial de f con respecto a la variable
cie f (x, y) = x2 + 2y 2 es una curva en x en el punto (x0 , y0 ) (o sea, lo que hemos denotado como
el espacio. ∂f
fx (x0 , y0 ) = (x0 , y0 )) al siguiente lı́mite
∂x
f (x0 + h, y0 ) − f (x0 , y0 )
lı́m
h→0 h
siempre que este lı́mite exista y sea finito.
2. Análogamente, se define la derivada parcial de f con respec-
to a la variable y en el punto (x0 , y0 ) (o sea, lo que hemos
∂f
denotado como fy (x0 , y0 ) = (x0 , y0 )) al lı́mite
∂y

f (x0 , y0 + h) − f (x0 , y0 )
lı́m .
h→0 h
siempre que este lı́mite exista y sea finito.

Notas:

24
1.3 Derivadas parciales

Geométricamente las derivadas parciales representan la variación de la


función a lo largo de los ejes OX y OY, respectivamente.
Ejemplo 17 Cálculo de derivadas parciales con la definición
Sea f (x, y) = x2 y + 2x + y 3 . Calcular fx (x, y) con la definición de lı́mite.

Solución Usando la Definición 10, tenemos:

f (x + h, y) − f (x, y)
fx (x, y) = lı́m
h→0 h
(x + h)2 y + 2(x + h) + y 3 − (x2 y + 2x + y 3 )
= lı́m
h→0 h
(x2 y + 2xhy + h2 y + 2x + 2h + y 3 − (x2 y + 2x + y 3 )
= lı́m
h→0 h
2xhy + h2 y + 2h
= lı́m
h→0 h
= lı́m 2xy + hy + 2
h→0
= 2xy + 2.

Por tanto fx (x, y) = 2xy + 2.

En este Ejemplo 17 hemos encontrado la derivada parcial usando la de-


finición formal de lı́mite. Sin embargo el uso de lı́mites no es necesario y
se puede hacer de una manera análoga al cálculo de las derivadas en una
dimensión. Cuando calculamos fx (x, y), consideramos que y no varı́a. Por
lo tanto podemos calcular la derivada con respecto a x considerando y
como una constante y procediendo de igual forma que en una dimensión.
d ∂
5x2 = 10x, calculamos ∂x x2 y = 2xy. Ahora tomamos
 
Al igual que dx
y como constante.
d ∂
53 = 0, calculamos ∂x y 3 = 0 tratando y como una
 
Al igual que dx
constante. Mostramos más ejemplos para clarificar este hecho. Nota: Algunas notaciones alternati-
vas para fx (x, y) son:

Ejemplo 18 Cálculo de derivadas parciales ∂ ∂f ∂z


f (x, y), , , y zx ,
Calcular fx (x, y) y fy (x, y) en cada uno de lo siguientes casos ∂x ∂x ∂x
con notaciones similares para
1. f (x, y) = x3 y 2 + 5y 2 − x + 7
fy (x, y). Se suele abreviar fx (x, y)
2. f (x, y) = cos(xy 2 ) + sin x mediante fx .
2 3√
3. f (x, y) = ex y x2 + 1

Notas:

25
Capı́tulo 1 Funciones de varias variables

Solución
1. Si f (x, y) = x3 y 2 + 5y 2 − x + 7,
manteniendo y constante se tiene que fx (x, y) = 3x2 y 2 − 1. Para
calcular fy (x, y), fijamos x y obtenemos fy (x, y) = 2x3 y + 10y.
2. Sea f (x, y) = cos(x2 ) + sin x.
Calculamos fx (x, y). Aplicando la regla de la cadena:

fx (x, y) = − sin(xy 2 )(y 2 ) + cos x = −y 2 sin(xy 2 ) + cos x.

Para calcular fy (x, y), tenemos en cuenta que x es el coeficiente de


y 2 dentro del término de coseno; Al ser x fijo, sin x también es fijo,
y lo tratamos como una constante.

fy (x, y) = − sin(xy 2 )(2xy) = −2xy sin(xy 2 ).

2 3√
3. Tenemos f (x, y) = ex y x2 + 1.
Para calcular fx (x, y), tenemos que aplicar la regla del producto:
2 3 2 3 1 −1/2
p
fx (x, y) = ex (2xy 3 ) x2 + 1 + ex y
y
x2 + 1
2
x2 y 3
2 3 e
= 2xy 3 ex y + √ .
2 x2 + 1
Para obtener
√ fy (x, y) no tenemos que aplicar la regla del producto
ya que x2 + 1 no contiene y, lo tratamos como fijo y por lo tanto
2 3
se convierte en un coeficiente del término ex y
2 3 2 3
p p
fy (x, y) = ex y (3x2 y 2 ) x2 + 1 = 3x2 y 2 ex y x2 + 1.

Hemos mostrado cómo calcular una derivada parcial, pero no está claro lo
que significa. Dada z = f (x, y), fx (x, y) mide la velocidad de cambio de z
cuando varı́a solo x y la variable y se mantiene constante.
Imaginemos que estamos en un prado y empezamos a caminar hacia el
este. Dependiendo de la ubicación, es posible subir, bajar o no cambiar
la altura. Esto es similar a la medición de zx . Volviendo a la ubicación
original, si caminamos hacia el norte (en la dirección del eje y) es posible
subir, bajar o no cambiar la altura, y esto nos lo indicará zy .
Ejemplo 19 Evaluación de derivadas parciales
Sea z = f (x, y) = −x2 − 12 y 2 + xy + 10. Encuentra fx (2, 1) y fy (2, 1) e
interpreta su significado.

Notas:

26
1.3 Derivadas parciales

Solución Observamos que fx (x, y) = −2x + y y fy (x, y) = −y + x.


Ası́ fx (2, 1) = −3 y fy (2, 1) = 1. También es útil tener en cuenta que
f (2, 1) = 7,5.

Consideramos fx (2, 1) = −3 y como ayuda la Figura 1.12(a) que muestra


la gáfica de f (x, y). Si nos situamos en el punto (2, 1, 7,5) y nos movemos
en paralelo al eje x (es decir, sólo cambiamos el valor de x y no el de y), la
tasa instantánea de cambio es de −3. El aumento del valor x disminuirá
el valor de z.

Consideremos ahora fy (2, 1) = 1, (ver Figura 1.12(b)). Moviéndonos a lo


largo de la curva en la superficie, paralelamente al eje y y manteniendo
constante x, aumenta el valor de z instantáneamente a una velocidad de
1. Dado que la magnitud de fx es mayor que la magnitud de fy en (2, 1),
es más pronunciada en la dirección x que en la dirección y.
(a)

Segundas derivadas parciales

Sea z = f (x, y). Hemos aprendido a calcular las derivadas parciales fx (x, y)
y fy (x, y), que son a su vez funciones de x e y. Por lo tanto podemos tomar
derivadas parciales de ellas con respecto a x e y como funciones que son.

Definición 11 Derivadas parciales de segundo orden


Sea z = f (x, y) una función en un conjunto abierto S.
1. La segunda derivada parcial de f con respecto a x es

∂2f
 
∂ ∂f  (b)
= 2
= fx x = fxx
∂x ∂x ∂x
Figura 1.12: Ilustración del significa-
2. La segunda derivada parcial de f con respecto a x y luego do de la derivada parcial
a y es
∂2f
 
∂ ∂f 
= = fx y = fxy .
∂y ∂x ∂y∂x
∂2f ∂2f
Definiciones similares son válidas para 2
= fyy y = fyx .
∂y ∂x∂y
Las segundas derivadas parciales fxy y fyx se denominan deriva-
das parciales mixtas o cruzadas.

Notas:

27
Capı́tulo 1 Funciones de varias variables

La notación de las segundas derivadas parciales da una idea de la notación


de la segunda derivada de una función de una sola variable. Si y = f (x),
d2 y
entonces f 00 (x) = 2 . La notación d2 y significa “calcular la derivada de
dx
y dos veces,” mientras que dx2 significa “con respecto a x”. Ahora que
tratamos con funciones de varias variables, vemos la importancia de espe-
cificar las variables que nos estamos refiriendo.

Ejemplo 20 Segundas derivadas parciales


Calcular fx , fy , fxx , fyy , fxy y fyx para

Nota: Todos los términos de la de- 1. f (x, y) = x3 y 2 + 2xy 3 + cos x


finición 11 dependen de lı́mites, por x3
lo que en cada definición siempre su- 2. f (x, y) =
y2
pondremos que tiene sentido “donde
exista el lı́mite”. 3. f (x, y) = ex sin(x2 y)

Solución En cada caso calculamos fx y fy y luego las segundas de-


rivadas parciales.
1. f (x, y) = x3 y 2 + 2xy 3 + cos x
fx (x, y) = 3x2 y 2 + 2y 3 − sin x, fy (x, y) = 2x3 y + 6xy 2
∂ ∂
3x2 y 2 + 2y 3 − sin x = 6xy 2 − cos x
 
fxx (x, y) = fx =
∂x ∂x
∂ ∂
2x3 y + 6xy 2 = 2x3 + 12xy
 
fyy (x, y) = fy =
∂y ∂y
∂ ∂
3x2 y 2 + 2y 3 − sin x = 6x2 y + 6y 2
 
fxy (x, y) = fx =
∂y ∂y
∂ ∂
2x3 y + 6xy 2 = 6x2 y + 6y 2
 
fyx (x, y) = fx =
∂x ∂x
x3
2. f (x, y) = = x3 y −2
y2
3x2 2x3
fx (x, y) = , fy (x, y) = −
y2 y3
∂  ∂ 3x2  6x
fxx (x, y) = fx = = 2
∂x ∂x y 2 y
∂  ∂ 2x3  6x3
fyy (x, y) = fy = − 3 = 4
∂y ∂y y y

Notas:

28
1.3 Derivadas parciales

∂  ∂ 3x2  6x2
fxy (x, y) = fx = 2
=− 3
∂y ∂y y y
∂  ∂ 2x3  6x2
fyx (x, y) = fx = − 3 =− 3
∂x ∂x y y
3. f (x, y) = ex sin(x2 y) fx (x, y) = ex sin(x2 y)+2xyex cos(x2 y), fy (x, y) =
x2 ex cos(x2 y)
fxx (x, y) = ex sin(x2 y)+4xyex cos(x2 y)+2yex cos(x2 y)−4x2 y 2 ex sin(x2 y)
fyy (x, y) = −x4 ex sin(x2 y)
fxy (x, y) = x2 ex cos(x2 y) + 2xex cos(x2 y) − 2x3 yex sin(x2 y)
fyx (x, y) = x2 ex cos(x2 y) + 2xex cos(x2 y) − 2x3 yex sin(x2 y)
Obsérvese cómo en cada una de las tres funciones del Ejemplo 20, fxy =
fyx . Debido a la complejidad de los ejemplos, esto probablemente no sea
una coincidencia. El siguiente Teorema afirma que no lo es.

Teorema 3 Teorema de Schwarz


Sea f tal que fxy y fyx son continuas en un conjunto abierto S. Si
(x, y) ∈ S se cumple que fxy (x, y) = fyx (x, y).

Calcular fxy y fyx de forma independiente y comparar los resultados pro-


porciona una manera conveniente de comprobar nuestro trabajo.

Ahora que sabemos la forma en que se obtiene la segunda parcial, vamos


a investigar qué nos indica.
Una vez más nos referimos a una función y = f (x) de una sola variable.
La segunda derivada de f es “la derivada de la derivada”, o “la tasa de
variación de la tasa de cambio”. La segunda mide cómo la vará la derivada
de la derivada.
Si f 00 (x) < 0, entonces la derivada es negativa (por lo que la gráfica de f
es cóncava); si f 00 (x) > 0, entonces la derivada es positiva, por lo que la
gráfica de f es convexa.
Consideremos ahora z = f (x, y). Podemos hacer las consideraciones simi-
lares sobre fxx y fyy a las que hicimos sobre f 00 (x) . Al tomar derivadas
con respecto a x dos veces, medimos la cantidad de los cambios fx con

Notas:

29
Capı́tulo 1 Funciones de varias variables

respecto a x. Si fxx (x, y) < 0, significa que a medida que aumenta x, fx


disminuye, y la gráfica de f es cóncava en la dirección de x. Usando la
analogı́a del prado como hicimos anteriormente en esta sección, fxx mide
si el camino es cóncavo o convexo al caminar hacia el este.
Del mismo modo, fyy mide la concavidad en la dirección de y. Si fyy (x, y) >
0, entonces fy es positiva con respecto a y y la gráfica de f será convexa en
la dirección y. Siguiendo con la analogı́a del prado, fyy mide si el camino
que se sigue es cóncavo o convexo cuando caminamos hacia el norte.
En el siguiente ejemplo se examinan estas ideas con números concretos y
gráficos.

Ejemplo 21 Comprensión de las segundas derivadas parciales


Sea z = x2 − y 2 + xy. Evaluar las primeras y segundas derivadas parciales
en (−1/2, 1/2) e interpretar lo que significa cada uno de estos números.

(a) Solución Se tiene que: fx (x, y) = 2x + y, fy (x, y) = 2y + x,


fxx (x, y) = 2, fyy (x, y) = −2 y fxy (x, y) = fyx (x, y) = 1. Ası́, en
(−1/2, 1/2) tenemos

fx (−1/2, 1/2) = −1/2, fy (−1/2, 1/2) = −3/2.

La pendiente de la recta tangente en (−1/2, 1/2, −1/4) en la dirección de


x es −1/2. Si nos movemos desde ese punto paralelo al eje x, la tasa ins-
tantánea de cambio será de −1/2. La pendiente de la recta tangente en este
punto en la dirección de y es −3/2. Si nos movemos desde ese punto para-
lelo al eje y, la tasa instantánea de cambio será de −3/2. Estas tangentes
se representan gráficamente en la Figura 1.13 (a) y (b), respectivamente,
donde las rectas tangentes se han trazado en lı́nea continua.
Volvamos a la Figura 1.13 (a). Hemos dibujado tres rectas tangentes, dos
(b) están en lı́nea discontinua, cada una en la dirección de x; es decir, cada
uno tiene una pendiente determinada por fx . Nótese cómo conforme y
Figura 1.13: Ilustración para el Ejem- aumenta, la pendiente de estas rectas se acercan a 0. Dado que las pen-
plo 21. dientes son todas negativas, cuanto más nos acercamos a 0 significa que las
pendientes están aumentando. Como fx aumentan a medida que aumenta
y, esto quiere decir que fxy debe ser positivo.
Como fxy = fyx , también esperamos que fy aumente a medida que au-
mente x. Observamos otra vez la Figura 1.13 (b) donde están dibujadas
tres tangentes, esta vez cada uno en la dirección de y con pendientes de-
terminados por fy . Conforme x aumenta, las pendientes se vuelven menos

Notas:

30
1.3 Derivadas parciales

pronunciadas (más cercanas a 0). Dado que estas son pendientes negativas,
esto significa que las pendientes están aumentando.

Hasta ahora tenemos una idea visual de fx , fy y fxy = fyx . Ahora inter-
pretamos fxx y fyy . En la Figura 1.13 (a), vemos que la curva dibujada
en x se mantiene constante en x = −1/2 y sólo y varı́a. Esta curva es
claramente cóncava, y corresponde al hecho de que fyy < 0. En Figura
1.13(b), observamos una curva donde y es constante y sólo x varı́a. Esta
curva es convexa, lo que corresponde al hecho de que fxx > 0.

Derivadas parciales de funciones de tres variables

Los conceptos subyacentes derivadas parciales se pueden generalizar fácil-


mente a más de dos variables. Damos algunas definiciones y ejemplos en el
caso de tres variables y confiamos en que el lector puede generalizar estas
definiciones a más variables.

Definición 12 Derivadas parciales con tres variables


Sea w = f (x, y, z) una función continua en un conjunto abierto S
en R3 .
La derivada parcial de f con respecto a x es:

f (x + h, y, z) − f (x, y, z)
fx (x, y, z) = lı́m
h→0 h
.
Definiciones similares son válidas para fy (x, y, z) y fz (x, y, z).

Tomando derivadas parciales de derivadas parciales, podemos calcular de-


rivadas parciales de segundo orden de f con respecto a z y luego de y, por
ejemplo, al igual que antes.

Ejemplo 22 Derivadas en funciones de tres variables


Calcular fx , fy , fz , fxz , fyz y fzz para

1. f (x, y, z) = x2 y 3 z 4 + x2 y 2 + x3 z 3 + y 4 z 4

2. f (x, y, z) = x sin(yz)

Notas:

31
Capı́tulo 1 Funciones de varias variables

Solución
1. fx = 2xy 3 z 4 + 2xy 2 + 3x2 z 3 ; fy = 3x2 y 2 z 4 + 2x2 y + 4y 3 z 4 ;
fz = 4x2 y 3 z 3 + 3x3 z 2 + 4y 4 z 3 ; fxz = 8xy 3 z 3 + 9x2 z 2 ;
fyz = 12x2 y 2 z 3 + 16y 3 z 3 ; fzz = 12x2 y 3 z 2 + 6x3 z + 12y 4 z 2
2. fx = sin(yz); fy = xz cos(yz); fz = xy cos(yz);
fxz = y cos(yz); fyz = x cos(yz) − xyz sin(yz); fzz = −xy 2 sin(xy)

Podemos continuar tomando derivadas parciales de derivadas parciales


de derivadas parciales, etc. Estas derivadas parciales de orden superior
no tienen una interpretación gráfica clara; sin embargo, no son difı́ciles de
calcular. No definiremos formalmente las derivadas de orden superior, sólo
daremos la notación.
     
∂ ∂ ∂f ∂ ∂ ∂f
fxyx (x, y) = y fxyz (x, y, z) = .
∂x ∂y ∂x ∂z ∂y ∂x

Ejemplo 23 Derivadas parciales de orden superior √


Calcular las derivadas parciales de primer orden de f (x, y, z) = e3x y + 2z.

Solución Las derivadas parciales pedidas son:


∂f ∂f e3x
= 3e3x y + 2z,
p
= √ ,
∂x ∂y 2 y + 2z
∂f 2 e3x e3x
= √ = √ ,
∂z 2 y + 2z y + 2z

Ejemplo 24 Derivadas parciales de orden superior

1. Sea f (x, y) = x2 y 2 + sin(xy). Calcular fxxy y fyxx .


2. Sea f (x, y, z) = x3 exy + cos(z). Calcular fxyz .

Solución
1. Para hallar fxxy , calculamos fx , después fxx , y por último fxxy :

fx = 2xy 2 + y cos(xy), fxx = 2y 2 − y 2 sin(xy)


fxxy = 4y − 2y sin(xy) − xy 2 cos(xy).

Notas:

32
1.3 Derivadas parciales

Para calcular fyxx , seguimos un proceso análogo al caso anterior

fy = 2x2 y + x cos(xy) fyx = 4xy + cos(xy) − xy sin(xy)


= 4y − y sin(xy) − y sin(xy) + xy 2 cos(xy)

fyxx
= 4y − 2y sin(xy) − xy 2 cos(xy).

Nótese cómo fxxy = fyxx .


2. Para calcular fxyz , hallamos fx , después fxy , y finalmente fxyz :

fx = 3x2 exy + x3 yexy ,


fxy = 3x3 exy + x3 exy + x4 yexy = 4x3 exy + x4 yexy
fxyz = 0.

En el ejemplo anterior vimos que fxxy = fyxx . Esto no es una coincidencia.


Aunque no lo estableceremos como un teorema formal, siempre que cada
una de las derivadas parciales sea continua, no importará el orden en que
se tomen las derivadas parciales. Por ejemplo, fxxy = fxyx = fyxx .
Esto puede ser útil. Si hubiéramos sabido esto, la segunda parte del Ejem-
plo 24 habrı́a sido mucho más sencillo de calcular. En lugar del cómputo
de fxyz en el orden x, y y z podrı́amos haberlo hecho en el orden z, x e
y (como fxyz = fzxy ). Es fácil ver que fz = − sin z y por tanto fzx como
fzxy son nulas.

Resumen de esta sección: hemos calculado derivadas parciales para medir


la tasa de cambio instantánea de una función multivariable con respecto
a una variable.
Si z = f (x, y), las derivadas parciales fx y fy miden la tasa instantánea de
cambio de z cuando se mueve paralela al eje x y al eje y, respectivamente.
Pero, ¿cómo medimos la tasa de cambio en un punto cuando no nos move-
mos paralelo a uno de estos ejes? ¿y si nos movemos en la dirección dada
por el vector h2, 1i? ¿podemos medir esa tasa de cambio? La respuesta es,
por supuesto, sı́, podemos. Pero antes, es necesario definir lo que significa
para una función de dos variables ser diferenciable.

Notas:

33
Ejercicios 1.3
Términos y conceptos 16. f (x, y) = (x + y)3

1. ¿Cuál es la diferencia entre constante y coeficiente? 17. f (x, y) = cos(5xy 3 )

2. Dada la función z = f (x, y), explica con tus palabras lo 18. f (x, y) = sin(5x2 + 2y 3 )
que significa fx .
p
19. f (x, y) = 4xy 2 + 1
3. En la derivada parcial fxy , ‘?cuál se calcula primero, fx
o fy ? √
20. f (x, y) = (2x + 5y) y

∂2f 1
4. En la derivada parcial , ‘?se computa primero, fx 21. f (x, y) =
∂x∂y x2 + y 2 + 1
o fy ?

22. f (x, y) = 5x − 17y

Problemas
23. f (x, y) = 3x2 + 1

En los Ejercicios 5 – 8, evaluar fx (x, y) y fy (x, y) en los


24. f (x, y) = ln(x2 + y)
puntos indicados.

ln x
5. f (x, y) = x2 y − x + 2y + 3 en (1, 2) 25. f (x, y) =
4y

6. f (x, y) = x3 − 3x + y 2 − 6y en (−1, 3) 26. f (x, y) = 5ex sin y + 9

7. f (x, y) = sin y cos x en (π/3, π/3) En los Ejercicios 27 – 30, encontrar una función z =
f (x, y) tal que fx y fy sean las dadas.
8. f (x, y) = ln(xy) en (−2, −3)
27. fx = sin y + 1, fy = x cos y
En los Ejercicios 9 – 26, hallar fx , fy , fxx , fyy , fxy
y fyx . 28. fx = x + y, fy = x + y

9. f (x, y) = x2 y + 3x2 + 4y − 5 29. fx = 6xy − 4y 2 , fy = 3x2 − 8xy + 2

10. f (x, y) = y 3 + 3xy 2 + 3x2 y + x3 2x 2y


30. fx = , fy =
x2 + y 2 x2 + y 2
x
11. f (x, y) =
y En los Ejercicios 31 – 34, hallar fx , fy , fz , fyz y fzy .

4
12. f (x, y) = 31. f (x, y, z) = x2 e2y−3z
xy

2
+y 2
32. f (x, y, z) = x3 y 2 + x3 z + y 2 z
13. f (x, y) = ex
3x
14. f (x, y) = ex+2y 33. f (x, y, z) =
7y 2 z

15. f (x, y) = sin x cos y 34. f (x, y, z) = ln(xyz)

34
1.4 Diferenciabilidad y la diferencial total

1.4. Diferenciabilidad y la diferencial total

Cuando estudiamos derivabilidad en una variable se estableció que si y =


f (x) y f era derivable, entonces dy = f 0 (x)dx.
Esto tenı́a importantes aplicaciones tanto en integración como en aproxi-
mación.
Nos concentramos en esta última aplicación. Si ∆x = dx es una variacia-
ción de x, sabemos que cuando dx es pequeño, dy ≈ ∆y es el cambio en
y como consecuencia del cambio en x. El hecho importante es que en las
condiciones que acabamos de decir, si dx tiende a 0, el error cometido al
aproximar ∆y por dy también tiende 0.
Como en secciones anteriores vamos a extender esta idea a funciones de
dos variables. Sea z = f (x, y), y sea ∆x = dx y ∆y = dy cambios en x e y,
respectivamente. Sea ∆z = f (x + dx, y + dy) − f (x, y) el cambio en z por
los cambios en x e y. Recordando que fx y fy son las tasas instantáneas del
cambio en z en las direcciones x e y, respectivamente, podemos aproximar
∆z por dz = fx dx + fy dy; en otras palabras, el cambio total de z es
aproximadamente el cambio causado por el cambio de x más el originado
por el cambio de y. A continuación veremos si esta aproximación es buena.
En primer lugar establecemos un nombre para dz.

Definición 13 Diferencial total


Sea z = f (x, y) continua en un conjunto abierto S. Sea dx y dy y
representan los cambios en x e y, respectivamente. Donde existan
las derivadas parciales fx y fy , definimos la diferencial total de
z como
dz = fx (x, y)dx + fy (x, y)dy.

Ejemplo 25 Diferencial total


Hallar dz siendo z = x4 e3y .

Solución Calculamos las derivadas parciales: fx = 4x3 e3y y fy =


4 3y
3x e . Por la Definición 13, tenemos

dz = 4x3 e3y dx + 3x4 e3y dy.

Notas:

35
Capı́tulo 1 Funciones de varias variables

Podemos aproximar ∆z con dz, pero como sucede con todas las aproxi-
maciones, existe un error. Tendremos una buena aproximación cuando el
error sea pequeño. Si (x0 , y0 ), sean Ex y Ey las funciones de dx y dy tal
que Ex dx + Ey dy describe este error. Entonces

∆z = dz + Ex dx + Ey dy
= fx (x0 , y0 )dx + fy (x0 , y0 )dy + Ex dx + Ey dy.

Si la aproximación de ∆z por dz es buena, entonces como dx e dy será


pequeña, y lo mismo ocurrirá con Ex dx + Ey dy. La aproximación de ∆z
por dz es aún mejor si cuando dx y dy tienden a 0, también lo hacen Ex
y Ey . Esto nos lleva a la definición de diferenciabilidad.

Definición 14 Diferenciabilidad
Sea z = f (x, y) definida en un conjunto abierto S que contiene al
punto (x0 , y0 ) donde fx (x0 , y0 ) y fy (x0 , y0 ) están definidas. Sea dz
la diferencial total de z en (x0 , y0 ), sea ∆z = f (x0 + dx, y0 + dy) −
f (x0 , y0 ), y sea Ex y Ey funciones de dx y dy de tal manera que

∆z = dz + Ex dx + Ey dy.

1. f es diferenciable en (x0 , y0 ) si, dado  > 0, existe δ > 0


tal que si || hdx, dyi || < δ, entonces || hEx , Ey i || < . Esto es,
cuando dx y dy tienden a 0, también lo hacen Ex y Ey .
2. f es diferenciable en S si f es diferenciable en cada punto
de S. Si f es diferenciable en R2 , diremos que f es diferen-
ciable.

Ejemplo 26 Función diferenciable


Demostrar que f (x, y) = xy + 3y 2 es diferenciable usando la Definición 14.

Solución Comenzamos hallando f (x + dx, y + dy), ∆z, fx y fy .

f (x + dx, y + dy) = (x + dx)(y + dy) + 3(y + dy)2


= xy + xdy + ydx + dxdy + 3y 2 + 6ydy + 3dy 2 .

∆z = f (x + dx, y + dy) − f (x, y), por lo que

∆z = xdy + ydx + dxdy + 6ydy + 3dy 2 .

Notas:

36
1.4 Diferenciabilidad y la diferencial total

Podemos calcular directamente fx = y y fy = x + 6y. Consideremos ∆z:

∆z = xdy + ydx + dxdy + 6ydy + 3dy 2 (reordenando)


2
= ydx + xdy + 6ydy + dxdy + 3dy
= (y) dx + (x + 6y) dy + (dy) dx + (3dy) dy
|{z} | {z } |{z} | {z }
fx fy Ex Ey

= fx dx + fy dy + Ex dx + Ey dy.

Observando Ex = dy y Ey = 3dy, es evidente que a medida que dx y dy


tienden a 0, Ex y Ey también lo hacen. Dado que esto no depende de un
punto especı́fico (x0 , y0 ), podemos decir que f (x, y) es diferenciable para
todos los puntos (x, y) en R2 , o, equivalentemente, que f es diferenciable.

De igual fomra que la derivabilidad de funciones de una variable signifi-


caba que la gráfica de f era “suave”. De la misma forma, para funciones
z = f (x, y) de dos variables será que la superficie definida por f también
sea “suave”, esto es, que no contenga cúspides, bordes, roturas, etc. El
siguiente teorema establece que las funciones diferenciables son continuas.

Teorema 4 Diferenciabilidad y continuidad


Sea z = f (x, y) definida en un conjunto abierto S que contiene
(x0 , y0 ). Si f es diferenciable en (x0 , y0 ), entonces f es continua en
(x0 , y0 ).

Teorema 5 Condición suficiente de diferenciabilidad


Sea z = f (x, y) definida en un conjunto abierto S que contiene
(x0 , y0 ). Si fx y fy son continuas en S, entonces f es diferenciable
en S.

Ejemplo 27 Diferenciabilidad
cos x + exy
Sea f (x, y) = . Probar que f es diferenciable en cualquier punto
x2 + y 2
distinto del (0,0).

Notas:

37
Capı́tulo 1 Funciones de varias variables

Solución Las derivadas parciales de f en cada punto (x, y) 6= (0, 0)


son:
∂f (− sin x + yexy )(x2 + y 2 ) − (cos x + exy )2x
=
∂x (x2 + y 2 )2
∂f (xexy )(x2 + y 2 ) − (cos x + exy )2y
=
∂y (x2 + y 2 )2
y ambas son continuas en todo punto (x, y) 6= (0, 0) con lo que, aplicando
el Teorema 4 tenemos que f es diferenciable en cualquier punto (x, y) 6=
(0, 0).
Los teoremas anteriores aseguraban que esencialmente todas las funciones
“usuales” son diferenciables (y por lo tanto continuas) en sus dominios
naturales. Notemos que es posible que una función f sea diferenciable
aunque fx y/o fy no sean continuas.
Cuando existen fx y fy en un punto, pero no son continuas en ese punto,
tenemos que utilizar otros métodos para determinar si f es diferenciable
en dicho punto.
Sea la función
( xy
si (x, y) 6= (0, 0)
F (x, y) = x2 + y2
0 si (x, y) = (0, 0).

Podemos hallar fx (0, 0) y fy (0, 0) utilizando la Definición 10:

f (0 + h, 0) − f (0, 0) 0
fx (0, 0) = lı́m = lı́m 2 = 0;
h→0 h h→0 h
f (0, 0 + h) − f (0, 0) 0
fy (0, 0) = lı́m = lı́m 2 = 0.
h→0 h h→0 h

Por tanto fx y fy existen en (0, 0). Sin embargo

y(y 2 − x2 ) x(x2 − y 2 )
fx (x, y) = y fy (x, y) =
(x2 + y 2 )2 (x2 + y 2 )2

no son continuas en (0, 0). Por ejemplo, para fx podemos ver que los lı́mites
reiterados en ese punto son diferentes.
Ası́ que, aunque fx y fy existen en todos los puntos del plano, no son con-
tinuas en (0, 0). Por lo tanto no afirmar nada acerca la diferenciabilidad
de f en ese punto aún.

Notas:

38
1.4 Diferenciabilidad y la diferencial total

Teorema 6 Caracterización de la diferenciabilidad


2
Sea f : S ⊂ R → R. Decimos que f es diferenciable en el punto (x0 , y0 ) ∈ S si se dan
las siguientes condiciones:
∂f ∂f
1. Existen (x0 , y0 ) y (x0 , y0 ).
∂x ∂y
2. Se verifica que
∂f ∂f
f (x, y) − f (x0 , y0 ) − (x − x0 ) ((x0 , y0 ) − (y − y0 ) (x0 , y0 )
∂x ∂y
lı́m p =0
(x,y)→(x0 ,y0 ) 2
(x − x0 ) + (y − y0 ) 2

En el Ejemplo 27 hemos visto que existen ambas derivadas parciales en


todo punto, incluido el (0,0), pero que no son continuas en dicho punto.
Sin embargo f sı́ es diferenciable en (0,0). Para ello vamos a recurrir a la
caracterización de diferenciabilidad, pues el criterio suficiente de que las
derivadas parciales primeras sean continuas en el punto nos ha fallado:
∂f ∂f
Antes vimos que (0, 0) y (0, 0) existı́an. Además
∂x ∂y
h i h i
f (x, y) − f (0, 0) − ∂f ∂f
∂x (0, 0) (x − 0) − ∂y (0, 0) (y − 0)
lı́m p =
(x,y)→(0,0) x2 + y 2
(x2 + y 2 ) · sin √ 21 2 ρ2 sin ρ1
x +y 1
lı́m p = lı́m = lı́m ρ · sin = 0.
(x,y)→(0,0) x2 + y 2 ρ→0 ρ ρ→0 ρ

con lo cual, dado que dicho lı́mite es cero, el Teorema 6 asegura que f es
diferenciable en (0, 0).

Idea 1 Continuidad y diferenciabilidad


1. Al igual que observábamos en el caso de una variable, si una
función de dos variables no es continua en un punto, no podrá
ser diferenciable en dicho punto.
2. El recı́proco del anterior teorema no es cierto en general, es
decir, podemos encontrar funciones de dos variables que sean
continuas en un punto y, que sin embargo, no sean diferen-
ciables en él.

Notas:

39
Capı́tulo 1 Funciones de varias variables

Aproximación con la diferencial total

Por definición, cuando f es diferenciable dz es una buena aproximación


para ∆z cuando dx y dy son “pequeñas”. Damos algunos ejemplos de
cómo se utiliza esto.

Ejemplo√28 Aproximación a la diferencial total


Sea z = x sin y. Aproximar f (4,1, 0,8).

Solución Como π/4 ≈ 0,785 ≈ 0,8, podemos aproximar √ f (4,1, 0,8)


mediante f (4, π/4). Podemos calcular fácilmente f (4, π/4) = 4 sin(π/4) =
√ 
2

2 2 = 2 ≈ 1,414. Sin cálculos esta es a la mejor aproximación qie
podrı́amos llegar razonablemente. La diferencial total nos da una forma
de ajustar esta aproximación inicial para obtener una más precisa.
Sea ∆z = f (4,1, 0,8) − f (4, π/4). La diferencial total, dz, es aproximada-
mente igual a ∆z, por lo que

f (4,1, 0,8) − f (4, π/4) ≈ dz ⇒ f (4,1, 0,8) ≈ dz + f (4, π/4). (1.1)

Para encontrar dz, necesitamos fx y fy .



sin y sin π/4 2/2 √
fx (x, y) = √ ⇒ fx (4, π/4) = √ = = 2/8.
2 x 2 4 4

√ √ 2 √
fy (x, y) = x cos y ⇒ fy (4, π/4) = 4 = 2.
2

Aproximando 4,1 por 4 obtenemos dx = 0,1; aproximando 0,8 por π/4


obtenemos dy ≈0 ,015. De esta forma

dz(4, π/4) = fx (4, π/4)(0,1) + fy (4, π/4)(0,015)



2 √
= (0,1) + 2(0,015)
8
≈0 ,039.

Volviendo a la ecuación (1.1), tenemos

f (4,1, 0,8) ≈0 ,039 + 1,414 = 1,4531.

Notas:

40
1.4 Diferenciabilidad y la diferencial total

Podemos calcular el valor real de f (4,1, 0,8) con una calculadora; el valor
real de una precisión de 5 decimales, es 1,45254. Obviamente la aproxima-
ción es bastante buena.

El objetivo del ejemplo anterior no fue el de desarrollar un método de


aproximación de funciones conocidas. Después de todo, podemos calcular
fácilmente f (4,1, 0,8) utilizando la tecnologı́a disponible. Más bien sirve
para ilustrar lo bien qe este método de aproximación funciona, y para
reforzar el siguiente concepto:
“Posición nueva = posición antigua + cantidad de cambio”
“Posición nueva ≈ posición antigual + cantidad aproximada de cambio.”
En el ejemplo anterior, podemos calcular f (4, /4π) y podrı́amos aproximar
por z el valor de f (4,1, 0,8),
Puede ser sorprendente conocer los valores de f , fx y fy en un punto de-
terminado sin conocer la función f . La diferencial total es un buen método
de aproximar f en puntos cercanos a uno conocido.

Ejemplo 29 Aproximación de una función desconocida


Teniendo en cuenta que f (2, −3) = 6, fx (2, −3) = 1,3 y fy (2, −3) = −0,6,
aproximar f (2,1, −3,03).

Solución La diferencial total aproxima cómo cambia la función f del


punto (2, −3) hasta el punto (2,1, −3,03). Con dx = 0, 1 y dy = −0,03,
tenemos

dz = fx (2, −3)dx + fy (2, −3)dy = 1,3(0,1) + (−0,6)(−0,03) = 0,148.

El cambio en z es aproximadamente de 0,148, y por tanto aproximamos


f (2,1, −3,03) ≈ 6,148.

Error/Análisis de sensibilidad

La diferencial total proporciona una aproximación de la variación de z


cuando hay pequeños cambios en x e y. Podemos usar este hecho para
estudiar la propagación de errores aproximados; es decir, preguntarnos si
al variar la entrada un poco, cuánto se desviará la salida. Analizamos esto
en un ejemplo.

Notas:

41
Capı́tulo 1 Funciones de varias variables

Ejemplo 30 Análisis de sensibilidad


Se va a construir un tanque cilı́ndrico de almacenamiento de acero de 10
metros de alto y 4 metros de diámetro. Se sabe que el acero se expande /
contrae con los cambios de temperatura; ¿es el volumen total del tanque
más sensible a los cambios de diámetro o de altura?

Solución El cilindro de altura h y el radio r tiene un volumen V =


πr2 h. Podemos ver V como una función de dos variables, r y h y calcular
sus derivadas parciales :
∂V ∂V
= Vr (r, h) = 2πrh y = Vh (r, h) = πr2 .
∂r ∂h
La diferencial total es dV = (2πrh)dr+(πr2 )dh. Al h = 10 y r = 2, tenmos
que dV = 40πdr + 4πdh. Teniendo en cuenta que el coeficiente de dr es de
40π ≈ 125,7 y el coeficiente de dh es una décima parte, aproximadamente
12,57, Un pequeño cambio en el radio se multiplicará por 125.7, mientras
que un pequeño cambio en la altura se multiplicará por 12,57. Ası́, el
volumen del tanque es más sensible a los cambios en radio que en altura.

El ejemplo anterior muestra que el volumen de un tanque es más sensible


a los cambios en el radio que en altura. Tenga en cuenta que este análisis
sólo se aplica a un tanque de esas dimensiones. Un tanque con una altura
de 1 metro y el radio de 5 metros serı́a más sensible a los cambios en altura
que en radio.
Se podrı́a hacer una tabla de pequeños cambios en el radio y la altura y
encontrar cambios exactos para cambios especı́ficos de volumen dado. Si
bien esto proporciona números exactos, no da tanta información como el
análisis de errores utilizando la diferencial total.

A continuación presentamos dos ejemplos con el estudio de la continuidad


y la diferenciabilidad en los que relacionamos todos los conceptos estudia-
dos hasta ahora.
Ejemplo 31 Estudio de la continuidad y la diferenciabilidad
Considere la función f (x, y) dada por:
 2
 x y , si (x, y) 6= (0, 0)
f (x, y) = x + y 2
2

0, si (x, y) = (0, 0)

1. Estudiar la continuidad en R2

Notas:

42
1.4 Diferenciabilidad y la diferencial total

2. Estudiar la diferenciabilidad en R2

Solución
1. En los puntos distintos de (0, 0) la función es claramente continua. En
(0, 0)

x2 y ρ3 cos2 α sin α
lı́m = lı́m = lı́m ρ cos2 α sin α = 0.
(x,y)→(0,0) x2 + y2 ρ→0 ρ2 ρ→0
α∈[0,2π] α∈[0,2π]

Por tanto, la función es continua en todo R2 ya que el valor del lı́mite


coincide con el valor de f (0, 0) lo que hace que sea continua en este punto,
y en todos los demás lo era como hemos dicho anteriormente.
2. En puntos distintos del origen la función tiene derivadas parciales con-
tinuas por lo que la función es diferenciable en estos puntos. Además:

h2 0
∂f f (0 + h, 0) − f (0, 0) 2
−0
(0, 0) = lı́m = lı́m h =0
∂x h→0 h h→0 h

0h
∂f f (0, 0 + h) − f (0, 0) 2
−0
(0, 0) = lı́m = lı́m h =0
∂y h→0 h h→0 h
En el origen aplicamos la definición de diferenciabilidad:

∂f ∂f
f (∆x, ∆y) − f (0, 0) − (0, 0)∆x − (0, 0)∆y
∂x ∂y
lı́m p =
(∆x,∆y)→(0,0) (∆x)2 + (∆y)2
(∆x)2 ∆y
(∆x)2 + (∆y)2 (∆x)2 ∆y
lı́m p = lı́m 3 =
(∆x,∆y)→(0,0) (∆x)2 + (∆y)2 (∆x,∆y)→(0,0) ((∆x)2 + (∆y)2 ) 2

ρ3 cos4 α sin α
lı́m = cos4 α sin α.
ρ→0 ρ3
α∈[0,2π]

Y como el lı́mite depende del ángulo α, la función no es diferenciable en


el origen.

Notas:

43
Capı́tulo 1 Funciones de varias variables

Ejemplo 32 Estudio de la continuidad y la diferenciabilidad


Considere la función f (x, y) dada por:
 2
 x y , si (x, y) 6= (0, 0)
f (x, y) = x4 + y 2
0, si (x, y) = (0, 0).

∂f ∂f
1. Hallar y .
∂x ∂y
2. ¿Es f (x, y) diferenciable en (0, 0)?
3. ¿Qué se puede concluir de los apartados anteriores con respecto a la
diferenciabilidad de la función?

Solución 1. Si (x, y) 6= (0, 0) entonces

∂f 2xy 3 − 2x5 y
(x, y) = .
∂x (x4 + y 2 )2

Si (x, y) = (0, 0), entonces

(0 + h)2 0
−0
∂f f (0 + h, 0) − f (0, 0) (0 + h)4 + 02
(0, 0) = lı́m = lı́m
∂x h→0 h h→0 h
0
= lı́m 5 = 0.
h→0 h

Y por tanto:
3 5
 2xy − 2x y , si (x, y) 6= 0

∂f
(x, y) = (x + y )2
4 2
∂x
0, si (x, y) = 0

y podemos comprobar igualmente que


 6 2 2
∂f  x − x y , si (x, y) 6= 0
(x, y) = (x + y 2 )2
4
∂y
0, si (x, y) = 0.

Veamos si es continua en (0, 0). Si tomamos direcciones y = mx2

x2 y x2 mx2 m m
lı́m = lı́m 4 = lı́m =
(x,y)→(0,0) x4 +y 2 x→0 x + m x2 4 x→0 1 + m 2 1 + m2

Notas:

44
1.4 Diferenciabilidad y la diferencial total

y como depende de m, la función no es continua en (0, 0).


Ejemplo 33 Estudio de la continuidad y la diferenciabilidad
Se considera la función real de dos variables
 3 3
 x + y , si (x, y) 6= 0
f (x, y) = x2 + y 2
0, si (x, y) = 0

1. Estudia, mediante la definición, para qué vectores unitarios u existe


la derivada direccional de la función en el origen, y calcularla.
2. ¿Cuánto vale el gradiente de f en el origen?
3. Estudia la diferenciabilidad en el origen.
4. Calcula el valor máximo de Du f (0, 0) y la dirección u en la derivada
direccional es máxima.

Solución
1. Tomamos el vector unitario u = (cos α, sin α) y usando la definición
calculamos la derivada direccional
t3 cos3 α + t3 sin3 α
f (t cos α, t sin α) − f (0, 0) −0
Du f (0, 0) = lı́m = lı́m t2
t→0 t x→0 t
3 3
= cos α + sin α

∂f ∂f
2. Sabemos que ∇f (0, 0) = ( (0, 0), (0, 0)). Para calcular las deriva-
∂x ∂y
das parciales en el origen utilizamos la definición y obtenemos
∂f ∂f
(0, 0) = 1, (0, 0) = 1
∂x ∂y
Por tanto, ∇f (0, 0) = (1, 1). La función no es diferenciable en el origen
porque en caso de serlo se tendrı́a que las derivadas direccionales en el
origen coincidirı́an y por el apartado 1.
Dfv (0, 0) = h∇f (0, 0), (cos α, sin α)i = cos α + sin α
que no coincide con lo obtenido en el primer apartado.
También podrı́a hacerse a partir de la definición estudiando el lı́mite:
∂f ∂f
f (∆x, ∆y) − f (0, 0) − (0, 0)∆x − (0, 0)∆y
∂x ∂y
lı́m p
(∆x,∆y)→(0,0) (∆x)2 + (∆y)2 .

Notas:

45
Capı́tulo 1 Funciones de varias variables

Diferenciabilidad de funciones de tres variables

La definición de diferenciabilidad de las funciones de tres variables es muy


similar a la de funciones de dos variables.

Definición 15 Diferencial total


Sea w = f (x, y, z) continua en un conjunto abierto S. Sean dx, dy
y dz los cambios en x, y y z, respectivamente. Donde existan las
derivadas parciales fx , fy y fz la diferencial total de w vendrá
dada por

Dz = fx (x, y, z)dx + fy (x, y, z)dy + fz (x, y, z)dz.

La diferencial total es una buena aproximación de la variación de w cuando


w = f (x, y, z) es diferenciable.

Definición 16 Diferenciabilidad
Sea w = f (x, y, z) definida en una bola abierta B que con-
tiene a (x0 , y0 , z0 ) y donde existen fx (x0 , y0 , z0 ), fy (x0 , y0 , z0 ) y
fz (x0 , y0 , z0 ). Sea dw la diferencial total de w en (x0 , y0 , z0 ), y sea
∆w = f (x0 + dx, y0 + dy, z0 + dz) − f (x0 , y0 , z0 ) y Ex , Ey y Ez
funciones de dx, dy y dz tales que

∆w = dw + Ex dx + Ey dy + Ez dz.

∆w = dw + Ex dx + Ey dy + Ez dz.
1. f es diferenciable en (x0 , y0 , z0 ) si, dado  > 0, existe δ > 0
tal que si || hdx, dy, dzi || < δ, entonces || hEx , Ey , Ez i || < .
2. f es diferenciable en B si f es diferenciable en cada punto
de B. Si f es diferenciable en R3 , diremos que f es diferen-
ciable.

Notas:

46
1.4 Diferenciabilidad y la diferencial total

Teorema 7 Continuidad y diferenciabilidad de funcio-


nes de tres variables
Sea w = f (x, y, z) definida en una bola B abierta que contiene al punto (x0 , y0 , z0 ).
1. Si f es diferenciable en (x0 , y0 , z0 ), entonces f es continua en (x0 , y0 , z0 ).
2. Si fx , fy y fz son continuas en B, entonces f es diferenciable en B.

Idea 2 Derivadas parciales y diferenciabilidad


A modo de resumen recopilamos todas las anteriores relaciones en el siguiente cuadro:

Parciales continuas ⇒ Diferenciable ⇒ Existen las derivadas parciales primeras



Continua

siendo cada uno de los enunciados recı́procos, en general, falsos, como hemos mostrado
a través de los anteriores ejemplos.

El Teorema 7 se puede extender a funciones de cualquier número de varia-


bles. De nuevo nos indica una forma sencilla de comprobar que la mayorı́a
de las funciones que nos encontramos son diferenciables en sus dominios
naturales.

En esta sección hemos dado una definición formal de “funciones diferen-


ciables”, junto con resultados que dan una comprensión más accesible para
el estudio de estas funciones.

Notas:

47
Ejercicios 1.4
Términos y conceptos 14. Balı́stica: El desplazamiento x de un proyectil viene
dado por x(θ, v0 , t) = (v0 cos θ)t. Si se dispara un pro-
yectil con velocidad inicial de v0 = 250m/s y un ángulo
1. T/F: Si f (x, y) es diferenciable en S, f es continua en
de elevación θ = 60◦ . Se sabe que ha recorrido una
S.
distancia de 375m en 3 segundos.

2. T/F: Si fx y fy son continuas en S, entonces f es di- ¿ Es el proyectil más sensible a la velocidad inicial o al
ferenciable en S. ángulo de elevación?

3. T/F: Si z = f (x, y) es diferenciable, entonces el cambio 15. Se quiere aproximar la altura ` de una pared. El ángulo
en z, bajo cambios pequeños de over dx y dy, en x e y θ, se muestra en el diagrama (no está a escala), mide
es aproximadamente dz. 85◦ , y la distancia x es de 30 metros. Suponiendo que
forman un triángulo rectángulo.
4. Completa la frase: “En una aproximación, el nuevo valor
de z se obtiene sumando al antiguo la .” ¿Es el error cometido al medir la altura ` más sensible
a la distancia x o al ángulo θ?

Problemas ` =?

En los Ejercicios 5 – 8, hallar la diferencia total dz. θ


x

5. z = x sin y + x2
16. Es de “sentido común” que es mejor medir una longitud
6. z = (2x2 + 3y)2 grande con un instrumento largo que con uno corto. La
distancia medida D se puede ver como el producto de la
longitud ` del instrumento multiplicado por las veces n
7. z = 5x − 7y que se ha necesitado. Por ejemplo, si usamos una regla
de 3 cm diez veces una detrs de otra “mediremos” una
8. z = xex+y longitud de 30 cm. Para medir la misma longitud con
una regla de 12 necesitaremos usar la regla 2.5 veces. (
es decir, 30 = 12 × 2,5.) Thus D = n`.
En los Ejercicios 9 – 12, se da la función z = f (x, y).
Calcular la aproximación pedida utilizando la difrencial
Supongamos que cada vez que se toma una medicin con
total.
la regla, la longitud que medimos est a menos de 1/16
p mm de la distancia real. (Es decir, d` = 1/16mm ≈
9. f (x, y) = x2 + y. Aproximar f (2,95, 7,1) sabiendo 0, 005 mm). Usando la diferencial demuestre que el
que f (3, 7) = 4. “sentido común” está en lo cierto, es decir, que es mejor
medir largas longitudes con una regla larga que con una
corta.
10. f (x, y) = sin x cos y. Aproximar f (0,1, −0,1) sabiendo
que f (0, 0) = 0.
En los Ejercicios 17 – 18, calcular la diferencial total
2 2 dw.
11. f (x, y) = x y − xy . Aproximar f (2,04, 3,06) sabiendo
que f (2, 3) = −6.
17. w = x2 yz 3
12. f (x, y) = ln(x − y). Aproximar f (5,1, 3,98) sabiendo
que f (5, 4) = 0. 18. w = ex sin y ln z

Los Ejercicios 13 – 16 estań relacionados con cuestiones En los Ejercicios 19 – 21, utilice la informacin proporcio-
sobre el error y el análisis de sensibilidad. nada y el diferencial total para calcular la aproximacin
dada.
13. Un tanque cilı́ndrico tiene un radio de 1 metro y 2 me-
tros de alto. Estudiar si el volumen es más sensible a los 19. f (3, 1) = 7, fx (3, 1) = 9, fy (3, 1) = −2. Approximar
cambios de radio o de altura. f (3,05, 0,9).

48
20. f (−4, 2) = 13, fx (−4, 2) = 2,6, fy (−4, 2) = 5,1. fz (2, 4, 5) = 3,7. Aproximar f (2,5, 4,1, 4,8).
Approximar f (−4,12, 2,07).
22. f (3, 3, 3) = 5, fx (3, 3, 3) = 2, fy (3, 3, 3) = 0,
21. f (2, 4, 5) = −1, fx (2, 4, 5) = 2, fy (2, 4, 5) = −3, fz (3, 3, 3) = −2. Aproximar f (3,1, 3,1, 3,1).

49
Capı́tulo 1 Funciones de varias variables

1.5. Regla de la cadena


d  
La regla de la cadena en una variable establece que f g(x) =
dx
0
 0
f g(x) g (x). Sabemos que si t = g(x), podemos expresar la regla de
la cadena como
df df dt
= .
dx dt dx
En esta sección extendemos la regla de la cadena a funciones de varias
variables.

Teorema 8 Regla de la cadena, Parte I


Sea z = f (x, y), x = g(t) y y = h(t), donde f , g yh son funciones
diferenciables. Entonces z = f (x, y) = f g(t), h(t) es una función
de t, y
dz df dx dy ∂f dx ∂f dy
= = fx (x, y) + fy (x, y) = + .
dt dt dt dt ∂x dt ∂y dt

Esquemáticamente

x t
z
y t

Veamos lo que describen las situaciones z = f (x, y), x = g(t) and y =


h(t). Sabemos que z = f (x, y) describe una superficie y que x = g(t) y
y = h(t) son las ecuaciones paramétricas de una curva en el plano x-y.
Figura 1.14: Regla de la cadena mul- Combinando estos hechos, estamos describiendo una curva en la superficie
tivariable. de f . La ecuaciones
 paramétricas de esta curva son x = g(t), y = h(t) and
z = f g(t), h(t) .
Consideremos la Figura 1.14 que muestra una superficie, junto con una
curva en el plano x-y. La restricción de f a los puntos de esa circunferen-
df
cia da la curva que se muestra en la superficie. La derivada de indicará
dt
la razón instantánea de cambio de f con respecto a t. Si consideramos
df
un objeto que se desplaza a lo largo de este camino, proporciona la
dt

Notas:

50
1.5 Regla de la cadena

velocidad del objeto. A continuación damos algunos ejemplos.

Ejemplo 34 Regla de la cadena multivariable


dz
Sea z = x2 y + x, donde x = sin t e y = e5t . Calcular usando la regla
dt
de la cadena.

Solución Es claro que


dx dy
fx (x, y) = 2xy + 1, fy (x, y) = x2 , = cos t, = 5e5t .
dt dt
Aplicando ahora el Teorema 8 tenemos que
dz
= (2xy + 1) cos t + 5x2 e5t .
dt
Parece que algo va mal ya que dz dt es una función de x, y y t. No, como
dz
x e y son funciones de t, dt sı́ que es realmente una función de t como
podemos ver al sustituri los valores de x por sin t e y por e5t :
dz
= (2xy + 1) cos t + 5x2 e5t = (2 sin(t)e5t + 1) cos t + 5e5t sin2 t.
dt

Podemos pensar que si sustituimos las expresiones de x e y al final del


proceso para probar que dz
dt es una función de t, ¿por qué no sustituimos
antes de derivar?
Es decir, podemos escribir z = x2 y + x = (sin t)2 e5t + sin t, y aplicando la
regla de la cadena y las reglas del producto, obtenemos el mismo resultado:
dz
= 2 sin t cos t e5t + 5 sin2 t e5t + cos t.
dt
No obstante, no es usual, y en ocasiones es hasta mucho más complicado,
hacerlo de esta forma.
Ejemplo 35 Regla de la cadena multivariable
Un objeto viaja a lo largo de una trayectoria sobre una superficie. No se
conoce la trayectoria exacta, pero se sabe que en t = t0 :
∂z ∂z dx dy
= 5, = −2, =3 and = 7.
∂x ∂y dt dt
dz
Calcular (t0 ).
dt

Notas:

51
Capı́tulo 1 Funciones de varias variables

Solución Mediante la regla de la cadena obtenemos que


dz ∂z dx ∂z dy
= + = 5(3) + (−2)(7) = 1.
dt ∂x dt ∂y dt
Es decir, conociendo cierta información como los ratios de cambio de la
partı́cula en la superficie y su trayectoria en el plano x-y, podemos deter-
minar si el objeto asciende o desciende.

Aplicamos la regla de la cadena para resolver un problema de optimización.

Ejemplo 36 Aplicación de la regla de la cadena


Consideramos un paraboloide dado por z = x2 + y 2 − xy, y una partı́cula
que se mueve según la trayectoria x = cos t; y = sin t. Calcular dz dt en
t = 0, y hallar donde la partı́cula alcanza su altura máxima y mı́nima.

Solución Calculamos
dx dy
fx (x, y) = 2x − y, fy (x, y) = 2y − x, = − sin t, = cos t.
dt dt
Combinando estas expresiones con la regla de la cadena obtenemos:
dz
= −(2x − y) sin t + (2y − x) cos t.
dt

dz
Cuando t = 0, x = 1 e y = 0. Ası́ = −(2)(0) + (−1)(1) = −1. Cuando
dt
t = 0, la partı́cula desciende, como muestra la Figura 1.15.
Para calcular los valores máximo y mı́nimo en la trayectoria de la partı́cula,
resolvemos dz
dt = 0 en t:

dz
= 0 = −(2x − y) sin t + (2y − x) cos t
dt
0 = −(2 cos t − sin t) sin t + (2 sin t − cos t) cos t
π
0 = sin2 t − cos2 t =⇒ t = n (para n impar)
4
De aquı́ obtenemos que en el intervalo [0, 2π], z alcanza el mı́nimo absolu-
to en t = π/4 y 5π/4. De igual forma obtenemos que el máximo absoluto
Figura 1.15: Trayectoria de la se alcanza en el tiempo t = 3π/4 y 7π/4, como se muestra en la Figura
partı́cula en el Ejemplo 36.
1.15.

Notas:

52
1.5 Regla de la cadena

Ejemplo 37 Regla de la cadena 


x = 6t
Calcular dz/dt siendo z = x2 + 3y, siendo
y = t2 + 2

dz ∂z dx ∂z dy
Solución = · + · = (2x)(6) + (3)(2t) = 12x + 6t.
dt ∂x dt ∂y dt
El resultado se puede dejar ası́ o bien hacer la sustitución x = 6t, con lo
cual queda

dz
= 12x + 6t = 12(6t) + 6t = 72t + 6t = 78t.
dt

Podemos extender la regla de la cadena para incluir la situación en la que


z sea una función de más de una variable, y cada una de estas variables
sea también una función de más de una variable. El caso más básico es
z = f (x, y) y x e y funciones de dos variables, por ejemplo s y t.

Teorema 9 Regla de la cadena multivariada


1. Sea z = f (x, y), x = g(s, t) and y = h(s, t), donde f , g y h
son funciones diferenciables. Entonces z es una función de s
y t, y además
∂z ∂f ∂x ∂f ∂y ∂z ∂f ∂x ∂f ∂y
= + , y = + .
∂s ∂x ∂s ∂y ∂s ∂t ∂x ∂t ∂y ∂t

2. Sea z = f (x1 , x2 , . . . , xm ) una función diferenciable de m va-


riables, donde cada una de las variables xi es una función
diferenciable de variables t1 , t2 , . . . , tn . Entonces z función de
las ti , y
∂z ∂f ∂x1 ∂f ∂x2 ∂f ∂xm
= + + ··· + .
∂ti ∂x1 ∂ti ∂x2 ∂ti ∂xm ∂ti

Esquemáticamente:

Notas:

53
Capı́tulo 1 Funciones de varias variables

r
x
s
z
r
y
s

Ejemplo 38 Regla de la cadena multivariable


Sea z = x2 y + x, x = s2 + 3t and y = 2s − t. Calcular ∂z
∂s y
∂z
∂t , y evaluar
cada una cuando s = 1 y t = 2.

Solución Aplicamos el Teorema 9:

∂f ∂f ∂x ∂x ∂y ∂y
= 2xy + 1, = x2 , = 2s, = 3, = 2, = −1.
∂x ∂y ∂s ∂t ∂s ∂t

Ası́
∂z
= (2xy + 1)(2s) + (x2 )(2) = 4xys + 2s + 2x2 , y
∂s
∂z
= (2xy + 1)(3) + (x2 )(−1) = 6xy − x2 + 3.
∂t
Cuando s = 1 y t = 2, x = 7 y y = 0, con lo que

∂z ∂z
= 100 y = −46.
∂s ∂t

Ejemplo 39 Regla de la cadena multivariada


∂w
Sea w = xy + z 2 , con x = t2 es , y = t cos s, y z = s sin t. Hallar ∂t cuando
s = 0 y t = π.

Solución Siguiendo el Teorema 9:

∂f ∂f ∂f ∂x ∂y ∂z
= y, = x, = 2z, = 2tes , = cos s, = s cos t.
∂x ∂y ∂z ∂t ∂t ∂t

∂w
Ası́ = y(2tes ) + x(cos s) + 2z(s cos t). Cuando s = 0 y t = π, tenemos
∂t
x = π 2 , y = π y z = 0. Ası́

∂w
= π(2π) + π 2 = 3π 2 .
∂t

Notas:

54
1.5 Regla de la cadena

Ejemplo 40 Regla
 de la cadena multivariada
2 ∂z ∂z
x = r s
Si z = 8x + y 2 , donde calcular y .
y = 3r − 5s ∂r ∂s

Solución
∂z ∂z ∂x ∂z ∂y
= · + · = (8) (2rs) + (2y) (3) = 16rs + 6y
∂r ∂x ∂r ∂y ∂r
∂z ∂z ∂x ∂z ∂y
= · + · = (8) (r2 ) + (2y) (−5) = 8r2 − 10y
∂s ∂x ∂s ∂y ∂s

Diferenciación implı́cita

dy
Estudiamos ahora cómo hallar cuando y es función implı́cita de x.
dx
Consideremos, por ejemplo, la función

x2 y − xy 3 = 3.
dy
Vamos a calcular :
dx
d  2 d   dy dy
x y − xy 3 = ⇒ 2xy + x2 − y 3 − 3xy 2

3 =0
dx dx dx dx
dy 2xy − y 3
=− 2 . (1.2)
dx x − 3xy 2

Pero también podemos calcularla utilizando la regla de la cadena. Consi-


deramos la función z = x2 y − xy 3 . La función implı́cita dada se tiene para
la curva de nivel z = 3. Considerando x e y como funciones de x, la regla
de la cadena establece que
dz ∂z dx ∂z dy
= + . (1.3)
dx ∂x dx ∂y dx
dz
Como z es constante (en nuestro ejemplo, z = 3), dx = 0. También sabe-
dx
mos que dx = 1. La expresión (1.3) queda entonces
∂z ∂z dy dy ∂z . ∂z fx
0= (1) + =⇒ =− =− .
∂x ∂y dx dx ∂x ∂y fy

Notas:

55
Capı́tulo 1 Funciones de varias variables

dy
Observemos que la expresión en la ecuación (1.2) es justo la derivada
dx
parcial de z con respecto a x, dividida por la derivada parcial de z con
respecto a y. Este hecho sucede siempre y lo plasmamos en el siguiente
resultado:

Teorema 10 Diferenciación implı́cita


Sea f una función diferenciable de x, y, donde f (x, y) = c define a y
como una función implı́cita de x, para alguna constante c. Entonces

dy fx (x, y)
=− .
dx fy (x, y)

Ejemplo 41 Diferenciación implı́cita


Dada la función implı́cita sin(x2 y 2 ) + y 3 = x + y, hallar y 0 .

Solución Sea f (x, y) = sin(x2 y 2 ) + y 3 − x − y; la función implı́cita es


dy
equivalente a f (x, y) = 0. Calculamos aplicando el Teorema 10. Ası́
dx
fx (x, y) = 2xy 2 cos(x2 y 2 ) − 1 y fy (x, y) = 2x2 y cos(x2 y 2 ) − 1,

por tanto
dy 2xy 2 cos(x2 y 2 ) − 1
=− 2 .
dx 2x y cos(x2 y 2 ) − 1

Notas:

56
Ejercicios 1.5
Términos y conceptos donde dz
dt
= 0. Nota: son las misma curvas/superficies
que las de los Ejercicios 6 – 11.
1. Sea una curva de nivel de z = f (x, y) descrita en el
forma x = g(t), y = h(t). Explicar el motivo por el que 12. z = 3x + 4y, x = t2 , y = 2t
dz
dt
= 0.

13. z = x2 − y 2 , x = t, y = t2 − 1
2. Rellenar: la regla de la cadena en una variable establece
d  
f g(x) = f 0 g(x) ·

que .
dx 14. z = 5x + 2y, x = 2 cos t + 1, y = sin t − 3

3. Completar: La regla de la cadena multivariada establece x


15. z = , x = cos t, y = sin t
que y2 + 1
df ∂f dy
= · + · .
dt ∂x dt 16. z = x2 + 2y 2 , x = sin t, y = 3 sin t

4. V/F: La regla de la cadena es útil solo en el caso de


que todas las funciones que intervengan se conozcan 17. z = cos x sin y, x = πt, y = 2πt + π/2
explı́citamente.
En los Ejercicios 18 – 21, se dan las funciones z =
5. La regla de la cadena nos permite calcular deriva- f (x, y), x = g(t) y y = h(t).
das implı́citas simplemente calculando dos derivadas
. ∂z
(a) Utilizar la regla de la cadena para obtener y
∂s
∂z
.
∂t
Problemas ∂z ∂z
(b) Evaluar y para los valores s y t dados.
∂s ∂t
En los Ejercicios 6 – 11, se dan las funciones z = f (x, y),
x = g(t) y y = h(t). 18. z = x2 y, x = s − t, y = 2s + 4t; s = 1,
t=0
dz
(a) Utilizar la regla de la cadena para obtener .
dt π 
dz 19. z = cos πx + y , x = st2 , y = s2 t; s = 1,
(b) Evaluar para el valor de t indicado. 2
dt t=1

6. z = 3x + 4y, x = t2 , y = 2t; t=1 20. z = x2 + y 2 , x = s cos t, y = s sin t; s = 2,


t = π/4
7. z = x2 − y 2 , x = t, y = t2 − 1; t=1
2
+y 2 )
21. z = e−(x , x = t, y = st2 ; s = 1, t = 1
8. z = 5x + 2y, x = 2 cos t + 1, y = sin t − 3;
t = π/4
dy
En los Ejercicios 22 – 25, obtener usando diferen-
dx
x ciación implı́cita y el Teorema10.
9. z = , x = cos t, y = sin t; t = π/2
y2 + 1
22. x2 tan y = 50
2 2
10. z = x + 2y , x = sin t, y = 3 sin t; t =
π/4
23. (3x2 + 2y 3 )4 = 2

11. z = cos x sin y, x = πt, y = 2πt + π/2;


t=3 x2 + y
24. = 17
x + y2
En los Ejercicios 12 – 17, se dan las funciones z =
f (x, y), x = g(t) y y = h(t). Calcular los valores de t 25. ln(x2 + xy + y 2 ) = 1

57
dz ∂z ∂z ∂z ∂z
En los Ejercicios 26 – 29, obtener ,o y , con 28. = −4, = 9,
dt ∂s ∂t ∂x ∂y
la información proporcionada. ∂x ∂x ∂y ∂y
= 5, = 7, = −2, =6
∂s ∂t ∂s ∂t
∂z ∂z dx dy
26. = 2, = 1, = 4, = −5
∂x ∂y dt dt ∂z ∂z
29. = 2, = 1,
∂x ∂y
∂z ∂z dx dy ∂x ∂x ∂y ∂y
27. = 1, = −3, = 6, =2 = −2, = 3, = 2, = −1
∂x ∂y dt dt ∂s ∂t ∂s ∂t

58
1.6 Derivada direccional

1.6. Derivada direccional

Las derivadas parciales nos dan una comprensión de cómo una super-
ficie cambia cuando nos movemos en las direcciones x e y. Hicimos la
comparación en un prado: si nos dirigı́amos hacia el este, la cantidad de
ascenso/descenso era comparable a fx .
Asimismo, la subida/caı́da en el movimiento hacia el norte era compa-
rable a fy . Cuanto más pronunciada era la pendiente, mayor será fy en
magnitud.
Pero ¿qué pasa si nos movemos al noreste y queremos medir la cantidad
de subida/descenso? Las derivadas parciales por sı́ solas no pueden medir
esto. En esta sección introducimos las derivadas direccionales, que son
capaces de medir este hecho.

Definición 17 Derivada direccional


Sea z = f (x, y) continua en un conjunto abierto S y sea ~u = hu1 , u2 i
un vector unitario. Para todos los puntos (x, y), la derivada di-
reccional de f en (x, y) en la dirección ~u es

f (x + hu1 , y + hu2 ) − f (x, y)


D~u f (x, y) = lı́m .
h→0 h

Teorema 11 Derivada direccional


Sea z = f (x, y) diferenciable en un abierto S que contiene al punto
(x0 , y0 ), y sea ~u = hu1 , u2 i un vector unitario.
La derivada direccional f en (x0 , y0 ) en la dirección ~u es

D~u f (x0 , y0 ) = fx (x0 , y0 )u1 + fy (x0 , y0 )u2 .

Ejemplo 42 Derivada direccional


Sea z = 14 − x2 − y 2 y sea P = (1, 2). Encontrar la derivada direccional
de f en P , en las siguientes direcciones:
1. En la dirección Q = (3, 4),

Notas:

59
Capı́tulo 1 Funciones de varias variables

2. En la dirección h2, −1i, y

3. En la dirección del origen de coordenadas.

Solución La superficie se muestra en la Figura 1.16, donde el punto


P = (1, 2) está indicado en el plano x, y ası́ como el punto (1, 2, 9) que
pertenece en la superficie. Calculamos fx (x, y) = −2x y fx (1, 2) = −2;
fy (x, y) = −2y y fy (1, 2) = −4.
# ‰
1. Sea ~u1 el vector unitario que
une
√ (1, 2)
√con
el punto Q = (3, 4), P Q =
h2, 2i y el unitario es ~u1 = 1/ 2, 1/ 2 . La derivada direccional de
f en (1, 2) en la dirección ~u1 es
Figura 1.16: Gráfico para ilustrar el √ √ √
Ejemplo 42. D~u1 f (1, 2) = −2(1/ 2) + (−4)(1/ 2) = −6/ 2 ≈ −4,24.

Ası́ la tasa de cambio instantánea al movernos desde el punto (1, 2, 9)


en la dirección del vector ~u1 es de −4,24. Movernos en esta dirección
significará descender.

2. Derivada direccional
en √ √ h2, −1i. Calculamos el vector
la dirección
unitario que es ~u2 = 2/ 5, −1/ 5 . La derivada direccional de f
en (1, 2) en la dirección ~u2 es
√ √
D~u2 f (1, 2) = −2(2/ 5) + (−4)(−1/ 5) = 0.

Comenzando en la superficie determinada por f situándonos en el


punto (1, 2) y si nos movemos en la dirección h2, −1i (o ~u2 ) resulta
que no hay cambio en el valor de z.

3. Si P = (1, 2), la dirección hacia el origen está dada


por√el vector

h−1, −2i; y la dirección unitaria viene dada por ~u3 = −1/ 5, −2/ 5 .
La derivada direccional pedida viene dada por
√ √ √
D~u3 f (1, 2) = −2(−1/ 5) + (−4)(−2/ 5) = 10/ 5 ≈ 4,47.

Esto es, ”movernos hacia el origen” significa abordar una pendiente


de alrededor de 4,47.

Para el estudio de las derivadas parciales será importante establecer la


conexión entre el vector unitario ~u = hu1 , u2 i que describe la dirección y
las derivadas parciales fx y fy .

Notas:

60
1.6 Derivada direccional

Definición 18 Gradiente
Si z = f (x, y) es diferenciable en un abierto S y (x0 , y0 ) ∈ S,
entonces
1. El gradiente de f es ∇f (x, y) = hfx (x, y), fy (x, y)i.
2. El gradiente de f en (x0 , y0 ) es

∇f (x0 , y0 ) = hfx (x0 , y0 ), fy (x0 , y0 )i .

Idea 3 Gradiente y derivada direccional Nota: El sı́mbolo “∇” deriva del


La derivada direccional z = f (x, y) en la dirección ~u es nombre griego dado a un arpa judı́a.

D~u f = ∇f · ~u.

Las propiedades del producto escalar previamente estudiadas nos permiten


investigar las propiedades de la derivada direccional. Teniendo en cuenta
que la derivada direccional da la razón instantánea de cambio de z cuando
se mueve en la dirección de ~u, surgen tres preguntas:
1. ¿En qué dirección se tiene el mayor cambio en z (es decir, la “cuesta
más pronuniciada”)? Nota: Para simplificar se suele escri-
bir ∇f = hfx , fy i. El gradiente permi-
2. ¿En qué dirección (es) se tiene el menor cambio en z (es decir, el
te calcular las derivadas direccionales
“descenso más pronunciado”)? en términos de productos escalares.
3. ¿En qué dirección (es) no hay cambio en z?
Mediante el uso de la propiedad del producto escalar, tenemos

∇f · ~u = || ∇f || || ~||u cos θ = || ∇f || cos θ, (1.4)

donde θ es el ángulo entre el gradiente y ~u. (Como ~u es un vector unitario,


|| ~u || = 1.) Esto nos permite responder a las tres preguntas formuladas
anteriormente.
1. La expresión 1.4 se maximiza cuando cos θ = 1, es decir, cuando el
gradiente y ~u tienen la misma dirección.
2. La La expresión 1.4 se minimiza cuando cos θ = −1, es decir, cuando
el gradiente y ~u tienen direcciones opuestas.

Notas:

61
Capı́tulo 1 Funciones de varias variables

3. La La expresión 1.4 es 0 cuando cos θ = 0, es decir, cuando el gra-


diente y ~u son ortogonales entre sı́.
Este resultado es bastante sorprendente. Una vez más imaginémonos de
pie en un prado y mirando a la dirección más pronunciado hacia arriba, la
dirección con la cuesta abajo m’as pronunciada estará justamente detrás
y a la izquierda o la derecha no cambiarı́a la elevación.
Recordemos que una curva de nivel se define como una curva en el plano
x − y a lo largo de la cual los valores de la función no cambian. Sea una
superficie z = f (x, y) y representemos una de esas curvas de nivel como el
vector ~r(t) = hx(t), y(t)i . Como el valor de f no cambia a lo largo de esta
curva, f x(t), y(t) = c para todo t para alguna constante c.
df
Como f es constante para todo t, dt = 0. Por la regla de la cadena tenmos
que
df
= fx (x, y)x 0 (t) + fy (x, y)y 0 (t) = hfx (x, y), fy (x, y)i · hx 0 (t), y 0 (t)i
dt
= ∇f · ~r 0 (t) = 0.

Esta última igualdad afirma ∇f · ~r 0 (t) = 0: el gradiente es ortogonal a


la derivada de ~r, es decir, es ortogonal al propio ~r. Como conclusión: en
cualquier punto de una superficie, el gradiente en ese punto es ortogonal
a la curva de nivel que pasa por ese punto. Situamos todas estas ideas en
un teorema:

Teorema 12 Gradiente y derivada direccional


Sea z = f (x, y) diferenciable en un abierto Scon gradiente ∇f , sea
P = (x0 , y0 ) un punto en S y sea ~u un vector unitario.
1. El máximo valor de D~u f (x0 , y0 ) es || ∇f (x0 , y0 ) ||; la direc-
ción de crecimiento maximal en z es ∇f (x0 , y0 ).
2. El mı́nimo valor de D~u f (x0 , y0 ) es −|| ∇f (x0 , y0 ) ||; la direc-
ción de decrecimiento maximal en z es −∇f (x0 , y0 ).
3. En P , ∇f (x0 , y0 ) esortogonal a la curva de nivel que pasa
por x0 , y0 , f (x0 , y0 ) .

Ejemplo 43 Direcciones de crecimiento máximo


Sea f (x, y) = sin x cos y y sea P = (π/3, π/3). Encontrar las direcciones
de crecimiento y decrecimiento máximo y encontrar también la dirección
donde el la tasa instantánea de crecimiento es 0.

Notas:

62
1.6 Derivada direccional

Solución Como fx = cos x cos y y fy = − sin x sin y, tenemos que


π π 1 3
∇f = hcos x cos y, − sin x sin yi y, en P , ∇f , = ,− .
3 3 4 4

La dirección de crecimiento maximal es h1/4,


√ −3/4i. En esta dirección la
tasa de cambio de z es || h1/4, −3/4i || = 10/4 ≈ 0,79.

√ decrecimiento se tiene en h−1/4, 3/4i; como una


La dirección de máximo
tasa de cambio de − 10/4 ≈ −0,79.
Cualquier dirección ortogonal a ∇f es una dirección sin cambio en z. Tene- (a)
mos dos opciones: la dirección de h3, 1i y la dirección de h−3, −1i. El vector
unitario en la dirección de h3, 1i se muestra en los gráficos
√ de la Figura
1.17 donde hemos dibujado la curva de nivel en z = 3/4 : recordemos
que a lo largo de esta curva los valores de z no cambian. Como h3, 1i es una
dirección sin cambio en z, este vector es tangente a la curva de nivel en P.

Ejemplo 44 Significado de ∇f = ~0
Sea f (x, y) = −x + 2x − y 2 + 2y + 1. Hallar la derivada direccional de f,
2

para cualquier dirección, en P = (1, 1).

Solución ∇f = h−2x + 2, −2y + 2i. En P tenemos que ∇f (1, 1) = (b)


h0, 0i. Por el Teorema 12, esta es la dirección de máximo crecimiento. Sin
embargo, en h0, 0i no hay pendiente. Cualquiera que sea el vector unitario Figura 1.17: Gráfico de la superficie
~u se tiene que D~u f = 0. para el Ejemplo 43 desde direcciones
importantes.
En la Figura 1.18 observamos que P está en la cima del paraboloide. La
tasa de cambio instantánea es nula en cualquier dirección que parta de P.

El hecho de que el gradiente de una superficie siempre tenga la dirección


de la máximo crecimiento/decrecimiento es muy útil, como ilustra el si-
guiente ejemplo.

Ejemplo 45 Caı́da del agua desde un punto


Consideremos la superficie f (x, y) = 20 − x2 − 2y 2 . El agua se vierte sobre
la superficie desde (1, 1/4). ¿qué camino seguirá?

Solución Sea ~r(t) = hx(t), y(t)i el vector de valores que describen el


recorrido del agua en el plano x − y; buscamos x(t) y y(t). Sabemos que el
Figura 1.18: At the top of a parabo-
loid, all directional derivatives are 0.

Notas:

63
Capı́tulo 1 Funciones de varias variables

agua fluirá siempre cuesta abajo en la dirección de descenso máximo ; Por


lo tanto, en cualquier punto de su trayectoria, se moverá en la dirección de
−∇f, (ignoramos los efectos fı́sicos de impulso en el agua .) Por lo tanto
~r 0 (t) será paralelo a ∇f, con constante c de tal manera que c∇f = ~r 0 (t) =
hx 0 (t), y 0 (t)i.
dx dy
Como ∇f = h−2x, −4yi y escribimos x 0 (t) como dt y y 0 (t) como dt .
Entonces
 
0 0 dx dy
c∇f = hx (t), y (t)i , es decir h−2cx, −4cyi = , .
dt dt

Esto implica
dx dy
(a) −2cx = y − 4cy = , es decir
dt dt

y 1 dx 1 dy
c=− y c=− .
2x dt 4y dt
2
Con la misma c en ambas expresiones, tenemos que
1 dx 1 dy
= .
x 2x dt 4y dt
−4 −2 2 4
Para encontrar la relación entres x e y, podemos integrar en ambos lados
−2 dx
con respecto a t. Como dt = dx tenemos que
dt
. Z Z Z Z
(b) 1 dx 1 dy 1 1
dt = dt ⇒ dx = dy ⇒ ln |x2 | = ln |y| + C1 .
2x dt 4y dt 2x 4y
Figura 1.19: Gráfico de la superficie
descrita en el Ejemplo 45 a lo largo Ahora tomando exponenciales se llega a que
del camino en el plano x-y plane con
las curvas de nivel. Cx2 = y.

Como el agua mana desde (1, 1/4), podemos despejar C:


1 1
C(1)2 = ⇒ C= .
4 4

El agua sigue la curva y = x2 /4. La superficie y la trayectoria se repre-


sentan gráficamente en la Figura 1.19(a). En la parte (b) se representan
curvas de nivel de la superficie. Nótese cómo el camino interseca a las cur-
vas de nivel en ángulo recto. A medida que el camino sigue el gradiente
cuesta abajo, lo que refuerza el hecho de que el gradiente es ortogonal a

Notas:

64
1.6 Derivada direccional

las curvas de nivel.

Funciones de tres variables

Los conceptos de derivadas direccionales y de gradiente se extienden fácil-


mente a tres (o más) variables.

Definición 19 Derivadas direccionales y gradiente en


tres variables
Sea z = F (x, y, z) continua en un conjunto abierto B y sea ~u un
vector unitario en R3 .
1. El gradiente de F es ∇F = hFx , Fy , Fz i.
2. La derivada direccional F en la dirección ~u es

D~u F = ∇F · ~u.

Las mismas propiedades dadas en el Teorema 12, se mantienen en tres


variables.

Teorema 13 Gradiente y derivada direccional


Sea z = F (x, y, z) continua en un conjunto abierto B, ∇F el gra-
diente de F y sea ~u un vector unitario en R3 .
1. El máximo valor de D~u F is || ∇F ||, se obtiene cuando el
ángulo entre ∇F y ~u es 0, es decier, la dirección de crecimiento
maximal es ∇F .
2. El mı́nimo valor de D~u F is −|| ∇F ||, se obtiene cuando el
ángulo entre ∇F y ~u es π, es decir, la dirección de decreci-
miento maximal es −∇F .
3. D~u F = 0 cuando ∇F y ~u son ortogonales.

Ejemplo 46 Derivadas direccionales en tres variables


Si una fuente puntual S está irradiando energı́a, la intensidad I en un
punto P dado en el espacio es inversamente proporcional al cuadrado de
la distancia entre S y P . Es decir, cuando S = (0, 0, 0), I(x, y, z) =

Notas:

65
Capı́tulo 1 Funciones de varias variables

k
para alguna constante k.
x2 + y2 + z2
Sea k = 1, sea ~u = h2/3, 2/3, 1/3i un vector unitario, y sea P = (2, 5, 3).
Encontrar la derivada direccional de I en P en la dirección de ~u, y encon-
trar la dirección de máximo crecimiento en P .

Solución
 
−2x −2y −2z
∇I = , ,
(x2 + y 2 + z 2 )2 (x2 + y 2 + z 2 )2 (x2 + y 2 + z 2 )2
 
−4 −10 −6
∇I(2, 5, 3) = , , ≈ h−0,003, −0,007, −0,004i
1444 1444 1444
17
D~u I = ∇I(2, 5, 3) · ~u = − ≈ −0,0078.
2166

La derivada direccional nos indica que se mueve en la dirección de ~u des-


de P resultando una disminución de la intensidad de aproximadamente
−0,008 unidades por unidad de longitud.
Notemos que
 
−4 −10 −6 2
∇I(2, 5, 3) = , , = h−2, −5, −3i .
1444 1444 1444 1444

El gradiente en (2, 5, 3) tiene la dirección h−2, −5, −3i , es decir, hacia el


origen. Este hecho corrobora la intuición: el mayor aumento en la intensi-
dad se encuentra moviéndonos hacia la fuente de la energı́a.

La derivada direccional nos permite encontrar la tasa instantánea de cam-


bio de z en cualquier dirección. Podemos utilizar estas tasas de cambio
instantáneas para definir rectas y planos que son tangentes a una superfi-
cie en un punto.

Notas:

66
Ejercicios 1.6
Términos y conceptos 1
15. f (x, y) = , P = (1, 1).
x2 + y 2 + 1
a) In the direction of ~v = h1, −1i.
1. What is the difference between a directional derivative
b) In the direction toward the point Q = (−2, −2).
and a partial derivative?

16. f (x, y) = −4x + 3y, P = (5, 2)


2. For what ~
u is Du~ f = fx ?
a) In the direction of ~v = h3, 1i .
b) In the direction toward the point Q = (2, 7).
3. For what ~
u is Du~ f = fy ?

17. f (x, y) = x2 + 2y 2 − xy − 7x, P = (4, 1)


4. The gradient is to level curves.
a) In the direction of ~v = h−2, 5i
b) In the direction toward the point Q = (4, 0).
5. The gradient points in the direction of increa-
se.
18. f (x, y) = x2 y 3 − 2x, P = (1, 1)
6. It is generally more informative to view the directional a) In the direction of ~v = h3, 3i
derivative not as the result of a limit, but rather as the b) In the direction toward the point Q = (1, 2).
result of a product.
In Exercises 19 – 24, a function z = f (x, y) and a point
P are given.
Problemas
(a) Find the direction of maximal increase of f at P .

In Exercises 7 – 12, a function z = f (x, y) is given. Find (b) What is the maximal value of Du~ f at P ?
∇f . (c) Find the direction of minimal increase of f at P .
(d) Give a direction ~
u such that Du~ f = 0 at P .
7. f (x, y) = −x2 y + xy 2 + xy
Note: these are the same functions and points as in
Exercises 13 through 18.
8. f (x, y) = sin x cos y

1 19. f (x, y) = −x2 y + xy 2 + xy, P = (2, 1)


9. f (x, y) =
x2 + y 2 + 1
π π
20. f (x, y) = sin x cos y, P = ,
10. f (x, y) = −4x + 3y 4 3

1
11. f (x, y) = x2 + 2y 2 − xy − 7x 21. f (x, y) = , P = (1, 1).
x2 + y 2 + 1

12. f (x, y) = x2 y 3 − 2x 22. f (x, y) = −4x + 3y, P = (5, 4).

In Exercises 13 – 18, a function z = f (x, y) and a point 23. f (x, y) = x2 + 2y 2 − xy − 7x, P = (4, 1)
P are given. Find the directional derivative of f in the
indicated directions. Note: these are the same functions
as in Exercises 7 through 12. 24. f (x, y) = x2 y 3 − 2x, P = (1, 1)

13. f (x, y) = −x2 y + xy 2 + xy, P = (2, 1) In Exercises 25 – 28, a function w = F (x, y, z), a vector
a) In the direction of ~v = h3, 4i ~v and a point P are given.
b) In the direction toward the point Q = (1, −1).
(a) Find ∇F (x, y, z).
π π (b) Find Du~ F at P .
14. f (x, y) = sin x cos y, P = ,
4 3
a) In the direction of ~v = h1, 1i. 25. F (x, y, z) = 3x2 z 3 + 4xy − 3z 2 , ~v = h1, 1, 1i, P =
b) In the direction toward the point Q = (0, 0). (3, 2, 1)

67
26. F (x, y, z) = sin(x) cos(y)ez , ~v = h2, 2, 1i, P = (1, 0, −1)
(0, 0, 0)
2
28. F (x, y, z) = , ~v = h1, 1, −2i, P =
x2 + y 2 + z 2
27. F (x, y, z) = x2 y 2 − y 2 z 2 , ~v = h−1, 7, 3i, P = (1, 1, 1)

68
2: Optimización
2.1. Introducción a la optimización
En la Teorı́a de Optimización la mayorı́a de los problemas que se plantean
tienen una estructura lógica común. La idea que subyace en ellos es la de
encontrar la mejor decisión posible en unas circunstancias dadas.
Como ejemplos podemos citar:
Minimizar una distancia.
Calcular los estimadores de máxima verosimilitud.
Maximizar beneficios determinando las cantidades de factores pro-
ductivos para ello.
Un consumidor que debe decidir qué cantidades comprar de varios
bienes de consumo a fin de minimizar los costes sin superar su pre-
supuesto.
De hecho, muchos definen la Economı́a como la ciencia que estudia “la
utilización óptima de recursos escasos.”
La búsqueda de soluciones óptimas a diversos problemas ha preocupado
al hombre en todas las épocas. Euclı́des, matemático griego del siglo III a.
C., describió cómo encontrar el paralelogramo de superficie máxima con
un perı́metro dado.
Sin embargo, los métodos de resolución para este tipo de problemas no
fueron desarrollados hasta los siglos XVII y XVIII mediante las poderosas
técnicas que proporcionó el Cálculo Diferencial.
Ante cualquier problema de optimización, lo lógico es plantearse ciertas
cuestiones como
1. Cuáles son las variables sobre las que tenemos que decidir. A éstas
nos referiremos como variables de decisión.
2. Cuáles son los valores posibles de las variables de decisión, que cons-
tituirán el denominado conjunto de oportunidades o también con-
junto admisible.
3. Qué criterio nos permitirá elegir la mejor opción de acuerdo con el
objetivo que se pretenda alcanzar, esto es, la elección de la función
objetivo.
Capı́tulo 2 Optimización

En general, un problema de optimización puede tener o no solución, si


ésta existe puede ser local o global y, única o múltiple.
En este capı́tulo analizaremos aspectos como la existencia y la globalidad
de las soluciones del problema teniendo en cuenta las caracterı́sticas de
la función objetivo y del conjunto admisible. Enunciaremos un teorema
clásico de la Teorı́a de Optimización como es el Teorema de Weierstrass.
Los teoremas referidos a programas convexos se expondrán en capı́tulos
posteriores.
También se presenta un primer método para resolver problemas de opti-
mización en funciones de dos variables, a saber, el método gráfico.

2.2. Formulación de programas matemáticos

Como se ha comentado en la introducción, los elementos que intervie-


nen en el planteamiento de un problema de optimización son: variables
de decisión, función objetivo, conjunto de soluciones posibles o conjunto
admisible.
La formulación de un problema consiste en la descripción matemática de
estos elementos y es un requisito previo e imprescindible para su posterior
resolución.
En primer lugar, definimos una serie de conceptos elementales y a la vez
necesarios en el estudio de los problemas de optimización.

Definición 20 Programa matemático


Un programa matemático es un problema que consiste en hallar
los óptimos de una función escalar que llamaremos función objetivo
sobre un subconjunto de Rn .

La formulación general de estos problemas consiste en:

Optimizar f (x)
s.a. x ∈ B.

A la función f se le denomina función objetivo.

Notas:

70
2.2 Formulación de programas matemáticos

Al conjunto B nos referiremos como conjunto factible o conjunto ad-


misible.
Se trata de determinar los valores que han de tomar las variables de deci-
sión
x = (x1 , x2 , . . . , xn )
dentro del conjunto B para que la función objetivo f alcance su valor
óptimo.
El conjunto B estará definido por las restricciones del problema, las cuales
delimitan los valores posibles de las variables de decisión.
Las restricciones pueden ser de igualdad o de desigualdad, normalmente
en los problemas económicos no aparecen desigualdades estrictas.
Ejemplo 47 Conjunto factible

Optimizar x + y
s.a. (x, y) ∈ B

donde B = {(1, 0), (0, 1), (−1, 3), (1, 2), (2, 1)}.

Solución Observamos que el conjunto factible está formado por cinco


puntos del plano. Para averiguar en cuál alcanza la función su mayor valor,
sólo debemos evaluar la función en cada uno de ellos,

f (1, 0) = f (0, 1) = 1, f (−1, 3) = 2, f (1, 2) = f (2, 1) = 3.

En consecuencia, el valor mı́nimo se alcanza en dos puntos, (1, 0), (0, 1) y


el valor máximo en otros dos, (1, 2), (2, 1).

Los distintos programas matemáticos pueden clasificarse atendiendo a su


conjunto factible y a su función objetivo.
Ası́, una posible clasificación de los programas es:
Programas clásicos. Aquellos programas que no tienen restriccio-
nes o si las tienen son todas de igualdad, en cuyo caso se llamarán
también problemas lagrangianos.
Programas no clásicos. Son aquellos programas en los que el con-
junto admisible está dado por restricciones de desigualdad.
Otra posible clasificación serı́a:

Notas:

71
Capı́tulo 2 Optimización

Programas lineales. Se trata de programas en los que la función


objetivo y las funciones que definen las restricciones son funciones
lineales.

Programas no lineales. Son aquellos programas en los que o bien


la función objetivo o alguna de las funciones que definen el conjunto
factible son no lineales.

Programas convexos. Llamaremos ası́ a los programas en los que


el conjunto admisible sea un conjunto convexo y la función objeti-
vo sea convexa si el programa es de minimizar y cóncava si es de
maximizar.

Ejemplo 48 Planteamiento de programas


Considérese la función de producción

Q(x, y) = xa y 1−a

con 0 < a < 1, donde x es el factor productivo capital e y el factor


trabajo. Supongamos que cada hora de trabajo se paga a p u.m., cada
unidad de factor capital a q u.m. y que se dispone de M u.m. para la
compra de recursos. Formular el programa que permite conocer cuál es la
distribución de factores que maximiza la producción.

Solución Obsérvese que las variables de decisión x, y son no nega-


tivas. Es más, si alguna de ellas vale cero entonces la producción serı́a
nula.

Ejemplo 49 Planteamiento de programas


Una empresa fabrica tres productos A, B y C para lo que utiliza tres mate-
riales distintos M1 , M2 , M3 . En este momento, se dispone en un almacén
de 8, 6, 20 unidades de M1 , M2 , M3 respectivamente. Las cantidades de
cada material necesarias para fabricar una unidad de cada producto vienen
dadas por la siguiente tabla:

A B C
M1 2 2 1
M2 4 1 2
M3 1 4 6

Si el beneficio unitario por la venta de cada uno de ellos es de 3, 4 y 2


u.m., plantear el programa cuya solución determina las cantidades que se
han de producir de cada artı́culo para maximizar el beneficio.

Notas:

72
2.3 Teorema de Weierstrass

Solución Notaremos por x, y, z a las cantidades de los artı́culos A, B,


C fabricadas respectivamente. Por tanto, la formulación de este problema
será:
Maximizar 3x + 4y + 2z
s.a. 2x + 2y + z ≤ 8
4x + y + 2z ≤ 6
x + 4y + 6z ≤ 20
x, y, z ≥ 0.
Se trata de un programa lineal. Este tipo de problemas son muy habituales
en Economı́a.

Ejemplo 50 Planteamiento de programas


Una empresa distribuidora de productos farmaceuticos requiere determi-
nar la localización de una bodega que funcionará como centro de distri-
bución y abastecimiento para sus locales en el paı́s. En especial se busca
estar a la menor distancia de los tres principales locales de venta al público
denominados A, B y C respectivamente. Las coordenadas geográficas de
dichos locales se presentan en el siguiente gŕafico: Formular un modelo de
optimización que permita determinar la localización óptima de la bodega
y que minimice las distancia a los distintos locales de la empresa asumien-
do que la bodega puede ser ubicada en cualquier coordenada o punto del
mapa. y
(30, 50)

(100, 30)
Solución
Si el punto del mapa donde se instalará la bodega tiene coordenadas (x, y),
deberá minimizar la distancia a todos los locales. Por tanto, el problema x
pedido es (0, 0)

p p p
Minimizar x2 + y 2 + (x − 30)2 + (y − 50)2 + (x − 100)2 + (y − 30)2 . Figura 2.1: Posición de puntos en el
Ejemplo 50
En la Figura 2.1 se observa la configuración de los puntos.

2.3. Teorema de Weierstrass


El teorema que vamos a enunciar en esta sección se debe al ilustre ma-
temático alemán Karl Weierstrass (1815-1897).
Entre otras aportaciones, introdujo el rigor en el Cálculo Matemático y,
como curiosidad, comentaremos que presentó el primer ejemplo de una

Notas:

73
Capı́tulo 2 Optimización

función que era continua en todo el dominio y derivable en ningún punto.


Se trata de una función imposible de representar gráficamente ya que entre
dos puntos cualesquiera tiene infinitos dientes de sierra.

Además, investigó en diversos campos de las Matemáticas, destacando


sobre todo en el estudio de las funciones analı́ticas y elı́pticas. Hoy en dı́a
se considera que fue uno de los matemáticos que más contribuyó en la
formalización de nociones tales como función, lı́mite y continuidad.

Iniciamos de esta sección recordando las definiciones de óptimos locales y


globales para una función de n variables.

Definición 21 Máximo local


Sea A ⊂ Rn y f : A −→ Rn . Diremos que a ∈ A es máximo local
de f cuando exista una bola de centro a y radio r, B(a, r), tal que

f (x) ≤ f (a)

para todo x ∈ A ∩ B(a, r).

Definición 22 Mı́nimo local


Sea A ⊂ R y f : A −→ Rn .
n

Diremos que a ∈ A es mı́nimo local de f cuando exista una bola


de centro a y radio r, B(a, r), tal que

f (x) ≥ f (a)

para todo x ∈ A ∩ B(a, r).

Observamos que, en un extremo local, se optimiza la función en un entorno


pero no necesariamente en todo su dominio.

Cuando se verifica la desigualdad en alguna de las dos definiciones ante-


riores, es decir,

f (x) ≥ f (a) o bien f (x) ≤ f (a)

Notas:

74
2.3 Teorema de Weierstrass

para todo x ∈ A se dice que la función posee en a mı́nimo global o


máximo global respectivamente.
Claramente, todo extremo global es extremo local. El recı́proco no es cierto
en general, como se muestra en los gráficos siguientes. Sin embargo, vere-
mos más adelante que existen clases de funciones en las que los óptimos
locales son globales.
y
En funciones de una variable es fácil ilustrar los conceptos de extremo
local y global como se muestra en la Figura 2.2. Máx. local

Los máximos y los mı́nimos de una función pueden relacionarse como sigue

Maximizar f (x) Minimizar −f (x)


⇐⇒ x
s.a. x∈A s.a. x∈A

Además, en este conjunto A

Valor máximo f (x) = −Valor mı́nimo − f (x) mı́n. local

Es importante notar que un programa matemático puede no poseer solu- Figura 2.2: Extremos en una variable
ción óptima, bien porque la función no esté acotada en la región factible
o bien porque, aunque esté acotada, simplemente no alcanza máximo o
mı́nimo. Por ejemplo, la función f (x) = e−x está acotada en [0, +∞), su
valor máximo es 1 y se alcanza en x = 0 pero no alcanza valor mı́nimo. La
función f (x) = x3 no está acotada en Rn y no alcanza mı́nimo ni máximo
global.
Es, por tanto, primordial garantizar que existe solución para un problema
de optimización. El siguiente teorema nos muestra que, bajo determinadas
condiciones sobre el dominio y la función, sı́ podemos asegurar la existencia
de extremos globales.

Teorema 14 (Teorema de Weierstrass)


Sea A ⊂ R cerrado y acotado (compacto) y f : A −→ Rn una
n

función continua. Entonces f alcanza máximo y mı́nimo global en y


A.

Observamos que las condiciones del teorema son suficientes y no necesa- x


rias, esto es, una función puede presentar extremos globales sin necesidad
Figura 2.3: Gráfica de f (x) = e−x en
[0, +∞).

Notas:

75
Capı́tulo 2 Optimización

de que su dominio sea compacto o que la función sea continua en todo su


dominio.
Ejemplo 51 Extremos locales
Comprobar que la función f (x, y) = xy posee extremos globales en cual-
quier rectángulo [a, b]×[c, d], y calcular dónde alcanza valor máximo dicha
función en
[−1, 2] × [0, 3].

Solución La función es continua ya que es polinómica. El rectángu-


lo está acotado; también es cerrado por ser el producto de dos intervalos
cerrados. Luego estamos en condiciones de aplicar el Teorema de Weiers-
trass y afirmar que f (x, y) alcanza máximo y mı́nimo global en cualquier
rectángulo de la forma [a, b] × [c, d].
Observamos que la función es el producto de las coordenadas. Por ello,
los extremos globales se alcanzarán en alguno de sus vértices. Por simple
inspección vemos que (2, 3) es máximo global y el valor de la función en
dicho punto es 6 y que (−1, 3) es mı́nimo global con valor -3
La función f (x, y) = |x| + |y| es continua en R2 y aunque dicho dominio
no es acotado, alcanza mı́nimo global en (0, 0) ya que no es posible que
tome valores negativos y sı́ toma el valor 0 en (0, 0).
La función f (x, y) = (x − y)4 tiene infinitos mı́nimos globales en R2 , con-
cretamente toda la recta x = y. No tiene máximos globales ni locales.
Ejemplo 52 Extremos locales
Demostrar que el programa

Maximizar 2x + y
s.a. e x + x4 ≤ 5
x, y ≥ 0

no posee máximo global.

Solución La única restricción que afecta a la variable y es que ésta


sea no negativa, por lo que en el conjunto factible y puede tomar un valor
tan alto como deseemos. Por tanto, la función f (x, y) = 2x + y no posee
máximo global.

Notas:

76
2.4 El método gráfico

2.4. El método gráfico

Una vez hemos abordado la existencia de solución para un problema de


optimización, el siguiente paso en el estudio de estos problemas es describir
técnicas para su resolución.
En esta sección vamos a desarrollar un primer método, llamado método
gráfico, para resolver problemas de optimización en dos variables. Éste
consiste en dibujar la región factible del programa y también curvas que
estén vinculadas a la función objetivo.
Iniciamos la descripción del método recordando los conceptos de conjunto
de nivel y de curva de nivel.

Definición 23 Conjunto de nivel


n
Sean A ⊂ R y f : A → R. Dado k ∈ R, se define el conjunto de
nivel k de f como

Ck = {x ∈ A : f (x) = k}.

En el caso particular de n = 2, los conjuntos de nivel se denominan tam-


bién curvas de nivel o lı́neas de nivel. Se deduce de la definición de
conjunto de nivel, que para dos niveles distintos, los conjuntos correspon-
dientes no se cortan, esto es,

k1 6= k2 =⇒ Ck1 ∩ Ck2 = ∅.

Las curvas de nivel se obtienen cortando la gráfica de la función f con


planos horizontales situados a distintas alturas.
En Cartografı́a se utilizan estas curvas con asiduidad para incorporar a
un mapa alguna información tridimensional del relieve que corresponde a
una zona determinada.
También se usan con frecuencia en Meteorologı́a para representar en un
mapa las isobaras, curvas que unen puntos de igual presión, o las isotermas,
curvas que unen puntos de igual temperatura.
Ejemplo 53 Curvas de nivel
Representar algunas curvas de nivel de la función f (x, y) = x2 + y 2 .

Notas:

77
Capı́tulo 2 Optimización

Solución Si k ∈ R, el conjunto de nivel k será

Ck = {(x, y) : x2 + y 2 = k}.


y Para k > 0, se trata de una circunferencia de centro (0, 0) y radio r = k.
k=4 Cuando k = 0, el conjunto de nivel está formado sólo por el punto (0, 0).
Para k < 0 el conjunto de nivel k es claramente vacı́o.

k=1 En la Figura 2.4 a continuación algunas curvas de nivel, lo que se conoce


como mapa de nivel .
k=0
x Ejemplo 54 Curvas de nivel
Representar algunas curvas de nivel de la función f (x, y) = x − y 2 .

Solución Si k ∈ R, el conjunto de nivel k será

Ck = {(x, y) : x − y 2 = k},

Figura 2.4: Curvas de nivel del Ejem- cuyas gráficas para cada k son parábolas Las representamos en la Figura
plo 53 . 2.5

Otro concepto muy relacionado con los conjuntos de nivel es el de vec-


tor gradiente de una función. Este vector indica en qué dirección crece
una función cuando estamos situados en un punto x, por lo que resulta
interesante de cara a hallar los máximos y mı́nimos de dicha función.
−3

k = −1

Definición 24 Vector gradiente


k=0
1

3
k=

k=

k=

y
Sea un abierto A ⊂ Rn y una función de clase C 1 ,

x f : A → R.

Definimos su vector gradiente en un punto cualquiera x como


 
∂f (x) ∂f (x)
Figura 2.5: Curvas de nivel para ∇f (x) = ,..., .
∂x1 ∂xn
Ejemplo 54
Para la obtención del vector gradiente de una función en un punto debe-
mos derivar parcialmente la función respecto a cada una de las variables
y después evaluar cada derivada en el punto dado.

Notas:

78
2.4 El método gráfico

Proposición 1 Ortogonalidad del gradiente


Sea una función f (x) de clase C 1 . Entonces el gradiente de f en a
es ortogonal a la curva de nivel que pasa por a.

Proposición 2 Crecimiento y gradiente


Sea f (x, y) una función de clase C 1 . Entonces el gradiente de f
indica la dirección de máximo crecimiento de la función f.

Esta propiedad nos indica que el gradiente “huye”de los mı́nimos y se


siente “atraı́do”por los máximos. Este recurso será el punto de apoyo para
desarrollar el método gráfico, ya que en un problema de maximización
la solución se obtiene desplazando las curvas de nivel en la dirección del
gradiente de la función objetivo.

Concretamente, para resolver un problema de optimización por el método


gráfico, debemos seguir los siguientes pasos:

1. Representar gráficamente el conjunto factible S.

2. Dibujar algunas curvas de nivel de la función objetivo f .

3. Superponer ambas representaciones para averiguar la solución.

a) El punto máximo será aquel punto del conjunto factible por el


que pase la curva de nivel mayor (de entre las curvas de nivel
que tocan al conjunto factible).

b) Para localizar un mı́nimo, buscaremos la última curva de nivel


que tenga intersección no vacı́a con la región factible siguiendo
la dirección contraria a la indicada por los vectores gradientes.

Advertimos que uno de los inconvenientes de la resolución geométrica de


los problemas de optimización es la posible dificultad que supongan las
representaciones gráficas tanto del conjunto factible como de las curvas de
nivel. En cualquier caso, la representación de éstas sólo es posible cuando
el número de variables de decisión sea dos.

En el siguiente ejemplo se ilustra cómo se aplica dicho método.

Notas:

79
Capı́tulo 2 Optimización

Ejemplo 55 Método gráfico


Resolver el programa lineal

Optimizar 2x + y
s.a. x+y ≤3
−x + y ≤ 3
x≤2
y ≥ −2

Solución Al tratarse de un programa lineal en dos variables la apli-


cación del método gráfico para su resolución resulta muy adecuada ya que
ni la representación del conjunto factible (un poliedro) ni la de las curvas
de nivel (lı́neas rectas) conllevan dificultad.
Representaremos en primer lugar la región factible. Comenzamos con la
restricción x + y ≤ 3. Para ello, dibujamos la recta x + y = 3, que divide
al plano en dos semiplanos.
Para saber cuál de ellos es x + y ≤ 3, elegimos un punto cualquiera de uno
de los semiplanos que no pertenezca a la recta x + y = 3.
Si verifica la restricción, todo el semiplano que contiene al punto elegido
es la región válida. Si no la verifica, el otro semiplano será la región válida
para esta restricción.
Repetimos el proceso con las demás restricciones. Por último, la intersec-
ción de todos los semiplanos válidos será la región factible.
Los vértices de la región se obtienen como intersección de las rectas. Por
ejemplo, el vértice (0, 3) se ha calculado al resolver

x+y =3
⇒ 2y = 6 ⇒ y = 3 ⇒ x = 0.
−x + y = 3

Para el resto de los vértices se procede análogamente. Una vez dibujada la


región factible, que es un poliedro, representamos algunas curvas de nivel
de la función objetivo, 2x + y = k.
A la vista del gráfico anterior, observamos que las curvas de nivel cre-
cen hacia la derecha del gráfico como indica la flecha en la parte inferior
izquierda del dibujo.
De esta forma, el primer punto en el que las curvas de nivel tocan a la
región factible es el punto (−5, −2). En este punto se alcanza el mı́nimo

Notas:

80
2.4 El método gráfico

y su valor en él es
f (−5, −2) = 2(−5) − 2 = −12.

x
y

+
y
El último punto en el que las curvas tocan a la región factible es el punto (0, 3)

=
3 3
(2, 1). En este punto se alcanza el máximo con valor f (2, 1) = 2(2)+1 = 5.

=
(2, 1)

y
+
x
x


2.4.1. Condiciones de tangencia (−5, −2) (2, −2)

En la mayorı́a de los problemas de optimización la resolución mediante el Figura 2.6: Region factible del Ejem-
método gráfico no es tan simple como en el ejemplo anterior. En general, plo 55
no se puede determinar a simple vista, como en los programas lineales, la
ubicación de los puntos óptimos puesto que las curvas de nivel o la frontera
del conjunto no son rectas o segmentos.
Normalmente, la solución del problema se alcanza en un punto del conjunto

2x

2x

2x

2x

2x
factible en que la curva de nivel óptimo y una de las curvas que definen la

+
y=

y=

y=

y=

y=
frontera de la región factible son tangentes. Esta condición de tangencia

−1

−8

−4

5
de ambas curvas se expresa matemáticamente por la condición de que los
x

2
respectivos vectores gradientes sean proporcionales.
Por ejemplo, en el programa
−→ k y
Optimizar f (x1 , x2 )
Figura 2.7: Curvas de nivel del Ejem-
s.a. g(x1 , x2 ) ≤ 0 plo 55

un punto de tangencia de la curva de nivel f (x1 , x2 ) = k con la curva


g(x1 , x2 ) = 0 se obtiene como el punto que satisface la condición
∇f (x1 , x2 ) = λ∇g(x1 , x2 ).

También es posible averiguar en qué parte de la región factible se encuentra


el óptimo cuando hay más de una restricción. Para el programa

Optimizar f (x1 , x2 )
s.a. g1 (x1 , x2 ) ≤ 0
···
gn (x1 , x2 ) ≤ 0

procederı́amos de la siguiente forma:


1. Mediante el método gráfico, en primer lugar hemos de deducir cuál
es la frontera gi donde está el óptimo.

Notas:

81
Capı́tulo 2 Optimización

2. El punto donde se alcanza el óptimo no ha de ser vértice de la región


factible, ya que en este caso se halları́a directamente. Mediante el
método gráfico podemos saber si estamos o no en esta situación.
3. La condición de tangencia nos proporciona una nueva ecuación para
calcular el óptimo,
∂f /∂x1 ∂f /∂x2
= .
∂gi /∂x1 ∂gi /∂x2
En caso de que algún denominador sea nulo se entiende que el corres-
pondiente numerador también es nulo.
Ejemplo 56 Método gráfico
Resolver el programa

Minimizar (x − 2)2 + (y − 2)2


y
s.a. x+y ≤3
x, y ≥ 0

(2, 2) Solución Podemos observar que las curvas de nivel son las circunfe-
P
rencias centradas en el punto (2, 2) que tienen por ecuación
(x − 2)2 + (y − 2)2 = k.
x La región factible es el polı́gono limitado por las rectas
x+y =3
x = 0, y = 0, x + y = 3
representado en la Figura 2.8.
Figura 2.8: Gráfica del Ejemplo 56.
El primer punto donde las curvas de nivel tocan a la región factible, P, no
es un vértice y por tanto, no podemos hallar sus coordenadas mediante la
intersección de dos lı́neas.
Como muesta la figura anterior, el punto P es un punto de tangencia entre
la curva de nivel mı́nimo que toca al conjunto y la recta x + y = 3.
La condición a imponer es que el gradiente de la función f (x, y) y el de la
función g(x, y) = x + y son proporcionales. Como
∇f (x, y) = (2(x − 2), 2(y − 2)) ,
∇g(x, y) = (1, 1) ,
en el punto de tangencia se tiene que
2(x − 2) 2(y − 2)
= ⇒ 2(x − 2) = 2(y − 2) ⇒ x = y.
1 1

Notas:

82
2.4 El método gráfico

Ası́ P es el punto de la recta que cumple esta condición. Por tanto, debe
satisfacer

x+y =3 3 3
⇒ 2y = 3 ⇒ y = ⇒ x= .
x=y 2 2
 
3 3
El mı́nimo global se alcanza en P = , y
2 2
   2  2
3 3 3 3 1
f , = −2 + −2 = .
2 2 2 2 2

es el valor mı́nimo de la función en el conjunto factible.

Ejemplo 57 Método gráfico


Resolver mediante el método gráfico el programa

Optimizar 2x + y
s.a. −x2 + 4x − y ≤ 0
3x + 5y ≤ 18
x, y ≥ 0.

Solución Para dibujar la región factible hemos de tener en cuenta


todas las restricciones:
La primera restricción tiene por frontera −x2 + 4x − y = 0 y su gráfica es
una parábola. La segunda restricción, 3x+5y ≤ 18, es el semiplano limita-
do por la recta 3x + 5y = 18 que contiene al punto (0, 0). Las dos últimas
restricciones indican que la región factible está en el primer cuadrante.
La intersección de las tres últimas restricciones es un triángulo, que está
acotado. Por tanto la región factible es acotada.
Con esta información sobre la función objetivo y la región factible con-
cluimos, por el Teorema de Weierstrass, que existen óptimos globales para
este programa.
En la Figura 2.9 hemos representado la región factible y algunas curvas
de nivel del problema. La región factible, sombreada, está compuesta por
dos subregiones disjuntas.
Las curvas de nivel son rectas de ecuación

2x + y = k

Notas:

83
Capı́tulo 2 Optimización

 
cuyas gráficas pasan por el punto (0, k).
18 y
0,
5 De la figura, se deduce que la primera curva de nivel que toca a la región
factible es la de nivel 0. El mı́nimo del programa, es el punto (0, 0), lo
cual era de esperar puesto que la región factible se encuentra en el primer
cuadrante y la función objetivo toma siempre valores no negativos en el
primer cuadrante. El valor en el mı́nimo es 0.
En cuanto al máximo del programa observamos que se alcanza en el punto
1 2 3 4 5 6x
(6, 0) y su valor en él es 12.
k=

k=

k=
0

Figura 2.9: Gráfica del Ejemplo 57.


2.5. Introducción a los programas sin res-
tricciones

En los capı́tulos anteriores hemos estudiado programas en los que las varia-
bles están sometidas a una serie de restricciones. En éste vamos a abordar
los llamados programas sin restricciones. En ellos, las variables de decisión
pueden tomar cualquier valor dentro del dominio de la función objetivo.
Esto podrı́a sugerir que este tipo de problemas carece de interés pues nor-
malmente las variables han de verificar alguna restricción, por ejemplo,
en un problema de planificación de la producción, la cantidad vendida
de un bien no puede superar a la cantidad disponible. Sin embargo, este
tipo de problemas aparecen frecuentemente de forma natural en diversos
campos de la ciencia como en Estadı́stica, en el ajuste de datos por mı́ni-
mos cuadrados, en Econometrı́a al calcular los estimadores de máxima
verosimilitud, en Geometrı́a, al minimizar la distancia entre dos puntos,
etc.
Destacamos también que algunos programas con restricciones de igualdad
son equivalentes a programas sin restricciones. Esto ocurre cuando las res-
tricciones permiten despejar algunas variables de decisión en función de
las otras.
Además, en ocasiones es posible abordar la resolución de un programa con
restricciones con las técnicas propias de los programas sin restricciones,
imponiendo a posteriori las restricciones para dar sentido económico o
geométrico a las soluciones.
En general, la localización de los óptimos locales de una función no será
posible sólo a partir de su definición. En este capı́tulo estableceremos cri-

Notas:

84
2.6 Formulación de los programas sin restricciones

terios generales que faciliten su estudio para funciones diferenciables, a


saber:
Condiciones necesarias de primer orden de extremo local.
Condiciones suficientes de segundo orden de extremo local.
Las condiciones necesarias de primer orden permitirán seleccionar los pun-
tos crı́ticos de una función entre los que se encuentran, en caso de existir,
los máximos y mı́nimos locales.
Por otra parte, las condiciones suficientes de segundo orden ayudarán a
determinar, en la mayorı́a de los casos, qué puntos crı́ticos son realmente
extremos locales.
Las condiciones de primer y segundo orden citadas caracterizan únicamen-
te óptimos locales.
Para concluir que la función posee óptimos globales, se requerirá informa-
ción adicional sobre el dominio de la función (si es o no compacto) y/o
sobre el comportamiento de la función, como por ejemplo el estudio de la
convexidad de la misma.

2.6. Formulación de los programas sin res-


tricciones
Un programa sin restricciones consiste en obtener los óptimos de una fun-
ción escalar definida en cierto subconjunto de Rn .
La formulación general de un problema de optimización sin restricciones
consiste en:
Optimizar f (x)
s.a. x ∈ A,
siendo A ⊂ Rn el dominio de la función.
A continuación, se incluyen algunos ejemplos de programas con enunciados
geométricos y económicos.
Ejemplo 58 Formulación
Un alambre de longitud L debe ser dividido en dos partes: con una de
ellas se construirá un cuadrado y con la otra una circunferencia. Formular
el programa que permite conocer cuál debe ser la longitud de cada una
de las partes para que la suma de las áreas del cuadrado y del cı́rculo sea
mı́nima.

Notas:

85
Capı́tulo 2 Optimización

Solución La variable de decisión del problema es la longitud del


primer trozo, que llamaremos x, por lo que la del segundo será L − x. La
x
función objetivo es la suma de las dos áreas, la del cuadrado de lado y
4
L−x
la del cı́rculo de radio R = . La formulación del problema es:

x2 (L − x)2
Minimizar +
16 4π
s.a. 0 ≤ x ≤ L.

En la resolución de este problema la restricción puede considerarse sólo al


final.
Ejemplo 59 Formulación
Formular un programa que permita determinar la mı́nima distancia
entre un punto de la gráfica de f (x) = x2 y otro de la recta y = x − 5.

Solución

La distancia entre dos puntos (x0 , y0 ) y (x1 , y1 ) del plano se calcula me-
diante la fórmula p
(x1 − x0 )2 + (y1 − y0 )2 .
Como uno de ellos pertenece a la gráfica de f, tendrá coordenadas (x, x2 ).
El otro, tendrá coordenadas genéricas (u, u − 5) por pertenecer a la recta.
Ası́, el problema a resolver es:
p
Minimizar (x − u)2 + (x2 − (u − 5))2
s.a. (x, u) ∈ R2 .

La resolución de los problemas enunciados consiste en localizar los óptimos


de una función en su dominio y se realizará más adelante.
En el siglo XVII, el matemático francés Fermat trató problemas de op-
timización sin restricciones para funciones de una variable mediante el
estudio de la posición de las rectas tangentes, observando que el óptimo
se alcanzaba en puntos donde la recta tangente era horizontal, es decir, en
puntos donde la derivada se anulaba.
Esta condición necesaria se generaliza para funciones de varias variables
en el siguiente epı́grafe.

Notas:

86
2.7 Condición necesaria de primer orden de extremo local

2.7. Condición necesaria de primer orden de


extremo local

Para iniciar este epı́grafe ilustramos mediante algunos ejemplos cómo a


veces es posible hallar los extremos de algunas funciones sólo a partir de
la definición de la función.
Ejemplo 60 Máximización y minimización
Observemos los siguientes comentarios

Solución

Si consideramos la función f (x, y) = 2x2 + 3y 2 es claro que sólo


toma valores no negativos y que vale 0 en (0, 0). Deducimos por
tanto, que (0, 0) es mı́nimo global de f . Además se observa que la
función no está acotada superiormente en R2 por lo que no posee
máximo global.
La función f (x, y, z) = (x − 1)2 + 3(y + 2)2 + (z − 3)2 es no negativa
y alcanza el valor 0 en un único punto, (1, −2, 3), por consiguiente,
este punto es su mı́nimo global. No posee máximo global.
La función f (x, y) = 1 − x2 − y 2 toma valores positivos y negativos,
es más, no supera el valor 1 y alcanza este valor en (0, 0). Por tanto
deducimos que posee máximo global en (0, 0) y que no tiene mı́nimo
global en R2 .

Sin embargo, queremos destacar que con frecuencia sólo la definición de


óptimo no permite determinar y localizar los máximos y mı́nimos de una
función y, en caso de que sea posible, el proceso resulta complejo.
Por ello resulta especialmente útil disponer de herramientas matemáticas
que faciliten los cálculos.
Se describirá, a continuación, la condición necesaria de primer orden de
extremo local para funciones diferenciables en un conjunto abierto.

Proposición 3 Condición necesaria


n
Sea A ⊂ R abierto y f : A −→ R diferenciable en A. Si a ∈ A es
extremo local de f entonces ∇f (a) = 0.

Notas:

87
Capı́tulo 2 Optimización

Definición 25 Condición necesaria


A los puntos a ∈ A con vector gradiente nulo se les denomina
puntos crı́ticos de la función f.

La proposición anterior asegura que los extremos locales de una función


diferenciable sobre un dominio abierto necesariamente han de ser puntos
crı́ticos. Geométricamente, para n = 2, esta condición indica que el plano
tangente a la gráfica de una función diferenciable en un óptimo local es
horizontal. Esto es una generalización de la conocida condición, f 0 (x) = 0,
para funciones de una variable.
Notamos que esta condición no es una condición suficiente para extre-
mo local como se ilustra en el primer apartado del siguiente ejemplo.
Ejemplo 61 Máximización y minimización
Significado de punto crı́tico

Solución • Para f (x, y) = x2 − y 2 el punto (0, 0) es un punto crı́tico


como se comprueba fácilmente. Sin embargo, dicho punto no es máximo
ni mı́nimo local, ya que para todo t 6= 0 se verifica

f (0, t) = −t2 < f (0, 0) < f (t, 0) = t2 .

• Para la función f (x, y) = x2 + y 2 el punto (0, 0) es punto crı́tico y


mı́nimo global.

• Para la función f (x, y) = |x| + |y| el punto (0, 0) es claramente un


mı́nimo, pero no cumple la anterior condición necesaria, debido a que la
función no es diferenciable en el punto (0, 0).

Definición 26 Condición necesaria


A los puntos crı́ticos de f que no sean extremos locales les llama-
remos puntos de silla de f.

Ejemplo 62 Puntos crı́ticos


Hallar los puntos crı́ticos de

Notas:

88
2.7 Condición necesaria de primer orden de extremo local

f (x, y) = x2 + 3xy − y 2 .

f (x, y, z) = −x2 − 5y 2 − 3z 2 + 8x − 10y + 2z − 13.

Estudiar si son o no extremos locales de tales funciones.

Solución La primera función admite un único punto crı́tico, a saber


(0, 0), que se obtiene al resolver el sistema

∂f

 = 2x + 3y = 0
∂x

∂f
= 3x − 2y = 0



∂y

de donde x = y = 0.

Advertimos que, claramente, este punto no es extremo global de la función,


ya que f (0, 0) = 0 y la función toma valores más pequeños y más grandes
en infinidad de puntos.

Es más, para todo t 6= 0 se verifica

f (0, t) = −t2 < 0 = f (0, 0) < f (t, 0) = t2 .

Por tanto, (0, 0) no es máximo ni mı́nimo local.


 
1
Respecto a la segunda función, su punto crı́tico es 4, −1, .
3
En este caso es útil expresar la función como suma de cuadrados, esto es,
 2
2 1 2 25
f (x, y, z) = −(x − 4) − 5(y + 1) − z − + .
3 3
 
1
Deducimos ası́ que 4, −1, es máximo global de la función.
3

Una vez seleccionados los puntos crı́ticos de una función, su clasificación


como extremo local o punto de silla no siempre es posible por argumentos
gráficos o algebraicos como en los ejemplos anteriores.

Las siguientes proposiciones pueden ayudarnos cuando la función objetivo


sea composición de otras dos funciones.

Notas:

89
Capı́tulo 2 Optimización

Proposición 4 Condición
Sean f : A −→ R y g : R −→ R diferenciables en a y b = f (a)
respectivamente, con A ⊂ Rn . Si g 0 (b) 6= 0 entonces a es punto
crı́tico de g ◦ f si y sólo si a es punto crı́tico de f.

Proposición 5 Condición
Sean f : A −→ R y g : R −→ R estrictamente creciente, entonces a
es mı́nimo local o global (máximo local o global) de f si, y sólo si,
a es mı́nimo local o global (máximo local o global) de g ◦ f.

Ejemplo 63 Composición
2 2
Calcular los extremos de h(x, y) = ex +y

2 2
Solución La función h(x, y) = ex +y es composición de dos funcio-
nes. Una de ellas es f (x, y) = x2 + y 2 y la otra es g(u) = eu .

Puesto que la función exponencial claramente es estrictamente creciente,


se verifica que los mı́nimos locales (globales) de f (x, y) serán mı́nimos lo-
cales (globales) de la función h(x, y). Por tanto, la función h(x, y) presenta
un mı́nimo global en (0, 0).

2.8. Condiciones de segundo orden

Dada una función diferenciable, una vez determinados sus puntos crı́ticos
es natural plantearse cómo averiguar si éstos son realmente óptimos locales
o globales de la misma. Para dilucidar si un determinado punto crı́tico es o
no un óptimo de una función son de gran utilidad sus derivadas de segundo
orden como muestra la siguiente proposición.

Notas:

90
2.8 Condiciones de segundo orden

Proposición 6 (Condición necesaria de segundo orden)


Sean A ⊂ Rn abierto y f : A −→ R de clase C 2 en A. Sea a ∈ A
punto crı́tico de f, entonces se satisface que:
1. Si a es mı́nimo local de f entonces Hess f (a) es definida po-
sitiva o semidefinida positiva.
2. Si a es máximo local de f entonces Hess f (a) es definida
negativa o semidefinida negativa.
Ası́, si Hess f (a) es indefinida entonces a es un punto de silla de f .

El siguiente resultado proporciona un criterio para clasificar los puntos


crı́ticos de una función de clase C 2 a través de sus derivadas de segundo
orden.

Proposición 7 Condición suficiente de segundo orden


Sean A ⊂ R abierto y f : A −→ R de clase C 2 en A. Sea a ∈ A
n

punto crı́tico de f, entonces se verifica que:


Si Hess f (a) es definida positiva entonces a es mı́nimo local
de f .
Si Hess f (a) es definida negativa entonces a es máximo local
de f .
Si Hess f (a) es indefinida entonces a es punto de silla de f .
Si Hess f (a) es semidefinida positiva entonces a es mı́nimo
local o punto de silla de f .
Si Hess f (a) es semidefinida negativa entonces a es máximo
local o punto de silla de f .

Las dos proposiciones anteriores indican que para funciones de clase C 2 ,


la existencia de óptimo local en un punto implica necesariamente un signo
para la forma cuadrática asociada a la matriz hessiana de la función en el
punto.

La aplicación de las condiciones de segundo orden se reduce a averiguar


el signo de la forma cuadrática cuya matriz asociada es la matriz hessiana
en el punto crı́tico.

Los dos métodos más conocidos para estudiar tal signo son el de los valores
propios y el de menores principales, que han sido expuestos en el Capı́tulo
1.

Notas:

91
Capı́tulo 2 Optimización

Ejemplo 64 Puntos crı́ticos


Determinar cuáles de los siguientes puntos (0, 0),(1, 1), (2, −2) son puntos
crı́ticos para la función

f (x, y) = x2 y + x3 − x2 + y 2

y analizar si son extremos locales o globales.

Solución Por definición, imponemos la condición de que todas las


derivadas parciales sean nulas,
2xy + 3x2 − 2x = 0


x2 + 2y = 0.
Puede verse que de los puntos dados, los que satisfacen estas dos ecuaciones
son (0, 0) y (2, −2). Luego (1, 1) no es punto crı́tico.
Es más, si resolvemos el sistema de ecuaciones, despejando en la segunda
ecuación 2y = −x2 y sustituyendo en la primera nos quedarı́a

x3 + 3x2 − 2x = 0

cuyas soluciones
  son x = 0, 1, 2. Por tanto, los puntos crı́ticos de f son
1
(0, 0), 1, − y (2, −2).
2
Para clasificar dichos puntos aplicaremos la condición suficiente de extre-
mo local. Para ello, calculamos la matriz hessiana
 
2y + 6x − 2 2x
Hess f (x, y) = .
2x 2
Evaluamos dicha matriz en cada punto crı́tico.
En (0, 0),  
−2 0
Hess f (0, 0) = .
0 2
Se trata de una matriz indefinida, por tanto, (0, 0) es un punto de silla.
 
1
En 1, − ,
2    
1 3 2
Hess f 1, − =
2 2 2
que es 
una matriz
 definida positiva ya que H1 = 3 > 0, H2 = 2 > 0. Por
1
lo que 1, − es un mı́nimo local.
2

Notas:

92
2.9 Extremos globales

En (2, −2)  
6 4
Hess f (2, −2) = ,
4 2
es una matriz indefinida ya que H1 = 6 > 0, H2 = −4 < 0. De donde
(2, −2) es un punto de silla.
 
1
Esta función tiene un único mı́nimo local en 1, − , pero no es mı́nimo
2
global ya que existen puntos donde la función toma un valor menor. Por
ejemplo
1 1
f (−2, 0) = −12 < f (1, − ) = − .
2 4
Además f (x, 0) = x3 − x2 de donde deducimos que cuando x → −∞ los
valores de la función tienden a −∞, esto es, no está acotada inferiormente.
En definitiva, esta función no posee extremos globales.

2.9. Extremos globales


Sabemos que si la función a optimizar está definida en un subconjunto
compacto de Rn y es continua en su dominio, la existencia de extremos
globales está asegurada por el Teorema de Weierstrass.
Para determinar estos extremos globales cuando la función es además de
clase C 1 en el interior del dominio se procede de forma análoga a la em-
pleada con funciones de una variable.
En primer lugar, calculamos los puntos crı́ticos de la función en el interior
del dominio y a continuación evaluamos la función en tales puntos.
Además, debemos estudiar lo que ocurre en la frontera del dominio ya que
los óptimos pueden hallarse no sólo entre los puntos crı́ticos sino también
en algún punto frontera.

2.9.1. Programas convexos

Las funciones convexas presentan propiedades de gran utilidad a la hora


de estudiar la existencia de extremos globales.
Recordamos de nuevo que los extremos locales son globales en los progra-
mas convexos, como garantiza el siguiente teorema.

Notas:

93
Capı́tulo 2 Optimización

Teorema 15 (Teorema Local-Global)


Sea A ⊂ Rn convexo y f : A −→ R una función convexa (cóncava)
en A. Si a ∈ A es mı́nimo local (máximo local) de f entonces a
es mı́nimo global (máximo global). Además el conjunto de puntos
donde f alcanza valor mı́nimo (valor máximo) es convexo.

Nótese que el teorema no asegura que una función convexa siempre posea
un mı́nimo global. Pero sı́ garantiza que todos los mı́nimos locales son
globales, lo que es un paso importante.
Aunque se trata de un teorema importante señalamos que a menudo po-
demos encontrar ejemplos que ponen de manifiesto lo restrictivo de sus
hipótesis, ya que no sólo exige que la función objetivo sea convexa y el do-
minio convexo, sino que además previamente se han tenido que localizar
los mı́nimos locales. En caso de que la función sea convexa y diferenciable
en un dominio abierto y convexo, este resultado es mejorado y lo único
que se exige a un punto para ser mı́nimo global es que sea punto crı́tico.

Proposición 8 Condición
n
Sea A ⊂ R abierto, convexo y f : A −→ R una función de clase
C 1 y convexa (cóncava) en A. Se verifica que:
a ∈ A es punto crı́tico de f ⇐⇒ a es mı́nimo (máximo) global.

En consecuencia, bajo las condiciones de la proposición, la condición ne-


cesaria de primer orden es también suficiente para óptimo global.
Ası́, para estas funciones la existencia de óptimos está asegurada cuando
la función posea puntos crı́ticos.
Es interesante resaltar que si f es una función no constante, convexa y está
definida sobre un conjunto abierto y convexo entonces f no posee máximos
locales ni globales. Puesto que cualquier extremo local serı́a punto crı́tico y,
por la proposición anterior, éste ha de ser mı́nimo global. Análogamente,
si f es cóncava sobre un dominio abierto y convexo no posee mı́nimos
locales.
Ejemplo 65 Puntos crı́ticos
Comprobar que la función f (x, y) = (x − 1)4 + (y − 1)4 posee un único

Notas:

94
2.9 Extremos globales

punto crı́tico, (1, 1) y analizar si es un extremo local o global.

Solución Calculamos los puntos crı́ticos resolviendo el sistema


(
4 (x − 1)3 = 0
4 (y − 1)3 = 0

de donde x = y = 1.
La matriz hessiana en dicho punto tiene como menores H1 = H2 = 0, ası́
que el criterio de los menores principales no decide. Sin embargo, adverti-
mos que la función es no negativa y que f (1, 1) = 0, de donde deducimos
que (1, 1) es mı́nimo global. También se verifica que f es convexa, ya que
su matriz hessiana

12(x − y)2
 
0
Hess f (x, y) =
0 12(y − 1)2

es definida positiva o semidefinida positiva en todos los puntos. Por tanto,


se concluye que (1, 1) es mı́nimo global.

Ejemplo 66
Comprobar que la función f (x, y) = x2 y 2 tiene como puntos crı́ticos a
los puntos (x, 0), (0, y) con x, y ∈ R y estudiar si son extremos locales o
globales.

Solución En primer lugar, calculamos los puntos crı́ticos



∂f

 = 2 xy 2 = 0
∂x

=⇒ x = 0 ó y = 0.
∂f
= 2 x2 y = 0



∂y

Calculamos su matriz hessiana

2y 2
 
4xy
Hess f (x, y) = ,
4xy 2x2

y los menores principales H1 = 2y 2 , H2 = −12x2 y 2 .


Deducimos que f no es convexa ni cóncava en R2 ya que la matriz hessiana
es indefinida en muchos puntos, por ejemplo en (1, 1).

Notas:

95
Capı́tulo 2 Optimización

Estudiamos si los puntos crı́ticos son extremos locales o no. La matriz


hessiana en cada punto crı́tico (x, 0) verifica que H1 = H2 = 0, por lo que
el criterio de los menores principales no decide. Sin embargo, como
 
0 0
Hess f (x, 0) = ,
0 2x2
utilizando el criterio de los valores propios deducimos que es semidefinida
positiva. También Hess f (0, y) es semidefinida positiva ya que
2y 2 0
 
Hess f (0, y) = .
0 0
Sólo podemos asegurar, a partir de la Proposición 5, que los puntos crı́ticos
(x, 0), (0, y) son mı́nimos locales o puntos de silla.
Por otro lado, observamos que f es no negativa y que f (x, 0) = f (0, y) = 0
para todo x, y ∈ R, de donde concluimos que todos los puntos crı́ticos son
mı́nimos globales.

Ejemplo 67
Determinar los extremos locales de la función
f (x, y) = x4 + 8x2 + y 2 − 4y − 2x.

Solución Calculamos los puntos crı́ticos para la función,


4x3 + 16x = 0 4x(x2 + 4) = 0
 
⇐⇒
2y − 4 = 0 y = 2.
De la primera ecuación la única posibilidad es que x = 0, de modo que el
único punto crı́tico es (0, 2).
Calculamos la matriz hessiana
12x2 + 16
   
0 16 0
Hess f (x, y) = ⇒ Hess f (0, 2) = .
0 2 0 2
Ası́, la matriz es definida positiva y en el punto (0, 2) hay un mı́nimo local.
Es más, como la matriz hessiana es definida positiva en todo punto, la
función f es convexa en R2 y podemos asegurar que el punto es mı́nimo
global.

Ejemplo 68
Resolver el programa

Notas:

96
2.9 Extremos globales

Maximizar 12q1 + 16q2 + 20q3 − q12 − 2q22 − 3q32 − 2q1 q2 − 25


s.a. qi ≥ 0, i = 1, 2, 3

Solución En principio, haremos caso omiso de las restricciones qi ≥


0. Debemos calcular los óptimos de una función de tres variables, diferen-
ciable en R3 .
Para hallarlos, calculamos los puntos crı́ticos de la función, resolviendo el
sistema de ecuaciones:

 12 − 2q1 − 2q2 = 0
16 − 4q2 − 2q1 = 0
20 − 6q3 = 0.

10
La solución del mismo es q1 = 4, q2 = 2, q3 = y tiene sentido
3
económico (las tres componentes son positivas).
Para dilucidar si es extremo o punto de silla, recurriremos a la matriz
hessiana,  
−2 −2 0
Hess f (q1 , q2 , q3 ) =  −2 −4 0  ,
0 0 −6
que es una matriz constante. Sus menores principales son
H1 = −2, H2 = 4, H3 = −24.
Deducimos que esta función es cóncava, al ser la matriz hessiana defi-
nida
 negativa,
 y por la Proposición 6 aseguramos que el punto crı́tico
10
4, 2, es máximo global en R3 . En particular, este punto crı́tico tam-
3
bién es máximo global en el conjunto formado por los puntos que cumplen
las restricciones de no negatividad.

Ejemplo 69
La función de costes totales de un monopolista que produce dos bienes es
C(q1 , q2 ) = q12 − 4q2 + 90
donde q1 , q2 representan las cantidades producidas de dichos bienes. Su-
pongamos que las demandas a las que se enfrenta la empresa son las si-
guientes: 
q1 = 680 − 5p1 − 3p2
q2 = 430 − 3p1 − 2p2

Notas:

97
Capı́tulo 2 Optimización

donde p1 , p2 son los precios de cada uno de los bienes.

Calcular los niveles de producción que proporcionan al empresario el máxi-


mo beneficio.

Solución En primer lugar, formulamos el problema matemáticamen-


te, para ello calculamos la función de beneficios, a saber,
B(q1 , q2 ) = I(q1 , q2 ) − C(q1 , q2 )
= p1 q1 + p2 q2 − q12 + 4q2 − 90.
De las ecuaciones de las demandas obtenemos las expresiones de los precios
p1 , p2 en función de las cantidades q1 , q2 .

p1 = 70 − 2q1 + 3q2
p2 = 110 + 3q1 − 5q2 .
Sustituyendo p1 y p2 en la función de beneficio, nuestro problema se for-
mula como sigue:
Maximizar −3q12 − 5q22 + 6q1 q2 + 70q1 + 114q2 − 90
s.a. q1 , q2 ≥ 0.
Puesto que la función de beneficios es diferenciable, para calcular su máxi-
mo global determinamos primero los puntos crı́ticos de dicha función. El
sistema de ecuaciones resultante es:

−6q1 + 6q2 + 70 = 0
6q1 − 10q2 + 114 = 0.
De la resolución del mismo se obtiene
173
q1 = = 57,67, q2 = 46.
3
Para decidir si es o no el máximo global buscado, estudiamos si la función
es cóncava o no. Para ello recurriremos nuevamente a la matriz hessiana,
 
−6 6
Hess B(q1 , q2 ) = .
6 −10
Sus menores principales son

H1 = −6, H2 = 24.

Se trata de una matriz definida negativa para cualesquiera q1 , q2 ∈ R. Por


tanto, la función B(q1 , q2 ) es cóncava en R2 y, en consecuencia, el punto

Notas:

98
2.9 Extremos globales

crı́tico es máximo global en R2 , en particular para q1 , q2 ≥ 0.

Ejemplo 70
Una fábrica produce un único bien a partir de tres factores, siendo el
beneficio obtenido por la empresa de

1
B(x, y, z) = x3 − y 2 + z + 10
2
millones de u.m. donde x, y, z representa el número de toneladas de las
tres materias primas utilizadas en el proceso de producción. La empresa
tiene un contrato con el proveedor que le obliga a consumir exactamente
dos toneladas al mes de la primera materia prima y a que las cantidades
consumidas de las otras dos sean iguales. Hállese la cantidad de cada input
que maximiza el beneficio.

Solución Hemos de resolver el problema siguiente


1
Maximizar x3 − y 2 + z + 10
2
s.a. x=2
y=z
x, y, z ≥ 0.

La no negatividad en principio no la vamos a considerar para la resolución


del programa, pero sólo admitimos la solución hallada si es no negativa.
Al igual que en el ejemplo anterior, lo transformaremos en un programa
sin restricciones.
Concretamente, si sustituimos x = 2, y = z en la función objetivo, la
reformulación del programa queda:

1
Maximizar F (y) = 8 − y 2 + y + 10
2
Calculando los puntos crı́ticos de esta función,

F 0 (y) = −y + 1 = 0

de lo que y = 1. Para decidir si es o no el máximo global buscado, estu-


diamos propiedades de la función, como por ejemplo si es cóncava o no.
Puesto que
F 00 (y) = −1 < 0

Notas:

99
Capı́tulo 2 Optimización

para cualquier y ∈ R, la función F (y) es cóncava en todo R y por ello, el


punto crı́tico es máximo global en R, en particular para y ≥ 0.
En consecuencia, volviendo al programa inicial obtenemos el correspon-
diente punto (2, 1, 1) como su máximo global de donde podemos asegurar
que el beneficio se maximiza utilizando 2 toneladas del primer input, 1
tonelada del segundo y 1 tonelada del tercero.

2.10. Introducción

En esta sección estudiaremos problemas de optimización en los que las


variables están sometidas a una serie de limitaciones que se formulan me-
diante igualdades. Estos problemas son de gran interés y aparecen a me-
nudo en diversas ciencias como la Economı́a, Estadı́stica, Econometrı́a,
etc.
El principal método de resolución para estos problemas se debe al ma-
temático Lagrange (1736-1813), contemporáneo de Euler. Debido a todos
sus méritos académicos, en 1808, Napoleón concedió a Lagrange el tı́tulo
de Conde del Imperio y la Orden de la Legión de Honor.

2.11. Método de sustitución

La formulación general de un programa con restricciones de igualdad con-


siste en:
Optimizar f (x)
s.a. g1 (x) = 0,
g2 (x) = 0,
..
.
gm (x) = 0,

con x = (x1 , . . . , xn ), m < n y donde f, gi : A → R, i = 1, 2, . . . , m.


En primer lugar, indicamos que el número de restricciones m es inferior al
número de variables de decisión n ya que en otro caso el conjunto factible
puede ser vacı́o o formado por un número finito de puntos por lo que la
resolución es trivial.

Notas:

100
2.11 Método de sustitución

A diferencia de los programas sin restricciones, la resolución de los mismos


consiste en encontrar los máximos y/o mı́nimos de una función, no en el
dominio de la función sino en el conjunto factible. Las soluciones del mismo
serán, en general, distintas a las obtenidas si no se hubiesen impuesto
restricciones.
Observamos también que una caracterı́stica de estos programas es que la
posibilidad de elegir valores para las variables de decisión disminuye. De
hecho, por cada restricción de este tipo se pierde un grado de libertad en
la elección de las variables de decisión.
Esta caracterı́stica queda muy clara cuando es posible resolver el sistema
de ecuaciones formado por las m restricciones y expresar m de las variables
en función de las n − m restantes.
En tal caso, la sustitución de tales variables en la función objetivo trans-
forma el programa inicial en uno equivalente sin restricciones y con n − m
variables, verificándose que si x es solución local o global del programa sin
restricciones entonces el punto correspondiente en el programa inicial será
solución local o global del mismo.
La resolución del programa por esta técnica se conoce como método de
sustitución.
Concretamente, supongamos que el sistema formado por las m restriccio-
nes permite despejar, por ejemplo, las m primeras variables en función de
las n − m restantes.
El conjunto de restricciones se expresará:

x1 = h1 (xm+1 , xm+2 , . . . , xn )
x2 = h2 (xm+1 , xm+2 , . . . , xn )
..
.
xm = hm (xm+1 , xm+2 , . . . , xn ).

Sin más que sustituir las m primeras variables por su expresión en la


función objetivo, el problema inicial se transforma en el siguiente programa
sin restricciones:

Optimizar f (h1 (xm+1 , . . . , xn ), . . . , hm (xm+1 , . . . , xn ), xm+1 , . . . , xn )


s.a. (xm+1 , . . . , xn ) ∈ Rn−m

Ejemplo 71 Mı́nima distancia


Determinar la mı́nima distancia del punto (1, −2) a la recta x + y = 2.

Notas:

101
Capı́tulo 2 Optimización

Solución La formulación de este problema es:


p
Minimizar (x − 1)2 + (y + 2)2
s.a. x + y = 2.

Puesto que la restricción permite despejar y en función de x, y = 2 − x,


el problema inicial es equivalente a
p
Minimizar (x − 1)2 + (4 − x)2
s.a. x ∈ R.

5 1
Resolviendo este programa, la solución es x = , y = − y la distancia
r 2 2
9
mı́nima es de unidades.
2

Ejemplo 72 Programa de optimización


Hallar el punto más elevado de la curva obtenida como intersección del
plano 2x + y − z = 0 con la esfera x2 + y 2 + z 2 = 60.

Solución El problema consiste en:

Maximizar z
s.a. x2 + y 2 + z 2 = 60
2x + y − z = 0.

Para su resolución aplicamos el método de sustitución. Para ello despeja-


mos la variable z en la segunda ecuación, z = 2x + y, y a continuación
sustituimos en la función objetivo y en la primera ecuación. El problema
queda transformado en

Maximizar 2x + y
s.a. x2 + y 2 + (2x + y)2 = 60.

Sin embargo, en este nuevo programa, la restricción no permite despejar


una variable en función de las otras y por lo tanto no es equivalente a un
programa sin restricciones.

Este último ejemplo ilustra cómo el método no es siempre aplicable, por


ello parece adecuado proporcionar otras técnicas alternativas para abordar
esta clase de programas.

Notas:

102
2.12 Condiciones necesarias de extremo local

2.12. Condiciones necesarias de extremo lo-


cal

Se considera el programa

Optimizar f (x)
s.a. g1 (x) = 0,
g2 (x) = 0, (2.1)
..
.
gm (x) = 0,

con m < n y donde f, gi : A → R, i = 1, 2, . . . , m, son funciones de clase


C 1 en A, con A subconjunto abierto de Rn . Notaremos g = (g1 , . . . , gm ).
Designamos por B al conjunto factible de este programa, es decir

B = {x ∈ A : gi (x) = 0, i = 1, . . . , m} .

Definición 27 Punto regular


Diremos que a ∈ B es un punto regular o verifica la condición de
regularidad si los vectores gradientes de las funciones restricciones
en dicho punto son linealmente independientes, esto es, el rango de
la matriz jacobiana en a es m,

rango(Jg(a)) = m.

Ejemplo 73 Puntos regulares


Probar que son regulares todos los puntos de la circunferencia

B = (x, y) : x2 + y 2 = 1 .


Solución Para cualquier punto (x, y) ∈ B se cumple que

Jg(x, y) = ∇g(x, y) = (2x, 2y).

Notas:

103
Capı́tulo 2 Optimización

Ası́, el vector ∇g(x, y) es linealmente dependiente si y sólo si es el vector


nulo. Comprobamos cuándo este vector es nulo:
(2x, 2y) = (0, 0), ⇐⇒ x = y = 0.
Pero como (0, 0) no pertenece a B deducimos que todos los puntos de B
son regulares.

Definición 28 Punto singular


Un punto de un conjunto B diremos que es singular o no regular
cuando no verifique la condición de regularidad.

Ejemplo 74 Puntos regulares


Sea el conjunto de restricciones B dado por la ecuación
(x − 1)3 − y 2 = 0.
Hallar los puntos singulares o no regulares de B.

Solución En este caso,


Jg(x, y) = ∇g(x, y) = (3(x − 1)2 , −2y)
que será nulo únicamente si x = 1 e y = 0. Ası́ (1, 0) pertenece a B y se
trata del único punto singular en B.

Al igual que en los programas sin restricciones, nos interesa saber qué
requisitos debe cumplir un punto del conjunto factible para ser extremo
local del programa. El siguiente teorema proporciona tal condición.

Teorema 16 Teorema de Lagrange


Supongamos que se verifican las hipótesis arriba escritas sobre
el programa. Si a ∈ B es extremo local del programa verifican-
do la condición de regularidad, entonces existen números reales
λ1 , λ2 , . . . , λm tales que

∇f (a) = λ1 ∇g1 (a) + λ2 ∇g2 (a) + . . . + λm ∇gm (a).

Notas:

104
2.12 Condiciones necesarias de extremo local

La anterior igualdad se denomina condición de Lagrange.


Los puntos a ∈ B que satisfacen dicha condición se denominarán puntos
estacionarios o puntos crı́ticos restringidos del programa.

Los números reales λ1 , λ2 , . . . , λm se denominan multiplicadores de La-


grange asociados a a.
Obsérvese que en el caso particular de un programa con una única res-
tricción, la condición necesaria de Lagrange para que un punto regular
a ∈ B sea óptimo local es que el vector gradiente de la función objetivo y
el vector gradiente de la función restricción sean proporcionales, esto es,

∇f (a) = λ∇g(a).

Esta condición coincide con la llamada condición de tangencia estudiada


en el Capı́tulo 2.
Ejemplo 75 Programa con restricción de igualdad
Comprobar que (1, 0, 0) es la solución del programa

Minimizar x + y + x2 + y 2 + z 2
s.a. x2 + y 2 = 1
x = 1.

¿Verifica este punto las condiciones de Lagrange? Razonar si hay alguna


contradicción.

Solución Claramente las restricciones del programa implican que x =


1, y = 0, por lo que la función objetivo se transforma en

f (1, 0, z) = 2 + z 2 .

Es obvio que en el punto (1, 0, 0) dicha función se minimiza.


Comprobamos si (1, 0, 0) verifica las condiciones de Lagrange. Puesto que
(1, 0, 0) es un punto singular del conjunto de restricciones no está obligado
a satisfacer las condiciones de Lagrange.
De hecho,

∇f (1, 0, 0) = (3, 1, 0), ∇g1 (1, 0, 0) = (2, 0, 0), ∇g2 (1, 0, 0) = (1, 0, 0),

por lo que el punto no verifica las condiciones de Lagrange. Al ser un pun-


to singular, no hay contradicción.

Notas:

105
Capı́tulo 2 Optimización

Del Teorema de Lagrange deducimos que los posibles óptimos locales del
programa inicial se encuentran entre los siguientes puntos del conjunto de
restricciones:
Puntos que no cumplen la condición de regularidad.
Puntos que cumplen la condición de regularidad y son puntos esta-
cionarios del programa.
Para la obtención de tales puntos utilizaremos una nueva función definida
a partir de la función objetivo y de las funciones restricciones.

Definición 29 Función lagrangiana


Denominamos lagrangiana asociada a 2.1 a la función

L(x, λ1 , λ2 , . . . , λm ) = f (x) − λ1 g1 (x) − λ2 g2 (x) − . . . − λm gm (x).

La justificación del interés de esta función nos la da el resultado siguiente:

Proposición 9 Función lagrangiana


Se verifica que (a, λ) es punto crı́tico de la función lagrangiana
si y sólo si a es punto estacionario del programa con vector de
multiplicadores de Lagrange λ = (λ1 , λ2 , . . . , λm ).

Ejemplo 76 Puntos estacionarios


Hallar los puntos estacionarios del programa

Maximizar 5−x−y
s.a. x2 + y 2 = 4.

Solución La función lagrangiana asociada es

L(x, y, λ) = 5 − x − y − λ(x2 + y 2 − 4).

Los puntos crı́ticos de L son las soluciones del sistema de ecuaciones



 −1 − 2λx = 0
−1 − 2λy = 0
 2
x + y 2 − 4 = 0.

Notas:

106
2.13 Condiciones suficientes de extremo local

De las ecuaciones primera y segunda se sigue que x = y.


Al sustituir en la tercera ecuación queda 2x2 = 4. Se obtiene ası́ que los
puntos crı́ticos de L son:
√ ! √ !
√ √ 2 √ √ 2
2, 2, − , − 2, − 2, .
4 4

Ası́, los puntos estacionarios del programa son


√ √   √ √ 
2, 2 , − 2, − 2 .

Ambos puntos verifican la condición de regularidad ya que


√ √ √ √
∇g( 2, 2) = (2 2, 2 2) 6= (0, 0),
√ √ √ √
∇g(− 2, − 2) = (−2 2, −2 2) 6= (0, 0).
Este programa tiene la particularidad de que en su conjunto factible to-
dos los puntos son regulares, de donde deducimos que los únicos posibles
extremos locales o globales son los dos puntos calculados. Analizaremos
más adelante si son o no extremos del programa.

2.13. Condiciones suficientes de extremo lo-


cal
En esta sección presentamos un criterio para decidir si un posible óptimo
local del programa es realmente un óptimo local condicionado. Se trata de
diferentes condiciones suficientes de segundo orden de óptimo local que son
de fácil aplicación práctica. Nosotros sólo veremos el criterio de la hessiana
aunque existen más como el criterio de la forma cuadrática restringida.

2.13.1. Criterio de la hessiana orlada

Suponemos que f, g1 , . . . , gm son funciones de clase C 2 en un conjunto A,


abierto de Rn .
Sea a un punto estacionario del programa con multiplicadores asociados

λ = (λ∗1 , . . . , λ∗m ). Suponemos que este punto cumple la condición de
regularidad.

Notas:

107
Capı́tulo 2 Optimización

Denotamos por Hj (con j = 1, . . . , m + n) al menor principal de orden j



de la matriz hessiana orlada evaluada en el punto (a, λ ). Entonces
1. Si los menores principales Hj , con j = 2m + 1, . . . , m + n, tienen
todos el mismo signo que (−1)m , entonces a es un mı́nimo local del
programa.
2. Si los menores principales Hj , con j = 2m + 1, . . . , m + n, tienen
signos alternos, siendo el primero de ellos el contrario del de (−1)m ,
entonces a es un máximo local del programa.
• Caso de programa en dos variables con una restricción
En particular, en el caso de dos variables y una restricción tenemos n = 2,
m = 1 y la matriz hessiana orlada es
 ∂g ∂g 
0
 ∂x ∂y 
∂2L ∂2L
 
 ∂g 
Hess(x, y, λ) =  
 ∂x
 ∂x2 ∂x∂y 

 ∂g ∂2L ∂2L 
∂y ∂x∂y ∂y 2

Notaremos, por simplicidad, el determinante de ésta como |H|.


En este caso, el único menor principal a considerar es el de orden 2m + 1,
o sea 3, es decir, el determinante de la matriz. El criterio serı́a:
1. Si en el punto estacionario |H| < 0 entonces se trata de un mı́nimo
local del programa.
2. Si en el punto estacionario |H| > 0 entonces se trata de un máximo
local del programa.
• Caso de un programa en tres variables y una restricción
Ahora es n = 3, m = 1 y la matriz hessiana orlada es

∂g ∂g ∂g
 
0

 ∂x ∂y ∂z 

2 2 2
 ∂g
 ∂ L ∂ L ∂ L 

 ∂x ∂x 2 ∂x∂y ∂x∂z 
Hess(x, y, z, λ) = 
 
 ∂g ∂2L ∂2L ∂2L


 
 ∂y ∂y∂x
 ∂y 2 ∂y∂z 

2
 ∂g ∂ L ∂2L ∂2L 
∂z ∂z∂x ∂z∂y ∂z 2

Notas:

108
2.13 Condiciones suficientes de extremo local

Los menores principales a considerar son los de orden 2m + 1 = 3 y orden


4. El signo de (−1)m = −1 es negativo. Entonces el criterio queda:
1. Si en el punto estacionario es H3 < 0, H4 < 0, entonces se trata de
un mı́nimo local del programa.
2. Si en el punto estacionario es H3 > 0, H4 < 0, entonces se trata de
un máximo local del programa.
Ejemplo 77 Ejemplo de aplicación de la hessiana orlada
Resolver el problema

Maximizar U (x, y) = x y
s.a. 3x + 2y = 24

Solución Aunque en este caso la obtención de solución es más simple


a través del método de sustitución, aplicamos el método de Lagrange para
ilustrar el criterio de la hessiana orlada.
La función lagrangiana es

L(x, y, λ) = x y − λ(3x + 2y − 24).

Las condiciones de Lagrange son:



 y − 3 λ = 0,
x − 2 λ = 0.
3x + 2y = 24

Resolviendo este sistema, su única solución es el punto (x, y) = (4, 6) con


λ = 2. Tenemos ası́ un único punto crı́tico restringido, P0 = (4, 6).
Para averiguar si es un máximo o un mı́nimo local, calculamos la matriz
hessiana orlada:
 ∂g ∂g 
0
 ∂x ∂y   
 2 2
 0 3 2
 ∂g ∂ L ∂ L 
= 3 0 1 
Hess(x, y, λ) = 
 ∂x ∂x2 ∂x∂y 
  2 1 0
 ∂g ∂2L ∂2L 
∂y ∂x∂y ∂y 2
Al evaluarla en el punto P0 queda igual ya que no depende del punto.
Calculamos su determinante y resulta |H| = 12 > 0, por lo que P0 es un
máximo local.

Notas:

109
Capı́tulo 2 Optimización

Ası́ que esta función presenta un máximo local en el punto (x, y) = (4, 6).
Si este máximo es global o no, no está garantizado con este procedimiento.

2.14. Condición suficiente de extremo global


En la mayorı́a de los problemas de optimización que se plantean se pre-
tende determinar los extremos globales de la función objetivo, en caso
de que existan. Por ello, es interesante disponer de resultados que nos
proporcionen información sobre la existencia y cálculo de los mismos.
En este epı́grafe presentamos dos tipos de condiciones suficientes de extre-
mo global. Es conveniente estudiar las caracterı́sticas del programa para
decidir las condiciones más adecuadas de cara a la resolución del mismo.
El lector ya está familiarizado con el siguiente teorema:

Teorema de Weierstrass

Cuando el conjunto admisible es compacto y la función objetivo es conti-


nua, este teorema asegura la existencia de extremos globales.
Las condiciones necesarias de primer orden garantizan que éstos se encuen-
tran entre los puntos singulares del programa o entre los puntos regulares
que son puntos estacionarios.
Evaluando la función en todos ellos determinaremos cuáles son extremos
globales del programa.
Ejemplo 78 Extremos globales
Calcular los extremos globales de

Maximizar 5−x−y
s.a. x2 + y 2 = 4

Solución Este ejemplo es la continuación del Ejemplo 76. Es posible


aplicar el Teorema de Weierstrass ya que el conjunto factible es compacto.
Hallamos el valor de la función objetivo en los posibles óptimos calculados
anteriormente
 √ √  √ √ √  √
f − 2, − 2 = 5 + 2 2, f 2, 2 = 5 − 2 2

Notas:

110
2.14 Condición suficiente de extremo global

√ √ √ √
y deducimos que ( 2, 2) es el mı́nimo global y que (− 2, − 2) es el
máximo global del programa, como se ilustra en la figura anterior.

2.14.1. Convexidad

Otro argumento para analizar si los puntos estacionarios son extremos


globales se muestra en las siguiente proposición

Proposición 10 Convexidad
Si las funciones gi , i = 1, 2, . . . , m son lineales y la función objetivo
f es convexa (cóncava) entonces todos los puntos estacionarios del
programa son mı́nimos globales (máximos globales) del programa.

Es de destacar que no es necesaria la linealidad de las funciones que definen


las restricciones para que el conjunto factible sea convexo, aunque sı́ es
suficiente.
Sin embargo, para conjuntos convexos dados por restricciones no lineales,
o bien no se satisface la condición de regularidad o el programa es trivial.
Ejemplo 79 Aplicación de la convexidad
La función de utilidad de un consumidor es
U (x, y) = 2 ln x + 2 ln y.
Su restricción presupuestaria viene dada por la ecuación x + 2y = 18.
Calcular los niveles de x, y que el consumidor debe adquirir de dos bienes
A y B, respectivamente, con el fin de maximizar su utilidad.

Solución Notamos que la función de utilidad está definida para


x, y > 0. Se trata de resolver el programa

Maximizar 2 ln x + 2 ln y
s.a. x + 2y = 18
x, y > 0.

La función lagrangiana correspondiente es


L(x, y, λ) = 2 ln x + 2 ln y − λ(x + 2y − 18).

Notas:

111
Capı́tulo 2 Optimización

Dicha función posee un único punto crı́tico que se obtiene al resolver el


sistema
 2
 −λ=0
x



2
− 2λ = 0
y




x + 2y − 18 = 0.

Despejamos λ de las dos primeras ecuaciones e igualando obtenemos x =


2y. Resolvemos el sistema que forma ésta con la tercera ecuación y de-
9 2
ducimos que la solución del sistema es 9, , . Por tanto el punto
  2 9
9
estacionario del programa será 9, .
2
Dicho punto verifica claramente la condición de regularidad, es más, to-
dos los puntos del conjunto factible son regulares. Nótese que la función
objetivo del programa es estrictamente cóncava, ya que la matriz hessiana
de la función es definida negativa en su dominio. y la restricción es lineal.
Luego el punto estacionario es máximo global del programa.

Se concluye que el consumidor obtiene una utilidad máxima cuando ad-


9
quiera 9 unidades del bien A y del bien B.
2
Es un extremo global ya que la región factible en este caso es el segmento
y las curvas de nivel son hipérbolas.

Ejemplo 80 Programa con restricción de igualdad


Para fabricar un estuche se utiliza un material para la parte inferior que
cuesta 1 u.m./cm2 , el material de los lados cuesta 2 u.m./cm2 y el de la
parte superior o tapa cuesta a 5 u.m./cm2 . Si el volumen total del estuche
es de 96 cm3 , determinar las dimensiones del estuche que minimizarán el
costo total de su fabricación.

Solución Si llamamos x a la profundidad del estuche, y al largo y z


al ancho, expresados en centı́metros, entonces el volumen del estuche será
V = xyz y el costo total de fabricación viene dado por

C(x, y, z) = yz + 2(2xy + 2xz) + 5yz = 6yz + 4xy + 4xz.

La formulación del problema será

Notas:

112
2.14 Condición suficiente de extremo global

Maximizar 6yz + 4xy + 4xz


s.a. x y z = 96
x, y, z > 0.

La función lagrangiana correspondiente es


L(x, y, z, λ) = 6yz + 4xy + 4xz − λ(xyz − 96).
Calculando los puntos crı́ticos de L, el sistema de ecuaciones resultante es


 4y + 4z − λyz = 0

 6z + 4x − λxz = 0



 6y + 4x − λxy = 0

xyz − 96 = 0.

Despejando λ en cada una de las primeras tres ecuaciones se obtiene


4y + 4z 6z + 4x 4x + 6y
λ= = = .
yz xz xy
Multiplicando en cruz cada ecuación se obtiene,
 2 2
 4xyz + 4xz = 6yz + 4xyz

4xyz + 4xy 2 = 6zy 2 + 4xyz

xyz − 96 = 0.

Podemos simplificarlas restando primero los términos comunes xyz de cada


ecuación,  2 2
 4xz = 6yz

4xy 2 = 6zy 2

xyz − 96 = 0.

Si dividimos la primera ecuación por z 2 y la segunda por y 2 deducimos


2
que y = z = x. Sustituyendo en la última ecuación nos quedarı́a
3
  
2 2
x x x − 96 = 0, esto es, x3 = 216.
3 3
La solución del sistema es x = 6, y = 4, z = 4, λ = 2.
Ası́, el punto estacionario del programa será (6, 4, 4) que tiene sus compo-
nentes positivas. Dicho punto verifica la condición de regularidad, es más,
todos los puntos del conjunto factible son regulares. Es el único candidato
a máximo global, por lo que si el problema tiene solución, es ésta.

Notas:

113

Você também pode gostar