Você está na página 1de 10

2 Fundamentos do cálculo variacional

Na formulação newtoniana, a dinâmica clássica é descrita a través de um princípio diferencial


em termos de uma configuração instantânea, a qual é solução de uma equação diferencial de
segunda ordem. Neste capítulo vamos ver como as leis da dinâmica podem ser reformuladas
através de um princípio integral, conhecido como o princípio variacional de Hamilton.
O princípio de Hamilton, além de levar em conta o movimento completo de um sistema
durante um intervalo de tempo finito, também reduz as leis da mecânica aum enunciado bem
geral onde, dentre todos os possíveis movimentos, o movimento real do sistema é aquele para
o qual é mínima (em geral, estacionária) uma certa quantidade chamada de ação. A ação é
uma grandeza que depende do movimento do sistema em sua totalidade. Matematicamente,
o princípio pode ser escrito por uma simples expressão,

δS = 0, (2.1)

onde o símbolo δ representa a variação funcional, e S é uma função que descreve à ação.
O objetivo deste capítulo é o de introduzir os fundamentos desta ferramenta matemática,
conhecida como cálculo das variações, necessária para formular o princípio de Hamilton. É
importante mencionar que todas as leis fundamentais da física podem ser escritas em termos
deste princípio, desde a relatividade e eletromagnetismo, até o modelo padrão de partículas
elementares.

2.1 Introdução ao cálculo de variações


O cálculo variacional tem como objetivo principal o de determinar os extremos (máximos e
mínimos) de objetos chamados de funcionais. Um funcional pode ser definido como um
mapeamento do espaço da funções aos números reais, i.e.

F : y(x) −→ F [y(x)] ∈ R, (2.2)

a cada função y(x) é associado um número real.

Exemplo 2.1.1: Consideremos dois pontos (x1 , y1 ) e (x2 , y2 ) num plano, e uma curva y(x)
que conecta esses dois pontos. O comprimento de arco infinitesimal é dado por
r  dy 2
(2.3)
p
ds = (dx)2 + (dy)2 = 1 + dx.
dx
Logo, o comprimento da curva desde x1 até x2 é
Z x2 p
s[y] = 1 + (y ′ (x))2 dx, (2.4)
x1

onde y ′ (x) ≡ dx
dy
. Dizemos então que o comprimento s é um funcional de y(x), i.e a cada
função diferenciável y(x) ∈ C ∞ (R), lhe associa um número s[y].

–7–
Figura 1: Curva passando pelos pontos x1 e x2

Exemplo 2.1.2: Se consideramos a mesma curva do exemplo 1, e agora calculamos a área


sob a curva entre os pontos x1 e x2 , temos que
Z x2
A[y] = y(x)dx. (2.5)
x1

Neste caso, a área sob a curva A é um funcional que a cada função contínua y(x) lhe associa
um número A[y].

Podemos notar nos dois exemplos anteriores que os funcionais são definidos a través de
uma integral. Essa não é uma propriedade inerente a todo funcional, mas veremos que essa
classe particular de funcionais serão importantes para a formulação do princípio de Hamilton.
Em diante, consideraremos funcionais integrais da forma,
Z x2
F [y] = f (y(x), y ′ (x), x)dx, (2.6)
x1

onde f : R3 −→ R, é uma função determinada para cada sistema em estudo. A ideia do cálculo
variacional será o de encontrar entre todas as curvas continuamente diferenciáveis C ∞ (R) que
passam pelos pontos (x1 , y1 ) e (x2 , y2 ), aquela que minimiza (ou extremiza) o funcional F [y].

Equação de Euler
Vamos supor que existe uma solução y(x) que extremiza o funcional F , e consideremoms uma
outra curva infinitesimalmente próxima, i.e

ȳ(x) = y(x) + δy(x), (2.7)

onde δy(x) representa um acréscimo infinitesimal de y no ponto x. Esta variação não deve ser
confundida com o diferencial dy, pois nesse caso está implicíto também uma variação dx.

–8–
Figura 2: Variação δy(x) de uma curva y(x).

A variaçao δy(x) pode ser entendida como uma variação de ponto fixo (ver Figura 2). Consi-
deremos dois pontos fixo x1 e x2 , i.e

ȳ(x1 ) = y(x1 ) −→ δy(x1 ) = 0,


ȳ(x2 ) = y(x2 ) −→ δy(x2 ) = 0. (2.8)

As variações das derivadas são dadas por,


dȳ dy d
ȳ ′ (x) = = + (δy(x)) , (2.9)
dx dx dx
ou

d dy
ȳ ′ (x) − y ′ (x) = δy ′ (x) ←→ δy = δ . (2.10)
dx dx

Logo, dizemos que o operador diferencial comuta com o operador variacional (de ponto fixo).
Agora, consideremos a variação do funcional (2.6),

δF = F [ȳ(x), ȳ ′ (x), x] − F [y(x), y ′ (x), x]


= F [y(x) + δy(x), y ′ (x) + δy ′ (x), x] − F [y(x), y ′ (x), x]. (2.11)

Usando uma expansão em serie de Taylor até ordem linear3 , temos


Z x2 Z x2
′ ′
δF = f [y + δy, y + δy , x]dx − f [y, y ′ , x]dx
x
Z 1x2    x1   Z x2
′ ∂f ∂f ′
= f [y, y , x] + δy + ′
δy dx − f [y, y ′ , x]dx
x ∂y ∂y x1
Z 1x2     
∂f ∂f d
= δy + ′
(δy) dx. (2.12)
x1 ∂y ∂y dx
3
Para simplificarmos a notação, vamos omitir o argumento da função y.

–9–
Integrando por partes o segundo termo, obtemos
Z x2   Z x2   Z x2  
∂f d d ∂f d ∂f
(δy)dx = δy dx − (δy)dx
x1 ∂y ′ dx x1 dx ∂y ′ x1 dx ∂y ′
 x 2 Z x 2  
∂f d ∂f
= (δy) − (δy)dx. (2.13)
∂y ′ x1 x1 dx ∂y ′

Podemos ver que o primeiro termo da eq. (2.13) se anula pela condição de extremos fixos
(2.8). Logo, obtemos
Z x2   
∂f d ∂f
δF = − (δy) dx. (2.14)
x1 ∂y dx ∂y ′

Logo, uma condição necessária para um extremo do funcional F [y] é que sea variação δF seja
nula para qualquer variação δy arbitrária (com extremos fixos), i.e
Z x2   
∂f d ∂f
δF = 0 −→ − (δy) = 0. (2.15)
x1 ∂y dx ∂y ′

Em geral, as curvas y(x) que satisfazem esta condição são chamadas de extremantes ou esta-
cionárias. Finalmente, usando o Lema fundamental do cálculo de variações, i.e

Se G(x) é uma função contínua para x1 ≥ x ≥ x2 , tal que


Z x2
G(x) η(x) dx = 0,
x1

para qualquer função η(x), com η(x1 ) = η(x2 ) = 0, então G(x) = 0 em [x1 , x2 ] .

obtemos a equação de Euler,


 
∂f d ∂f
δF = 0 −→ − =0 . (2.16)
∂y dx ∂y ′

A equação de Euler é portanto uma condição necessária para a existência de um extremo


(máximo ou mínimo) do funcional F , i.e se f satisfaz a equação de Euler, então F tem um
extremo.

Exemplo 2.1.3 (Geodésicas da esfera) Uma geodésica é uma curva com a menor distância
entre dois pontos dados. Consideremos o comprimento de arco elementar nas coordenadas
esféricas (r, θ, ϕ),

x = r sin θ cos ϕ 
y = r sin θ sin ϕ −→ ds2 = dr2 + r2 dθ2 + r2 sin2 θ dϕ2 . (2.17)

z = r cos θ

– 10 –
Na superfície da esfera, r = R, temos
"  2 #

ds2 = R2 1 + sin2 θ (dθ)2 . (2.18)

Logo, para uma curva ϕ(θ), o comprimento entre os pontos θ1 e θ2 , é dador por
Z θ2 q
s[ϕ] = R 1 + sin2 θ (ϕ′ (θ))2 dθ. (2.19)
θ1
q
Podemos identificar a nossa função f (ϕ, ϕ , θ) = R 1 + sin2 θ (ϕ′ (θ))2 . Da equação de Euler,

temos
sin2 θ ϕ′ (θ)
 
∂f d ∂f ∂f
− = 0 −→ = = c1 , (2.20)
∂ϕ dθ ∂ϕ′ ∂ϕ′
q
2 ′ 2
1 + sin θ (ϕ (θ))

onde c1 é uma constante. Resolvendo para ϕ′ , temos

dϕ c1 csc2 θ c (1 + cot2 θ)
=p = p 1 q . (2.21)
dθ 1 − c21 csc2 θ 1 − c21 1 − c21 2 cot2 θ
1−c1

Integrando, obtemos
!
c cot θ
ϕ = − arccos p1 + c2 (2.22)
1 − c21
ou
c1 cot θ
cos(ϕ − c2 ) = p . (2.23)
1 − c21

Podemos ainda reescrever o resultado na forma,

A sin θ cos ϕ + B sin θ sin ϕ = C cos θ, (2.24)

ou
c1
Ax + By = Cz com A = cos c2 , B = sin c2 , C=p . (2.25)
1 − c21

Logo, a curva geodésica é a interseção da esfera r = R com o plano dado pela equação eq.
(2.25), que passa pela origem. Estas correspondem aos círculos grande de raio R, cujo centro
está no centro (origem) da esfera.

– 11 –
2.2 O problema da Braquistrocrona
O problema da Braquistrocrona, proposto por Johann Bernoulli (1696), é o problema que
originalmente estimulou o desenvolvimento do cálculo variacional. O problema consiste basi-
camente em determinar a curva unindo dois pontos P1 e P2 , não pertencentes a uma mesma
linha vertical, tal que uma partícula de massa m sob a ação da força gravitacional deslize sem
atrito ao longo dela no menor tempo possível.

Figura 3: O problema da braquistrocrona. Uma partícula deslizando sem atrito num campo
gravitacional constante.

O tempo para a partícula deslizar uma distância infinitesimal ds é dado por dt = ds/v.
Portanto, o tempo total é dado por
Z 2
ds
t= . (2.26)
1 v

Por conveniência vamos escolher y como a variável independente. Logo, podemos escrever o
comprimento infinitesimal da seguinte forma
s 
2
dx
(2.27)
p p
2 2
ds = (dx) + (dy) = (dy) + 1 = (dy) (x′ )2 + 1.
dy

Além disso, a conservação da energia pode ser usada para relacionar a velocidade com o
deslocamento vertical y da partícula, i.e
1 2
(2.28)
p
mv = mgy −→ v= 2gy.
2
Substituindo as expressões acima encontramos que o tempo total é dado por
Z y2 s
1 + (x′ )2
t[x] = dy, (2.29)
y1 2gy

o que implica que o tempo é um funcional da curva x(y), tal que


s
1 + (x′ )2
f (x, x′ , y) = . (2.30)
2gy

– 12 –
Da equação de Euler temos,

x′
 
∂f d ∂f ∂f
− =0 −→ = = c1 , (2.31)
∂x dy ∂x′ ∂x′
p
y (1 + (x′ )2 )

o que implica
s
y
c21 y
Z
x(y) = dy. (2.32)
0 1 − c21 y

Introduzindo um paramêtro α através da definição sin2 α = c21 y, o resultado obtido é


 
1 1
x(α) = 2 α − sin(2α) . (2.33)
c1 2

Agora, fazendo θ = 2α, e a = 1/2c21 , encontramos finalmente as equações paramétricas do


ciclóide, i.e

x(θ) = a (θ − sin θ)
y(θ) = a (1 − cos θ) . (2.34)

Figura 4: O problema da braquistrocrona. A solução é um ciclóide.

2.3 Outras exemplos


Exemplo 2.3.1 A menor distância entre dois pontos
Dado dois pontos A e B no plano, qual função y(x) minimiza a distância entre os pontos? Se
aplicamos o critério de extremos da equação de Euler, a solução claramente será um minimo,
pois sempre poderemos encontrar uma curva com uma longitude arbitrariamente grande. O
comprimento de qualquer curva de A até B é dado por
Z B Z Bp Z Bp
SAB = ds = (dx)2 + (dy)2 = (x′ )2 + 1 dy. (2.35)
A A A

– 13 –
Note que aqui temos escolhido y como nossa variável independente, e portanto consideramos
curvas x(y). Logo,

(2.36)
p
f [x, x′ , y] = (x′ )2 + 1,

e substituindo na eq. de Euler, temos


!
x′
 
∂f d ∂f d
− =0 −→ = 0. (2.37)
∂x′
p
∂x dy dy 1 + (x′ )2

Resolvendo para x′ , temos

x′
r
dx c
p =c −→ ′
x = = = constante. (2.38)
1 + (x′ )2 dy 1 − c2

A solução deste problema é claramente uma linha reta da forma:

x(y) = ay + b, (2.39)

com a e b constantes.

Exemplo 2.3.2 Superfície mínima de revolução

Figura 5: Superfície de revolução com área mínima.

Consideremos uma superfície gerada pela rotação em torno do eixo y de uma curva plana
passando por dois pontos fixos. Então, podemos nos perguntar qual é a curva que gera a
superficie de revolução com área mínima?. O elemento de área infinitesimal é dado por:

(2.40)
p
dA = (2πx)ds = (2πx) 1 + (y ′ )2 dx.

Aqui temos escolhido x como variável independente, de modo que a área total é dado por
Z x2 p
A[y] = 2π x 1 + (y ′ )2 dx. (2.41)
x1 | {z }
f [y,y ′ ,x]

– 14 –
Da equação de Euler, temos:

xy ′
 
∂f d ∂f ∂f
− =0 −→ = = a, (2.42)
∂y dx ∂y ′ ∂y ′
p
1 + (y ′ )2

onde a é uma constante. Resolvendo y(x), temos


Z x2
dy a a

y = =√ −→ y(x) = √ dx. (2.43)
dx x − a2
2
x1 x2− a2
Integrando obtemos,
 
x y−b
y(x) = a cosh −1
+b −→ x(y) = a cosh . (2.44)
a a

Equação de arco de catenária

2.4 Funcional de várias funções


Da mesma forma como definimos funções de várias variáveis, também podemos generalizar os
funcionais para o caso de várias funções, i.e:
Z x2
F [y1 (x), . . . , yn (x)] = f [y1 , . . . , yn , y1′ , . . . , yn′ , x] dx. (2.45)
x1

Por simplicidade da notação, de agora em diante escreveremos:


Z x2
F [yk ] = f [yk , yk′ , x] dx, com k = 1, . . . , n. (2.46)
x1

Para achar os extremos deste funcional considereamos um conjunto de n curvas infinitesimal-


mente próximas, i.e:

ȳk (x) = yk (x) + δyk (x), (2.47)

mantendo os extremos fixos,

ȳk (x1 ) = yk (x1 ) −→ δyk (x1 ) = 0,


ȳk (x2 ) = yk (x2 ) −→ δyk (x2 ) = 0. (2.48)

Calculando a variação do funcional F , obtemos


Z x2 n     
X ∂f ∂f dyk
δF = (δyk ) + δ dx,
x1 k=1 ∂yk ∂yk′ dx
n 
Z x2 X  
∂f d ∂f
= − (δyk (x)) dx. (2.49)
x1 k=1 ∂yk dx ∂yk′

– 15 –
Agora, os extremos do funcional F são achadas a partir da condição de variação nula, δF = 0.
Se todas as variações δyk (x) forem linearmente independentes, então encontramos que o
critério de extremo é dado por uma conjunto de n equações de Euler, uma para cada curva
yk , i.e:
 
∂f d ∂f
− =0 k = 1, . . . , n. (2.50)
∂yk dx ∂yk′

Exercícios
(2.1) Resolva o problema 2.4 do livro texto de Nivaldo.

(2.2) Determine as geodésicas do cilindro.

(2.3) Resolva o problema 2.1 do livro texto de Nivaldo.

(2.4) Mostre que a equação paramétrica do ciclóide pode ser escrita como
 y p
x(y) = a arccos 1 − − y(2a − y),
a
e o tempo mínimo no problema da Braquistrocrona é dado por
r
a
t= θ.
g

(2.5) Mostre que a equação de Euler pode ser reescrita na seguinte forma:
 
∂f d ′ ∂f
− f − y ′ = 0.
∂x dx ∂y

– 16 –

Você também pode gostar