Você está na página 1de 70

Capı́tulo 11

Propriedades de Algumas Funções Especiais


Conteúdo
11.1 Discussão Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 487
11.1.1 Relações de Ortogonalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488
11.1.1.1 Condições de Contorno e a Origem das Relações de Ortogonalidade . . . . . . . . . . . 492
11.1.2 Fórmulas de Rodrigues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 496
11.1.3 Funções Geratrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 498
11.2 Propriedades de Algumas Funções Especiais . . . . . . . . . . . . . . . . . . . . . . . . . . 506
11.2.1 Propriedades dos Polinômios de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506
11.2.2 Propriedades dos Polinômios de Legendre Associados . . . . . . . . . . . . . . . . . . . . . . . 511
11.2.2.1 As Funções Harmônicas Esféricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 517
11.2.2.2 Fórmula de Adição de Funções Harmônicas Esféricas . . . . . . . . . . . . . . . . . . . 519
11.2.3 Propriedades dos Polinômios de Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 523
11.2.4 Propriedades dos Polinômios de Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527
11.2.5 Propriedades dos Polinômios de Laguerre Associados . . . . . . . . . . . . . . . . . . . . . . . 531
11.2.6 Propriedades das Funções de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534
11.2.7 Propriedades das Funções de Bessel Esféricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 548
11.3 Exercı́cios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 552
APÊNDICES . . . . . . . . . . . . . . . . . . . . . . . . 555
11.A Provando (11.70) à Força Bruta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 555

E ste capı́tulo dá continuidade ao Capı́tulo 10 e concentra-se no estudo de propriedades especiais de algumas das
funções lá apresentadas como soluções de equações diferenciais de interesse. Nossos principais objetivos são a
dedução das relações de ortogonalidade de certas funções, a dedução das chamadas fórmulas de Rodrigues e de
relações de recorrência para as mesmas e também a determinação de suas funções geratrizes. Essas proprie-
dades, que serão devidamente definidas e discutidas na Seção 11.1, são úteis para a resolução de equações diferenciais,
especialmente aquelas provenientes de problemas envolvendo equações diferenciais parciais submetidas a certas condições
iniciais e/ou de contorno. Exemplos de aplicações a problemas fı́sicos são discutidos no Capı́tulo 16, página 695. Ainda
que nosso tratamento seja tão completo quanto possı́vel, dentro do escopo relativamente limitado que pretendemos ter,
repetimos aqui a recomendação das referências listadas no Capı́tulo 10 à página 415.

11.1 Discussão Preliminar


Na próxima seção, a Seção 11.2, tencionamos apresentar ao leitor certas propriedades de algumas das funções encontra-
das como solução de equações diferenciais de interesse em Fı́sica, propriedades essas cuja utilidade maior manifesta-se
especialmente, como mencionado, na resolução de equações diferenciais parciais submetidas a certas condições iniciais
e/ou de contorno. Na presente seção prepararemos o terreno discutindo algumas idéias gerais.
As idéias gerais que apresentaremos envolvem 1. as chamadas relações de ortogonalidade, que generalizam aquelas
bem-conhecidas da teoria das séries de Fourier; 2. as chamadas fórmulas de Rodrigues, úteis para a obtenção de relações
de recorrência entre funções e 3. as chamadas funções geratrizes, das quais outras propriedades úteis são extraı́das, como
por exemplo representações integrais para certas funções.
Os exemplos principais dos quais trataremos a seguir, na Seção 11.2, envolvem os polinômios de Legendre, de Hermite
e de Laguerre e as funções de Bessel, todas de importância na resolução de problemas do Eletromagnetismo, de Mecânica
Quântica, da Mecânica dos Fluidos e de outras áreas.

487
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 488/1633

11.1.1 Relações de Ortogonalidade


No Capı́tulo 10 tratamos nossas equações diferenciais como equações no plano complexo. Para a discussão das chamadas
relações de ortogonalidade devemos considerar apenas equações diferenciais de uma variável real. De qualquer forma,
na absoluta maioria das equações diferenciais de interesse em Fı́sica a função incógnita y é uma função de uma variável
real, digamos, x, e assim consideraremos aqui.
Seja o problema de determinar as soluções não-nulas da equação diferencial y ′′ (x) + λy(x) = 0, com x restrita ao
intervalo [0, π], e que satisfaçam as condições y(0) = y(π) = 0. Tais soluções somente existem se λ for da forma λ = m2
com m = 1, 2, 3, . . . e são, para cada tal m, da forma ym (x) = sen (mx). Esse problema surge em um problema clássico
da mecânica de corpos deformáveis, a saber, no problema da corda vibrante homogênea, do qual tratamos na Seção
16.5.1, página 748. De importância crucial na resolução daquele problemaRsão as chamadas relações de ortogonalidade
π
satisfeitas pelas funções sen (mx) no intervalo [0, π], as quais afirmam que 0 sen (mx) sen (nx)dx = π2 δm, n , para todos
m, n = 1, 2, 3, . . .. Como o leitor pode constatar pela leitura da Seção 16.5.1, essas relações permitem a obtenção de
soluções da equação de movimento da corda vibrante homogênea que satisfaçam condições, ditas condições iniciais, que
fixem a posição e a velocidade de cada ponto da corda no instante inicial de seu movimento (“problema de Cauchy”).
Diversos outros problemas fı́sicos, alguns também tratados no Capı́tulo 16, página 695, podem ser igualmente resolvi-
dos com o uso de relações de ortogonalidade análogas. Na presente seção discutiremos de forma bastante geral como tais
relações se originam. Na Seção 11.2, página 506, veremos as idéias aqui apresentadas serem empregadas em exemplos
concretos que, por sua vez, encontrarão aplicações nos problemas tratados no Capı́tulo 16.
Mencionamos, por fim, que as relações de ortogonalidade aqui discutidas podem ser elegantemente descritas na teoria
dos espaços de Hilbert, que introduzimos no Capı́tulo 31, página 1471. Na teoria dos espaços de Hilbert até mesmo a
denominação “relações de ortogonalidade”, a qual pode parecer obscura a um leitor iniciante, torna-se natural. Boa parte
dos desenvolvimentos que introduziremos na presente seção serão reencontrados na discussão do chamado problema de
Sturm-Liouville, ao qual dedicamos o Capı́tulo 13, página 622.

• Resultados preparatórios
Vamos começar nossa discussão mencionando alguns resultados úteis que serão usados logo adiante.
Lema 11.1 Seja O ⊂ R um aberto e seja x0 um ponto de O. Vamos supor que tenhamos duas funções reais diferenciáveis
f e g : O → R ou C que satisfaçam γ1 f (x0 ) + γ2 f ′ (x0 ) = 0 e γ1 g(x0 ) + γ2 g ′ (x0 ) = 0, para constantes (reais ou complexas)
γ1 e γ2 , ambas não-simultaneamente nulas, ou seja, (γ1 , γ2 ) 6= (0, 0). Então, vale
f (x0 )g ′ (x0 ) − f ′ (x0 )g(x0 ) = 0 . (11.1)
Se as constantes γ1 e γ2 acima forem constantes reais, vale também
f (x0 )g ′ (x0 ) − f ′ (x0 )g(x0 ) = 0 . (11.2)
2

Prova. As condições do enunciado podem ser escritas em forma matricial como


    
f (x0 ) f ′ (x0 ) γ1 0
= .
g(x0 ) g ′ (x0 ) γ2 0
Logo, como (γ1 , γ2 ) 6= (0, 0), a matriz do lado esquerdo deve ser não-inversı́vel, ou seja, seu determinante deve ser nulo:
f (x0 )g ′ (x0 ) − f ′ (x0 )g(x0 ) = 0. Se γ1 e γ2 forem constantes reais vale também
    
f (x0 ) f ′ (x0 ) γ1 0
=
g(x0 ) g ′ (x0 ) γ2 0

e, pelo mesmo argumento de acima, segue que f (x0 )g ′ (x0 ) − f ′ (x0 )g(x0 ) = 0.

Corolário 11.1 Seja O ⊂ R um aberto e seja x0 um ponto de O. Seja u : O → C uma função diferenciável. Então, uma
condição necessária e suficiente para que existam constantes reais α1 e α2 , ambas não-simultaneamente nulas, ou seja,
(α1 , α2 ) 6= (0, 0) tais que α1 u(x0 ) + α2 u′ (x0 ) = 0 para algum x0 ∈ O é que valha u(x0 )u′ (x0 ) − u′ (x0 )u(x0 ) = 0. 2
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 489/1633

Prova. Se existirem constantes reais α1 e α2 , ambas não-simultaneamente nulas, tais que α1 u(x0 ) + α2 u′ (x0 ) = 0 para
′ ′
algum x0 ∈ O, então, adotando f = g = u em  (11.2) segue
 que u(x0 )u (x0 ) − u (x0 )u(x0 ) = 0. Reciprocamente, se

u(x0 ) u (x0 )
u(x0 )u′ (x0 ) − u′ (x0 )u(x0 ) = 0 então a matrix u(x ′ não tem inversa e, portanto, pelo Corolário 5.2, página 197,
  0 ) u (x0 )

γ1
existe um vetor não-nulo ∈ C2 tal que
γ2
    
u(x0 ) u′ (x0 ) γ1 0
= . (11.3)
u(x0 ) u′ (x0 ) γ2 0

Isso afirma que γ1 u(x0 ) + γ2 u′ (x0 ) = 0 e que γ1 u(x0 ) + γ2 u′ (x0 ) = 0. Tomando o complexo conjugado dessas igualdades,
obtemos     
u(x0 ) u′ (x0 ) γ1 0
= . (11.4)
u(x0 ) u′ (x0 ) γ2 0
Somando e subtraindo (11.3) de (11.4) obtemos
         
u(x0 ) u′ (x0 ) Re (γ1 ) 0 u(x0 ) u′ (x0 ) Im (γ1 ) 0
′ = e ′ = .
u(x0 ) u (x0 ) Re (γ2 ) 0 u(x0 ) u (x0 ) Im (γ2 ) 0
 
Como (γ1 , γ2 ) 6= (0, 0) então ou (α1 , α2 ) = Re (γ1 ), Re (γ2 ) ou (α1 , α2 ) = Im (γ1 ), Im (γ2 ) (ou ambos) são vetores
reais não-nulos. Assim,
   provamos
  que existem constantes reais α1 e α2 , ambas não-simultaneamente nulas, tais que

u(x0 ) u (x0 ) α 0
1
= , e, portanto, tais que α1 u(x0 ) + α2 u′ (x0 ) = 0.
u(x0 ) u′ (x0 ) α2 0

• Convenções sobre intervalos. Alguma notação


Em muitas das equações diferenciais de interesse em Fı́sica a variável x é restrita a uma região J ⊂ R da reta real,
sendo J um intervalo fechado (tal como [a, b]), aberto (tal como (a, b)) ou semi-aberto (tal como (a, b] ou [a, b)).
Podem também ocorrer intervalos infinitos, tais como J = (−∞, ∞), ou semi-infinitos, como J = (0, ∞) ou J = [0, ∞).
Denotaremos por J 0 o interior do intervalo J, ou seja, J 0 é o maior intervalo aberto contido em J. Por exemplo, se
J = [a, b] teremos J 0 = (a, b), se J = [0, ∞) então J 0 = (0, ∞) e se J é aberto então J 0 = J.
Daqui para frente vamos escrever o intervalo J 0 , finito ou não, na forma J 0 := (A, B) ⊂ R e, portanto, (A, B) pode
representar intervalos finitos, como por exemplo (0, 1), semi-infinitos, como por exemplo (0, ∞) ou ainda toda a reta
real (−∞, ∞).
Z B Z b
Para uma função f conveniente, vamos denotar por f (x)dx o limite lim f (x)dx, caso este exista. Os limites
a→A+
A b→B−
a

lim e lim representam os limites laterais à esquerda e à direita, respectivamente.


x→Y− x→Y+

• A forma canônica de Liouville


Até aqui escrevemos nossas equações lineares homogêneas de segunda ordem na forma
y ′′ (x) + a(x)y ′ (x) + b(x)y(x) = 0
(agora já adotando como variável x ∈ J). Em muitos problemas de interesse essa equação pode ser escrita de outra
forma, denominada por alguns autores de forma canônica de Liouville, e que será importante para o que segue:
(p(x)y ′ (x))′ + q(x)y(x) + µ r(x)y(x) = 0, (11.5)
onde,

1. p(x) é real, contı́nua e diferenciável em J 0 e p(x) > 0 para todo x ∈ J 0 .


2. q é real e contı́nua em J.
(11.6)
3. r(x) é real e contı́nua em J 0 e r(x) > 0 para todo x ∈ J 0 .

4. µ é uma constante.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 490/1633

As condições de positividade de p e r em J 0 são as mais importantes. Note-se que não excluiremos que p e r possam se
anular (ou mesmo divergir) nos extremos do intervalo J 1 .
Como o leitor pode facilmente constatar, a relação entre essas funções é a seguinte:
p′ (x) 1
a(x) = , b(x) = (q(x) + µr(x)) .
p(x) p(x)
Dadas a(x) e b(x), a primeira relação acima fixa p(x) (a menos de uma constante), a saber,
Z x 
′ ′
p(x) = exp a(x )dx + const. .
0

Já a segunda nem sempre fixa q(x) e r(x) univocamente, tudo dependendo da condição de positividade sobre r(x), que
foi mencionada acima, ou de qual parâmetro se deseja tomar por µ. Na maioria dos casos, porém, q e r podem ser fixados
univocamente, o que ficará claro nos exemplos que seguem.
Várias das equações diferenciais de segunda ordem das quais tratamos no Capı́tulo 10 podem ser escritas na forma
canônica em algum intervalo J conveniente2 . Vamos a alguns exemplos que nos interessarão:

ˆ A equação do oscilador harmônico simples: y ′′ (x) + λy(x) = 0. Aqui p(x) = 1, q(x) = 0, r(x) = 1 e µ = λ.
Vários tipos de intervalos J aparecem em problemas. No problema da corda vibrante, por exemplo, pode-se adotar
J = [0, L], L sendo o comprimento da corda.
ˆ A equação de Legendre (1 − x2 )y ′′ (x) − 2xy ′ (x) + λ(λ + 1)y(x) = 0 é tipicamente considerada no intervalo
J = [−1, 1] e pode ser escrita na forma canônica de Liouville como
 ′
1 − x2 y ′ (x) + λ(λ + 1)y(x) = 0 .
Aqui p(x) = (1 − x2 ), q(x) = 0, r(x) = 1 e µ = λ(λ + 1).
Note que p(x) > 0 em J 0 = (−1, 1), mas anula-se nos extremos x = ±1. Já a função r(x) é positiva em todo
J = [−1, 1].
ˆ A equação de Hermite y ′′ (x) − 2xy ′ (x) + λy(x) = 0, é tipicamente considerada no intervalo J = (−∞, ∞) e
pode ser escrita na forma canônica de Liouville como
 2
′ 2
e−x y ′ (x) + λe−x y(x) = 0 .
2 2
Aqui p(x) = e−x , q(x) = 0, r(x) = e−x e µ = λ.
Note que p(x) > 0 e r(x) > 0 em todo J = (−∞, ∞).
ˆ A equação de Chebyshev (1−x2 )y ′′ (x)−x y ′ (x)+λ2 y(x) = 0 é tipicamente considerada no intervalo J = [−1, 1]
e pode ser escrita na forma canônica de Liouville como
p ′ 1
1 − x2 y ′ (x) + λ2 √ y(x) = 0 .
1 − x2
√ √
Aqui p(x) = 1 − x2 , q(x) = 0, r(x) = 1/ 1 − x2 e µ = λ2 .
Note que p(x) > 0 em J 0 = (−1, 1), mas anula-se nos extremos x = ±1. Já a função r(x) é positiva em todo
J = (−1, 1), mas diverge nos extremos x = ±1.
ˆ A equação de Laguerre xy ′′ (x) + (1 − x)y ′ (x) + λy(x) = 0 é tipicamente considerada no intervalo J = [0, ∞) e
pode ser escrita na forma canônica de Liouville como
′
xe−x y ′ (x) + λe−x y(x) = 0 .
Aqui p(x) = xe−x , q(x) = 0, r(x) = e−x e µ = λ.
Note que p(x) > 0 em J 0 = (0, ∞), mas anula-se no extremo x = 0. Já a função r(x) é positiva em todo
J = [0, ∞).
1 O caso em que p e r permanecem finitas e positivas nos extremos do intervalo J é particularmente importante no chamado Problema de

Sturm-Liouville regular, tratado no Capı́tulo 13, página 622.


2 A conveniência é ditada pelo problema fı́sico subjacente.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 491/1633

ˆ A equação de Bessel de ordem ν, escrita na forma x2 y ′′ (x) + xy ′ (x) + (α2 x2 − ν 2 )y(x) = 0, é tipicamente
considerada no intervalo J = [0, 1] e pode ser escrita no intervalo (0, 1] na forma canônica de Liouville como

ν2
(xy ′ (x))′ − y(x) + α2 xy(x) = 0 .
x
2
Aqui p(x) = x, q(x) = − νx , r(x) = x e µ = α2 .
Note que p(x) > 0 em J 0 = (0, 1), mas anula-se no extremo x = 0, o mesmo valendo para r(x).

A equação de Bessel esférica também podem ser escrita na forma canônica de Liouville. Porém, a mesma pode
ser facilmente transformada em uma equação de Bessel e, portanto, seu tratamento é um caso particular do daquelas
equações. Vide Seção 11.2.7, página 548.

• O operador de Liouville
A forma canônica de Liouville (11.5) sugere a introdução de uma notação muito conveniente. Seja uma função u
definida em J que seja pelo menos duas vezes diferenciável. Sob as hipóteses (11.6) definimos o chamado operador de
Liouville3 , denotado por L, como sendo o operador diferencial dado por

(Lu)(x) := (p(x)u′ )′ + q(x)u , (11.7)

ou seja,  
d d
L := p(x) + q(x) .
dx dx
Definimos também o operador diferencial denotado por M por
 
1 1 d d q(x)
M := − L = − p(x) −− .
r(x) r(x) dx dx r(x)

A equação (11.5) fica simplificada na forma

(Lu)(x) + λ r(x)u(x) = 0 , ou seja, (M u)(x) = λ u(x) . (11.8)

Se λ for um número tal que a equação (11.8) for satisfeita para alguma função uλ , então diz-se que λ é um autovalor e
uλ é dito ser a auto-função associada ao autovalor λ. Essa nomenclatura surge por analogia com os conceitos de autovalor
e auto-vetor de matrizes na álgebra linear. Estritamente falando λ e uλ são auto-valores, respectivamente, auto-funções,
do operador M .

• O Lema de Green
O seguinte resultado elemetar sobre o operador L, por vezes, denominado Lema de Green4 , será importante no que
segue.
Lema 11.2 Seja J ≡ (A, B) ⊂ R um intervalo como descrito acima e sejam u e v funções duas vezes diferenciáveis
definidas em um intervalo finito [a, b] ⊂ J, com A < a < b < B. Sejam p, q e r satisfazendo as condições enumeradas
em (11.6). Então,
Z b Z b    
v(x) (Lu)(x) dx − (Lv)(x) u(x) dx = p(b) v(b)u′ (b) − v ′ (b)u(b) − p(a) v(a)u′ (a) − v ′ (a)u(a) . (11.9)
a a

Se u e v forem definidas em J 0 , forem duas vezes diferenciáveis e satisfizerem as condições que os limites laterais
   
lim p(a) v(a)u′ (a) − v ′ (a)u(a) e lim p(b) v(b)u′ (b) − v ′ (b)u(b)
a→A+ b→B−

3 Essanomenclatura não é universal, talvez por causar uma certa confusão com um outro operador, também dito de Liouville, que ocorre na
Mecânica Clássica: L := ∂H ∂
∂p ∂q
− ∂H ∂
∂q ∂p
, com H sendo a função Hamiltoniana, q e p sendo coordenadas de posição e momento, respectivamente.
4 George Green (1793–1841).
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 492/1633

existem e satisfazem
   
lim p(a) v(a)u′ (a) − v ′ (a)u(a) = lim p(b) v(b)u′ (b) − v ′ (b)u(b) , (11.10)
a→A+ b→B−

então teremos, conseqüentemente,


Z B Z B
v(x) (Lu)(x) dx = (Lv)(x) u(x) dx , (11.11)
A A

o que equivale a dizer que


Z B Z B
v(x) (M u)(x) r(x) dx = (M v)(x) u(x) r(x) dx . (11.12)
A A
2

Prova. Usando-se integração por partes, temos


Z b Z b Z b
v(x) (Lu)(x) dx = v(x)(p(x)u′ )′ dx + v(x)q(x)u(x) dx
a a a

Z b b Z b

= − v ′ (x)(p(x)u′ ) dx + vpu + v(x)q(x)u(x) dx
a a a

Z b b b Z b

= u(pv ′ )′ dx + vpu′ − v ′ pu + v(x)q(x)u(x) dx
a a a a

Z b b b

= (Lv)(x) u(x) dx + vpu′ − v ′ pu , (11.13)
a a a

ou seja,
Z b Z b   b    

v(x) (Lu)(x) dx− (Lv)(x) u(x) dx = vpu′ −v ′ pu = p(b) v(b)u′ (b)−v ′ (b)u(b) −p(a) v(a)u′ (a)−v ′ (a)u(a) .
a a a

Nota para o estudante mais avançado. Se V for um espaço vetorial de funções duas vezes diferenciáveis satisfazendo
(11.10), então (11.11) informa-nos que o operador L é um operador simétrico em V com relação ao produto escalar
RB
hf, gi = A f (x)g(x)dx e (11.12) informa-nos que o operador M é um operador simétrico em V com relação ao produto
RB
escalar hf, gir = A f (x)g(x) r(x)dx.

11.1.1.1 Condições de Contorno e a Origem das Relações de Ortogonalidade


Vamos nos interessar por equações diferenciais como Lu + µru = 0 definidas em um intervalo J = (A, B), não-
necessariamente finito, como descrevemos acima, com as soluções u satisfazendo as condições que os limites laterais
   
lim p(a) u(a)u′ (a) − u′ (a)u(a) e lim p(b) u(b)u′ (b) − u′ (b)u(b)
a→A+ b→B−

existam e satisfaçam
   
lim p(a) u(a)u′ (a) − u′ (a)u(a) = lim p(b) u(b)u′ (b) − u′ (b)u(b) . (11.14)
a→A+ b→B−

Há várias condições sob as quais (11.14) é satisfeita. Listemos alguns dos casos que ocorrem em equações de interesse:
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 493/1633

I J = (A, B) é um intervalo finito ou não, lim p(A) = lim p(B) = 0 mas o produto u(x)u′ (x) não diverge nos
a→A+ b→B−
limites x → A+ e x → B− . Essas condições implicam (11.14), ambos os lados da igualdade sendo nulos.
II J = [A, B] é um intervalo finito, p(A) e p(B) são ambos finitos mas u satisfaz condições de contorno em A e em
B do forma

α1 u(A) + α2 u′ (A) = 0, (11.15)

β1 u(B) + β2 u′ (B) = 0, (11.16)

onde α1 , α2 , β1 , β2 são constantes reais fixadas, sendo (α1 , α2 ) 6= (0, 0) e (β1 , β2 ) 6= (0, 0).
Pelo Corolário 11.1, página 488, essas condições implicam que u(A)u′ (A)−u′ (A)u(A) = 0 e u(B)u′ (B)−u′ (B)u(B) =
0, o que implica (11.14), ambos os lados da igualdade sendo nulos.
III J = (A, B) é um intervalo finito e vale uma combinação dos casos anteriores. Por exemplo, lim p(A) = 0 com o
a→A+

produto u(x)u (x) não divergindo no limite x → A+ e, além disso, existem constantes reais (β1 , β2 ) 6= (0, 0) tais
que β1 u(B) + β2 u′ (B) = 0.

As condições (11.14) são, portanto, mais gerais que condições como I ou II, acima. A Proposição 11.1, adiante,
aponta algumas de suas conseqüências.

• Realidade dos autovalores, simplicidade e realidade das autofunções


Proposição 11.1 Seja um intervalo (não necessariamente finito) J = (A, B), como descrito acima, e sejam p, q e r
funções definidas em J, satisfazendo as condições enumeradas em (11.6).
Considere-se o problema de determinar uma constante µ e uma solução u da equação diferencial Lu(x)+µr(x)u(x) = 0
definida em J, com u satisfazendo as condições que os limites
   
lim p(a) u(a)u′ (a) − u′ (a)u(a) e lim p(b) u(b)u′ (b) − u′ (b)u(b)
a→A+ b→B−

existam e satisfaçam
   
lim p(a) u(a)u′ (a) − u′ (a)u(a) = lim p(b) u(b)u′ (b) − u′ (b)u(b) . (11.17)
a→A+ b→B−

Então, valem os seguintes fatos:

a. µ ∈ R,
b. A solução u é única a menos de uma constante multiplicativa,
c. A solução u é múltipla de uma solução real.

Conseqüentemente, toda solução da equação Lu(x) + µr(x)u(x) = 0 com µ ∈ R sob as condições (11.17) é múltipla de
uma única solução real da equação Lu(x)+µr(x)u(x) = 0. Note-se que funções reais satisfazem trivialmente as condições
(11.17). 2
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 494/1633

Rb
Prova. Parte a. Consideremos (a, b) um intervalo finito contido em J e seja a expressão µ − µ a |u(x)|2 r(x) dx.
Podemos escrevê-la como
Z Z
 b 2
 b
µ−µ |u(x)| r(x) dx = µ−µ u(x)u(x) r(x) dx
a a

Z b Z b 
= (µu(x)r(x))u(x) dx − u(x) µr(x)u(x) dx
a a

Z b Z b
= − (Lu)(x)u(x) dx + u(x)(Lu)(x) dx
a a

(11.9)
   
= p(b) u(b)u′ (b) − u′ (b)u(b) − p(a) u(a)u′ (a) − u′ (a)u(a) .
Rb
Por (11.17), o lado direito converge a zero nos limites b → B− e a → A+ . Como a
|u(x)|2 r(x) dx > 0 para todos a e b
com A < a < b < B, concluı́mos que µ = µ, provando que µ ∈ R.
Parte b. Sejam u1 , u2 tais que Lu1 + µru1 = 0 e Lu2 + µru2 = 0 para um dado µ, ambas satisfazendo as condições
mencionadas no enunciado. Como vimos na parte a, µ é real. Considere-se a função
 
u1 (x) u′1 (x)
W12 (x) = det = u1 (x)u′2 (x) − u′1 (x)u2 (x) .
u2 (x) u′2 (x)

Vamos em primeiro lugar mostrar que p(x)W12 (x) é constante, ou seja, que (pW12 )′ = 0. De fato,

(pW12 )′ = p′ W12 + pW′12 = p′ (u1 u′2 − u′1 u2 ) + p (u1 u′2 − u′1 u2 )′

= p′ (u1 u′2 − u′1 u2 ) + p (u′1 u′2 + u1 u′′2 − u′′1 u2 − u′1 u′2 )

= p′ (u1 u′2 − u′1 u2 ) + p (u1 u′′2 − u′′1 u2 )

= u1 (p′ u′2 + pu′′2 ) − u2 (p′ u′1 + pu′′1 )

= u1 (pu′2 )′ − u2 (pu′1 )′

= −u1 (qu2 + µru2 ) + u2 (qu1 + µru1 )

= 0. (11.18)

Agora, p(x)W12 (x) = p(x) u1 (x)u′2 (x) − u2 (x)u′1 (x) e, portanto, pelas hipóteses (11.17), seus limites b → B− e a → A+
existem e anulam-se, provando que p(x)W12 (x) = 0 para todo x. Pelas hipóteses em (11.6), p é positivo em J 0 e,
portanto, W12 (x) = 0 para todo x.
Isso diz que as duas linhas que formam a matriz cujo determinante é W12 (x) são, para cada x ∈ [a, b], proporcionais
uma a outra, ou seja, existe γ(x) tal que, por exemplo,

u1 (x) = γ(x)u2 (x) e u′1 (x) = γ(x)u′2 (x)

para todo x. Derivando a primeira e comparando à segunda, conclui-se que γ(x) é constante, ou seja, não depende de x.
Assim, verificamos que as funções u1 e u2 são múltiplas entre si. Com isso, mostramos que se tivermos duas auto-funções
com o mesmo auto-valor as auto-funções são múltiplas uma da outra e o subespaço que ambas geram tem dimensão 1.
Parte c. Como p, q, r são reais e também µ (pela parte a), então se u é solução de Lu + µru = 0 seu complexo conjugado
u também o é. Fora isso, se u satisfaz as condições (11.17), seu complexo conjugado u também as satisfaz. Logo, pela
parte b, existe uma constante γ ∈ C tal que u = γu.
A equação u = γu implica u = γu e, portanto |γ| = 1, ou seja, γ = eiθ , para θ ∈ R. Decompondo u em suas partes
real e imaginária, u = v + iw, concluı́mos que v − iw = (cos θ + i sen θ)(v + iw), ou seja, valem (1 − cos θ)v = − sen (θ)w e
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 495/1633

(1 + cos θ)w = − sen (θ)v. Agora, se cos θ = 1, então a segunda igualdade


 implica w
 = 0 e, portanto, u = v. Se cos θ 6= 1,
sen θ sen θ
então a primeira igualdade implica v = − 1−cos θ w e , portanto, u = − 1−cos θ + i w.

Os resultados da Proposição 11.1 podem ser parafraseados da seguinte forma. Considere-se o problema de determinar
os autovalores µ e autofunções u da equação Lu + µru = 0 sob condições que impliquem a condições (11.17), tais como as
condições I ou II da página 492. Então os autovalores são reais, simples (ou seja, não-degenerados: para cada autovalor
o espaço das correspondentes autofunções é unidimencional) e as autofunções podem ser tomadas reais.

• Problemas de autovalores e relações de ortogonalidade


No teorema a seguir consideraremos funções reais u1 e u2 definidas em um intervalo (não necessariamente finito)
J = (A, B), que satisfaçam as condições de os limites
   
lim p(a) u1 (a)u′2 (a) − u′1 (a)u2 (a) e lim p(b) u1 (b)u′2 (b) − u′1 (b)u2 (b)
a→A+ b→B−

existirem e satisfazerem
   
lim p(a) u1 (a)u′2 (a) − u′1 (a)u2 (a) = lim p(b) u1 (b)u′2 (b) − u′1 (b)u2 (b) . (11.19)
a→A+ b→B−

Há várias condições sob as quais (11.19) é satisfeita. Listemos alguns dos casos que ocorrem em equações de interesse:

I’ J = (A, B) é um intervalo finito ou não, lim p(A) = lim p(B) = 0 mas o produto u1 (x)u′2 (x) − u′1 (x)u2 (x)
a→A+ b→B−
não diverge nos limites x → A+ e x → B− . Essas condições implicam (11.19), ambos os lados da igualdade sendo
nulos.
II’ J = [A, B] é um intervalo finito, p(A) e p(B) são ambos finitos mas tanto a função u1 quanto a função u2 satisfazem
condições de contorno em A e em B do forma

α1 u(A) + α2 u′ (A) = 0, (11.20)

β1 u(B) + β2 u′ (B) = 0, (11.21)

onde α1 , α2 , β1 , β2 são constantes reais fixadas, sendo (α1 , α2 ) 6= (0, 0) e (β1 , β2 ) 6= (0, 0).
Pelo Lema 11.1, página 488, particularmente por (11.1), essas condições implicam que u1 (A)u′2 (A)−u′1 (A)u2 (A) = 0
e u1 (B)u′2 (B) − u′1 (B)u2 (B) = 0, o que implica (11.19), ambos os lados da igualdade sendo nulos.
III’ J = (A, B) é um intervalo finito e vale uma combinação dos casos anteriores. Por exemplo, lim p(A) = 0
a→A+
com o produto u1 (x)u′2 (x) − u′1 (x)u2 (x) não divergindo no limite x → A+ e, além disso, existem constantes reais
(β1 , β2 ) 6= (0, 0) tais que tanto a função u1 quanto a função u2 satisfazem β1 u(B) + β2 u′ (B) = 0.

Conseqüentemente, as condições (11.19) são mais gerais que condições como I’ ou II’, acima. O seguinte resultado
aponta uma das conseqüências das hipóteses de (11.19) e expressa uma da mais importantes propriedades das soluções
das equações diferenciais discutidas acima: as chamadas relações de ortogonalidade.
Teorema 11.1 Considere-se a equação diferencial Lu(x) + µr(x)u(x) = 0 definida no intervalo (não necessariamente
finito) J = (A, B), com p, q e r satisfazendo as condições enumeradas em (11.6). Sejam λ1 e λ2 ∈ R com λ1 6= λ2 e
suponhamos que u1 e u2 sejam funções reais não-nulas que satisfazem

Lu1 (x) + λ1 r(x)u1 (x) = 0 e Lu2 (x) + λ2 r(x)u2 (x) = 0 , (11.22)


em J = (A, B) e suponhamos ainda que os limites
   
lim p(a) u1 (a)u′2 (a) − u′1 (a)u2 (a) e lim p(b) u1 (b)u′2 (b) − u′1 (b)u2 (b)
a→A+ b→B−

existam e satisfaçam
   
lim p(a) u1 (a)u′2 (a) − u′1 (a)u2 (a) = lim p(b) u1 (b)u′2 (b) − u′1 (b)u2 (b) . (11.23)
a→A+ b→B−
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 496/1633

Então,
Z B
u1 (x) u2 (x) r(x) dx = 0 . (11.24)
A
2

Prova. Seja (a, b), com A < a < b < B, qualquer intervalo finito contido em J 0 . Consideremos a expressão
Z b
(λ1 − λ2 ) u1 (x) u2 (x) r(x) dx .
a

Como λ1 e λ2 são reais, isso pode ser escrito por (11.22) como

Z b Z b
(λ1 r(x)u1 (x)) u2 (x) dx − u1 (x) (λ2 r(x)u2 (x)) dx
a a

Z b Z b
= u1 (x) (Lu2 )(x) dx − (Lu1 )(x) u2 (x) dx
a a

   
= p(b) u1 (b)u′2 (b) − u′1 (b)u2 (b) − p(a) u1 (a)u′2 (a) − u′1 (a)u2 (a) ,

sendo que na última igualdade usamos (11.9), lembrando que, no caso presente, todas as funções e constantes são reais.
Conseqüentemente, tem-se pelas hipóteses,

Z B
(λ1 − λ2 ) u1 (x) u2 (x) r(x) dx
A

   
= lim p(b) u1 (b)u′2 (b) − u′1 (b)u2 (b) − lim p(a) u1 (a)u′2 (a) − u′1 (a)u2 (a) = 0 .
b→B− a→A+

Z B
Como λ1 6= λ2 , isso implica u1 (x) u2 (x) r(x) dx = 0, como querı́amos provar.
A

A relação (11.24) diz-nos que u1 e u2 são ortogonais em relação ao produto escalar real
Z B
hf, gir := f (x)g(x) r(x) dx , (11.25)
A
RB
definido no conjunto de todas as funções f : J → R tais que A f (x)2 r(x) dx < ∞. Essas relações de ortogonalidade são
de suma importância em aplicações, especialmente na resolução de equações diferenciais sob certas condições de contorno.
O leitor interessado em exemplos pode passar diretamente à Seção 11.2, página 506. Aplicações à solução de equações
diferenciais parciais de interesse em Fı́sica serão vistas no Capı́tulo 16, página 695.

11.1.2 Fórmulas de Rodrigues


As idéias desta pequena seção serão melhor ilustradas nos exemplos da Seção 11.2.
Consideremos a equação diferencial (p(x)y ′ (x))′ + q(x)y(x) + µ r(x)y(x) = 0, ou seja, Ly + µry = 0, com p, q e r
satisfazendo as condições enumeradas em (11.6) e suponhamos também que r seja uma função infinitamente diferenciável
de x. Consideremos que o intervalo J onde a equação é considerada seja J = [−1, 1]. Para n = 0, 1, 2, . . ., sejam
definidas as funções !
1 dn 2 n
pn (x) := r(x)(1 − x ) . (11.26)
r(x) dxn
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 497/1633

É fácil ver que se m < n, então Z 1


xm pn (x) r(x) dx = 0 , (11.27)
−1

ou seja, cada pn é ortogonal, segundo o produto escalar h·, ·ir definido em (11.25), a todos os polinômios de grau menor
que n. Para provar (11.27), basta escrever
Z 1 Z 1 !
n
d
xm pn (x) r(x) dx = xm r(x)(1 − x2 )n dx
−1 −1 dxn
 
dk
e fazer n vezes integração por partes, lembrando que a expressão dxk
r(x)(1 − x2 )n , com k < n, sempre contém um
fator (1 − x2 ) que se anula em ±1.

E. 11.1 Exercı́cio importante. Faça isso! 6

Se as funções pn forem elas mesmas polinômios de grau n, o que ocorre em vários casos, concluı́mos que
Z 1
pm (x) pn (x) r(x) dx = 0 ,
−1

sempre que m 6= n. Isso significa que os polinômios pn (x) são ortogonais dois-a-dois segundo o produto escalar h·, ·ir no
intervalo J = [−1, 1].
Várias equações diferenciais do tipo mencionado acima, definidas em um intervalo finito [−1, 1], têm soluções polino-
miais, como por exemplo, a equação de Legendre e de Chebyshev. Como as mesmas, pelo Teorema 11.1, são ortogonais
em relação ao produto escalar h·, ·ir no intervalo J = [−1, 1]5 , as considerações acima sugerem que as soluções polinomi-
ais possam ser escritas, a menos de uma constante multiplicativa, na forma (11.26). Isso é, de fato, verdade para várias
equações importantes (como as de Legendre e Chebyshev) e da expressão (11.26) será possı́vel obter várias propriedades
daqueles polinômios. Isso será melhor discutido nos exemplos que trataremos na Seção 11.2.
A expressão (11.26) é denominada fórmula de Rodrigues6 .

E. 11.2 Exercı́cio. Generalize a fórmula de Rodrigues (11.26) para um intervalo J = [a, b] finito arbitrário. Sugestão:
procure uma transformação linear que mapeie bijetivamente [−1, 1] em [a, b]. 6

As fórmulas de Rodrigues podem ser generalizadas para equações diferenciais definidas em intervalos não-finitos, como
J = (0, ∞) ou J = (−∞, ∞). Tratemos disso.
Para o caso J = (0, ∞) devemos supor novamente que r(x) seja infinitamente diferenciável, mas devemos ainda supor
que r(x) seja limitada em x = 0 e que r(x) e todas as suas derivadas r(m) (x) caiam no infinito mais rápido que qualquer
potência, ou seja limx→∞ xk r(m) (x) = 0 para todo k ≥ 0 e m ≥ 0. Definimos, nesse caso,

1 dn  
pn (x) := n
r(x) xn . (11.28)
r(x) dx

É fácil ver que se m < n, então Z ∞


xm pn (x) r(x) dx = 0 , (11.29)
0
Para ver isso, escrevemos novamente
Z Z !
∞ ∞
m m dn
x pn (x) r(x) dx = x r(x) xn dx
0 0 dxn
5 Veremos isso explicitamente nos exemplos da Seção 11.2
6 Benjamin Olinde Rodrigues (1794–1851). Rodrigues foi banqueiro e matemático amador, nascido na França, mas de origem judaico-
portuguesa. Encontrou a fórmula que leva seu nome apenas para o caso dos polinômios de Legendre. A generalização aqui apresentada é
posterior. Rodrigues também deu contribuições para a teoria dos quatérnions e para o grupo SO(3) (vide Proposição 17.5, página 840). Apesar
de banqueiro, Rodrigues foi lı́der do partido socialista francês.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 498/1633

e fazemos
 integração
 por partes, usando que limx→∞ xk r(m) (x) = 0 para todos k ≥ 0 e m ≥ 0 e que a expressão
k
d n
dxk r(x)x , com k < n, sempre contém um fator x que se anula em 0.

E. 11.3 Exercı́cio importante. Complete os detalhes. 6

Em certos exemplos, como na equação de Laguerre, as funções pn são polinômios na variável x. Nesses casos, temos
então que Z ∞
pm (x) pn (x) r(x) dx = 0 ,
0

sempre que m 6= n. Isso significa que os polinômios pn (x) são ortogonais dois-a-dois segundo o produto escalar h·, ·ir no
intervalo J = (0, ∞). Como antes, isso sugere que as soluções polinomiais de certas equações diferenciais definidas no
intervalo J = (0, ∞) possam ser escritas, a menos de uma constante multiplicativa, na forma sugerida pela fórmula de
Rodrigues (11.28). Veremos que tal é o caso para os polinômios de Laguerre e isso nos permitirá obter algumas relações
úteis sobre aqueles polinômios.
Para o caso J = (−∞, ∞) devemos supor novamente que r(x) seja infinitamente diferenciável, mas devemos
ainda supor que r(x) e todas as suas derivadas r(m) (x) caiam no infinito mais rápido que qualquer potência, ou seja
lim|x|→∞ |x|k |r(m) (x)| = 0 para todo k ≥ 0 e m ≥ 0. Definimos, nesse caso,

1 dn  
pn (x) := r(x) . (11.30)
r(x) dxn

É fácil ver que se m < n, então Z ∞


xm pn (x) r(x) dx = 0 , (11.31)
−∞

Para ver isso, escrevemos novamente


Z ∞ Z ∞
dn  
xm pn (x) r(x) dx = xm r(x) dx
−∞ −∞ dxn

e fazemos integração por partes, usando que lim|x|→∞ |x|k |r(m) (x)| = 0 para todos k ≥ 0 e m ≥ 0.

E. 11.4 Exercı́cio importante. Complete os detalhes. 6

Em certos exemplos, como na equação de Hermite, as funções pn são polinômios na variável x. Nesses casos, temos
então que Z ∞
pm (x) pn (x) r(x) dx = 0 ,
−∞

sempre que m 6= n. Isso significa que os polinômios pn (x) são ortogonais dois-a-dois segundo o produto escalar h·, ·ir no
intervalo J = (−∞, ∞). Como antes, isso sugere que as soluções polinomiais de certas equações diferenciais definidas no
intervalo J = (−∞, ∞) possam ser escritas, a menos de uma constante multiplicativa, na forma sugerida pela fórmula de
Rodrigues (11.30). Veremos que tal é o caso para os polinômios de Hermite e isso nos permitirá obter algumas relações
úteis sobre os mesmos.

11.1.3 Funções Geratrizes


Funções geratrizes desempenham um elegante papel no estudo de propriedades de seqüências numéricas, em análise
combinatória e no estudo de certas seqüências de funções (ilustraremos essa afirmação estudando com elas, logo abaixo,
a chamada seqüência de Fibonacci). Faremos adiante uso de funções geratrizes para demonstrar algumas propriedades
úteis de algumas das soluções que encontramos no Capı́tulo 10, como os polinômios de Legendre, de Hermite, de Laguerre,
de Chebyshev e as funções de Bessel.
O leitor poderá encontrar na bela referência [64] uma vasta coleção de identidades combinatórias interessantes que
podem ser engenhosamente demonstradas com o uso de funções geratrizes de seqüências, assim como outras referências
à literatura pertinente.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 499/1633

• Funções geratrizes
Seja {an , n ∈ N0 } uma seqüência de números reais ou complexos. Define-se a função geratriz da seqüência {an , n ∈
N0 } como sendo a função dada por

X
G{an } (t) := a n tn .
n=0
Essa definição pressupõe que a série de potências em t do lado direito seja convergente em alguma região aberta do plano
complexo, digamos |t| < T , para algum T > 0. Isso nem sempre é o caso. Por exemplo, se an = n! a série acima tem
raio de convergência nulo.

• Funções geratrizes exponenciais


A função geratriz exponencial da seqüência {an , n ∈ N0 } é definida por
X∞
an n
E{an } (t) := t .
n=0
n!

Essa definição pressupõe que a série de potências em t do lado direito seja convergente em alguma região aberta do plano
complexo, digamos |t| < T . Observe que o lado direito, caso seja convergente, coincide com a série de Taylor centrada
dk E{an }
em 0 da função E{an } (t) e, portanto, para cada k vale ak = (0).
dtk

• Funções geratrizes de Dirichlet


Para certos tipos Pde seqüências é conveniente definir outro tipo de função geratriz, substituindo os monômios tn por

outras funções de t: n=0 an Sn (t). O exemplo mais importante desse tipo de função geratriz é aquele no qual se toma
t
Sn (t) = 1/n , n ≥ 1. Isso nos conduz à próxima definição.
A função geratriz de Dirichlet7 da seqüência {an , n ∈ N} é definida por
X∞
an
D{an } (t) := ,
n=1
nt

desde que a série do lado direito convirja com a variável t em alguma região aberta do plano complexo.
A mais famosa das funções geratrizes de Dirichlet é a função zeta de Riemann8 , que é a função geratriz de Dirichlet
da seqüência constante an = 1, n ≥ 1:
X∞
1
ζ(s) := s
. (11.32)
n=1
n
Como facilmente se vê, a série do lado direito converge na região do plano complexo definida por Re(s) > 1. A função
zeta de Riemann desempenha um papel de grande importância na teoria das funções de variável complexa e na teoria de
números, pois várias de suas propriedades estão relacionadas a propriedades do conjunto de números primos. Vide, e.g.,
[71], [178], [179] ou [45].

• Funções geratrizes de Lambert


A função geratriz de Lambert9 da seqüência {an , n ∈ N} é definida por

X tn
L{an } (t) := an ,
n=1
1 − tn

desde que a série do lado direito convirja com a variável t em alguma região aberta do plano complexo. As funções
geratrizes de Lambert são também denominadas séries de Lambert.
As funções geratrizes definidas acima têm várias propriedades algébricas interessantes, como mostrado nos exercı́cios
que seguem.
7 Johann Peter Gustav Lejeune Dirichlet (1805–1859).
8 Georg Friedrich Bernhard Riemann (1826–1866).
9 Johan Heinrich Lambert (1728–1777).
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 500/1633

E. 11.5 Exercı́cio. Se {an } e {bn } são duas seqüências cujas funções geratrizes G{an } (t) e G{bn } (t) têm uma região
aberta de convergência comum, mostre que

G{an } (t) G{bn } (t) = G{cn } (t) ,

onde
n
X
cn = an−p bp .
p=0
6

E. 11.6 Exercı́cio. Se {an } e {bn } são duas seqüências cujas funções geratrizes exponenciais E{an } (t) e E{bn } (t) têm
uma região aberta de convergência comum, mostre que

E{an } (t) E{bn } (t) = E{cn } (t) ,

onde
n  
X n
cn = an−p bp .
p=0
p
6

E. 11.7 Exercı́cio. Se {an } e {bn } são duas seqüências cujas funções geratrizes de Dirichlet D{an } (t) e D{bn } (t) têm uma
região aberta de convergência comum, mostre que

D{an } (t) D{bn } (t) = D{cn } (t) ,

onde
n
X
cn = an/p bp .
p=1
n/p inteiro

E. 11.8 Exercı́cio. Se {an } é uma seqüência cuja função geratriz de Lambert é L{an } (t), mostre que
X
L{an } (t) = bm tm = G{bn } (t) ,
m=1

onde b0 := 0 e, para m > 0,


m
X
bm := an .
n=1
m/n inteiro

Passemos a discutir algumas aplicações das funções geratrizes.

• Números de Fibonacci
Seja an , n = 0, 1, 2, 3, 4 . . ., a seqüência definida recursivamente da seguinte forma:

a0 = 1 , a1 = 1 , an+2 = an+1 + an , ∀n≥0.

Essa seqüência é denominada seqüência de Fibonacci10 . Cada elemento da seqüência de Fibonacci é a soma de seus dois
antecessores. Os primeiros elementos da seqüência de Fibonacci são

1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 6765, 10946, 17711, 28657, . . . .
10 Leonardo Pisano, cognominado “Fibonacci” (1170–1250).
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 501/1633

Fibonacci introduziu a seqüência que leva seu nome em um problema de seu livro Liber abbaci, de 1202 (livro esse que
introduziu o sistema decimal arábico na Europa, em substituição ao sistema de algarismos romanos, usado até então):
“Um certo homem coloca um casal de coelhos em um local cercado de muros por todos os lados. Quantos pares de coelhos
podem ser produzidos a partir daquele casal em um ano se for suposto que a cada mês cada casal gera um novo casal, o
qual se torna fértil em um mês”. A resposta (supondo que nenhum coelho morre) é que, após n meses, tem-se an pares
de coelhos, sendo an dado acima. Trata-se provavelmente do primeiro modelo de evolução de populações. A seqüência
de Fibonacci é surpreendentemente rica em propriedades, sendo possivelmente uma das mais pesquisadas, existindo até
mesmo uma publicação periódica (“Fibonacci Quarterly”) dedicada a seu estudo.
Um fato que confere aos números de Fibonacci um sabor especial é que os mesmos aparecem freqüentemente na
Natureza. Há, por exemplo, uma forte probabilidade de os números de pétalas em flores de determinadas espécies de
plantas serem números de Fibonacci. O mesmo se dá com o número de voltas espirais na casca de abacaxis e de pinhas,
com o número de ramos de plantas e árvores, com o número de padrões de um determinado tipo nas conchas de caramujos
etc11 . A razão do surgimento de números de Fibonacci em contextos biológicos está relacionado à formação e reprodução
de padrões, mas é apenas parcialmente entendida atualmente.
No intuito de ilustrar a utilidade de funções geratrizes de seqüências, vamos demonstrar a seguinte identidade para
os elementos da seqüência de Fibonacci:
 
√ !n+1 √ !n+1
1  1+ 5 1− 5  ,
an = √ − (11.33)
5 2 2

válida para todo n ≥ 0. Essa expressão permite obter cada an diretamente em termos de n.
A função geratriz da seqüência de Fibonacci é

X
F (t) = a n tn . (11.34)
n=0

Mostremos primeiramente que a série de potências do lado direito tem um raio de convergência não-nulo. Pelo teste da
razão vale, para n > 0,
 
an+1 tn+1
= an+1 |t| = an + an−1 |t| = 1 + an−1 |t| ≤ 2|t| ,
a n tn an an an
pois an−1
an ≤ 1, já que a seqüência de Fibonacci é crescente. Logo, a série converge absolutamente pelo menos na região
|t| < 1/2. A verdadeira região de convergência é um pouco maior (como veremos adiante), mas não precisaremos desse
fato por ora, pois tudo o que necessitamos é da existência de um raio de convergência não-nulo, o que justifica as
manipulações que faremos.
Façamos uso da definição da seqüência de Fibonacci para obter uma fórmula explı́cita para F (t). Temos que

X
F (t) = 1+t+ a n tn
n=2


X ∞
X ∞
X
= 1+t+ (an−1 + an−2 ) tn = 1 + t + an−1 tn + an−2 tn
n=2 n=2 n=2


X ∞
X
= 1+t+t a n tn + t2 a n tn
n=1 n=0

= 1 + t + t(F (t) − 1) + t2 F (t) .


11 Para algumas referências:
ˆ S. L. Basin, “The Fibonacci Sequence as it appears in Nature”, The Fibonacci Quarterly, 1, (1963), 53–57.
ˆ A. Brousseau, “Fibonacci Statistics in Conifers”, The Fibonacci Quarterly, 7 (1969), 525–532.
ˆ P. B. Onderdonk, “Pineapples and Fibonacci Numbers”, The Fibonacci Quarterly, 8 (1970), 507–508.
Um livro clássico sobre o assunto é [175]. A área da Biologia e da Matemática que se dedica ao estudo da formação e evolução de padrões é
denominada Filotaxia.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 502/1633

Assim, (1 − t − t2 )F (t) = 1 e, portanto,


1
F (t) = .
1 − t − t2
A idéia agora é obter a expansão em série de Taylor de F (t) em torno de t = 0 e compará-la a (11.34), para assim obter
uma expressão explı́cita para os an ’s. Para isso, ao invés de calcularmos as derivadas de F em t = 0, é mais fácil proceder
da seguinte forma. Escrevemos 1 − t − t2 = −(t − γ1 )(t − γ2 ) onde
√ √
5−1 5+1
γ1 = , γ2 = − .
2 2
Assim,
 
1 1 1 1 1
F (t) = = − = −
1 − t − t2 (t − γ1 )(t − γ2 ) γ1 − γ2 γ1 − t γ2 − t
" ! !#
1 1 1 1 1
= √ −
5 γ1 1 − γt1 γ2 1 − γt2

∞  
1 X 1 1
= √ − n+1 tn
5 n=0 γ1n+1 γ2


1 X  
= √ (−γ2 )n+1 − (−γ1 )n+1 tn
5 n=0
 
∞ √ !n+1 √ !n+1
X 1  1+ 5 1− 5
= √ −  tn ,
n=0
5 2 2

onde usamos que 1/γ1 = −γ2 . Comparando com (11.34) obtemos (11.33),√como querı́amos. Da última expressão, vê-se
também que o raio de convergência da série de potências que define F é ( 5 − 1)/2 ≈ 0, 618 . . ..

• Algumas identidades combinatórias


A seqüência de exercı́cios dirigidos que segue apresenta-nos uma série de identidades combinatórias de interesse
(usaremos algumas no Capı́tulo 12, página 557). A primeira obtem-se através de uma função geratriz.

E. 11.9 Exercı́cio dirigido. Para n ∈ N, m ∈ N0 , defina-se o conjunto


n o
Nnm := (a1 , . . . , an ) ∈ Nn0 , a1 + · · · + an = m .

Seja |Nnm | o número de elementos de Nnm . |Nnm | representa o número de maneiras de colocar exatamente m objetos indis-
tinguı́veis em n posições distintas. Mostre que
 
n+m−1 (n + m − 1)!
|Nnm | = = .
m (n − 1)! m!

Sugestão. Mostre primeiramente que a função geratriz da seqüência |Nm


m |, m = 0, 1, 2, . . ., é


X  n
1
|Nnm | tm = . (11.35)
m=0
1−t

Para isso, mostre que, para |t| < 1,


 n ∞
!n ∞ ∞
1 X X X
a
= t = ta1 +···+an = |Nnm | tm .
1−t a=0 a1 , ..., an =0 m=0
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 503/1633

De (11.35), obtenha
 n  
1 dm 1
n · · · (m + m − 1) (n + m − 1)! n+m−1
|Nnm | = = = = .
m! dtm 1−t t=0 m! (n − 1)! m! m
6

E. 11.10 Exercı́cio dirigido. Para n ∈ N, m ∈ N0 , defina-se o conjunto


n o
Mnm := (a1 , . . . , an ) ∈ Nn0 , 0 ≤ a1 + · · · + an ≤ m .

Seja |Mnm | o número de elementos de Mnm . |Mnm | representa o número de maneiras de colocar de zero a no máximo m objetos
indistinguı́veis em n posições distintas. Mostre que
 
n+m (n + m)!
|Mnm | = = . (11.36)
m n! m!
Sugestão. Convença-se que
m
X m 
X 
n+k−1
|Mnm | = |Nnk | = . (11.37)
k
k=0 k=0

Usando a bem conhecida identidade de Pascal12


     
a a−1 a−1
= + (11.38)
b b b−1
conclua que
m 
X  m 
X  m 
X  m 
X 
n+k n+k (11.38) n+k−1 n+k−1
= 1+ = 1+ +
k k k k−1
k=0 k=1 k=1 k=1

m 
X  m 
X 
n+k−1 n+l−1
= 1+ +
k l−1
k=1 l=1

m 
X  X
m−1 
l′ =l−1 n+k−1 n + l′
= 1+ +
k l′
k=1 l′ =0

e, assim, conclua que


m 
X  m 
X  m 
X  X
m−1   
n+k−1 n+k−1 n+k n + l′ n+m
= 1+ = − = .
k k k l′ m
k=0 k=1 k=0 l′ =0

Por (11.37), isso prova (11.36). 6

m 
X   
n+k−1 n+m
A identidade = é conhecida como segunda identidade de Pascal ou identidade da soma
k m
k=0
paralela. Para outras identidades combinatórias úteis, vide [64].

E. 11.11 Exercı́cio. Seguindo passos análogos aos do último exercı́cio, demonstre a identidade da soma vertical:
  Xn  
n+1 j
= .
m+1 j=0
m

6
12 Blaise Pascal (1623–1662).
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 504/1633

E. 11.12 Exercı́cio. As  denominações identidade da soma paralela e identidade da soma vertical provêm da relação dos
coeficientes binomiais ab com o triângulo de Pascal. Desenhe um triângulo de Pascal e entenda o significado dessas identidades
e a razão de seus nomes. 6

 
E. 11.13 Exercı́cio dirigido. As identidades |Nnm | = n+m−1 m e |Mnm | = n+m m podem ser obtidas de uma forma talvez
mais direta esimples, dependendo do gosto do leitor. Suponha que se tenha m bolas pretas e n bolas brancas. Convença-se
que há n+mm = n+mn arranjos possı́veis dessas bolas (supondo que as bolas pretas são indistinguı́veis entre si, e que o mesmo
valha para as brancas). Uma maneira de fazer esse raciocı́nio é imaginar as n + m bolas enfileiradas e contar de quantas
maneiras distintas essas fileiras podem ser formadas. Há (n + m)! permutações das n + m bolas, das quais devem ser fatoradas
m! permutações envolvendo apenas bolas pretas e n! permutações envolvendo apenas bolas brancas, fornecendo assim n+m m
arranjos. Convença-se também que, pela definição, esse número de arranjos é igual a |Mnm |. Isso provou que |Mnm | = n+m m .
n n n n n+m
 n+m−1
 n+m−1

Convença-se que, pela definição, |Nm | = |Mm | − |Mm−1 |. Tem-se, então |Nm | = m − m−1 = m , onde a
última igualdade segue da identidade de Pascal (11.38). 6

• Números de Bernoulli
A seqüência de números racionais denominados números de Bernoulli13 tem importância destacada na Teoria dos
Números, especialmente devido à sua relação com a função zeta de Riemann, definida acima. Os números de Bernoulli
também aparecem na expansão em série de Taylor da função tangente e na chamada fórmula de Euler-Maclaurin. Os
chamados números de Bernoulli, denotados por Bn , com n ∈ N0 , são definidos de sorte que sua função geratriz exponencial
E{Bn } (z) seja a função z/(ez − 1), ou seja, são definidos por

X∞
z Bn n
z
=: z . (11.39)
e −1 n=0
n!

Devido ao fato de z/(ez − 1) ter um polo em z = ±2πi sendo, porém, analı́tica em |z| < 2π, concluı́mos
P a priori que a
série de potências do lado direito é convergente para |z| < 2π. Multiplicando (11.39) por ez − 1 = ∞ m=1 z m
/m!, obtemos

! ∞
! ∞ p
!
X Bn n X zm X X Bq
z = z = z p+1 ,
n=0
n! m=1
m! p=0 q=0
q!(p + 1 − q)!

de onde concluı́mos que


p
X Bq
B0 = 1 e = 0 para todo p ≥ 1 .
q=0
q!(p + 1 − q)!

Multiplicando a segunda relação acima por (p + 1)! a mesma torna-se


p
X  
p+1
Bq = 0 para todo p ≥ 1 ,
q=0
q

forma essa mais freqüentemente encontrada na literatura. Essa relação acima permite obter recursivamente os coeficientes
Bn a partir de B0 = 1. De fato, isolando o termo com q = p, temos
p−1  
−1 X p+1
Bp = Bq para todo p ≥ 1 , (11.40)
p + 1 q=0 q

ou seja,
p−1
X Bq
Bp = −p! para todo p ≥ 1 . (11.41)
q=0
q!(p + 1 − q)!

Usando a fórmula (11.40) é possı́vel obter os primeiros números de Bernoulli, vide Tabela 11.1, página 505. A
13 Jakob Bernoulli (1654–1705).
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 505/1633

n 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Bn 1 − 21 1
6 0 1
− 30 0 1
42 0 1
− 30 0 5
66 0 691
− 2730 0 7
6 0 − 3617
510 0

Tabela 11.1: Números de Bernoulli Bn para n = 0, . . . , 17.

contemplação da Tabela 11.1 permite conjecturar que, exceto B1 , todos os Bn com n ı́mpar são nulos. Veremos abaixo
que essa conjectura é verdadeira. A impressão, porém, que os Bn ’s não-nulos crescem lentamente, obtida da observação
dos primeiros elementos da seqüência, é falsa. Devido ao fato de a série de potências em não convergir para |z| = 2π
concluı́mos que os |Bn | não-nulos devem assintoticamente ser maiores que, ou da ordem de, n!/(2π)n para n grande. Isso
de fato é correto e a expressão precisa será apresentada em (11.47). Outra conjectura que se pode levantar da observação
da Tabela 11.1 é que os sinais dos números de Bernoulli com ı́ndice par (exceto B0 ) são alternados. Esse fato é também
correto e será provado mais adiante.
Separando o termo com B1 de (11.39), que é −z/2, e passando-o para o lado esquerdo, obtemos

X∞
z z Bn n
z
+ = 1 + z .
e −1 2 n=2
n!

z z

O lado esquerdo vale 2 coth 2 , como facilmente se constata. Concluı́mos assim que

X∞
2n Bn n
z coth(z) = 1 + z , (11.42)
n=2
n!

para |z| < 2π. Como z coth(z) é uma função par, vemos de (11.42) que, exceto B1 , todos os demais Bn ’s com n ı́mpar
são nulos. Com esse conhecimento podemos escrever
X∞
4n B2n 2n
z coth(z) = z . (11.43)
n=0
(2n)!

Como z cot(z) = iz coth(iz), obtemos também

X∞
(−1)n 4n B2n 2n
z cot(z) = z , (11.44)
n=0
(2n)!

para |z| < 2π.


Há uma conclusão importante a se obter de (11.44). A função z cot(z) satisfaz também a igualdade, obtida primei-
ramente por Euler em 1748,

X
2 1
z cot(z) = 1 − 2z . (11.45)
(kπ)2 − z 2
k=1

Uma demonstração dessa importante relação pode ser encontrada no Exercı́cio-dirigido E. 11.32, página 552 destas notas
ou no Exercı́cio-dirigido E. 27.21, página 1234 (para outras referências vide esses Exercı́cios-dirigidos). Agora, para
|z| < π, podemos escrever, já que k ≥ 1,
!
1 X  z 2n

1 1 1
=  = ,
(kπ)2 − z 2 (kπ)2 1 − z 2 (kπ)2 n=0 kπ

e reinserindo isso em (11.45), obtemos


∞ ∞
!
X X 1
z cot(z) = 1 − 2 z 2n .
n=1
(kπ)2n
k=1
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 506/1633

Comparando a (11.44), obtemos finalmente



X n
1 n+1 4 B2n 2n
= (−1) π , (11.46)
k 2n 2(2n)!
k=1

válida para todo inteiro n > 0. Note que o lado esquerdo é igual a ζ(2n), onde ζ é a função zeta de Riemann, definida
em (11.32), página 499. A célebre expressão (11.46) foi obtida pela primeira vez em 1735, por Euler, resolvendo assim
parcialmente um problema, denominado problema de Basel, levantado por Mengoli14 em 1644, que consistia em encontrar
X∞
1
uma fórmula fechada para as somas , m ∈ N, m > 1, as quais envolvem potências de inversas de números inteiros.
km
k=1
Os primeiros resultados obtidos de (11.46) são

X ∞
X ∞
X ∞
X ∞
X
1 π2 1 π4 1 π6 1 π8 1 π 10
= , = , = , = , = .
k2 6 k4 90 k6 945 k8 9450 k 10 93555
k=1 k=1 k=1 k=1 k=1

Como o lado esquerdo de (11.46) é sempre positivo e não-nulo concluı́mos daquela identidade que os sinais da seqüência
B2n , n ≥ 1, são alternados e que os B2n ’s nunca se anulam. Como o lado esquerdo de (11.46) converge a 1 quando
n → ∞ (por que?), obtemos a expressão assintótica

n→∞ 2(2n)!
B2n ≈ (−1)n+1 . (11.47)
(2π)2n

Diversos textos tratam de outras propriedades elementares dos números de Bernoulli. Recomendamos, em particular,
[64]. Vide também [168]. Para uma prova de (11.46) em alguns casos particulares usando séries de Fourier, vide os
exercı́cios da Seção 27.7, página 1231. Para uma prova geral de (11.46) usando séries de Fourier, vide [50]. Para uma
discussão aparentada, vide Seção 20.C, página 996, destas notas.
O estudante deve interessar-se em saber que é até hoje um problema aberto determinar fórmulas exatas para as séries

X 1
= ζ(m) quando m é um número ı́mpar maior que 1. Além de não haver tais fórmulas exatas, sabe-se muito
km
k=1
pouco sobre ζ(m) com m ı́mpar. Apenas em 1979 foi demonstrado por R. Apéry15 que ζ(3) é um número irracional16.
Em 2000, Tanguy Rivoal demonstrou que há infinitos ζ(m), com m ı́mpar, que são irracionais17.

11.2 Propriedades de Algumas Funções Especiais


Vamos agora então reunir o conhecimento acumulado acima para obter várias propriedades úteis de algumas das funções
especiais que encontramos como soluções de equações diferenciais de interesse. As várias identidades que provaremos po-
dem ser obtidas de diferentes modos, de sorte que o leitor certamente encontrará na literatura demonstrações alternativas
àquelas aqui apresentadas.

11.2.1 Propriedades dos Polinômios de Legendre

• Relações de ortogonalidade para os polinômios de Legendre


 ′
A equação de Legendre 1 − x2 y ′ (x) + λ(λ + 1)y(x) = 0, é tipicamente considerada no intervalo J = [−1, 1].
Aqui, p(x) = (1 − x2 ), q(x) = 0, r(x) = 1 e µ = λ(λ + 1). A função p(x) anula-se nos extremos ±1 do intervalo
J = [−1, 1].
14 Pietro Mengoli (1626–1686).
15 Roger Apéry (1916–1994).
16 Para o trabalho original: Roger Apéry, “Irrationalité de ζ(2) et ζ(3), Astérisque, 61 (1979), 11–13. Vide também Alfred van der Poorten,

“A proof that Euler missed. Apéry’s proof of the irrationality of ζ(3). An informal report”, Math. Intell., 1 (1979), 195–203.
17 T. Rivoal, “La fonction Zêta de Riemann prend une infinit’e de valeurs irrationnelles aux entiers impairs”. Comptes rendus de l’Académie

des Sciences, Paris, 331 (2000), 267–270.


JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 507/1633

Os polinômios de Legendre Pm (x) foram definidos em (10.14), página 419, por


⌊m/2⌋
X (−1)a (2m − 2a)!
Pm (x) := xm−2a , (11.48)
a=0
2m (m − a)! (m − 2a)! a!

onde ⌊m/2⌋ é o maior inteiro menor ou igual a m/2, e são soluções da equação de Legendre com µ = m(m + 1), sendo
(as únicas) soluções da equação de Legendre que permanecem limitadas nos pontos ±1.
Como p(x) anula-se nos extremos ±1 e os Pm (x) são limitados nesses pontos, vale para os polinômios de Legendre a
relação (11.23) e concluı́mos pelo Teorema 11.1, página 495, que
Z 1
Pn (x)Pm (x) dx = 0 (11.49)
−1

para todo n 6= m, com m, n = 0, 1, 2, 3, . . .. Notemos que isso implica


Z 1
xk Pm (x) dx = 0 (11.50)
−1

para todo k < m, pois os monômios xk podem ser escritos como combinações lineares dos polinômios Pn ’s com n < m.
Para calcular as integrais de (11.49) no caso n = m, podemos elegantemente usar as relações
′ ′
Pn+1 (x) = (2n + 1)Pn (x) + Pn−1 (x) , n≥0, (11.51)
e
Pn (1) = 1 , Pn (−1) = (−1)n , n≥0, (11.52)
as quais serão demonstradas mais abaixo (relações (11.57) e (11.61), respectivamente) como conseqüência da fórmula de
Rodrigues para os polinômios de Legendre. De fato, por integração por partes, tem-se
Z 1 1 Z 1

Pn (x)Pn+1 (x) dx = Pn (x)Pn+1 (x) − Pn′ (x)Pn+1 (x) dx .
−1 −1 −1
1 R1

Por (11.52), Pn (x)Pn+1 (x) = 1 + (−1)2n = 2. Por (11.50), −1 Pn′ (x)Pn+1 (x) dx = 0, pois Pn′ (x) é seguramente um
−1
polinômio de grau n − 1. Assim,
Z 1 Z 1 Z 1
′ (11.51)  ′

2 = Pn (x)Pn+1 (x) dx = Pn (x) (2n + 1)Pn (x) + Pn−1 (x) dx = (2n + 1) Pn (x)2 dx ,
−1 −1 −1
R1 ′ ′
pois, novamente por (11.50), −1
Pn (x)Pn−1 (x) dx = 0, já que Pn−1 (x) é um polinômio de grau n − 2. Isso provou que
Z 1
2
Pn (x)Pm (x) dx = δn, m , (11.53)
−1 2n + 1
para todos m, n ≥ 0. Estas são as relações de ortogonalidade para os polinômios de Legendre. Para uma outra
demonstração, vide Exercı́cio E. 11.30, página 552.
Em muitas situações práticas é conveniente expressar (11.53) através da mudança de variável x = cos θ, com 0 ≤ θ ≤ π.
Ficamos com Z π
2
Pn (cos θ)Pm (cos θ) sen (θ) dθ = δn, m , (11.54)
0 2n + 1
para todos m, n ≥ 0.
Na Seção 27.6, página 1224, é demonstrada a importante propriedade de completeza dos polinômios de Legendre no
espaço de Hilbert L2 ([−1, 1], dx).

• Fórmula de Rodrigues para os polinômios de Legendre


Pelas nossas considerações gerais sobre as fórmulas de Rodrigues da Seção 11.1.2, página 496, podemos presumir que
os polinômios Pm , por serem ortogonais entre si (vide (11.49)), possam ser expressos na forma (11.26) com r(x) = 1, ou
seja,
dm  2 m

Pm (x) = Km (1 − x ) ,
dxm
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 508/1633

onde Km sãoPconstantes
 quem−a
dependem da normalização adotada. De fato, essa pressuposição é correta pois, escrevendo
m
(1 − x2 )m = a=0 m a (−1) x2m−2a (binômio de Newton) e notando que


 (2m − 2a)! m−2a

 x , para 0 ≤ a ≤ ⌊m/2⌋

d  2m−2a 
m  (m − 2a)!

x = (11.55)
dxm 





 0, para ⌊m/2⌋ + 1 ≤ a ≤ m

(justifique!), concluı́mos facilmente que


m  
dm   dm X m
m
(1 − x2 )m = (−1)m−a x2m−2a
dx dxm a=0 a

⌊m/2⌋  
dm X m
= (−1)m−a x2m−2a
dxm a=0 a

⌊m/2⌋
X  
m (2m − 2a)! m−2a
= (−1)m−a x
a=0
a (m − 2a)!

⌊m/2⌋
X (−1)a (2m − 2a)!
= (−1)m 2m m! xm−2a
a=0
2m (m − a)!(m − 2a)!a!

= (−1)m 2m m! Pm (x) .

Assim, Km = (−1)m /(2m m!) e


1 dm  2 m

Pm (x) = (x − 1) , (11.56)
2m m! dxm
como pressuposto. Essa expressão é conhecida como fórmula de Rodrigues para os polinômios de Legendre e é válida
para todo m ≥ 0, inteiro.
De (11.56) outras relações úteis podem ser extraı́das, nosso próximo assunto.

• Relações de recorrência para os polinômios de Legendre


Vamos aqui demonstrar as seguintes relações válidas para os polinômios de Legendre:
′ ′
Pn+1 (x) = (2n + 1)Pn (x) + Pn−1 (x) , (11.57)


Pn+1 (x) = xPn′ (x) + (n + 1)Pn (x) , (11.58)

nPn (x) ′
= xPn′ (x) − Pn−1 (x) , (11.59)

(n + 1)Pn+1 (x) = (2n + 1)xPn (x) − nPn−1 (x) , (11.60)

Pn (1) = 1 , Pn (−1) = (−1)n . (11.61)

Todas as relações acima têm aplicações (vimos isso quando provamos as relações de ortogonalidade para os Pn ’s). A
relação (11.60) é particularmente interessante por permitir determinar os Pn ’s recursivamente a partir dos dois primeiros:
P0 (x) = 1 e P1 (x) = x.
d 2
Comecemos por provar (11.57). Como dx (x − 1)n+1 = 2(n + 1)x(x2 − 1)n , segue da fórmula de Rodrigues para Pn+1
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 509/1633

que

′ 1 dn+1 h 2 n
i
Pn+1 (x) = 2(n + 1)x(x − 1)
2n+1 (n + 1)! dxn+1

1 dn h 2 i
= (x − 1)n + 2nx2 (x2 − 1)n−1
2n n! dx n

1 dn h 2 n 2 n−1
i
= (2n + 1)(x − 1) + 2n(x − 1)
2n n! dxn

= (2n + 1)Pn (x) + Pn−1 (x) ,

provando (11.57). Por outro lado, começando pela primeira linha obtida acima, e usando-se a regra de Leibniz, tem-se

′ 1 dn+1 h 2 n
i
Pn+1 (x) = x(x − 1)
2n n! dxn+1
n+1    p   n+1−p 
1 X n+1 d d 2 n
= x (x − 1)
2n n! p=0 p dxp dxn+1−p

1 dn+1 (n + 1) dn 2
= x n+1 (x2 − 1)n + n (x − 1)n
2nn! dx 2 n! dxn

= xPn′ (x) + (n + 1)Pn (x) ,

provando (11.58). A relação (11.59) é obtida subtraindo-se (11.58) de (11.57). Por fim, para obter (11.60), multiplicamos
(11.57) por x e escrevemos
′ ′
(2n + 1)xPn (x) = xPn+1 (x) − xPn−1 (x)



= xPn+1 (x) − Pn′ (x) + Pn′ (x) − xPn−1

(x)

(11.59) 
= ′
(n + 1)Pn+1 (x) + Pn′ (x) − xPn−1 (x)

(11.58)
= (n + 1)Pn+1 (x) + nPn−1 (x) .

Disso (11.60) segue imediatamente.


Por fim, vamos provar (11.61) por indução. Como P0 (x) = 1 e P1 (x) = x, as relações acima valem para n = 0 e
n = 1. Supondo-as válidas para n − 1 e n, teremos por (11.60) que (n + 1)Pn+1 (1) = (2n + 1) − n = (n + 1), o que implica
Pn+1 (1) = 1 e (n + 1)Pn+1 (−1) = −(2n + 1)(−1)n + n(−1)n = (n + 1)(−1)n+1 , o que implica Pn+1 (−1) = (−1)n+1 . Isso
encerra a demonstração de (11.57)-(11.61).

• A função geratriz dos polinômios de Legendre


A função geratriz dos polinômios de Legendre é

X 1
L(x, t) := Pn (x) tn = √ , (11.62)
n=0
1 − 2tx + t2

válida para |t| < 1 e |x| ≤ 1. Essa relação tem diversas demonstrações, a mais elegante sendo a seguinte (de [85]).
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 510/1633


Calculando-se ∂t L(x, t) e usando-se (11.60), tem-se
X∞ ∞
X

L(x, t) = nPn (x) tn−1 = (n + 1)Pn+1 (x) tn
∂t n=1 n=0

∞ h
X i
(11.60)
= (2n + 1)xPn (x) − nPn−1 (x) tn
n=0


X ∞
X ∞
X
= 2x nPn (x) tn + x Pn (x) tn − nPn−1 (x) tn
n=0 n=0 n=0


X ∞
X ∞
X
= 2x nPn (x) tn + x Pn (x) tn − (n + 1)Pn (x) tn+1
n=0 n=0 n=0

∞ ∞ ∞
∂ X X ∂ X
= 2xt Pn (x) tn + (x − t) Pn (x) tn − t2 Pn (x) tn
∂t n=0 n=0
∂t n=0


= (2xt − t2 ) L(x, t) + (x − t)L(x, t) .
∂t

E. 11.14 Exercı́cio. Verifique! 6

Assim, L(x, t) satisfaz a equação diferencial


1 ∂ (x − t)
L(x, t) = .
L(x, t) ∂t 1 − 2xt + t2
1 ∂ 
O lado direito é − ln 1 − 2xt + t2 . Logo,
2 ∂t
exp(l(x))
L(x, t) = √ ,
1 − 2tx + t2
onde l(x) é, em princı́pio, uma função arbitrária. Lembrando, porém, que L(x, 0) = P0 (x) = 1 para todo x, obtem-se
de imediato que l(x) = 0 para todo x. Isso estabelece (11.62), como querı́amos.

• Representações integrais para os polinômios de Legendre


A bem-conhecida Fórmula Integral de Cauchy, afirma que, para uma função f analı́tica em um domı́nio aberto
simplesmente conexo D, vale Z
(n) n! f (w)
f (z) = dw , (11.63)
2πi C (w − z)n+1
para todo z ∈ D, onde a curva C é uma curva diferenciável fechada inteiramente contida em D e dá precisamente uma
volta no sentido anti-horário em torno de z. Combinando a fórmula de Rodrigues e a Fórmula Integral de Cauchy,
obtem-se imediatamente Z
1 (w2 − 1)l
Pl (z) = l+1 dw , (11.64)
2 πi C (w − z)l+1
onde C é uma curva fechada e diferenciável no plano complexo dando uma volta em torno de z no sentido anti-horário.
Essa expressão é conhecida como representação integral de Schläfli18 dos polinômios de Legendre.
Uma conseqüência dessa representação é a seguinte expressão:
Z π  l
1
Pl (z) = z + i(1 − z 2 )1/2 cos(φ) dφ , (11.65)
2π −π
18 Ludwig Schläfli (1814–1895).
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 511/1633

válida para |z| < 1. A demonstração dessa expressão será apresentada mais adiante como caso particular de uma
identidade mais geral (expressão (11.75), abaixo), válida para os polinômios de Legendre associados. Como a equação de
Legendre é invariante pela mudança l → −(l + 1) (verifique que l(l + 1) é levado em si mesmo por essa transformação!),
vale também a identidade19 Z π
1 1
Pl (z) =  l+1 dφ . (11.66)
2π −π
z + i(1 − z 2 )1/2 cos(φ)
Para z real no intervalo [−1, 1], podemos escrever, como é comum em aplicações, z = cos(θ) com 0 ≤ θ ≤ π e com isso
as duas identidades acima ficam
Z π  l Z π
1 1 1
Pl (cos(θ)) = cos(θ) + i sen (θ) cos(φ) dφ =  l+1 dφ .
2π −π 2π −π
cos(θ) + i sen (θ) cos(φ)

Usando o binômio de Newton podemos usar a primeira identidade para escrever Pl (cos(θ)) como um polinômio em
cos θ e sen θ:
l   p Z π 
1 X l p l−p  p
Pl (cos(θ)) = i cos(θ) sen (θ) cos(φ) dφ
2π p=0 p −π

X (−1)q  l 2q 
⌊l/2⌋ l−2q  2q
= 2q
cos(θ) sen (θ)
q=0
2 2q q

⌊l/2⌋  l−2q  2q


X (−1)q l!
= cos(θ) sen (θ) .
q=0
22q (l − 2q)! (q!)2

11.2.2 Propriedades dos Polinômios de Legendre Associados


Na Seção 10.3.1, página 461, introduzimos a equação de Legendre associada (10.153) e mostramos que para λ = l ∈ N0
e µ = m ∈ N0 a mesma possui soluções da forma
dm
Plm (z) := (1 − z 2 )m/2 Pl (z) , (11.67)
dz m
para z ∈ C com |z| < 1, onde Pl é o polinômio de Legendre de grau l. É claro que Plm (z) é nulo se m > l (pois Pl é
um polinômio de grau l). A relação (11.67), como dissemos na Seção 10.3.1, define os chamados polinômios de Legendre
associados20 , ainda que eles não sejam exatamente polinômios na variável z.
Vimos também que, devido à fórmula de Rodrigues para os polinômios de Legendre, podemos escrever Plm (z) como
1 dl+m  
Plm (z) = l (1 − z 2 )m/2 l+m (z 2 − 1)l , (11.68)
2 l! dz
para z ∈ C com |z| < 1 e 0 ≤ m ≤ l. Lá notamos também que essa expressão faz sentido mesmo para m inteiro negativo,
mas tal que −l ≤ m ≤ l. Assim, definimos
1 dl−m  
Pl−m (z) = l (1 − z 2 )−m/2 l−m (z 2 − 1)l , (11.69)
2 l! dz
também com 0 ≤ m ≤ l e para z ∈ C com |z| < 1. Afirmamos que
(l − m)! m
Pl−m (z) = (−1)m P (z) . (11.70)
(l + m)! l
19 Esse argumento envolvendo a transformação l → −(l + 1) é ainda incompleto, mas pode-se provar que o lado direito de (11.66) é de fato

igual ao esquerdo, pois é regular e satisfaz a equação de Legendre. Deixamos os detalhes como exercı́cio.
20 O leitor deve ser advertido que, lastimavelmente, não há uniformidade na literatura quanto à definição dos polinômios de Legendre

associados. Alguns autores (e.g., [113]) introduzem um fator (−1)m no lado direito de (11.67). Assim, algumas das expressões que obtemos
aqui podem diferir das correspondentes encontradas em alguns textos e o leitor deve compará-las cuidadosamente. A definição que seguimos
é a recomendada pela American Mathematical Society.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 512/1633

Essa relação é importante por mostrar que Pl−m (z) é também uma solução da equação de Legendre associada, por ser
proporcional a Plm (z). Fora isso a expressão acima é relevante para as chamadas funções harmônicas esféricas, das quais
trataremos mais abaixo.
Apresentaremos duas demonstrações de (11.70), ambas instrutivas. Uma “à força bruta”, usando diretamente as
definições, é desenvolvida no Apêndice 11.A, página 555. Uma segunda, mais gentil, será vista logo abaixo e usa uma
representação integral dos polinômios de Legendre associados.

• Representações integrais para os polinômios de Legendre associados


Nossa intenção agora é obter algumas representações integrais úteis para os polinômios de Legendre associados mas,
en passant, encontraremos uma outra demonstração mais gentil da identidade (11.70).
k
d 2 l
As expressões (11.68) e (11.69) envolvem derivadas do tipo dz k (z − 1) para k = l + m e k = l − m, respectivamente.
k
d 2 l
Procuremos primeiramente expressar genericamente dz k (z −1) em termos de certas integrais. Tomemos provisoriamente

z real no intervalo aberto −1 < z < 1. Pela Fórmula Integral de Cauchy (11.63), podemos escrever21
Z
dk 2 k! (w2 − 1)l
k
(z − 1)l = dw , (11.71)
dz 2πi C (w − z)k+1

onde C é uma curva fechada e diferenciável no plano complexo, dando uma volta em torno de z no sentido anti-horário.
Escolhemos a curva C dada por C := {w ∈ C| |w − z| = (1 − z 2 )1/2 }, de modo que podemos escrever todo ponto w de
C na forma
w = z + i(1 − z 2 )1/2 eiφ
com −π ≤ φ ≤ π. Com isso, a integral em w sobre C pode ser escrita como uma integral em φ e para isso, usa-se

dw = −(1 − z 2 )1/2 eiφ dφ ,

w−z = i(1 − z 2 )1/2 eiφ ,

w2 − 1 = −(1 − z 2 ) (e2iφ + 1) + 2iz(1 − z 2 )1/2 eiφ

 2  iφ 
2 1/2 iφ e + e−iφ
= 2 i(1 − z ) e + 2iz(1 − z 2 )1/2 eiφ
2
 
= 2i(1 − z 2 )1/2 eiφ z + i(1 − z 2 )1/2 cos(φ) .

Assim,
Z
dk 2 k! (w2 − 1)l
(z − 1)l = dw
dz k 2πi C (w − z)k+1
  l
Z π 2i(1 − z 2 )1/2 eiφ z + i(1 − z 2 )1/2 cos(φ)
k!
= −(1 − z 2 )1/2 k+1 eiφ dφ
2πi −π i(1 − z 2 )1/2 eiφ
Z π  l
2l il−k k!
= (1 − z 2 )(l−k)/2 z + i(1 − z 2 )1/2 cos(φ) ei(l−k)φ dφ
2π −π

e assim, Z
dk 2 l
l l−k
2 (l−k)/2 2 i k! π  2 1/2
l 
(z − 1) = (1 − z ) z + i(1 − z ) cos(φ) cos (l − k)φ dφ , (11.72)
dz k 2π −π
Z π  l
pois z + i(1 − z 2 )1/2 cos(φ) sen ((l − k)φ) dφ = 0, pelo fato de o integrando ser uma função ı́mpar.
−π
21 As idéias que se seguem provavelmente originam-se dos trabalhos de Schläfli. Nossas fontes são [85] e [190], que seguimos com adaptações.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 513/1633

Aplicando (11.72) às expressões (11.68) e (11.69) de Plm e Pl−m (adotando k = l + m e k = l − m, respectivamente),
chegamos a
Z
i−m (l + m)! π  l 
Plm (z) = z + i(1 − z 2 )1/2 cos(φ) cos − mφ dφ ,
2πl! −π

Z π  l
i+m (l − m)! 
Pl−m (z) = z + i(1 − z 2 )1/2 cos(φ) cos + mφ dφ ,
2πl! −π

e comparando-as, extraı́mos que


(l + m)! −m
Plm (z) = (−1)m P (z) . (11.73)
(l − m)! l
Com isso, encontramos uma segunda demonstração de (11.70). As identidades acima foram provadas para z real em
−1 < z < 1, mas valem para todo z complexo com |z| < 1 (e mesmo em z = ±1), pois lá Plm (z) e Pl−m (z) têm uma
extensão analı́tica única.
Coletemos o que provamos acima. Aplicando (11.71) à definição (11.68) de Plm (z), agora para todo m ∈ Z com
−l ≤ m ≤ l, chegamos à expressão
Z
(l + m)! (w2 − 1)l
Plm (z) = l+1 (1 − z 2 )m/2 l+m+1
dw , (11.74)
2 πi l! C (w − z)

onde C é uma curva fechada e diferenciável no plano complexo dando uma volta em torno de z no sentido anti-horário.
Essa expressão generaliza a representação de Schläfli (11.64) para os polinômios de Legendre. Como conseqüência,
estabelecemos também logo acima a representação integral
Z
m i−m (l + m)! π  l 
Pl (z) = z + i(1 − z 2 )1/2 cos(φ) cos mφ dφ , (11.75)
2πl! −π

válida para |z| < 1 e para todo l ∈ N0 e todo m ∈ Z com −l ≤ m ≤ l.


Assim como a equação de Legendre, a equação de Legendre associada é invariante pela transformação l → −(l + 1).
Assim, vale também22
Z π
m im l! 1 
Pl (z) =  l+1 cos mφ dφ , (11.76)
2π(l − m)! −π
z + i(1 − z 2 )1/2 cos(φ)

onde acima usamos o fato que (l+m)! l! = (l + m)(l + m − 1) · · · (l + 1) é levado pela transformação l → −(l + 1) em
l!
(−1 − l + m)(−2 − l + m) · · · (−l) = (−1)m (l)(l + 1) · · · (l − m + 1) = (l−m)! .
Em aplicações é comum tomar-se z real no intervalo [−1, 1] e escrever z = cos(θ) com 0 ≤ θ ≤ π. Com isso, as duas
identidades acima ficam
Z
m i−m (l + m)! π  l 
Pl (cos(θ)) = cos(θ) + i sen (θ) cos(φ) cos mφ dφ , (11.77)
2πl! −π

Z π
im l! 1 
Plm (cos(θ)) =  l+1 cos mφ dφ . (11.78)
2π(l − m)! −π
cos(θ) + i sen (θ) cos(φ)

Através do binômio de Newton, a primeira identidade pode ser usada para expressar Plm (cos(θ)) como um polinômio em
22 Esse argumento envolvendo a transformação l → −(l + 1) é ainda incompleto, mas pode-se provar que o lado direito de (11.76) é de fato

igual ao esquerdo, pois é regular e satisfaz a equação de Legendre associada. Deixamos os detalhes como exercı́cio.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 514/1633

cos θ e sen θ:
l   l−p  p Z π  p
i−m (l + m)! X p l 
Plm (cos(θ)) = i cos(θ) sen (θ) cos(φ) cos mφ dφ ,
2πl! p=0
p −π

⌊ l−|m|
X2 ⌋   
−m+|m| (l + m)! (−1)q l 2q + |m| l−2q−|m| 2q+|m|
= i cos(θ) sen (θ)
2|m| l! q=0
22q 2q + |m| q

⌊ l−|m|
X2 ⌋
−m+|m| (l + m)! (−1)q l−2q−|m| 2q+|m|
= i cos(θ) sen (θ) .
2|m| q=0
22q (l − 2q − |m|)! (q + |m|)! q!

(11.79)
Note que i−m+|m| = 1 se m ≥ 0 e i−m+|m| = (−1)m se m < 0, de modo que Plm (cos(θ)) é real se 0 ≤ θ ≤ π. A expressão
(11.79) é por vezes utilizada na prática para expressar as funções harmônicas esféricas (que definiremos abaixo) como
polinômios em cos θ e sen θ. Logo adiante faremos uso da mesma no estudo das relações de ortogonalidade das funções
Plm .

• A função geratriz dos polinômios de Legendre associados


Usando (11.67), (11.62) e a identidade, válida para m ≥ 0,
dm 1 (2m)! m 1

m
(1 − 2tx + t2 )− 2 = m t (1 − 2tx + t2 )−m− 2
dx 2 m!
(prove-a!) é fácil mostrar que

X m
m (2m)! (1 − x2 ) 2
Pl+m (x) tl = m , (11.80)
2 m! (1 − 2tx + t2 )m+ 12
l=0
válida para todo m ≥ 0.

E. 11.15 Exercı́cio. Mostre isso. 6

A expressão (11.80) é também denominada função geratriz dos polinômios de Legendre associados. A expressão (11.80)
tem poucas aplicações diretas, mas pode ser usada para demonstrar outras relações sobre os polinômios de Legendre
associados.

• Relações de recorrência para os polinômios de Legendre associados


Os polinômios de Legendre associados satisfazem uma série de relações de recorrência. Listemos as mais relevantes:
 
2mx
Plm+1 (x) = √ Plm (x) − l(l + 1) − m(m − 1) Plm−1 (x) ,
1 − x2
p
m+1 m+1
Pl+1 (x) = (2l + 1) 1 − x2 Plm (x) + Pl−1 (x) ,
p
m−1 m−1
(2l + 1) 1 − x2 Plm (x) = (l + m)(l + m − 1)Pl−1 (x) − (l − m + 1)(l − m + 2)Pl+1 (x) ,

(2l + 1)xPlm (x) m


= (l + m)Pl−1 m
(x) + (l − m + 1)Pl+1 (x) ,

p d
21 − x2 Plm (x) = Plm+1 (x) − (l + m)(l − m + 1)Plm−1 (x) .
dx
As demonstrações podem ser obtidas da seguinte forma: 1. a partir das relações de recorrência dos polinômios de Legendre
(11.57)-(11.61) com uso da definição (11.67); 2. a partir de (11.68) ou, em alguns casos, 3. com o uso da função geratriz
(11.80). Deixamos as demonstrações como exercı́cio.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 515/1633

E. 11.16 Exercı́cio. Prove todas as relações acima. Sugestão: tente por conta própria seguir as sugestões do último
parágrafo. Senão, consulte a literatura supracitada, mas com as seguintes precauções: a. diferentes textos apresentam
definições diferentes dos Plm , o que conduz a relações de recorrência distintas das de acima; b. nem todos os livros-texto23
provam todas as relações e c. alguns contêm erros. 6

• Relações de ortogonalidade para os polinômios de Legendre associados


Obteremos agora relações de ortogonalidade para os polinômios de Legendre associados, relações essas de grande
importância na Análise Harmônica e que inspiram a definição das chamadas funções harmônicas esféricas.
A equação de Legendre associada (10.153) é considerada na maioria das aplicações no intervalo [−1, 1], como já
mencionamos. A mesma, em analogia com a equação de Legendre, pode ser escrita como

m2
((1 − x2 )y ′ (x))′ + l(l + 1)y(x) − y(x) = 0 , (11.81)
1 − x2
onde aqui já nos restringimos ao caso l ∈ N0 , m ∈ Z com −l ≤ m ≤ l. Como se vê, temos aqui p(x) = (1 − x2 ), mas
podemos fazer as seguintes escolhas

m2
1) q(x) = − , r(x) = 1, µ = l(l + 1) ,
1 − x2

1
2) q(x) = l(l + 1), r(x) = , µ = −m2 .
1 − x2
Analisaremos essas duas opções em separado. O caso 1 é o mais interessante, especialmente devido a sua aplicação para
as funções harmônicas esféricas. O caso 2 não é de grande interesse e o leitor pode dispensar sua leitura, se o desejar24 .
Caso 1) A primeira questão que aqui se coloca é se a condição (11.23) é satisfeita para funções Plm (x) e Plm
′ (x) com

l ≤ l , ou seja, se
  1
′ ′
p(x) Plm (x) (Plm m m
′ (x)) − Pl′ (x) (Pl (x)) = 0, (11.82)
−1

com l ≤ l′ . A maneira mais fácil de discutir isso é escrever x = cos(θ) e, como

d m 1 d m
Pl′ (x) = − P ′ (cos θ),
dx sen (θ) dθ l

e p(x) = sen (θ)2 , (11.82) fica


 d d m  θ=π

sen (θ) Plm (cos θ) Plm m
′ (cos θ) − Pl′ (cos θ) Pl (cos θ) . (11.83)
dθ dθ θ=0

d
Agora, por (11.79), Plm (cos θ) é um polinômio trigonométrico, e assim o é também dθ Plm (cos θ). Logo, ambos são finitos
em θ = 0 e θ = π. Como, porém, sen θ anula-se nesses extremos, concluı́mos que (11.83) é nula, confirmando a validade
de (11.23) no caso em questão. Concluı́mos assim, pelo Teorema 11.1, página 495, que deve valer
Z 1
Plm (x) Plm
′ (x) dx = 0 (11.84)
−1

sempre que l 6= l′ .
R1
Interessamo-nos agora pelo caso l′ = l. Caso l = l′ = 0 vale P00 (x) = 1 e −1
(P00 )2 dx = 2. Para calcular
R1 m 2
−1 (Pl (x)) dx com l > 0 podemos proceder de diferentes maneiras, a mais direta sendo a seguinte. Usando (11.70) e
23 Segundo o Houaiss, “livros-textos” ou “livros-texto” são dois plurais gramaticalmente corretos para “livro-texto”, assim como “espaços-

tempos” e “espaços-tempo” são plurais aceitáveis para “espaço-tempo”.


24 O caso 2 é um tanto patológico (pois a função r(x) diverge em ±1 e não é integrável) e é evitado por quase todos os livros-texto.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 516/1633

as expressões (11.68) e (11.69) para Plm e Pl−m , respectivamente, escrevemos


Z 1 Z
(l + m)! 1 m
Plm (x) Plm (x) dx = (−1)m P (x)Pl−m (x) dx
−1 (l − m)! −1 l
Z 1   
(−1)m (l + m)! dl+m 2 dl−m 2
= (x − 1)l (x − 1)l
dx
22l (l!)2 (l − m)! −1 dxl+m dxl−m
Z 1  
int. por partes l−m vezes (−1)l (l + m)! d2l 2
= (x − 1) (x2 − 1)l dx
l
22l (l!)2 (l − m)! −1 dx2l
Z 1
(2l)! (l + m)!
= (1 − x2 )l dx
22l (l!)2 (l − m)! −1

 
(2l)! (l + m)! 2 (2l)!!
=
22l (l!)2 (l − m)! (2l + 1)!!

2 (l + m)!
= .
2l + 1 (l − m)!
Na terceira linha aplicamos integração por partes l − m vezes. Isso é justificado pois, como facilmente se vê por indução,
dp 2 l 2 l−p
derivadas como dx p (x − 1) , com 0 ≤ p < l são proporcionais a (x − 1) e, por isso, os termos de fronteira se anulam.
(2l)! (2l)!!
Na última passagem usamos o fato que (2l+1)!! = 2l+1 e o fato que (2l)!! = 2l l!. Na penúltima passagem usamos a
identidade Z 1
(2l)!!
(1 − x2 )l dx = 2 , (11.85)
−1 (2l + 1)!!
R1
a qual pode ser provada da seguinte forma. Seja Al := −1 (1 − x2 )l dx. Então, para l > 0,

Z 1 Z 1  
dx
Al := (1 − x2 )l dx = (1 − x2 )l dx
−1 −1 dx

1 Z 1
int. por partes
= x(1 − x2 )l +2l x2 (1 − x2 )l−1 dx = −2lAl + 2lAl−1 .
−1 −1
| {z }
=0

2l
Assim, Al = 2l+1 Al−1 e como A0 = 2, segue (11.85).
Demonstramos, assim, as relações de ortogonalidade
Z 1
2 (l + m)!
Plm (x) Plm
′ (x) dx = δl, l′ , (11.86)
−1 2l + 1 (l − m)!

válidas para todo l, l′ ∈ N0 e m, m′ ∈ Z com −l ≤ m ≤ l e −l′ ≤ m′ ≤ l′ . É por vezes útil expressar essas relações com
a mudança de variáveis x = cos θ:
Z π
2 (l + m)!
Plm (cos θ) Plm
′ (cos θ) sen θ dθ = δl, l′ . (11.87)
0 2l + 1 (l − m)!
Essa forma das relações de ortogonalidade dos polinômios de Legendre associados será particularmente relevante para as
funções harmônicas esféricas, como veremos adiante.

Caso 2) A primeira questão que aqui se coloca é se a condição (11.23) é satisfeita para funções Plm (x) e Plm (x), com
6 |m′ | (lembre-se o leitor que µ = −m2 e, portanto µ 6= µ′ equivale a |m| =
|m| = 6 |m′ |), ou seja, se
  ′ ′  1
′ ′
p(x) Plm (x) Plm (x) − Plm (x) (Plm (x)) = 0. (11.88)
−1
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 517/1633

sempre que |m| =6 |m′ |. A mesma análise feita para o caso 1 mostra que isso é verdadeiro, confirmando a validade de
(11.23) no caso em questão. Concluı́mos assim, pelo Teorema 11.1, página 495, que deve valer
Z 1 Z π
′ 1 ′ 1
Plm (x) Plm (x) dx = 0, ou seja, Plm (cos θ) Plm (cos θ) dθ = 0, (11.89)
−1 1 − x2 0 sen (θ)

6 |m′ |. A expressão (11.79) ensina-nos que Plm (cos θ) é proporcional a ( sen θ)|m| . Logo, como |m| =
sempre que |m| = 6 |m′ |,
m m′ 1
sempre haverá no produto Pl (cos θ)Pl (cos θ) pelo menos um fator sen θ para compensar o sen θ , o que mostra que o
integrando em (11.89) é limitado. O caso |m′ | = |m| é um tanto patológico (a integral diverge se m = m′ = 0), difı́cil de
demonstrar e sem conseqüências práticas relevantes, de modo que nos limitamos a apresentar o resultado final25 :


 0,

 se |m′ | =
6 |m|,




Z 1 

1  ∞, se m′ = m = 0,
m m′
Pl (x) Pl (x) dx = (11.90)
−1 1 − x2 
 (−1)m ′

 , se − m = m > 0,

 m



 1 (l + m)!
 , se m′ = m > 0.
m (l − m)!

Note o leitor que a condição m > 0 só pode ocorrer se l > 0.


Como já dissemos, as relações (11.90) são menos importantes na prática que as de (11.86). Essas inspiram uma
definição importante: a das funções harmônicas esféricas.

11.2.2.1 As Funções Harmônicas Esféricas


No espaço Rn , n ≥ 2, o conjunto de pontos que distam de uma unidade da origem formam a assim chamada esfera
unitária26 , denotada por S n−1 :
n o
S n−1 := (x1 , . . . , xn ) ∈ Rn (x1 )2 + · · · + (xn )2 = 1 .

O conjunto S 1 ⊂ R2 é o cı́rculo unitário e seus pontos podem ser descritos por um único ângulo ϕ com −π ≤ ϕ ≤ π:
n  o
S 1 := cos ϕ, sen ϕ ∈ R2 , −π ≤ ϕ ≤ π .

Como se vê, os pontos correspondentes a ϕ = ±π são identificados. O conjunto S 2 ⊂ R3 é a esfera unitária e seus pontos
podem ser descritos por dois ângulos: ϕ e θ, com −π ≤ ϕ ≤ π e 0 ≤ θ ≤ π:
n  o
S 2 := sen (θ) cos(ϕ), sen (θ) sen (ϕ), cos(θ) ∈ R3 , −π ≤ ϕ ≤ π, 0 ≤ θ ≤ π .

Novamente, os pontos correspondentes a ϕ = ±π são identificados e para os pontos correspondentes a θ = 0 e θ = π o


ângulo ϕ é indeterminado.
As chamadas Funções Harmônicas Esféricas, ou simplesmente Harmônicas Esféricas (ou ainda Harmônicos Esféricos),
são as funções definidas por
s
m m 2l + 1 (l − m)! m
Yl (θ, ϕ) := (−1) P (cos(θ)) eimϕ , (11.91)
4π (l + m)! l

onde 0 ≤ θ ≤ π, −π ≤ ϕ ≤ π, l ∈ N0 e m ∈ Z com −l ≤ m ≤ l. Note-se que


r
0 2l + 1
Yl (θ, ϕ) = Pl (cos(θ)) , (11.92)

25 Para uma referência mais detalhada, vide [123], pag. 74.
26 Há aqui um abuso de linguagem, pois S n−1 é, estritamente falando, a superfı́cie da esfera.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 518/1633

onde Pl são os polinômios de Legendre.


Mais uma vez o leitor deve ser advertido da existência de outras convenções sobre a definição das funções harmônicas
esféricas. Essas funções são empregadas em diversas áreas de pesquisa, como na Fı́sica Atômica, no Eletromagnetismo,
na Geofı́sica, na Geodesia, na Sismologia, no estudo do magnetismo terrestre e planetário e, mais modernamente, na
Cosmologia, no estudo da radiação cósmica de fundo. Assim, diferentes comunidades empregam por vezes convenções
diferentes quanto à normalização das funções harmônicas esféricas. A que adotamos é a mais freqüentemente empregada
na Fı́sica Quântica, mas mesmo lá há excessões: alguns autores substituem o fator (−1)m por im na definição (11.91).
Outros não incluem o fator (−1)m na definição das funções harmônicas esféricas, mas sim na definição dos polinômios
de Legendre associados o que, afinal, resulta no mesmo. O fator de fase (−1)m , que adotamos em (11.91) é denominado
fase de Condon-Shortley27 em referência aos autores de um texto clássico sobre espectros atômicos (ref. [34]).
As funções harmônicas esféricas são solução da equação diferencial parcial
 
1 ∂ ∂Y 1 ∂ 2Y
( sen θ) (θ, ϕ) + (θ, ϕ) + l(l + 1)Y (θ, ϕ) = 0 , (11.93)
sen θ ∂θ ∂θ ( sen θ) ∂ϕ2
2

que é encontrada quando da resolução da equação de Helmholtz ou de Laplace em três dimensões em coordenadas
esféricas, assim como no problema do átomo de hidrogênio na Mecânica Quântica ou qualquer outro problema quântico
em três dimensões no qual o potencial seja esfericamente simétrico. Vide equação (16.45) e seguintes.
É um exercı́cio relevante verificar que, devido à relação (11.70), tem-se, com a definição acima,

Ylm (θ, ϕ) = (−1)m Yl−m (θ, ϕ) . (11.94)

As primeiras funções harmônicas esféricas são


1
Y00 (θ, ϕ) = √ , (11.95)

r r r
3 3 3
Y1−1 (θ, ϕ) = sen θe−iϕ , 0
Y1 (θ, ϕ) = cos θ , Y11 (θ, ϕ) = − sen θeiϕ , (11.96)
8π 4π 8π
s s s s s
−2 15 ` ´2 −2iϕ −1 15 −iϕ 0 5 „3` ´2 1« 1 15 iϕ 2 15 ` ´2 2iϕ
Y = sen θ e , Y = sen θ cos θ e , Y2 = cos θ − , Y2 = − sen θ cos θ e , Y2 = sen θ e .
2 2
32π 8π 4π 2 2 8π 32π
(11.97)

• Relação com séries de Fourier


No cı́rculo unitário S 1 valem as bem-conhecidas relações de ortogonalidade
Z Z π
em′ em dl = em′ (ϕ) em (ϕ) dϕ = δm, m′ (11.98)
S1 −π

onde, para m ∈ Z,
1
em (ϕ) := √ eimϕ , −π ≤ ϕ ≤ π ,

dl = dϕ sendo a medida de comprimento do cı́rculo unitário S 1 . Usando as relações de ortogonalidade (11.98) e as
relações de ortogonalidade (11.87), é fácil constatar que
Z Z π Z π
m
(θ, ϕ) Ylm (θ, ϕ) sen (θ) dθ dϕ = δm, m′ δl, l′
m ′ ′
Yl′ Yl dΩ = Ylm′ (11.99)
S2 −π 0

para todos l, l′ ∈ N0 e todos m, m′ ∈ Z com −l′ ≤ m′ ≤ l′ e −l ≤ m ≤ l, onde dΩ = sen (θ) dθ dϕ é a medida de área
na esfera unitária S 2 em coordenada polares. Essas são as relações de ortogonalidade das funções harmônicas esféricas,
as quais desempenham um relevante papel na resolução de problemas envolvendo certas equações diferenciais parciais
em três dimensões que tenham simetria esférica. As funções harmônicas esféricas surgem na importante solução de um
problema fundamental da Mecânica Quântica, o problema do átomo de hidrogênio. As formas dos orbitais eletrônicos,
27 Edward Uhler Condon (1902–1974). George H. Shortley (?–?).
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 519/1633

de importância fundamental no estudo de átomos e moléculas e suas ligações quı́micas, estão intimamente relacionadas
às funções Ylm (θ, ϕ) e aos polinômios de Laguerre associados.
Como se percebe da comparação de (11.98) com (11.99), as funções harmônicas esféricas desempenham na esfera
unitária S 2 o mesmo papel que as funções em desempenham no cı́rculo S 1 : formam um conjunto ortonormal em relação
à medida de área dΩ = sen (θ) dθ dϕ. Assim como as funções em formam um conjunto ortonormal completo para as
funções definidas em S 1 , o que nos permite expressar funções f (ϕ), periódicas de perı́odo 2π, contı́nuas por partes ou
apenas de quadrado integrável, em termos de uma série de Fourier:

X Z π
f (ϕ) = cm em (ϕ) com cm := em (ϕ) f (ϕ) dϕ ,
m=−∞ −π

as funções harmônicas esféricas também formam um conjunto ortonormal completo para as funções definidas em S 2 .
Assim, em um sentido a ser precisado, todas as funções f (θ, ϕ) definidas em S 2 , e que sejam contı́nuas por partes ou
apenas de quadrado integrável, podem ser escritas em termos de uma série envolvendo funções harmônicas esféricas.
Essa série é dada por
∞ X
X l Z π Z π
f (θ, ϕ) = cl, m Ylm (θ, ϕ), com cl, m := Ylm (θ, ϕ) f (θ, ϕ) sen (θ) dθ dϕ ,
l=0 m=−l −π 0

e é uma espécie de generalização para a esfera S 2 da série de Fourier. Essas considerações justificam a denominação de
“funções harmônicas esféricas” para as funções Ylm .
As funções harmônicas esféricas também desempenham um papel na teoria de representações do grupo SO(3). Há
também generalizações das funções harmônicas esféricas para as esferas S n com n ≥ 3. Essas generalizações são estudadas,
por exemplo, em [85].

11.2.2.2 Fórmula de Adição de Funções Harmônicas Esféricas


Oa polinômios de Legendre e as funções harmônicas esféricas possuem uma propriedade especial utilizada na Eletrostática
(na chamada expansão de multipolos, vide página 522) e na Mecânica Quântica, o chamado teorema de adição de
funções harmônicas esféricas, ou fórmula de adição de funções harmônicas esféricas. No que segue apresentaremos a
demonstração dessa propriedade. Começamos com uma observação sobre o operador Laplaciano.

• Invariância por rotações do Laplaciano

 x1Consideremos
 um sistema de coordenadas Cartesianas em R3 onde cada ponto do espaço é descrito por uma tripla
x2
x3
definidas em relação a um sistema de coordenadas ortonormais x̂, ŷ e ẑ. Por uma rotação desse sistema de
 x′   x1 
1
coordenadas, as coordenadas de cada ponto do espaço são transformadas segundo x′2 = R xx2 , onde R é uma
3
x′3
3
X
matriz ortogonal, ou seja, satisfazendo RT R = RRT = 1. Assim, para cada i = 1, 2, 3 vale x′i = Rij xj . Note que
j=1
∂ x′a
para todos a e b vale ∂xb = Rab , que são constantes. Com isso, é fácil ver que o operador Laplaciano em coordenadas
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 520/1633

Cartesianas é invariante por rotações. De fato,


3
X 3 X
X 3 X3 3 X
X 3 X
3
∂2 ∂ x′l ∂ x′m ∂ ∂ ∂ ∂
∆ = = = Rlk Rmk
∂x2k m=1
∂xk ∂xk ∂x′l ∂x′m ∂x′l ∂x′m
k=1 k=1 l=1 k=1 l=1 m=1

3 X
3 3
!
X X ∂ ∂
T
= Rlk Rkm
∂x′l ∂x′m
l=1 m=1 k=1

3 X
X 3
 ∂ ∂
= RRT lm ∂x′l ∂x′m
l=1 m=1

3 X
X 3 3
X
∂ ∂ ∂2
= δlm ′ = = ∆′ ,
∂xl ∂x′m ∂x′2
l
l=1 m=1 l=1

como querı́amos provar. O operador Laplaciano pode ser escrito em coordenadas esféricas como
   
1 ∂ ∂ 1 1 ∂ ∂ 1 ∂2
∆ = 2 r2 + 2 L2 , onde L2 := ( sen θ) + . (11.100)
r ∂r ∂r r sen θ ∂θ ∂θ ( sen θ) ∂ϕ2
2

Como a coordenada radial é invariante por rotações, concluı́mos que


   
1 ∂ ∂ 1 ∂2 1 ∂ ′ ∂ 1 ∂2
L2 = (L2 )′ , ou seja, ( sen θ) + 2 2
= ′ ′
( sen θ ) ′
+ .
sen θ ∂θ ∂θ ( sen θ) ∂ϕ sen θ ∂θ ∂θ ( sen θ ) ∂ϕ′2
′ 2

Acima θ e θ′ são os ângulos polares em relação aos eixos definidos por ẑ e ẑ ′ , respectivamente, e ϕ e ϕ′ são os correspon-
dentes ângulos azimutais.
O estudante familiarizado com a Mecânica Quântica há de perceber que o uso da notação L2 para denotar a parte
angular do operador Laplaciano provém da forma do operador momento angular (quadrado) em coordenadas esféricas
de um sistema composto por uma partı́cula.
Para o que segue o estudante deve recordar também que, segundo (11.93) (vide também a equação (16.45) e seguintes,
página 709), as funções harmônicas esféricas satisfazem L2 Ylm (θ, ϕ) = l(l + 1)Ylm (θ, ϕ).

• Fórmula de adição de funções harmônicas esféricas


Sejam n̂ e n̂′ dois versores em R3 . Suas coordenadas Cartesianas em relação a algum sistema de referência ortogonal
definido por três versores x̂, ŷ e ẑ podem ser escritas em termos dos ângulos polar e azimutal de um sistema de coordenadas
esféricas obtidas da maneira usual a partir do eixo definido por ẑ como
 
n̂ := sen (θ) cos(ϕ), sen (θ) sen (ϕ), cos(θ) e n̂′ := sen (θ′ ) cos(ϕ′ ), sen (θ′ ) sen (ϕ′ ), cos(θ′ ) .
Seja θ′′ o ângulo entre as direções que estes vetores definem, de sorte que n̂ · n̂′ = cos θ′′ . Naturalmente, escrevendo
explicitamente o produto escalar n̂ · n̂′ em termos das componentes de n̂ e n̂′ , obtemos
cos θ′′ = cos θ cos θ′ + sen θ sen θ′ cos (ϕ′ − ϕ) ,
expressão essa que relaciona θ′′ aos ângulos θ, ϕ, θ′ e ϕ′ .
Se realizarmos uma rotação do sistema de coordenadas de modo a fazer o versor n̂ coincidir com o novo eixo ẑ ′′ , as
coordenadas que descreverão o vetor n̂ serão (0, 0, 1) e, como o ânguloentre n̂ e n̂′ é preservado, as coordenadas que
descreverão o vetor n̂′ serão sen (θ′′ ) cos(ϕ′′ ), sen (θ′′ ) sen (ϕ′′ ), cos(θ′′ ) .
Denotamos por (L2 )′ o operador diferencial definido em (11.100) referente às coordenadas θ′ e ϕ′ e por (L2 )′′ corres-
pondente o operador diferencial referente às coordenadas θ′′ e ϕ′′ . Como mencionamos acima, a invariância do Laplaciano
por rotações de sistemas de coordenadas implica (L2 )′ = (L2 )′′ .

Sendo uma função contı́nua de θ′ e ϕ′ , a função Pl (cos θ′′ ) = Pl cos θ cos θ′ + sen θ sen θ′ cos (ϕ′ − ϕ) pode ser
desenvolvida em série de funções harmônicas esféricas
∞ X
X n
Pl (cos θ′′ ) = cnm (θ, ϕ) Ynm (θ′ , ϕ′ ) (11.101)
n=0 m=−n
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 521/1633

mas só comparecem acima termos com n = l, a saber, tem-se


l
X
Pl (cos θ′′ ) = clm (θ, ϕ) Ylm (θ′ , ϕ′ ) . (11.102)
m=−l

Para provar (11.102)


q notamos que Pl (cos θ′′ ) satisfaz (L2 )′′ Pl (cos θ′′ ) = l(l + 1)Pl (cos θ′′ ) pois, devido a (11.92), tem-se

Pl (cos θ′′ ) = 2l+1 Yl0 (θ′′ , ϕ′′ ). Dessa forma,

∞ X
X n
l(l + 1) cnm (θ, ϕ) Ynm (θ′ , ϕ′ ) = l(l + 1)Pl (cos θ′′ ) = (L2 )′′ Pl (cos θ′′ ) = (L2 )′ Pl (cos θ′′ )
n=0 m=−n

∞ X
X n ∞ X
X n
= cnm (θ, ϕ) (L2 )′ Ynm (θ′ , ϕ′ ) = cnm (θ, ϕ) n(n + 1)Ynm (θ′ , ϕ′ ) .
n=0 m=−n n=0 m=−n

Assim, estabelecemos que


∞ X
X n h i
l(l + 1) − n(n + 1) cnm (θ, ϕ) Ynm (θ′ , ϕ′ ) = 0 ,
n=0 m=−n

o que implica que para todos θ e ϕ tem-se cnm (θ, ϕ) = 0 sempre que n(n + 1) 6= l(l + 1), ou seja, sempre que n 6= l (a
outra solução para n da equação n(n + 1) − l(l + 1) = 0 é n = −l − 1, que é negativa e, portanto, deve ser descartada).
Isso estabeleceu (11.102).
De maneira totalmente análoga é possı́vel estabelecer que
l
X q ′′
Ylm (θ′ , ϕ′ ) = am ′′
lq (θ, ϕ) Yl (θ , ϕ ) . (11.103)
q=−l

Por (11.101) e usando as relações de ortogonalidade das funções harmônicas esféricas, temos
Z l
X Z
(11.103)
clm (θ, ϕ) = Pl (cos θ′′ ) Ylm (θ′ , ϕ′ ) dΩ = am
lq (θ, ϕ) Pl (cos θ′′ ) Ylq (θ′′ , ϕ′′ ) dΩ′′ .
q=−l
q

Lembrando por (11.92) que Pl (cos θ′′ ) = 0 ′′
2l+1 Yl (θ , ϕ′′ ) e usando as relações de ortogonalidade das funções harmônicas
esféricas, obtemos, r

clm (θ, ϕ) = am (θ, ϕ) . (11.104)
2l + 1 l0
No caso em que n̂ = n̂′ tem-se, naturalmente, θ = θ′ e ϕ = ϕ′ , mas também tem-se θ′′ = 0. A expressão (11.103)
afirma, então, que
Xl
q
Ylm (θ, ϕ) = am ′′
lq (θ, ϕ) Yl (0, ϕ ) .
q=−l

Agora, pela definição (11.91), vale


r s
2l + 1 (l − q)! q ′′
Ylq (0, ′′
ϕ ) = (−1) q
P (1) eiqϕ .
4π (l + q)! l
r
2l + 1 m
Como Plq (1) = 0 para q 6= 0 e Pl0 (1) = 1, obtemos Ylm (θ, ϕ) = al0 (θ, ϕ) e, portanto, am
l0 (θ, ϕ) =
q 4π

2l+1 Ylm (θ, ϕ). Levando isso a (11.104), obtemos


clm (θ, ϕ) = Y m (θ, ϕ) ,
2l + 1 l
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 522/1633

Portanto, obtemos por (11.101)


l
4π X m
Pl (cos θ′′ ) = Yl (θ, ϕ) Ylm (θ′ , ϕ′ ) .
2l + 1
m=−l

Como Pl (cos θ′′ ) é real, podemos escrever isso também na forma


l
4π X m ′ ′ m
Pl (cos θ′′ ) = Yl (θ , ϕ ) Yl (θ, ϕ) . (11.105)
2l + 1
m=−l

Esta é a chamada fórmula de adição das funções harmônicas esféricas ou teorema de adição das funções harmônicas
esféricas. Note que (11.105) afirma também que
l
X (l − m)! m ′
Pl (cos θ′′ ) = Pl (cos θ) Plm (cos θ′ ) eim(ϕ −ϕ) , (11.106)
(l + m)!
m=−l

ou seja,
Xl
(l − m)! m
Pl (cos θ′′ ) = Pl (cos θ) Pl (cos θ′ ) + 2 Pl (cos θ) Plm (cos θ′ ) cos m(ϕ′ − ϕ) . (11.107)
m=1
(l + m)!

Para o caso em que θ = θ′ e ϕ = ϕ′ tem-se θ′′ = 0 e a relação (11.105) informa que


l
X 2 2l + 1
|Ylm (θ, ϕ)| = , (11.108)

m=−l

relação esta válida para todos θ e ϕ. Essa relação é por vezes denominada regra de soma de quadrados de funções
harmônicas esféricas.

• Aplicação à Eletrostática. Expansão de multipolos


Apresentaremos aqui uma aplicação da fórmula de adição de harmônicos esféricos à Eletrostática.
Sejam ~x e ~x′ dois vetores em R3 cujas componentes Cartesianas escritas em termos de um sistema de coordenadas
esféricas sejam
 
~x = r sen (θ) cos(ϕ), r sen (θ) sen (ϕ), r cos(θ) e ~x′ = r′ sen (θ′ ) cos(ϕ′ ), r′ sen (θ′ ) sen (ϕ′ ), r′ cos(θ′ ) .

Naturalmente, para ~x 6= ~x′ vale




 1 1

 q   , se r′ < r ,

 r r′ r′ 2
1 1 1−2 r cos θ′′ + r
= p =
k~x − ~x′ k k~xk2 + k~x′ k2 − 2~x · ~x′ 
 1 1


 q   , se r < r′ ,
 r′ r r 2
1−2 r′ cos θ′′ + r′

onde θ′′ é o ângulo entre ~x e ~x′ (de sorte que ~x · ~x′ = rr′ cos θ′′ ).
Usando a expressão (11.62), página 509, a fórmula da função geratriz dos polinônios de Legendre, escrevemos
 ∞

 X r′l


 Pl (cos θ′′ ) , se r′ < r ,

 rl+1

 l=0
1
=
k~x − ~x′ k 


 ∞
X

 rl


 Pl (cos θ′′ ) , se r < r′ .
r′l+1
l=0
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 523/1633

Podemos agora fazer uso da fórmula de adição (11.105) e obter


  
1  ′l m ′ ′  Ylm (θ, ϕ)
X∞ X l




 4π r Yl (θ , ϕ ) , se r′ < r ,

 2l + 1 rl+1

 l=0 m=−l
1
= (11.109)
k~x − ~x′ k 
 !

 ∞ X
l

 X 1 Ylm (θ′ , ϕ′ ) 

 4π rl Ylm (θ, ϕ) , se r < r′ .
 2l + 1 r′l+1
l=0 m=−l

O interesse na expressão acima reside no fato de que as contribuições de ~x e ~x′ ocorrem de forma fatorizada em cada
termo das somas em l e m (os fatores entre parênteses).
Vams agora aplicar as expressões acima à Eletrostática (como referências gerais citamos [93], [65] ou [157]). Seja
dada uma distribuição de cargas ρ(~x′ ) e vamos supor que ao potencial elétrico φ(~x) não é imposta nenhuma condição
de contorno, exceto anular-se no infinito. Sabemos que em tal caso a equação de Poisson28 ∆φ = − ǫρ0 tem por solução
Z
1 ρ(~x′ )
φ(~x) = d3 ~x′ se ρ decair a zero suficientemente rápido no infinito.
4πǫ0 k~x − ~x′ k
Se ρ tiver suporte compacto, de forma que para algum R > 0 tenha-se ρ(~x′ ) = 0 para todo ~x′ com k~x′ k > R, então
para todo ~x satisfazendo k~xk > R podemos usar (11.109) (para o caso r′ < r) e escrever
∞ l  m 
1 X X Qlm Yl (θ, ϕ)
φ(~x) = , (11.110)
ǫ0 2l + 1 rl+1
l=0 m=−l

onde
Z   Z ∞ Z π Z 2π
′ ′l 3 ′
Qlm := ρ(~x ) r Ylm (θ′ , ϕ′ ) d ~x = ρ(r′ , θ′ , ϕ′ ) (r′ )l+2 Ylm (θ′ , ϕ′ ) sen θ′ dϕ′ dθ′ dr′ . (11.111)
0 0 0

A expansão (11.110) é denominada expansão de multipolos para o potencial φ. Os coeficientes Qlm dados em (11.111)
são denominados momentos de multipolo.
Usando que Y00 = √1 ,
vemos que primeiro termo da expansão de multipolos (correspondente ao termo com l = 0)
4π R
Q
é √00 1
ǫ0 4π r
sendo que, por (11.111), Q00 = √14π ρ(~x′ ) d3 ~x′ = Q√total

, sendo Qtotal a carga total da distribuição ρ.
Percebemos que o primeiro termo da expansão de multipolos corresponde à bem-conhecida Lei de Coulomb29 e podemos
assim compreender os demais como sendo correções a essa lei para distribuições de carga gerais ρ.
Mais detalhes sobre usos da expansão de multipolos na Eletrostática podem ser encontrados em bons livros de
Eletromagnetismo (e.g. [93], [65] ou [157]).

11.2.3 Propriedades dos Polinômios de Hermite

• Relações de ortogonalidade para os polinômios de Hermite


 2
′ 2
A equação de Hermite e−x y ′ (x) + λe−x y(x) = 0 é tipicamente considerada no intervalo J = (−∞, ∞). Aqui
2 2
p(x) = e−x , q(x) = 0, r(x) = e−x e µ = λ. Note que p(x) > 0 e r(x) > 0 em todo J = (−∞, ∞). Os polinômios de
Hermite Hm (x) foram definidos30 em (10.20) por
⌊m/2⌋
X (−1)k m!
Hm (x) := (2x)m−2k . (11.112)
k! (m − 2k)!
k=0
28 Siméon Denis Poisson (1781–1840).
29 Charles Augustin de Coulomb (1736–1806).
30 Advertência. Nestas notas usamos a chamada “definição fı́sica” dos polinômios de Hermite. Há uma outra convenção, usada especial-

mente na Teoria das Probabilidades, que difere da definição usada em Fı́sica por um fator constante e por um reescalonamento do argumento.
O leitor deve, por isso, ter cuidado ao comparar nossas expressões com outras usadas em textos da Teoria das Probabilidades.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 524/1633

onde ⌊m/2⌋ é o maior inteiro menor ou igual a m/2, e são soluções da equação de Hermite com µ = 2m.
Como p(x) decai a zero para x → ±∞ e os Hm (x) são polinômios, vale para os polinômios de Hermite a relação
(11.23) e concluı́mos pelo Teorema 11.1 que
Z ∞
2
Hn (x)Hm (x) e−x dx = 0 (11.113)
−∞

para todo n 6= m, com m, n = 0, 1, 2, 3, . . .. Para calcular as integrais acima no caso n = m, podemos elegantemente
usar as relações
Hn+1 (x) = 2xHn (x) − 2nHn−1 (x) , (11.114)
R∞ 2
as quais serão provadas mais abaixo (expressão (11.121)). Seja An := −∞ (Hn (x))2 e−x dx. Tem-se que
Z ∞
2
2nAn−1 = (2nHn−1 (x)) Hn−1 (x) e−x dx
−∞

Z ∞ Z ∞
(11.114) −x2 2
= (2xHn (x)) Hn−1 (x) e dx − Hn+1 (x) Hn−1 (x) e−x dx
−∞ −∞
| {z }
= 0 por (11.113)

Z ∞
2
= Hn (x) (2xHn−1 (x)) e−x dx
−∞

Z ∞ Z ∞
(11.114) 2 2
= Hn (x) Hn (x) e−x dx + (2n − 2) Hn (x) Hn−2 (x) e−x dx
−∞ −∞
| {z }
= 0 por (11.113)

= An .
R∞ 2 √
Logo, An = (2n)An−1 , ou seja, An = (2n)!! A0 = 2n n! A0 . Como A0 = −∞ e−x dx = π, concluı́mos que
Z ∞
2 √
Hn (x)Hm (x) e−x dx = 2n n! π δn, m , (11.115)
−∞

para todo m, n ≥ 0. Estas são as relações de ortogonalidade dos polinômios de Hermite.


Na Seção 27.6, página 1224, é demonstrada a importante propriedade de completeza dos polinômios de Hermite no
2
espaço de Hilbert L2 (R, e−x dx).

• A função geratriz exponencial dos polinômios de Hermite


Vamos aqui considerar a função geratriz exponencial dos polinômios de Hermite e provar que a mesma satisfaz

X∞
Hn (x) n 2
t = e2xt−t . (11.116)
n=0
n!
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 525/1633

Usando-se diretamente (11.112) e separando-se na soma n’s pares de n’s ı́mpares, segue que
X∞ X∞ ∞
Hn (x) n H2m (x) 2m X H2m+1 (x) 2m+1
t = t + t
n=0
n! m=0
(2m)! m=0
(2m + 1)!

∞ X
X m ∞ X
X m
(−1)k (2x)2m−2k t2m (−1)k (2x)2m+1−2k t2m+1
= +
m=0 k=0
k! (2m − 2k)! m=0 k=0
k! (2m + 1 − 2k)!

∞ X
X ∞ ∞ ∞
(−1)k (2x)2m−2k t2m X X (−1)k (2x)2m+1−2k t2m+1
= +
k! (2m − 2k)! k! (2m + 1 − 2k)!
k=0 m=k k=0 m=k

∞ X
X ∞ ∞ ∞
m→m+k (−1)k (2x)2m t2m+2k X X (−1)k (2x)2m+1 t2m+1+2k
= +
m=0
k! (2m)! m=0
k! (2m + 1)!
k=0 k=0


! ∞
! ∞
! ∞
!
X (−1)k t2k X (2xt)2m X (−1)k t2k X (2xt)2m+1
= +
k! m=0
(2m)! k! m=0
(2m + 1)!
k=0 k=0


!
X (2xt)n
−t2
= e
n=0
n!

2
= e2xt−t ,

como querı́amos provar.

• Fórmula de Rodrigues para os polinômios de Hermite


Pelas nossas considerações gerais sobre as fórmulas de Rodrigues, podemos presumir que os polinômios Hm , por serem
2
ortogonais entre si (vide (11.113)), possam ser expressos na forma (11.30) com r(x) = e−x , ou seja,
2 dn −x2
Hn (x) = Kn ex e ,
dxn
onde Km são constantes que dependem da normalização adotada. De fato, essa pressuposição é correta pois, multiplicando
2
(11.116) por e−x , obtem-se

X∞ 2
2 Hm (x)e−x m
e−(x−t) = t . (11.117)
m=0
m!
Encarando o lado direito como a expansão em série de Taylor em t, em torno de t = 0, da função do lado esquerdo,
concluı́mos que
−x2 dn −(x−t)2
Hn (x)e = e ,
dtn t=0
d d
para todo n ≥ 0. Com a mudança de variável u = x − t, = − du
dt , ficamos com

2 dn −u2 dn −x2
Hn (x)e−x = (−1)n n
e = (−1)n e .
du u=x dxn
Assim,
dn −x2 2
Hn (x) = (−1)n ex
e , (11.118)
dxn
para todo n ≥ 0. Essa é a fórmula de Rodrigues dos polinômios de Hermite.

E. 11.17 Exercı́cio. Prove as relações de ortogonalidade (11.115) usando a relação (11.118), a relação (11.112) e integração
por partes. 6
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 526/1633

• Relações de recorrência para os polinômios de Hermite


Tomando-se a derivada em x de (11.118), é elementar constatar que

Hn′ (x) = 2xHn (x) − Hn+1 (x) . (11.119)

Ao mesmo tempo,

dn+1 −x2
2
Hn+1 (x) = (−1)n+1 ex e
dxn+1
n
 
x2 d d −x2
= (−1)n+1 e e
dxn dx

2 dn  −x2 
= 2(−1)n ex xe
dxn

Xn    p   n−p 
Leibniz n x2 n d d −x2
= 2(−1) e x e
p=0
p dxp dxn−p

 n   
2 d 2 dn−1  2
= 2(−1)n ex x n e−x + n n−1 e−x
dx dx

= 2xHn (x) − 2nHn−1 (x) .

Assim, Hn+1 (x) = 2xHn (x) − 2nHn−1 (x). Note que, como H0 (x) = 1 e H1 (x) = 2x, essa identidade vale também para
n = 0, convencionando que H−1 (0) ≡ 0. Reunindo isso com (11.119), somos conduzidos a Hn′ (x) = 2nHn−1 (x), n ≥ 0.
Resumindo, obtemos as seguintes relações:

Hn′ (x) = 2xHn (x) − Hn+1 (x) , (11.120)

Hn+1 (x) = 2xHn (x) − 2nHn−1 (x) , (11.121)

Hn′ (x) = 2nHn−1 (x) , (11.122)

válidas para todo n ≥ 0 com a convenção H−1 (0) ≡ 0. Estas expressões são bastante úteis. A relação (11.121), por
exemplo, permite obter recursivamente todos os Hn ’s a partir de H0 (x) = 1 e H1 (x) = 2x.

Em livros de Mecânica Quântica o estudante poderá aprender que algumas das propriedades dos polinômios de
Hermite que obtivemos acima podem ser provadas com o uso dos chamados operadores de criação e aniquilação.

• Funções de Hermite
As chamadas funções de Hermite são definidas por
2
hn (x) := cn Hn (x)e−x /2
, (11.123)
1
com x ∈ N, n ∈ N0 e onde cn := √ √ . Como podemos aprender na Seção 16.7, página 759, essas funções são as
2n n! π
auto-funções normalizadas no operador Hamiltoniano para o oscilador harmônico. De acordo com (11.115), essas funções
satisfazem Z ∞
hn (x)hm (x) dx = δn,m (11.124)
−∞

para todos n, m ∈ N0 , como facilmente se verifica. Na Seção 27.6.2, página 1226, aprendemos também que essas funções
formam uma base ortonormal completa no espaço de Hilbert L2 (R, dx).
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 527/1633

Usando a fórmula de Rodrigues (11.118) para os polinômios de Hermite Hn , podemos escrever

2 dn −x2
hn (x) = (−1)n cn ex /2
e .
dxn

Essa fórmula pode ser reescrita de uma forma que é mais conveniente para certos propósitos. É muito fácil perceber que
se f é uma função infinitamente diferenciável, vale
  
x2 /2 d d 2
e f (x) = − x ex /2 f (x) .
dx dx

Verifique! Assim, tem-se a seguinte relação operatorial:


 
2 d d 2
ex /2
= − x ex /2
dx dx
2
/2 dn d
n 2
que nos permite escrever ex dxn = dx − x ex /2 . Com isso obtemos a fórmula de Rodrigues para as funções de
Hermite:  n
d 2
hn (x) = cn x − e−x /2 , (11.125)
dx
válida para todo n ∈ N0 .
Na Seção 28.2.1.2, página 1264, provamos que as funções de Hermite são auto-funções da transformada de Fourier.

11.2.4 Propriedades dos Polinômios de Laguerre

• Relações de ortogonalidade para os polinômios de Laguerre



A equação de Laguerre (xe−x y ′ (x)) + λe−x y(x) = 0 é tipicamente considerada no intervalo J = [0, ∞). Para ela
tem-se p(x) = xe−x , q(x) = 0, r(x) = e−x e µ = λ. Note que p(x) > 0 em J 0 = (0, ∞), e anula-se em x = 0 e no infinito.
Além disso, r(x) > 0 em todo J = [0, ∞). Os polinômios de Laguerre foram definidos em (10.137) por
m
X  
m! n m
Lm (x) := (−1) xn (11.126)
n=0
n! n

e representam soluções da equação de Laguerre em J = [0, ∞) para µ = m. É bastante claro que para os polinômios de
Laguerre vale a condição (11.23) e, portanto, pelo Teorema 11.1, segue que
Z ∞
Ln (x)Lm (x) e−x dx = 0 (11.127)
0

para todo n 6= m, com m, n = 0, 1, 2, 3, . . .. Notemos também aqui que (11.127) implica


Z ∞
xk Lm (x) e−x dx = 0 (11.128)
0

para todo k < m, pois os monômios xk podem ser escritos como combinações lineares dos polinômios Ln ’s com n < m.
Para calcular as integrais de (11.127) no caso m = n podemos fazer uso da identidade

L′n+1 (x) = (n + 1)L′n (x) − (n + 1)Ln (x) , (11.129)


JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 528/1633

que será demonstrada mais abaixo (expressão (11.133)). Com ela, vê-se que
Z ∞ Z ∞  
(n + 1) Ln (x)2 e−x dx = Ln (x) (n + 1)Ln (x) e−x dx
0 0

Z ∞ Z ∞
(11.129)
= (n + 1) Ln (x)L′n (x) e−x dx − Ln (x)L′n+1 (x) e−x dx
|0 {z } 0

= 0 por (11.128)

∞ Z ∞
int. por partes
= −Ln (x)Ln+1 (x)e−x + L′n (x)Ln+1 (x) e−x dx
0 0
| {z }
= 0 por (11.128)

Z ∞
− Ln (x)Ln+1 (x) e−x dx
|0 {z }
= 0 por (11.127)

(11.126)
= Ln (0)Ln+1 (0) = (n + 1)(n!)2 .

Concluı́mos assim que Z ∞


Ln (x)Lm (x) e−x dx = (n!)2 δn, m (11.130)
0
para todos n, m ≥ 0. Estas são as relações de ortogonalidade para os polinômios de Laguerre.

• Fórmula de Rodrigues para os polinômios de Laguerre


Pela ortogonalidade dos polinômios de Laguerre (11.127), podemos presumir, sob a luz das considerações da Seção
11.1.2, página 496, que os polinômios de Laguerre satisfazem, por (11.28), uma relação como

1 dm  m

x d
m 
m −x

Lm (x) := Km r(x) x = K m e x e , (11.131)
r(x) dxm dxm

onde Km é uma constante dependente da normalização adotada. De fato, pela regra de Leibniz,
m    m−p   p 
dm  m −x  X m d d −x
ex x e = ex xm
e
dxm p=0
p dxm−p dxp

m
X  
m m! p (11.126)
= (−1)p x = Lm (x) .
p=0
p p!

Assim, Km = 1 e concluı́mos que


dm  m −x 
Lm (x) = ex x e , (11.132)
dxm
para todo m ≥ 0. Esta é a fórmula de Rodrigues para os polinômios de Laguerre.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 529/1633

• Relações de recorrência para os polinômios de Laguerre


Por (11.132), é elementar constatar que

dm+1  m+1 −x  x d
m+1
d  m+1 −x 
L′m+1 (x) = ex x e + e x e
dxm+1 dxm+1 dx

dm+1  m −x  x d
m+1  
= Lm+1 (x) + (m + 1)ex x e − e xm+1 −x
e
dxm+1 dxm+1

(11.132) dm+1  m −x  d dm  m −x 
= (m + 1)ex x e = (m + 1)ex x e
dxm+1 dx dxm

d  −x 
= (m + 1)ex e Lm (x)
dx

= −(m + 1)Lm (x) + (m + 1)L′m (x) .

Estabelecemos assim que


L′m+1 (x) = (m + 1)L′m (x) − (m + 1)Lm (x) , (11.133)
m ≥ 0. Essa é uma das fórmulas de recorrência para os polinômios de Laguerre, a qual empregamos acima para provar
as relações de ortogonalidade (11.130) no caso m = n. Há uma segunda, da qual trataremos agora. Pela fórmula de
Rodrigues vale
(11.132) dm  m −x  dm  
Lm (x) = ex x e = ex x xm−1 e−x
dxm dxm

Xm    p 
Leibniz m d dm−p 
= ex p
x m−p
xm−1 e−x
p=0
p dx dx

dm  x d
m−1 
= ex x m
xm−1 −x
e + me m−1
xm−1 e−x
dx dx

d 
= ex x e−x Lm−1 (x) + mLm−1 (x)
dx

= −xLm−1 (x) + xL′m−1 (x) + mLm−1 (x) .

Estabelecemos que
Lm (x) = −xLm−1 (x) + xL′m−1 (x) + mLm−1 (x) (11.134)
o que também implica (fazendo m → m + 1)

Lm+1 (x) = −xLm (x) + xL′m (x) + (m + 1)Lm (x) . (11.135)

Multiplicando ambos os lados de (11.134) por −m e somando o resultado a (11.135), teremos:

Lm+1 (x) − mLm (x) = −xLm (x) + xL′m (x) + (m + 1)Lm (x) + mxLm−1 (x) − mxL′m−1 (x) − m2 Lm−1 (x) . (11.136)

(11.133)
Por (11.133), os termos xL′m (x) − mxL′m−1 (x) valem x(L′m (x) − mL′m−1 (x)) = −mxLm−1 (x). Introduzindo isso de
volta a (11.136), inferimos que
Lm+1 (x) = (2m − x + 1)Lm (x) − m2 Lm−1 (x) .

Resumindo nossas conclusões, estabelecemos as seguintes relações:

L′m+1 (x) = (m + 1)L′m (x) − (m + 1)Lm (x) , (11.137)

Lm+1 (x) = (2m − x + 1)Lm (x) − m2 Lm−1 (x) . (11.138)


JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 530/1633

Essas relações são denominadas fórmulas de recorrência para os polinômios de Laguerre. A relação (11.138), em parti-
cular, permite obter recursivamente todos os Lm (x)’s a partir de L0 (x) = 1 e L1 (x) = 1 − x.

• A função geratriz exponencial dos polinômios de Laguerre


Partindo de (11.126) obtemos para a função geratriz exponencial dos polinômios de Laguerre

X∞
Lm (x) m
L(x, t) := t
m=0
m!

o seguinte desenvolvimento31:
∞ X
X m   ∞ X
X ∞  
1 m 1 m
L(x, t) = (−1)n xn tm = (−1)n xn tm (11.139)
m=0 n=0
n! n n=0 m=n
n! n

∞ ∞  
!
X xn X m m
n
= (−1) t . (11.140)
n=0
n! m=n
n

Agora,
X∞   ∞
m m m→m+n tn X (m + n)! m
t = t
m=n
n n! m=0 m!

∞ ∞
!
tn X dn m+n tn dn n
X
m
= t = t t
n! m=0 dtn n! dtn m=0

 
tn dn tn
=
n! dtn 1−t

n    p   n−p 
Leibniz tn X n d n d −1
= t (1 − t)
n! p=0 p dtp dtn−p

n     
tn X n n! (n − p)!
= tn−p
n! p=0 p (n − p)! (1 − t)n−p+1

n    n−p  n
tn X n t tn t tn
= = 1+ = .
1 − t p=0 p 1−t 1−t 1−t (1 − t)n+1

Retornando com isso a (11.140), temos


∞  n
1 X (−1)n xt
L(x, t) = ,
1 − t n=0 n! 1−t

e assim concluı́mos que  


xt
exp −
1−t
L(x, t) = . (11.141)
1−t
Essa é a função geratriz exponencial dos polinômios de Laguerre.
31 Assumimos |t| e |x| pequenos o suficiente para justificar as diversas manipulações que faremos.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 531/1633

11.2.5 Propriedades dos Polinômios de Laguerre Associados


A equação de Laguerre associada
xy ′′ + (m + 1 − x)y ′ + (n − m)y = 0 , (11.142)
com m e n inteiros com 0 ≤ m ≤ n, é tipicamente considerada no intervalo J = [0, ∞). A mesma pode ser ser levada à
forma canônica (11.5), transformando-se em

(xm+1 e−x y ′ (x))′ + (n − m)xm e−x y(x) = 0 .

Tem-se, portanto, p(x) = xm+1 e−x , q(x) = 0, r(x) = xm e−x e µ = n − m. Uma alternativa talvez melhor é tomar-se
p(x) = xm+1 e−x , q(x) = −mxm e−x , r(x) = xm e−x e µ = n. Note-se que p(x) e r(x) são os mesmos em ambas as
escolhas.
Os polinômios de Laguerre associados foram definidos em (10.162) e expressões seguintes por32
  n−m
X  
dm dm dn n! n
L(m)
n (x) = m
Ln (x) = ex n (xn e−x ) = (−1)m (−1)k xk , (11.143)
dx dxm dx k! m + k
k=0

(m)
com 0 ≤ m ≤ n. O polinômio Ln é a única solução de (11.142) que é regular em x = 0. É de se notar que, por essa
definição, tem-se
L(0)
n (x) = Ln (x) (11.144)
para todo n ≥ 0 e, portanto, os polinômios de Laguerre são polinômios de Laguerre associados.

E. 11.18 Exercı́cio. Mostre que

(−1)m n! x −m dn−m 
Ln(m) (x) = e x xn e−x .
(n − m)! dxn−m
6

(m)
É bastante elementar constatar que, com m fixo, as funções Ln com n ≥ m satisfazem (11.23) para o intervalo
J = [0, ∞). Assim, vale que Z ∞
(m)
L(m)
n (x) Ln′ (x) x e
m −x
dx = 0 (11.145)
0

sempre que n 6= n . Para calcular a integral acima no caso n′ = n fazemos uso da relação (11.152), que será demonstrada

(m)
logo adiante. Tomando (11.152), substituindo n → n − 1 e multiplicando-a por n−1 Ln (x), obtemos

(n − m)  (m) 2 (m) 2 (m)


Ln (x) = (2n − m − x − 1)Ln−1 (x)L(m) (m)
n (x) − (n − 1) Ln−2 (x)Ln (x) .
n
(m)
Tomando (11.152) e multiplicando-a por (n + 1)−1 Ln−1 (x), obtemos

(n + 1 − m) (m)  2
(m) (m) (m)
Ln+1 (x)Ln−1 (x) = (2n − m − x + 1)L(m)
n (x)Ln−1 (x) − n
2
Ln−1 (x) .
n+1
Subtraindo uma expressão da outra, obtemos

(n − m)  (m) 2 (n + 1 − m) (m) (m)


Ln (x) − Ln+1 (x)Ln−1 (x)
n n+1
 2
(m) 2 (m) (m)
= −2Ln−1(x)L(m) (m) 2
n (x) − (n − 1) Ln−2 (x)Ln (x) + n Ln−1 (x) .
32 Mais uma vez advertimos o leitor do fato de haver várias convenções distintas quanto à definição dos polinômios de Laguerre associados

na literatura. Para comparação, polinômios de Laguerre associados definidos em [113], que denotamos aqui por L Lm n (x), diferem dos nossos
(m) (−1)m (m)
Ln (x) da seguinte forma: L Lm n (x) = L
(n+m)! n+m
(x).
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 532/1633

Multiplicando agora esta expressão por xm e−x , integrando entre 0 e ∞ e usando (11.145), ficamos com
Z ∞ 2 Z ∞ 2
n3 (m)
L(m)
n (x) x m −x
e dx = Ln−1 (x) xm e−x dx .
0 (n − m) 0

A indução pode ser feita diminuindo n até atingir o valor m, de onde extraı́mos que
Z ∞ 2 Z ∞ 2
(n!)3
Ln(m) (x) xm e−x dx = L (m)
m (x) xm e−x dx .
0 (m!)3 (n − m)! 0
(m) R∞
Pela última igualdade em (11.143), tem-se Lm (x) = (−1)m m!. Ao mesmo tempo, 0
xm e−x dx = m!. Assim,
Z ∞  2 (n!)3
L(m)
n (x) xm e−x dx = .
0 (n − m)!

Essa expressão pressupõe, naturalmente, 0 ≤ m ≤ n.


Concluı́mos assim que com nossas definições
Z ∞
(m) (n!)3
L(m) m −x
n (x) Ln′ (x) x e dx = δn, n′ . (11.146)
0 (n − m)!

Essas são as relações de ortogonalidade dos polinômios de Laguerre associados.


Comentário para o leitor mais avançado. Chamamos à atenção do leitor o fato que as relações de ortogonalidade (11.146)
não são as relações de ortogonalidade
  da parte radial das auto-funções de energia do átomo de hidrogênio. Para cada
ρ (2l+1) ρ
l ≥ 0 as funções ρl e− 2p Lp+l p , com p ≥ l + 1, satisfazem as relações de ortogonalidade,
Z ∞      
− ρ (2l+1) ρ ρ
l − 2p (2l+1) ρ 2 p2l+4 ((p + l)!)3
ρl e 2p′ Lp′ +l ′
ρ e L p+l ρ2 dρ = δp, p′ , (11.147)
0 p p (p − l − 1)!

as quais discutiremos na Seção 16.8, página 761. Lamentavelmente, alguns livros-texto discutem incorretamente esse
ponto quando tratam do átomo de hidrogênio. Uma exceção, um tanto surpreendentemente, é [6].

• Uma conseqüência de (11.146) empregada no estudo do átomo de hidrogênio


As relações (11.146) implicam um resultado que é usado no contexto do átomo de hidrogênio. Trata-se do seguinte:
no caso n = n′ (11.146) diz-nos que
Z ∞ 2 (n!)3
L(m)
n (x) xm e−x dx = .
0 (n − m)!

No problema do átomo de hidrogênio surge a necessidade de se determinar a integral


Z ∞ 2
Ln(m) (x) xm+1 e−x dx (11.148)
0

que difere da anterior pois o fator xm é substituı́do por xm+1 . Essa última integral pode ser calculada empregando-se a
relação
(n + 1 − m) (m) 2 (m)
xL(m)
n (x) = − Ln+1 (x) + (2n − m + 1)L(m)n (x) − n Ln−1 (x) ,
n+1
que será provada logo abaixo (expressão (11.152)). Inserindo-a em (11.148) e usando as relações de ortogonalidade
(11.146), obtem-se facilmente
Z ∞ 2 (n!)3
L(m)
n (x) xm+1 −x
e dx = (2n − m + 1) . (11.149)
0 (n − m)!

Essa expressão será usada quando da normalização das auto-funções de energia do átomo de hidrogênio.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 533/1633

• Relações de recorrência para os polinômios de Laguerre associados


(m)
Se explorarmos a primeira igualdade em (11.143), que define os polinômios Ln , algumas fórmulas de recorrência
para os polinômios de Laguerre associados podem ser obtidas diretamente daquelas dos polinômios de Laguerre listadas
em (11.137)-(11.138) simplesmente diferenciando-as m vezes em relação a x. Como facilmente se constata, obtem-se
(m+1)
Ln+1 (x) = (n + 1)L(m+1)
n (x) − (n + 1)L(m)
n (x) , (11.150)

(m) (m)
Ln+1 (x) = (2n − x + 1)L(m) (m−1)
n (x) − mLn (x) − n2 Ln−1 (x) , (11.151)

(m) ′ (m+1)
onde, em (11.150), usamos o fato evidente que Ll (x) = Ll (x).
(m−1) 1 (m) (m)
Tomando (11.150) e trocando m → m − 1, obtem-se Ln (x) = − (n+1) Ln+1 (x) + Ln (x). Inserindo isso em
(11.151), obtem-se
(m) (m)
(n + 1 − m)Ln+1 (x) = (n + 1)(2n − m − x + 1)L(m) 2
n (x) − n (n + 1)Ln−1 (x) . (11.152)

Essas relações são denominadas fórmulas de recorrência para os polinômios de Laguerre associados.

• A função geratriz exponencial dos polinômios de Laguerre associados


A partir da definição (11.143) e de (11.141) é elementar constatar que a função geratriz exponencial dos polinômios
de Laguerre associados é dada por

X (m)  
Ll (x) l (−1)m tm xt
Las. (x, t) := t = exp − . (11.153)
l! (1 − t)m+1 1−t
l=m

dm
A soma acima começa com l = m pois dxm Ll (x) = 0 caso m > l.

• A equação de Laguerre generalizada


A assim denominada equação de Laguerre generalizada é a equação diferencial

zy ′′ (z) + (α + 1 − z)y ′ (z) + ny(z) .

com n ∈ N0 e α > −1, real. Trata-se de uma variante da equação de Laguerre associada, pois α aqui não é necessariamente
um inteiro.

E. 11.19 Exercı́cio. Mostre que essa equação tem uma solução da forma de um polinômio
n
X  
n Γ(n + α + 1) k

n (z) := (−1)k z .
k Γ(k + α + 1)
k=0

E. 11.20 Exercı́cio. Mostre que


dn  n+α −x 
Lα x −α
n (x) = e x x e ,
dxn
x > 0. 6

E. 11.21 Exercı́cio. Mostre que Z ∞


Lα α α −x
n (x)Lm (x) x e dx = 0
0
se m 6= n. Calcule a integral no caso m = n. 6
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 534/1633

E. 11.22 Exercı́cio. Para α = m, inteiro, mostre que

(n − m)! (m)

n (x) = (−1)
m
Ln (x) .
n!
6

11.2.6 Propriedades das Funções de Bessel


Na presente seção apresentaremos algumas das propriedades mais importantes e mais empregadas das funções de Bessel,
especialmente as de ordem inteira. Devido à sua importância em um sem-número de problemas aplicados, as funções de
Bessel e de Neumann têm sido intensamente estudadas nos últimos duzentos anos e foi coletado um enorme conjunto de
informações sobre as mesmas, gerando uma vasta literatura. Por isso, nossas pretensões aqui são relativamente modestas.
Um texto clássico sobre o assunto é [184]. Outros excelentes são [190], [85] e [113], mas todas as referências listadas à
página 415 tratam do assunto com maior ou menor grau de profundidade.
No estudo das propriedades das funções de Bessel Jν (x) procederemos de um modo ligeiramente diferente do que
fizemos acima. Isso se dá por várias razões. Uma delas é que as funções de Bessel não são polinômios, ao contrário dos
casos de acima. Outra é a natureza das relações de ortogonalidade dessas funções.

• Origens
As funções de Bessel surgem em vários problemas da Fı́sica-Matemática, especialmente envolvendo a resolução de
certas equações diferenciais em coordenadas cilı́ndricas. O mais célebre desses problemas é aquele que estuda as vibrações
de uma membrana circular (um tambor), problema encontrado em vários livros-texto e que estudamos na Seção 16.6,
página 757. Esse problema foi tratado pela primeira vez por Euler33 em 1764, antecedendo a Bessel. Em verdade, certas
funções de Bessel surgiram antes ainda, em 1703, na resolução da chamada equação de Riccati34 por Jacob Bernoulli35
(vide nota histórica à página 327) e em 1732, em trabalhos de Daniel Bernoulli36 sobre o problema da corda vibrante
e suas variantes (vide problema da corda pendurada na Seção 16.5.2, página 750). O trabalho do astrônomo Bessel37
no qual as funções que levam seu nome foram (re)encontradas é bem posterior e data de 1817, tendo sido publicado em
182438.
O problema que conduziu Bessel não foi o de resolver uma equação diferencial, mas o de determinar coeficientes de
Fourier que descrevem a trajetória de um planeta em movimento periódico em uma órbita elı́ptica em torno do Sol e
obedecendo a segunda lei de Kepler39 , segundo a qual o raio-vetor que conecta o Sol ao planeta em questão varre áreas
iguais em tempos iguais40 . Bessel obteve para esses coeficientes uma expressão integral que é a representação integral
das funções de Bessel que apresentamos em (11.179), mais abaixo. Posteriormente, identificou-se que esses coeficientes
representavam as funções previamente tratadas por Daniel Bernoulli e Euler, mas as mesmas acabaram sendo nomeadas
em honra a Bessel (segundo [82], o nome de Bessel foi atribuı́do à equação diferencial por Schlömilch41 em 1857 e
Lipschitz42 em 1859). Em seu trabalho, na verdade, Bessel estendeu resultados anteriores de Lagrange43, de 1769, o qual
também dedicou-se à questão de determinar os coeficientes de Fourier que expressam como função do tempo a distância
ao Sol de um planeta em órbita elı́ptica, calculando os três primeiros44 .
A determinação desses coeficientes de Fourier não é um mero exercı́cio acadêmico, pois é importante para cálculos, via
teoria de perturbações, da influência gravitacional que os planetas exercem entre si e da conseqüente previsão de desvios
das suas órbitas elı́pticas. O estudo matemático de perturbações periódicas ou quase-periódicas em sistemas mecânicos
33 Leonhard Euler (1707–1783).
34 Iacopo Francesco Riccati (1676–1754).
35 Jacob Bernoulli (1654–1705).
36 Daniel Bernoulli (1700–1782).
37 Friedrich Wilhelm Bessel (1784–1846).
38 F. W. Bessel, “Untersuchungen des Theils der planetarischen Störungen, welcher aus der Bewegung der Sonne entsteht”. Berliner
Abhandlungen, 1–52 (1824).
39 Johannes Kepler (1571–1630).
40 Como todo estudante de Fı́sica bem sabe, isso é conseqüência da conservação do momento angular sob uma força central.
41 Oscar Xavier Schlömilch (1823–1901).
42 Rudolf Otto Sigismund Lipschitz (1832–1903).
43 Joseph-Louis Lagrange (1736–1813).
44 Outras informações históricas sobre o desenvolvimento das funções de Bessel podem ser encontradas em [184].
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 535/1633

(ou em equações diferenciais, em geral) é um vasto assunto de pesquisa que tem desafiado inúmeros pesquisadores até a
atualidade.
Bessel é também autor de dois outros importantes feitos cientı́ficos, a proposição da existência de estrelas binárias e
a medição da distância ao Sol de uma outra estrela.
Bessel foi um dos primeiros a propor a existência de estrelas binárias, prevendo em 1834 a existência de uma compa-
nheira da estrela Sirius. Tal previsão foi possı́vel em função de medidas de alta precisão, que Bessel produziu durante
anos, da posição de várias estrelas. Tais medidas indicavam um movimento elı́ptico periódico de Sirius cuja origem não
poderia ser explicada em termos de movimentos da Terra ou do sistema solar. Bessel propôs que esse movimento era
devido à presença de uma outra estrela menos brilhante nas proximidades de Sirius e que ambas orbitavam em torno do
centro de massa comum, explicando assim as observações. Em 1840, Bessel anunciou a observação de tais movimentos
periódicos em outra estrela, a estrela Procyon.
A existência da companheira de Sirius foi confirmada por observações feitas em 1862 por A. G. Clark45 e a de Procyon
em 1896, por J. M. Schaeberle46 , ambas após a morte de Bessel. As estatı́sticas atuais indicam que cerca de metade das
estrelas da nossa galáxia é composta por estrelas binárias. Há também sistemas triplos de estrelas (α Centauri sendo o
exemplo mais popularmente conhecido), quádruplos (ǫ Lyrae) etc.
Um problema matemático, levantado pela primeira vez por Laplace47 em 1785 e ainda hoje em aberto, ao qual
nomes como o de Poincaré48 deram importantes contribuições, é o de saber se sistemas múltiplos como esses, ou como o
nosso próprio sistema solar, são estáveis. Esse problema deu origem a uma importante área de pesquisa atual, a teoria
dos sistemas dinâmicos49 . Métodos como os que Bessel e outros empregaram para a detecção de sistemas binários são
empregados hoje em dia na detecção de planetas orbitando estrelas, outro tema atual de pesquisa.
Bessel foi também o primeiro, em 1838, a determinar a distância ao Sol de uma outra estrela, usando para tal o
método de paralaxe. A estrela em questão foi 61 Cygni e Bessel calculou sua distância ao Sol como sendo cerca de 10
anos-luz. O valor atualmente aceito é de cerca de 10,7 anos-luz, ou 3,3 parsecs50 . Com esse trabalho, Bessel contribuiu
para o estudo das escalas de distância cosmológicas, tarefa em implementação até os nossos dias.

• Relações de recorrência para as funções de Bessel


Seja a função de Bessel Jν (x) definida em (10.103) por

X (−1)k  x 2k+ν
Jν (x) := . (11.154)
k! Γ(k + 1 + ν) 2
k=0

Consideremos provisoriamente ν diferente de 0 ou de um inteiro negativo (pois Γ(x) diverge se x é um inteiro negativo).
Multiplicando Jν por xν e diferenciando em relação a x, obtem-se
∞  2k+ν
d d X (−1)k 1 2k+2ν
(xν Jν (x)) = (x)
dx dx k! Γ(k + 1 + ν) 2
k=0


X  2k+ν−1
(−1)k (k + ν) 1 2k+2ν−1
= (x)
k! Γ(k + 1 + ν) 2
k=0


X (−1)k  x 2k+ν−1
= xν
k! Γ(k + ν) 2
k=0

= xν Jν−1 (x) .
45 Alvan Graham Clark (1832–1897).
46 John Martin Schaeberle (1853–1924).
47 Pierre-Simon Laplace (1749–1827).
48 Jules Henri Poincaré (1854–1912).
49 Em verdade, boa parte da topologia moderna foi criada por Poincaré no seu tratamento do problema de estabilidade.
50 Um ano-luz é a distância que a luz percorre em um ano e corresponde a aproximadamente 9, 46 1012 km, ou 9, 5 trilhões de quilômetros.

Um parsec é definido como a distância de um objeto cuja paralaxe em relação à Terra seja de um segundo de arco, uma medida de distância
usada tradicionalmente na Astronomia. Um parsec corresponde a aproximadamente 3, 262 anos-luz, ou 3, 09 1013 km.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 536/1633

Multiplicando Jν por x−ν e diferenciando em relação a x, obtem-se analogamente


∞  2k+ν
d  d X (−1)k 1 2k
x−ν Jν (x) = (x)
dx dx k! Γ(k + 1 + ν) 2
k=0


X  2k+ν−1
(−1)k 1
= (x)2k−1
(k − 1)! Γ(k + 1 + ν) 2
k=1


X (−1)k  x 2k+ν−1
= x−ν
(k − 1)! Γ(k + 1 + ν) 2
k=1


X (−1)k  x 2k+ν+1
k→k+1
= −x−ν
k! Γ(k + 2 + ν) 2
k=0

= −x−ν Jν+1 (x) .

Provamos assim que, para ν 6= 0, −1, −2, −3 . . .,


d d 
(xν Jν (x)) = xν Jν−1 (x) e x−ν Jν (x) = −x−ν Jν+1 (x) . (11.155)
dx dx
Adotando-se a já mencionada definição J−m (x) = (−1)m Jm (x), para m inteiro positivo ou zero, vemos que a expressão
acima também vale para ν = 0, −1, −2, −3 . . ..

E. 11.23 Exercı́cio. Mostre isso! 6

Para ν = 0, a segunda relação em (11.155) diz-nos que

J0′ (x) = −J1 (x) . (11.156)

Expandindo as derivadas em (11.155), teremos que

xν Jν′ (x) + νxν−1 Jν (x) = xν Jν−1 (x) e

x−ν Jν′ (x) − νx−ν−1 Jν (x) = −x−ν Jν+1 (x) ,

ou seja,
xJν′ (x) = xJν−1 (x) − νJν (x) e xJν′ (x) = νJν (x) − xJν+1 (x) . (11.157)
Somando e subtraindo essas duas expressões uma da outra obtemos as seguintes relações importantes:
1 
Jν′ (x) = Jν−1 (x) − Jν+1 (x) , (11.158)
2

1 
Jν+1 (x) = 2νJν (x) − xJν−1 (x) . (11.159)
x
Essas relações, válidas para todo ν ∈ C, são denominadas relações de recorrência das funções de Bessel. A segunda delas
permite, por exemplo, obter todas as funções Jm com m inteiro positivo a partir de J0 e J1 . Na verdade, por (11.156),
basta conhecer J0 e sua derivada.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 537/1633

Resumindo, obtivemos as seguintes relações


d
(xν Jν (x)) = xν Jν−1 (x) , (11.160)
dx

d 
x−ν Jν (x) = −x−ν Jν+1 (x) , (11.161)
dx

xJν′ (x) = xJν−1 (x) − νJν (x) , (11.162)

xJν′ (x) = νJν (x) − xJν+1 (x) , (11.163)

1 
Jν′ (x) = Jν−1 (x) − Jν+1 (x) , (11.164)
2

1 
Jν+1 (x) = 2νJν (x) − xJν−1 (x) , (11.165)
x
válidas para todo ν ∈ C e todo x ∈ C, x 6= 0.
Expressões análogas às de acima são também válidas para as funções Nν (x).

• A relação entre Jn e J0 , n ∈ N
A segunda expressão em (11.155) diz-nos que

1 d 
x−ν Jν (x) = −x−(ν+1) Jν+1 (x) .
x dx
Disso segue imediatamente que
 n
1 d 
x−ν Jν (x) = (−1)n x−(ν+n) Jν+n (x) , (11.166)
x dx

válida para todo ν, x ∈ C e n ∈ N0 . No caso particular em que ν = 0, obtem-se,


 n
n n 1 d
Jn (x) = (−1) x (J0 (x)) , (11.167)
x dx

válida para todo x ∈ C e n ∈ N0 . A expressão (11.167) generaliza (11.156) e guarda certa semelhança com as fórmulas
de Rodrigues.

E. 11.24 Exercı́cio. Obtenha (11.166) e (11.167) diretamente da definição (11.154). 6

• A função geratriz das funções de Bessel


A determinação da função geratriz das funções de Bessel é importante, entre outras razões, por nos permitir obter
representações integrais para as funções de Bessel, representações essas que assumem uma grande relevância em várias
aplicações.
Tomemos as funções de Bessel de ordem inteira definidas por

X (−1)k  x 2k+m
Jm (x) := , (11.168)
k! (k + m)! 2
k=0

para m ≥ 0, convencionando-se que J−m (x) = (−1)m Jm (x) (vide (10.121) e a discussão que lhe acompanha). Vamos
aqui considerar a função geratriz definida por

X
J(x, t) := tm Jm (x)
m=−∞
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 538/1633

para t 6= 0 e vamos provar que



X   
x 1
tm Jm (x) = exp t− . (11.169)
m=−∞
2 t

Dessa importante relação serão extraı́dos vários fatos úteis sobre as funções de Bessel de ordem inteira. Antes de
provarmos isso, mostremos que J(x, t) está bem definida. Por (11.168), vale

X 1 x 2k+m 1 x m X 1 x 2k

1 x m |x/2|2

|Jm (x)| ≤ ≤ = e ,
k! (k + m)! 2 m! 2 k! 2 m! 2
k=0 k=0

de modo que
∞ m m
1 x m

X X X∞ X∞
1 1 xt
|J(x, t)| ≤ |J0 (x)| + |t|m |Jm (x)| + |Jm (x)| ≤ |J0 (x)| + e|x/2|2 + e |x/2|2
,
t
m! 2 m! 2t
m=1 m=1 m=1 m=1

sendo que as últimas somas são convergentes para todo x ∈ C e todo t ∈ C com t 6= 0, o que prova que J(x, t) é analı́tica
para todo x ∈ C e todo t ∈ C com t 6= 0.
Podemos com isso demonstrar (11.169) de modo bem simples, tomando a derivada parcial em relação a x de J(x, t),
derivando termo a termo na soma (o que é permitido, devido à analiticidade) e usando (11.158):

X

J(x, t) = tm Jm

(x) (11.170)
∂x m=−∞

∞ ∞
(11.158) 1 X m 1 X m
= t Jm−1 (x) − t Jm+1 (x) (11.171)
2 m=−∞ 2 m=−∞

∞ ∞
k=m−1,
l=m+1 t X k t−1 X l
= t Jk (x) − t Jl (x) (11.172)
2 2
k=−∞ l=−∞

 
11
= t− J(x, t) . (11.173)
2t


Assim, J(x, t) satisfaz a equação diferencial ∂x J(x, t) = 21 t − 1t J(x, t), cuja solução geral é
  
x 1
J(x, t) = f (t) exp t− ,
2 t

para alguma função f (t). Agora, como Jm (0) = 0 para m 6= 0 e J0 (0) = 1, segue que J(0, t) = 1, o que implica f (t) = 1,
provando (11.169).
Estudando a demonstração acima o leitor poderá reconhecer a importância de definir-se J−m (x) = (−1)m Jm (x), para
m inteiro positivo ou zero.

• Fórmula de adição das funções de Bessel


Uma das relações mais úteis que advêm de (11.169) é a seguinte:

X
Jm (x + y) = Jn (x)Jm−n (y) , (11.174)
n=−∞

válida para todo m ∈ Z e todos x, y ∈ C. Essa expressão é denominada por alguns autores fórmula de adição das
funções de Bessel (a “adição”, aqui, refere-se à adição dos argumentos da função no lado esquerdo). As funções de Bessel
satisfazem várias outras relações de adição do tipo de acima e remetemos o leitor à literatura supracitada (por exemplo,
à referência [85]) para generalizações.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 539/1633

A demonstração de (11.174) é obtida de (11.169) calculando-se o produto J(x, t)J(y, t) de duas formas: por um lado,
         ∞
X
x 1 y 1 x+y 1
J(x, t)J(y, t) = exp t− exp t− = exp t− = tm Jm (x + y) . (11.175)
2 t 2 t 2 t m=−∞

Por outro lado,



! ∞
! ∞ ∞ ∞ ∞
!
X X X X X X
k l k+l m
J(x, t)J(y, t) = t Jk (x) t Jl (y) = t Jk (x)Jl (y) = t Jn (x)Jm−n (y) .
k=−∞ l=−∞ k=−∞ l=−∞ m=−∞ n=−∞
(11.176)
Comparando-se (11.175) a (11.176) obtem-se (11.174).
Se em (11.174) tomarmos y = −x e m = 0, e usarmos que Jn (x) = J−n (−x) e que J0 (0) = 1, obteremos
∞ 
X 2  2 ∞ 
X 2
1 = Jn (x) = J0 (x) + 2 Jn (x) . (11.177)
n=−∞ n=1

Como Jn (x) é real para x ∈ R, isso ensina-nos que |J0 (x)| ≤ 1 e |Jn (x)| ≤ √1 , para todo x ∈ R e n > 0, n inteiro.
2

E. 11.25 Exercı́cio. Justifique! 6

É possı́vel estabelecer limites superiores mais precisos para |Jn (x)|, mas não trataremos disso aqui.

• Representações integrais das funções de Bessel


A relação (11.169) tem vários usos, um deles é o de fornecer uma representação integral para as funções de Bessel,
com a qual outras propriedades podem ser obtidas. A relação (11.169) foi provada para todo x ∈ C e t ∈ C com t 6= 0.
Tomemos t com |t| = 1, ou seja, tomemos t da forma t = eiϕ , com −π ≤ ϕ ≤ π. Obtemos,

X
eix sen (ϕ) = Jm (x)eimϕ . (11.178)
m=−∞

O ponto interessante é que podemos interpretar o lado direito como sendo a série de Fourier na variável ϕ da função
periódica de perı́odo 2π do lado esquerdo, de onde tiramos que
Z π Z π
1 1
Jm (x) = eix sen (ϕ) e−imϕ dϕ = eix sen (ϕ)−imϕ dϕ ,
2π −π 2π −π

para todo m ∈ Z. Usando eia = cos(a) + i sen (a), tem-se


Z π Z π
1 i
Jm (x) = cos (x sen (ϕ) − mϕ) dϕ + sen (x sen (ϕ) − mϕ) dϕ .
2π −π 2π −π

A segunda integral do lado direito é nula, pois o integrando é uma função ı́mpar em ϕ. Como o integrando da primeira
integral do lado direito é uma função par em ϕ, segue que
Z π Z
1 1 π
Jm (x) = cos (x sen (ϕ) − mϕ) dϕ = cos (x sen (ϕ) − mϕ) dϕ , (11.179)
2π −π π 0

válida para todo m ∈ Z. Essa expressão é a importante representação integral da função de Bessel Jm (x), m ∈ Z.
Tomando-se t = ieiϕ em (11.169), obtem-se

X
eix cos(ϕ) = im Jm (x)eimϕ . (11.180)
m=−∞

de onde se extrai Z π
(−i)m
Jm (x) = eix cos(ϕ)−imϕ dϕ , (11.181)
2π −π
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 540/1633

e disso se obtém Z π
(−i)m
Jm (x) = eix cos(ϕ) cos(mϕ) dϕ . (11.182)
2π −π

É fácil obter de (11.181) que


Z π  
(−1)m
J2m (x) = cos x cos(ϕ) − 2mϕ dϕ ,
2π −π

Z π  
(−1)m
J2m+1 (x) = sen x cos(ϕ) − (2m + 1)ϕ dϕ .
2π −π

para todo m = 0, 1, 2, . . .. De (11.181) segue, em particular, a relação


Z π
1
J0 (x) = eix cos(ϕ) dϕ . (11.183)
2π −π
Aplicações dessa identidade encontram-se nos Exercı́cios E. 11.26 e E. 11.27.

E. 11.26 Exercı́cio. Seja f : R2 → C integrável e seja


Z
1
p) :=
F[f ](~ f (~x)e−i~p·~x d2 ~x
2π R2

sua transformada de Fourier, onde ~x = (x1 , x2 ),pp~ = (p1 , p2 ) e p~ · ~x = p1 x1 + p2 x2 . Suponha que f dependa apenas da
coordenada radial: f (~x) = f (r), com r = k~xk = x21 + x22 . Mostre que
Z ∞
F[f ](~
p) = f (r)J0 (pr)r dr ,
0

onde p = |~
p|. Sugestão: use (11.183). 6




 f0 , 0 ≤ r ≤ R
E. 11.27 Exercı́cio. Seja f : R2 → C definida por f (~x) = f (r) = , sendo f0 e R constantes com


 0, r>R
R > 0. Mostre que
f0 R
F[f ](~
p) = J1 (pR) .
p
Sugestão: De (11.155) segue que xJ0 (x) = (xJ1 (x))′ . 6

• Propriedades adicionais
De (11.178) podemos extrair mais algumas relações de interesse. Mostremos algumas aqui. Separando a parte real e
a parte imaginária de ambos os lados de (11.178), teremos
  ∞
X
cos x sen (ϕ) = Jm (x) cos(mϕ) ,
m=−∞

  ∞
X
sen x sen (ϕ) = Jm (x) sen (mϕ) .
m=−∞

Usando que J−m (x) = (−1)m Jm (x), obtemos alguns cancelamentos que conduzem a
  ∞
X
cos x sen (ϕ) = J0 (x) + 2 J2k (x) cos(2kϕ) , (11.184)
k=1

  ∞
X
sen x sen (ϕ) = 2 J2k−1 (x) sen ((2k − 1)ϕ) . (11.185)
k=1
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 541/1633

Em particular, para ϕ = π/2, isso diz-nos que



X
cos(x) = J0 (x) + 2 (−1)k J2k (x) , (11.186)
k=1


X
sen (x) = 2 (−1)k+1 J2k−1 (x) . (11.187)
k=1

Tomando ϕ = 0 em (11.184), segue também a identidade



X
1 = J0 (x) + 2 J2k (x) .
k=1

De (11.184)-(11.185), obtem-se também, usando as bem-conhecidas relações de ortogonalidade das funções seno e
co-seno,

Z π 

1   Jm (x), m par
cos x sen ϕ cos(mϕ)dϕ = .
π 0 

 0, m ı́mpar


Z 

1 π   0, m par
sen x sen ϕ sen (mϕ)dϕ = .
π 0 

 Jm (x), m ı́mpar

Outras identidades podem ser obtidas a partir das várias apresentadas de acima, ou com os mesmos métodos, mas
encerramos aqui nossa apresentação das mesmas, convidando o leitor a um passeio à literatura pertinente às funções de
Bessel. Nossa intenção agora é a de discutir as relações de ortogonalidade para as funções de Bessel.

E. 11.28 Exercı́cio. Usando (10.38), mostre a partir de (11.184) que vale a identidade
 p  ∞
X
cos x 1 − u2 = J0 (x) + 2 J2k (x)T2k (u) , (11.188)
k=1

onde Tm é o m-ésimo polinômio de Chebyshev. 6

• A transformada de Fourier de Jm
Seguindo a convenção que adotamos no Capı́tulo 28, página 1243, definimos a transformada de Fourier F[f ] de uma
função de uma variável f e a transformada de Fourier inversa F−1 [f ] por
Z ∞ Z ∞
1 1
F[f ](p) = √ e−ipx f (x) dx e F−1 [f ](p) = √ eipx f (x) dx .
2π −∞ 2π −∞

A relação (11.182) pode ser escrita na forma


Z π
(−i)m
Jm (x) = eix cos(ϕ) cos(mϕ) dϕ . (11.189)
π 0

Adotando m ∈ N0 , com a mudança de variáveis ϕ = arccos u, isso fica


Z m Z 1
(−i)m 1 ixu  1 (10.38) (−i) Tm (u)
Jm (x) = e cos m arccos(u) √ du = eixu √ du , (11.190)
π −1 1−u 2 π −1 1 − u2
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 542/1633

onde Tm é o m-ésimo polinômio de Chebyshev (vide página 425). Definamos uma função Jc m por
r
c m 2 Tm (u)
Jm (u) := (−i) √ χ(−1, 1) (u) , (11.191)
π 1 − u2



 1 , u ∈ (−1, 1) ,
onde χ(−1, 1) é a função caracterı́stica do intervalo (−1, 1): χ(−1, 1) (u) := Então, (11.190) traduz-se


 0 , u 6∈ (−1, 1) .
na afirmação que h i
Jm (x) = F−1 Jc
m (x) (11.192)
e, portanto, r
2 Tm (u)
F[Jm ](u) = Jc
m (u) = (−i)
m
√ χ(−1, 1) (u) . (11.193)
π 1 − u2
Essa expressão determina a transformada de Fourier das funções de Bessel de ordem m ∈ N0 . A função Jc
m é integrável,
ou seja, um elemento de L1 (R, dx) (justifique!) e, portanto, (11.192) está bem definida. Como as funções Jm não
são integráveis em R, nem de quadrado integrável, a expressão (11.193) deve ser entendida no sentido de distribuições
temperadas. Vide Seção 28.3.6, página 1292.

• Zeros das funções de Bessel


Antes de entrarmos na discussão sobre as relações de ortogonalidade para as funções de Bessel em J = [0, 1] precisamos
fazer alguns comentários sobre os zeros das funções de Bessel. Os seguintes teoremas são válidos:
Teorema 11.2 As funções Jn (z), com n ∈ Z, não possuem zeros complexos e possuem uma coleção infinita enumerável
de zeros reais, todos simples, exceto z = 0, que é um zero de ordem |m| de Jm (z) para m ∈ Z, m 6= 0. Os zeros de Jn (z),
com n ∈ Z, não possuem pontos de acumulação em R. Como Jn (x) = (−1)n Jn (−x), vemos que os zeros de Jn (x) são
simétricos em relação ao ponto x = 0. Fora isso, como J−n (x) = (−1)n+1 Jn (x), os zeros de Jn (x) coincidem com os de
J−n (x). Por fim, os zeros positivos das funções de Bessel de ordem inteira positiva possuem a seguinte propriedade de
alternância: entre dois zeros positivos sucessivos de Jn existe um zero de Jn−1 e um de Jn+1 , para todos n ≥ 0. 2

Teorema 11.3 Seja ν real e suponha que | arg z| < π. Então Jν (z) possui uma coleção infinita enumerável de zeros
reais e positivos e um número 2N (ν) de zeros conjugados complexos, sendo que

1. N (ν) = 0 se ν > −1 ou ν = −1, −2, −3, . . .,


2. N (ν) = m se −m − 1 < ν < m, m = 1, 2, 3, . . ..

Os zeros reais positivos de Jν (z), com ν real, não possuem pontos de acumulação em R+ . 2

Teorema 11.4 Para ν ≥ 0 a função Jν′ (z) possui apenas zeros simples, exceto em z = 0 e entre dois zeros sucessivos
de Jν′ (z) há exatamente um zero de Jν (z). 2

O teorema seguinte é particularmente útil na resolução de problemas envolvendo condições de contorno mistas.
Teorema 11.5 Para A e B reais e ν real com ν > −1 a equação

AJν (z) + BzJν′ (z)

para | arg z| < π possui uma coleção enumerável de zeros reais positivos e no caso em que ν + A/B ≥ 0, também não
possui raı́zes complexas. Caso ν + A/B < 0, AJν (z) + BzJν′ (z) possui duas raı́zes imaginárias puras. 2
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 543/1633

Os enunciados acima foram extraı́dos de [113], [85] e [79] e suas demonstrações podem ser encontradas em [184] ou
(parcialmente) em [85]. Não as apresentaremos aqui, mas o leitor não deve ser desestimulado a estudá-las pois as mesmas
são elementares e utilizam-se essencialmente apenas do material que já apresentamos aqui.

• As relações de ortogonalidade das funções de Bessel no intervalo [0, 1]


Em muitos problemas, por exemplo, naquele em que estudamos os modos de vibração de uma membrana circular,
estamos interessados nas soluções da equação de Bessel em um intervalo finito fechado. Consideraremos, para fixar idéias,
o caso em que o intervalo é J = [0, 1]. Em uma tal situação encontraremos relações de ortogonalidade, as quais são
muito importantes na resolução de certos problemas envolvendo equações diferenciais parciais submetidas a condições
iniciais e de contorno.
Devido aos comentários que fizemos acima sobre os zeros das funções de Bessel consideraremos no que segue apenas
o caso em que ν é real.
Seja para um dado α ∈ R a função fα (x) := Jν (αx). É fácil verificar que fα (x) é solução da equação
ν2
(xy ′ (x))′ − y(x) + α2 xy(x) = 0 . (11.194)
x

E. 11.29 Exercı́cio importante. Verifique isso. 6

Como α aparece elevada ao quadrado na expressão acima podemos sem perda de generalidade considerar α > 0 (o
caso α = 0 é trivial, pois corresponde a uma função constante: f0 (x) = Jν (0)).
Nosso principal resultado será o seguinte teorema, o qual estabelece uma classe bastante geral de relações de orto-
gonalidade para as funções de Bessel. Essas relações de ortogonalidade são de suma importância nas aplicações dessas
funções à solução de certas equações diferenciais submetidas a certas condições iniciais e de contorno.
Teorema 11.6 Seja ν ≥ 0 e sejam fixados certos números reais A, B com (A, B) 6= (0, 0) satisfazendo ν + A/B ≥ 0,
caso B 6= 0 (vide Teoremas 11.2-11.5). Seja também ZνA, B o conjunto de todos os números α > 0 tais que

AJν (α) + BαJν′ (α) = 0 , (11.195)

ou seja,
ZνA, B := {α > 0| AJν (α) + BαJν′ (α) = 0} . (11.196)
Pelo Teorema 11.5, esse conjunto é não-vazio e enumerável. Então a condição (11.23) do Teorema 11.1, página 495,
com J = [0, 1], é satisfeita para todas as funções fα (x) = Jν (αx) com α ∈ ZνA, B e, portanto, para α, β ∈ ZνA, B com
α 6= β valem as relações de ortogonalidade (com r(x) = x)
Z 1
fα (x)fβ (x) x dx = 0 ,
0

ou seja, Z 1
Jν (αx)Jν (βx) x dx = 0 . (11.197)
0
para todos α, β ∈ ZνA, B com α 6= β. Para todos α, β ∈ ZνA, B , tem-se
Z 1    
δα, β 2 ν2 2
Jν (αx)Jν (βx) x dx = (Jν′ (α)) + 1 − 2 (Jν (α))
0 2 α
 
(11.163) δα, β 2 2ν 2
= (Jν (α)) − Jν (α)Jν+1 (α) + (Jν+1 (α)) . (11.198)
2 α
Essa expressão é denominada relação de ortogonalidade das funções de Bessel. Note que há uma relação de ortogonalidade
para cada tripla (ν, A, B) com ν ≥ 0 e (A, B) 6= (0, 0) e ν + A/B ≥ 0, B 6= 0, pois cada tripla (ν, A, B) fixa o
conjunto WνA, B .
A relação (11.195) corresponde a condições de contorno freqüentemente encontradas na resolução de equações diferen-
ciais parciais da Fı́sica, como por exemplo no problema de propagação de ondas em uma membrana circular (um tambor).
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 544/1633

No caso A = 1, B = 0 o conjunto Zν1, 0 coincide com o dos zeros da função de Bessel Jν (x). No caso A = 0, B = 1 o
conjunto Zν0, 1 coincide com o dos zeros da função Jν′ (x).
Em particular, se ν ≥ 0 e ανk é o k-ésimo zero da função Jν (x) no intervalo (0, ∞), então
Z 1 2 2
  (J ′ (αν )) (Jν+1 (ανk ))
Jν ανk x Jν ανl x x dx = δk, l ν k = δk, l . (11.199)
0 2 2

Analogamente, se ν ≥ 0 e βkν é o k-ésimo zero da função Jν′ (x) no intervalo (0, ∞), então
Z 1  2 ! 2
ν
 ν
 ν (Jν (βkν ))
Jν βk x Jν βl x x dx = δk, l 1 − ν . (11.200)
0 βk 2

Dessa relação percebemos incidentalmente que βkν > ν para todo k, pois o lado esquerdo é certamente positivo quando
k = l. 2

Prova do Teorema 11.6. Podemos encarar a equação (11.194) como sendo da forma canônica (11.5) para o intervalo
2
J = (0, 1] com p(x) = x, q(x) = − νx , r(x) = x e µ = α2 . Perguntemo-nos agora se para duas funções fα (x) := Jν (αx)
e fβ (x) := Jν (βx) a condição (11.23) do Teorema 11.1, página 495 é satisfeita nos extremos do intervalo J = (0, 1], ou
seja, se  
p(1) fα (1)fβ′ (1) − fα′ (1)fβ (1) − lim p(x) fα (x)fβ′ (x) − fα′ (x)fβ (x) = 0 ,
x→0

isto é, se
(Jν (α)βJν′ (β) − αJν′ (α)Jν (β)) − lim x (Jν (αx)βJν′ (βx) − αJν′ (αx)Jν (βx)) = 0 .
x→0

Dado que o primeiro termo da expansão de Jν (x) é proporcional a xν , e que, conseqüentemente, o primeiro termo da
expansão de Jν′ (x) é proporcional a xν−1 teremos que

lim x (Jν (αx)βJν′ (βx) − αJν′ (αx)Jν (βx)) ∝ lim xxν xν−1 = 0
x→0 x→0

sempre que ν > 0. Para ν = 0 a relação acima também é válida, pois o primeiro termo da expansão de J0 (x) é constante,
mas o primeiro termo da expansão de J0′ (x) é proporcional a x. Para ν < 0 o limite x → 0 da expressão acima é singular.
Concluı́mos que para ν ≥ 0 vale
 
p(1) fα (1)fβ′ (1) − fα′ (1)fβ (1) − lim p(x) fα (x)fβ′ (x) − fα′ (x)fβ (x) = (Jν (α)βJν′ (β) − αJν′ (α)Jν (β)) .
x→0

Procuramos agora identificar condições sob as quais o lado direito se anula, o que nos garantirá a aplicabilidade do
teorema de ortogonalidade, Teorema 11.1.
Um caso óbvio é aquele no qual α e β são zeros da função de Bessel Jν . Outro caso óbvio é aquele no qual α e β são
zeros de Jν′ , a derivada da função de Bessel Jν . O caso mais geral está na seguinte proposição.
Proposição 11.2 Suponhamos que para certos números A e B com (A, B) 6= (0, 0) existam constantes reais α e β tais
que

AJν (α) + BαJν′ (α) = 0 e (11.201)

AJν (β) + BβJν′ (β) = 0. (11.202)

Então,
Jν (α)βJν′ (β) − αJν′ (α)Jν (β) = 0 .
2
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 545/1633

Prova. As relações (11.201)-(11.202) podem ser expressas em forma matricial como


    
Jν (α) αJν′ (α)  A 0
    
    
   =   .
    
    
    
Jν (β) βJν′ (β) B 0

Como por hipótese (A, B) 6= (0, 0), a relação acima só é possı́vel se a matriz 2 × 2 do lado esquerdo for não-inversı́vel,
ou seja, se tiver determinante nulo. Assim, devemos ter
 
Jν (α) αJν′ (α)
 
 
0 = det 

 = Jν (α)βJν′ (β) − αJν′ (α)Jν (β) ,

 
 

Jν (β) βJν (β)

que é o que querı́amos estabelecer.

Com essa proposição, fica estabelecido que a condição (11.23) do Teorema 11.1, página 495, com com J = [0, 1],
é satisfeita para todas as funções fα (x) = Jν (αx) com α ∈ ZνA, B e, portanto, para α, β ∈ ZνA, B com α 6= β valem as
relações de ortogonalidade (com r(x) = x)
Z 1 Z 1
fα (x)fβ (x) x dx = 0 ou seja, Jν (αx)Jν (βx) x dx = 0 ,
0 0

para todos α, β ∈ ZνA, B com α 6= β.


Passemos à questão de provar (11.198) para o caso em que α = β. Isso pode ser feito de diversas maneiras, a mais
direta sendo a seguinte. Escrevamos a equação (11.194) na forma

x2 y ′′ (x) + xy ′ (x) + α2 x2 − ν 2 y(x) = 0 . (11.203)

Multiplicando-a por 2y ′ (x), obtemos



0 = 2x2 y ′ (x)y ′′ (x) + 2x(y ′ (x))2 + 2 α2 x2 − ν 2 y(x)y ′ (x)

d ′ 2  d 2
= x2 (y (x)) + 2x(y ′ (x))2 + α2 x2 − ν 2 (y(x))
dx dx

d  2 ′ 2
  d 2
= x (y (x)) + α2 x2 − ν 2 (y(x))
dx dx
e, portanto,
d  2 ′ 2
 d h 2 2  2
i
2
x (y (x)) +
0 = α x − ν 2 (y(x)) − 2α2 x (y(x)) . (11.204)
dx dx
Integrando-se ambos os lados da igualdade entre 0 e 1, obtem-se
  h  i 1 Z 1
2 1
0 = x2 (y ′ (x)) + α2 x2 − ν 2 (y(x))2 − 2α2 x (y(x))2 dx . (11.205)
0 0 0

Como fα (x) = Jν (αx) é solução de (11.203), podemos adotar y(x) = Jν (αx), acima. Assim,
   
2 1 2 1 2
x2 (y ′ (x)) = α2 x2 (Jν′ (αx)) = α2 (Jν′ (α)) .
0 0

h  i 1    
2 2 2 2
α2 x2 − ν 2 (y(x)) = α2 − ν 2 (Jν (α)) + ν 2 (Jν (0)) = α2 − ν 2 (Jν (α)) ,
0
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 546/1633

2
pois ν 2 (Jν (0)) = 0 para todo ν ≥ 0 (por que?). Portanto, (11.205) fica
Z 1  
2
2α 2
x (Jν (αx))2 dx = α2 (Jν′ (α)) + α2 − ν 2 (Jν (α))2 ,
0

o que conduz à primeira linha de (11.198) no caso α = β. A identidade


 
′ 2 ν2 2 2 2ν 2
(Jν (α)) + 1 − 2 (Jν (α)) = (Jν (α)) − Jν (α)Jν+1 (α) + (Jν+1 (α))
α α
segue diretamente de (11.163).
Com isso, o Teorema 11.6 está demonstrado

• Generalizações das relações de ortogonalidade das funções de Bessel e Neumann


Algumas vezes lidamos com problemas envolvendo a equações de Bessel em intervalos como [R1 , R2 ] com 0 < R1 <
R2 < ∞ e procuramos soluções que anulam-se nos extremos desse intervalo. Exemplos de tais situações encontram-se no
problema descrito no Exercı́cio E. 16.52, página 808 e no problema descrito no Exercı́cio E. 16.53, página 808. Como o
ponto 0 não é um ponto da fronteira do intervalo considerado, as relações de ortogonalidade acima encontradas não se
aplicam diretamente. O teorema a seguir fornece as relações de ortogonalidade desejadas nessa situação.
Teorema 11.7 Sejam 0 < R1 < R2 < ∞ e Sνn (x) definida no intervalo [R1 , R2 ] por
        

 µνn R1 µνn ρ µνn R1 µνn ρ
J
 −ν
 Jν − Jν J−ν , para ν 6∈ Z ,

 R2 R2 R2 R2

Sνn (x) :=



        

 µmn R1 µmn ρ µmn R1 µ mn ρ
 Nm Jm − Jm Nm , para ν = m ∈ Z ,
R2 R2 R2 R2
onde, para ν 6∈ Z, µνn é o n-ésimo zero em (0, ∞) da função
   
R1 R1
J−ν x Jν (x) − Jν x J−ν (x)
R2 R2
e para ν = m ∈ Z, µmn é o n-ésimo zero em (0, ∞) da função
   
R1 R1
Nm x Jm (x) − Jm x Nm (x) .
R2 R2

Pelas definições, Sνn (R1 ) = Sνn (R2 ) = 0 para todo ν ∈ R e todo n ∈ N. Além disso, Sνn (x) é solução da equação de
Bessel 
x2 y ′′ (x) + xy ′ (x) + α2 x2 − ν 2 y(x) = 0 (11.206)
µνn
no intervalo [R1 , R2 ], com α = R2 , também para todo ν ∈ R e todo n ∈ N.
Então, as funções Sνn (x) satisfazem as relações de ortogonalidade
Z R2
Sνn (x)Sνn′ (x) x dx = 0 (11.207)
R1

para n 6= n′ e todo ν ∈ R, com


Z R2  2
Sνn (x) x dx = Kνn (11.208)
R1
para todo ν ∈ R e todo n ∈ N, onde
(      2
1 R1 R1
Kνn = (R2 )2 J−ν µνn Jν′ (µνn ) − Jν µνn ′
J−ν (µνn )
2 R2 R2

        2 )
2 R1 ′ R1 R1 ′ R1
−(R1 ) J−ν µνn Jν µνn − Jν µνn J−ν µνn
R2 R2 R2 R2
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 547/1633

para ν 6∈ Z e
(      2
1 2 R1 ′ R1 ′
Kmn = (R2 ) Nm µmn Jm (µmn ) − Jm µmn Nm (µmn )
2 R2 R2

        2 )
R1 R1 R1 R1
−(R1 )2 Nm µmn ′
Jm µmn − Jm µmn ′
Nm µmn
R2 R2 R2 R2

para ν = m ∈ Z. 2

Prova. As relações (11.207) seguem diretamente do Teorema 11.1, página 495 pelo fato que Sνn (R1 ) = Sνn (R2 ) = 0 para
todo ν ∈ R e todo n ∈ N.
Para demonstrar (11.208) consideraremos apenas o caso ν 6∈ Z, pois o caso ν = m ∈ Z é tratado identicamente.
Nosso ponto de partida é a equação (11.204), página 545:

d  2 ′ 2
 d h 2 2  2
i
2
0 = x (y (x)) + α x − ν 2 (y(x)) − 2α2 x (y(x)) , (11.209)
dx dx
válida para qualquer solução de (11.206) (vide página 545). Integrando-se ambos os lados da igualdade entre R1 e R2 ,
obtem-se Z R2
  h  i R
2 R2 2 2 2
0 = x2 (y ′ (x)) + α2 x2 − ν 2 (y(x)) − 2α2 x (y(x)) dx . (11.210)
R1 R1 R1

Como        
µmn R1 µmn µmn R1 µmn
y(x) = Sνn (x) := J−νm Jνm x − Jνm J−νm x ,
R2 R2 R2 R2
µmn
é solução de (11.206) com α = R2 temos, para essa y,
  R2   R2 h i
2 2 2 2
x2 (y ′ (x)) = x2 (Sνn

(x)) = (R2 )2 (Sνn

(R2 )) − (R1 )2 (Sνn

(R1 )) ,
R1 R1

h  i R h  i R
2 2 2 2
α2 x2 − ν 2 (y(x)) = α2 x2 − ν 2 (Sνn (x)) = 0,
R1 R1

pois Sνn (x) anula-se em R1 e em R2 . Portanto, (11.210) fica


Z R2 h i
2 2 2
2α2 x (Sνn (x)) dx = (R2 )2 (Sνn

(R2 )) − (R1 )2 (Sνn

(R1 )) ,
R1

o que conduz à

Z R2
2 (R2 )2 h 2 ′ 2 2 ′ 2
i
x (Sνn (x)) dx = (R2 ) (S νn (R2 )) − (R1 ) (S νn (R1 ))
R1 2(µmn )2
(      2
1 R1 R1
= (R2 )2 J−νm µmn Jν′ m (µmn ) − Jνm µmn ′
J−ν (µmn )
2 R2 R2 m

        2 )
2 R1 ′ R1 R1 ′ R1
− (R1 ) J−νm µmn Jνm µmn − Jνm µmn J−νm µmn ,
R2 R2 R2 R2

como querı́amos provar.


JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 548/1633

• Comentário sobre a equação de Bessel no intervalo J = [0, ∞)


Seja a equação de Bessel x2 y ′′ (x) + xy ′ (x) + (x2 − ν 2 )y(x) = 0 e consideremo-la agora no intervalo semi-infinito
J = [0, ∞). A mesma pode ser escrita como
ν2
(xy ′ (x))′ − y(x) + xy(x) = 0 , (11.211)
x
e aqui temos p(x) = x e poderı́amos adotar q(x) = x, r(x) = x1 e µ = −ν 2 . Há, porém, uma diferença marcante em
relação aos casos anteriormente tratados. Para as funções Jν (x), mesmo com ν inteiro, não vale a relação (11.23), pois
limx→∞ p(x)Jν (x)Jν ′ (x) não se anula e, portanto, o Teorema 11.1 não se aplica nesse caso. De fato, Jν (x) comporta-se
para x → ∞ como r 
2 cos x − νπ π
2 − 4
Jν (x) ≈ √ .
π x
Infelizmente, não apresentaremos a demonstração dessa expressão assintótica nestas Notas. O leitor poderá encontrá-la
em vários textos, por exemplo, em [184], [190], [85] e mesmo em [109]. Em [85], por exemplo, encontra-se demonstrada
a expressão assintótica mais detalhada

r  ∞   2r
2 cos x − νπ − π X (−1)r Γ ν + 2r + 12 1
Jν (x) ≈ √2 4
1

π x r=0
(2r)! Γ ν − 2r + 2
2x

r  ∞   2r+1
2 sen x − νπ − π X (−1)r Γ ν + 2r + 23 1
− √ 2 4  ,
π x r=0
(2r + 1)! Γ ν − 2r − 21 2x

válida para x → ∞. Com isso, percebemos que não devem valer para as funções de Bessel com ν’s diferentes relações de
ortogonalidade envolvendo integrais em J = [0, ∞).

11.2.7 Propriedades das Funções de Bessel Esféricas


As funções de Bessel e Neumann esféricas de ordem ν foram definidas em (10.126) e (10.127) por
r r
π π
jν (z) := Jν+ 12 (z) , nν (z) := N 1 (z) . (11.212)
2z 2z ν+ 2
Por serem fortemente relacionadas às funções de Bessel, suas propriedades podem ser facilmente deduzidas das proprie-
dades estudadas acima daquelas funções.
Por (10.103), tem-se
√ X ∞  z 2k+ν
π (−1)k
jν (z) = .
2 k! Γ(k + 1 + ν + 1/2) 2
k=0
Pela fórmula de duplicação (10.27), podemos escrever isso como

X (−1)k Γ(k + 1 + ν)
jν (z) = 2ν z 2k+ν .
k! Γ(2(k + 1 + ν))
k=0

Em particular, para ν = l ∈ N0 , vale



X (−1)k (k + l)! 2k+l
jl (z) = 2l z .
k! (2k + 2l + 1)!
k=0

• Relações de recorrência para as funções de Bessel esféricas


Fórmulas de recorrência para as funções de Bessel esféricas também podem ser obtidas daquelas para as funções de
Bessel listadas em (11.160)-(11.165). Analisando-as, é imediato ver que de (11.160) e (11.161) segue facilmente que
d  d 
xν+1 jν (x) = xν+1 jν−1 (x) e x−ν jν (x) = −x−ν jν+1 (x) . (11.213)
dx dx
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 549/1633

De (11.162) e (11.163) segue facilmente que

xjν′ (x) = xjν−1 (x) − (ν + 1)jν (x) e xjν′ (x) = νjν (x) − xjν+1 (x) . (11.214)

Dessas duas relações segue facilmente que


 
1 jν (x)
jν′ (x) = jν−1 (x) − − jν+1 (x) , (11.215)
2 x

1 
jν+1 (x) = (2ν + 1)jν (x) − xjν−1 (x) , (11.216)
x
para todo ν. Usando (11.216), é fácil ver que (11.215) pode ser reescrita como

(2ν + 1) jν′ (x) = νjν−1 (x) − (ν + 1)jν+1 (x) (11.217)

para todo ν.
Resumindo nossas conclusões, obtivemos que
d 
xν+1 jν (x) = xν+1 jν−1 (x) , (11.218)
dx

d 
x−ν jν (x) = −x−ν jν+1 (x) , (11.219)
dx

xjν′ (x) = xjν−1 (x) − (ν + 1)jν (x) , (11.220)

xjν′ (x) = νjν (x) − xjν+1 (x) , (11.221)

(2ν + 1) jν′ (x) = νjν−1 (x) − (ν + 1)jν+1 (x) , (11.222)

1 
jν+1 (x) = (2ν + 1)jν (x) − xjν−1 (x) . (11.223)
x
Expressões análogas são válidas para as funções nν (x).
Com o uso das relações de recorrência acima é possı́vel obter para as funções de Bessel esféricas o análogo da expressão
(11.167).

• A relação entre jn e j0 , n ∈ N
A expressão (11.219) diz-nos que

1 d 
x−ν jν (x) = −x−(ν+1) jν+1 (x) .
x dx
Disso segue imediatamente que  n
1 d 
x−ν jν (x) = (−1)n x−(ν+n) jν+n (x) , (11.224)
x dx
válida para todo ν, x ∈ C e n ∈ N0 . No caso particular em que ν = 0, obtem-se,
 n  n 
n n 1 d n n 1 d sen x 
jn (x) = (−1) x (j0 (x)) = (−1) x , (11.225)
x dx x dx x

válida para todo x ∈ C e n ∈ N0 . A expressão (11.225) guarda certa semelhança com as fórmulas de Rodrigues.
Para as funções de Neumann esféricas tem-se uma expressão análoga:
 n 
n+1 n 1 d cos x 
nn (x) = (−1) x . (11.226)
x dx x
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 550/1633

As primeiras funções de Bessel esféricas são


sen x sen x cos x sen x cos x
j0 (x) = , j1 (x) = − , j2 (x) = (3 − x2 ) −3 2 (11.227)
x x2 x x3 x
e as primeiras funções de Neumann esféricas são
cos x cos x sen x cos x sen x
n0 (x) = − , n1 (x) = − 2
− , n2 (x) = −(3 − x2 ) 3
−3 2 . (11.228)
x x x x x

• Relações de ortogonalidade para as funções de Bessel esféricas no intervalo [0, 1]


As relações de ortogonalidade para as funções de Bessel esféricas podem ser provadas diretamente daquelas expressas
no Teorema 11.6.
ν+1/2
Observemos em primeiro lugar que o conjunto ZA, B que, pela definição (11.196), é
n o
ν+1/2 ′
ZA, B := α > 0| AJν+1/2 (α) + BαJν+1/2 (α) = 0

pode ser caracterizado em termos de jν como


   
ν+1/2 B
ZA, B := α > 0 A + jν (α) + Bαjν′ (α) = 0 .
2

Assim, ao lidarmos com problemas que possuem condições de contorno do tipo

Ajν (α) + Bαjν′ (α) = 0


ν+1/2
o conjunto de α’s que satisfazem isso é ZA−B/2, B .
Isso mostra que podemos q aplicar diretamente as conclusões do√Teorema 11.6, tomando o cuidadode substituir: 1. ν
px √ √
por ν + 1/2, 2. Jν (α) por 2α
π jν (α), 3. (na integral) Jν (αx) por α π jν (αx) e 3. e Jν′ (α) por π j2ν√(α)
α
+ αjν′ (α) .
Após algumas contas elementares, obtem-se o seguinte:
Teorema 11.8 Seja ν ≥ 0, sejam fixados certos números reais A, B com (A, B) 6= (0, 0) satisfazendo ν+1/2+A/B ≥ 0,
caso B 6= 0 (vide Teoremas 11.2-11.5) e seja definido
ν+1/2
WνA, B := {α > 0| Ajν (α) + Bαjν′ (α) = 0} = ZA−B/2, B .

Pelo Teorema 11.5, esse conjunto é não-vazio e enumerável. Para todos α, β ∈ WνA, B , tem-se
Z "  2   #
1
2 δα, β 1 jν (α) √ ′ (ν + 21 )2 2
jν (αx)jν (βx) x dx = √ + αjν (α) + 1 − (jν (α))
0 2 α 2 α α2
  
δα, β ν(ν + 1) 2 jν (α)jν′ (α) ′ 2
= 1− (jν (α)) + + (jν (α))
2 α2 α
 
(11.221) δα, β 2 (2ν + 1) 2
= (jν (α)) − jν (α)jν+1 (α) + (jν+1 (α)) . (11.229)
2 α

Essa expressão é denominada relação de ortogonalidade das funções de Bessel esféricas. Note que há uma relação de
ortogonalidade para cada tripla (ν, A, B) com ν ≥ 0 e (A, B) 6= (0, 0), pois cada tripla (ν, A, B) fixa o conjunto ZνA, B .
No caso A = 1, B = 0 o conjunto Wν1, 0 coincide com o dos zeros da função de Bessel esférica jν (x). No caso
A = 0, B = 1 o conjunto Wν0, 1 coincide com o dos zeros da função jν′ (x).
Em particular, se ν ≥ 0 e ανk é o k-ésimo zero da função jν (x) no intervalo (0, ∞), então
Z 1 2 2
  (j ′ (αν )) (jν+1 (ανk ))
jν ανk x jν ανl x x2 dx = δk, l ν k = δk, l . (11.230)
0 2 2
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 551/1633

Analogamente, se ν ≥ 0 e βkν é o k-ésimo zero da função jν′ (x) no intervalo (0, ∞), então
Z 1   2
  ν(ν + 1) (jν (βkν ))
jν βkν x jν βlν x 2
x dx = δk, l 1− . (11.231)
0 (βkν )2 2
p
Dessa relação percebemos incidentalmente que βkν > ν(ν + 1) para todo k, pois o lado esquerdo é certamente positivo
quando k = l. 2

sen (x)
É instrutivo considerar a relação (11.230) no caso ν = 0, quando j0 (x) = x e, portanto, α0k = kπ, com k > 0
inteiro. Como j0′ (x) = cos(x)
x − senx2(x) , (11.230) está dizendo que
Z 1  2
sen (kπx) sen (lπx) δk, l cos(kπ) 1
dx = = δk, l ,
0 klπ 2 2 kπ 2(kπ)2

ou seja,
Z 1
1
sen (kπx) sen (lπx) dx = δk, l .
0 2
Essa é uma relação bem conhecida que, evidentemente, pode também ser provada por meios mais elementares.
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 552/1633

11.3 Exercı́cios Adicionais


E. 11.30 Exercı́cio-dirigido. A idéia deste exercı́cio é provar as relações de ortogonalidade dos polinômios de Legendre
usando diretamente a fórmula de Rodrigues, expressão (11.56), página 508.

a. Usando a fórmula de Rodrigues para os polinômios de Legendre, mostre que


Z 1
xm Pn (x)dx = 0 (11.232)
−1

para todo 0 ≤ m < n, m inteiro. Sugestão: integração por partes.


b. Mostre que Z 1
22n+1 (n!)2
(x2 − 1)n dx = (−1)n
−1 (2n + 1)!
para todo n ∈ N0 .
c. Mostre que Z 1
2n+1 (n!)2
xn Pn (x)dx = . (11.233)
−1 (2n + 1)!
Sugestão: use a fórmula de Rodrigues, integração por partes e a expressão do item b.
d. Usando (11.232) e (11.233) mostre a validade das relações de ortogonalidade
Z 1
2
Pn (x)Pm (x)dx = δn, m .
−1 2n + 1

Sugestão: use a fórmula de Rodrigues ou a expressão (11.48) para obter o coeficiente de maior grau dos polinômios de
Legendre.

E. 11.31 Exercı́cio. Prove que no intervalo (−1, 1) vale



P0 (x) 5P2 (x) X (−1)m+1 (4m + 1) (2m − 3)!
|x| = + + P2m (x) . (11.234)
2 8 m=2
22m−1 (m + 1)! (m − 2)!
Z 1
Sugestão: para calcular integrais como xP2m (x)dx pode-se usar (11.57) e/ou (11.60), integração por partes e os fatos
0
m
(−1) (2m − 1)!!
que Pn (1) = 1, ∀n ∈ N0 , e P2m (0) = , ∀m ∈ N0 , m ≥ 1, o qual segue de (11.48). 6
2m m!

E. 11.32 Exercı́cio-dirigido. O propósito deste exercı́cio dirigido é demonstrar a importante fórmula da cotangente de
Euler, também conhecida como expansão em frações parciais da função cotangente:

1 X 2z
π cot(πz) = − , (11.235)
z n=1 n2 − z 2

válida para z ∈ C \ Z. Estabeleceremos primeiro a relação



1 X 2x
π cot(πx) = − , (11.236)
x n=1 n2 − x2
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 553/1633

para x ∈ R\Z. A expressão (11.236) foi obtida pela primeira vez por Euler em 1749. Seguiremos uma demonstração elementar
e elegante devida a Herglotz51 tal como apresentada em [3], texto esse que, por sua vez, segue Elstrodt52 . Essa demonstração
é elegante por fazer uso de poucos ingredientes. Basicamente usa-se apenas o fato de que ambos os lados de (11.236) são
funções contı́nuas (em R \ Z), são periódicas de perı́odo 1, têm as mesmas divergências nos inteiros e, last but not least,
satisfazem uma mesma relação algébrica, a relação (11.237), abaixo. Para uma outra demonstração de (11.235) usando o
Teorema de Mittag-Leffler, vide [102] ou outro bom livro de funções de variável complexa. A relação (11.236) pode também
ser provada usando séries de Fourier. Vide Exercı́cio E. 27.21, página 1234. Vide também [50].
Passemos à prova de Herglotz para (11.235). Defina-se, para x ∈ R \ Z,

f (x) := π cot(πx) e g(x) := lim gN (x) ,


N →∞

onde
N
X N
1 1 X 2x
gN (x) := = − .
x+n x n=1 n2 − x2
n=−N

Desejamos provar que f (x) = g(x) para todo x ∈ R \ Z. Isso é feito nos passos indicados no que segue.

a. Prove que gN (x) converge uniformemente para N → ∞ e em qualquer intervalo fechado contido em R \ Z. Sugestões:
para n ≥ 2 e 2n − 1 > x2 tem-se n2 − x2 > (n − 1)2 > 0 e
1 1
0 < < .
n2 −x2 (n − 1)2

M de Weierstraß53 (Proposição 27.1, página 1174) e use o teste da comparação por uma integral para
Use o Teste P

mostrar que n=1 n12 é finita.
Isso estabeleceu que g existe em R \ Z.
b. Convença-se que f e g são contı́nuas em R \ Z. Para g isso segue da convergência uniforme provada em 1.
c. Mostre que f e g são periódicas de perı́odo 1. Para f isso é evidente. Para g isso segue de
1 1
gN (x + 1) = gN (x) + + ,
x+N x+1+N
para x ∈ R \ Z. Prove isso e tome N → ∞ para obter g(x + 1) = g(x) para todo x ∈ R \ Z.
d. Mostre que f e g são funções ı́mpares: f (−x) = −f (x) e g(−x) = −g(x) para todo x ∈ R \ Z. Novamente isso é
evidente para f e para g isso segue do fato que gN (−x) = −gN (x) para todo N .
e. Até aqui só lidamos com propriedades elementares de f e g mas agora vem uma passagem crucial. Mostre que f e g
satisfazem x   x  
x+1 x+1
f +f = 2f (x) e g +g = 2g(x) , (11.237)
2 2 2 2
para todo x ∈ R \ Z. Note que se trata da mesma relação algébrica para f e g. Para f isso segue das bem-conhecidas
fórmulas de adição das funções seno e co-seno. Mostre isso. Para g isso segue da identidade
x  
x+1 2
gN + gN = 2g2N (x) + .
2 2 x + 2N + 1

Prove-a usando a relação trivial


1 1 2 2
x + x+1 = +
2 +n 2 +n x + 2n x + 1 + 2n
e tome o limite N → ∞.
51 Gustav Ferdinand Maria Herglotz (1881–1953).
52 J.Elstrodt, “Partialbruchzerlegung des Kotangens, Herglotz-Trick und die Weierstraßsche stetige, nirgendsdifferenzierbare Funktion”.
Math. Semesterberichte 45 (1998), 207–220.
53 Karl Theodor Wilhelm Weierstraß (1815–1897).
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 554/1633

f. Defina a função h(x) := f (x) − g(x) (que desejamos provar ser identicamente nula). Note em primeiro lugar que h é
uma função ı́mpar, contı́nua e periódica de perı́odo 1 em R \ Z, pois f e g o são.
g. Mostre, usando, por exemplo, a regra de l’Hospital54 , que
   
1 πx cos(πx) − sen (πx)
lim π cot(πx) − = lim = 0.
x→0 x x→0 x sen (πx)

h. Mostre que fato provado em 7 implica lim h(x) = 0. Como h é periódica de perı́odo 1, isso significa que lim h(x) = 0
x→0 x→n
para todo n ∈ Z. Definindo h(n) = 0 para todo n ∈ Z, essa propriedade, por sua vez, implica que a função h torna-se
contı́nua e periódica de perı́odo 1 em todo R, não apenas em R \ Z.
i. Como h é contı́nua e periódica em todo R, h possui um máximo, que denotaremos por H. Seja x0 um ponto de R tal
que h(x0 ) = H (que um tal ponto existe segue da continuidade e periodicidade de h). Agora, tem-se por (11.237) que

x    x    x   
0 x0 + 1 0 x0 + 1 0 x0 + 1
h +h = f +f −g −g
2 2 2 2 2 2

(11.237)
= 2f (x0 ) − 2g(x0 ) = 2h(x0 ) = 2H .
 
Isso está dizendo que a soma de h x20 e h x02+1 é duas vezes o máximo valor alcançado por h em toda R. Ora, isso
só é possı́vel se ambos os termos forem iguais a H,
 pois se um fosse menor que H o outro teria que ser maior que H, o
que não é possı́vel. Assim concluı́mos que h x20 = H (e que h x02+1 = H, mas não usaremos esse segundo fato).
 
Vimos então que h(x0 ) = H implica h x20 = H. Prosseguindo indutivamente, segue que h 2xm0 = H para todo
inteiro m com m ≥ 0. Como h é contı́nua, podemos tomar o limite m → ∞ e obter
x   x0 
0 continuidade
H = lim h m = h lim m = h(0) = 0 ,
m→∞ 2 m→∞ 2

concluindo que H = 0.
j. Vimos que o máximo de h em R é nulo. Isso significa que h(x) ≤ 0 para todo x ∈ R. Porém, como h é uma função
ı́mpar (observado no item f), isso implica que h(x) = 0 para todo x ∈ R. Isso provou que f (x) = g(x) para todo
x ∈ R \ Z, ou seja, provou (11.236) em R \ Z, como querı́amos.

Que a relação (11.235) vale para todo z ∈ C \ Z segue agora do fato que ambos os lados de (11.236) têm extensões
analı́ticas em todo C \ Z (prove isso!) e são iguais em R \ Z, por (11.236) (justifique!). 6

54 Guillaume François Antoine, Marquês de l’Hôpital (ou l’Hospital) (1661–1704).


JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 555/1633

Apêndices
11.A Provando (11.70) à Força Bruta
A idéia é tomar (11.68), escrever (z 2 − 1)l = (z − 1)l (z + 1)l e aplicar a regra de Leibniz. Tudo está resumido nas seguintes
linhas auto-explicativas, acompanhadas de uns poucos comentários ao final:

(1 − z 2 )m/2 dl+m  2 
Plm (z) := (z − 1)l
2l l! dz l+m

(1 − z 2 )m/2 dl+m  l l

= (z − 1) (z + 1)
2l l! dz l+m
l+m  
Leibniz (1 − z 2 )m/2 X l + m dp   l+m−p 
l d l

= (z − 1) (z + 1)
2l l! p=0
p dz p dz l+m−p

l  
(∗) (1 − z 2 )m/2 X l + m dp  l
 dl+m−p 
l

= (z − 1) (z + 1)
2l l! p=m
p dz p dz l+m−p

l    
(1 − z 2 )m/2 X l + m l! l−p l! p−m
= (z − 1) (z + 1)
2l l! p=m
p (l − p)! (p − m)!

l  
(1 − z 2 )m/2 X l + m (l!)2
= (z − 1)l−p (z + 1)p−m
2l l! p=m
p (l − p)! (p − m)!

l  
(∗∗) (z 2 − 1)m (1 − z 2 )m/2 X l + m (l!)2
= (−1)m 2 m l
(z − 1)l−p (z + 1)p−m
(1 − z ) 2 l! p=m
p (l − p)! (p − m)!

l  
(−1)m (1 − z 2 )−m/2 X l + m (l!)2
= l
(z − 1)l−p+m (z + 1)p
2 l! p=m
p (l − p)! (p − m)!

l−m  
p→p+m (−1)m (1 − z 2 )−m/2 X l + m (l!)2
= (z − 1)l−p (z + 1)p+m
2l l! p=0
p + m (l − p − m)! p!

l−m
(−1)m (1 − z 2 )−m/2 X (l + m)! (l!)2
= l
(z − 1)l−p (z + 1)p+m
2 l! p=0
(l − p)! (p + m)! (l − p − m)! p!

l−m
(l + m)! (1 − z 2 )−m/2 X (l − m)! (l!)2
= (−1)m (z − 1)l−p (z + 1)p+m
(l − m)! 2l l! p=0
(l − p)! (p + m)! (l − p − m)! p!
JCABarata. Curso de Fı́sica-Matemática Versão de 20 de abril de 2009. Capı́tulo 11 556/1633

l−m    
(l + m)! (1 − z 2 )−m/2 X l − m l! l!
= (−1)m (z − 1)l−p
(z + 1)p+m
(l − m)! 2l l! p=0
p (l − p)! (p + m)!

l−m   p   l−m−p 
m (l+ m)! (1 − z 2 )−m/2 X l − m d l d l
= (−1) (z − 1) (z + 1)
(l − m)! 2l l! p=0
p dz p dz l−m−p

Leibniz (l + m)! (1 − z 2 )−m/2 dl−m 


= (−1)m (z − 1)l (z + 1)l
(l − m)! 2l l! dz l−m

(l + m)! (1 − z 2 )−m/2 dl−m 2 (l + m)! −m


= (−1)m (z − 1)l = (−1)m P (z) ,
(l − m)! 2l l! dz l−m (l − m)! l

como querı́amos provar.


p l+m−p
d l d l
No ponto indicado por (∗) acima, usamos o fato que dz p (z−1) = 0 se p > l e dz l+m−p (z−1) = 0 se l+m−p > l. Ambas

as condições juntas implicam m ≤ p ≤ l, daı́ a mudança nos limites da soma. No ponto indicado por (∗∗) multiplicamos
2
−1)m
toda a expressão por 1 = (−1)m (z 2 m m m
(1−z 2 )m . Na linha seguinte o fator (z − 1) é escrito como (z − 1) (z + 1) e distribuı́do
1
dentro da soma. Fora isso, usamos também que (1−z 2 )m (1 − z 2 )m/2 = (1 − z 2 )−m/2 .

Você também pode gostar