Análise Matemática

Capítulo 2 – Análise Matemática
Por M. A. Lavrentyev e S. M. Nikolsky.1
2.1. Introdução
O surgimento no final da idade média de novas condições de manufatura na Europa, isto é, o

nascimento do capitalismo que estava substituindo o sistema feudal foi acompanhado por
importantes descobertas e explorações geográficas. Em 1492, se baseando na ideia que a terra era
esférica, Cristóvão Colombo descobriu o Novo Mundo. A descoberta de Colombo estendeu de uma
maneira extraordinária as fronteiras do mundo conhecido e produziu uma revolução nas mentes dos
homens. O fim do século XV e começo do século XVI viu a atividade criativa de grandes artistas-
humanistas tais como Leonardo da Vinci, Rafael e Michelangelo dar um novo significado às artes.
Em 1543 Copérnico publicou o seu trabalho, “Da revolução dos corpos celestes”, que mudou
completamente a face da astronomia; em 1609 apareceu “A nova astronomia” de Kepler que
continha a primeira e a segunda lei do movimento dos planetas ao redor do sol, e em 1618 no seu
livro “Harmonia dos mundos” apresentava a terceira lei. Galileu, com base nos seus estudos sobre
os trabalhos de Arquimedes e nos seus célebres experimentos, lançava os fundamentos da nova
mecânica, uma ciência indispensável para a nova tecnologia que estava nascendo. Em 1609 Galileu
apontou o telescópio que acabara de construir, embora ainda pequeno e imperfeito, para o céu
estrelado. A primeira visão do espaço celeste com telescópio foi suficiente para refutar as esferas
celestes ideais propostas por Aristóteles e o dogma da forma perfeita dos corpos celestes. De fato, a
superfície da lua era recoberta de montanhas e crateras. Vênus apresentava fases como a própria
Lua, Júpiter era rodeado por quatro satélites e oferecia um modelo visual em miniatura do sistema
solar. A Via-Láctea surgia com um número incontável de estrelas independentes, e pela primeira vez
os homens se surpreendiam maravilhados com a imensa distância em que se encontravam as
estrelas. Nenhuma outra descoberta científica teve um impacto tão grande no mundo civilizado.2
Para avançar no desenvolvimento da navegação, e consequentemente na astronomia, e também no

desenvolvimento de novas tecnologias e da mecânica se impunha o estudo de novos problemas de
matemática. A novidade destes problemas era principalmente o fato que eles requeriam o
desenvolvimento de uma matemática relacionada com as leis do movimento no sentido mais amplo
do termo.
O estado de repouso e imobilidade é desconhecido da natureza. Toda a natureza, das menores

partículas até os corpos mais massivos, está em um eterno estado de criação e aniquilação, um fluxo
perpétuo, um movimento incessante de mudança. Com efeito, toda ciência natural estuda algum
aspecto deste movimento. A análise matemática é o ramo da matemática que prover os métodos
para uma investigação quantitativa dos vários processos de mudança, movimento, e dependência de
1 N. T. - Mikhail Alekseevich Lavrentyev (1900 – 1980) foi um grande matemático e físico soviético com
contribuições científicas importantes na hidrodinâmica. Sergey Mikhailovich Nikolsky (1905 – 2012), também
soviético, foi um notável matemático com contribuições na área de análise funcional, aproximação de funções,
fórmulas de quadratura e suas aplicações nas soluções de equações diferenciais parciais.
2 Esta seção está baseada no belo ensaio do acadêmico soviético S. I. Vavilov, “Galileu”, Volume 10, 1952. Sergey
Ivanovich Vavilov (1891 – 1951) foi um famoso físico soviético que presidiu a Academia de Ciências Soviética de
1945 até sua morte. Seu irmão mais velho é o famoso geneticista Nikolai Ivanovich Vavilov (1887 – 1943).
1/141
uma grandeza em relação a outra. Assim, a análise matemática naturalmente surge em um período
quando o desenvolvimento da mecânica e da astronomia, trazido à luz por questões associadas à
tecnologia e navegação, tinha já produzido uma acumulação considerável de observações, medidas
e hipóteses, o que induziu a ciência se dirigir para a investigação quantitativa das formas mais
simples de movimento.
O nome “análise infinitesimal” encontrado muitas vezes na análise matemática nada diz sobre o
objeto investigado, mas enfatiza o método. Aqui estamos tratando com um método especial da
matemática chamado método infinitesimal, ou na sua forma moderna, com limites. Daremos agora
alguns exemplos típicos de argumentos que fazem uso do método de limites e na última seção
definiremos os conceitos necessários.
Exemplo 1. Foi estabelecido experimentalmente por Galileu que a distância s percorrida no tempo t
por um corpo em queda livre no vácuo é expressa pela fórmula:
g t2
s= (1).
2
Onde g é a constante gravitacional igual a 9,81 m/sec 2 .3 Qual seria a velocidade de um corpo em
queda livre em cada ponto da sua trajetória?
Suponha que um corpo esteja passando por um ponto A no tempo t e considere o que acontece em
um pequeno intervalo de tempo Δ t , isto é, no intervalo de t a t+ Δ t . A distância coberta pelo
corpo aumentará de certa quantidade Δ s . A distância original que o corpo percorreu até o
g t2
instante de tempo t é dada por: s1 = . Então a distância total percorrida pelo corpo no tempo
2
t+ Δ t será:
g (t +Δ t )2 gt2 g
s2 = = + ( 2 t Δ t +Δ t 2 ) .
2 2 2
Daí, tiramos que o incremento da distância percorrida pelo corpo é:
g
Δ s = s 2−s 1 = (2 t Δ t+ Δ t 2) .
2
Isto representa a distância coberta pelo corpo no intervalo que vai de t a t+ Δ t . Para encontrar a
velocidade média v av no trecho Δ s dividimos a equação acima por Δ t . Daí, fica:
Δs g
v av = = gt+ Δt .
Δt 2
Fazendo Δ t se aproximar de zero obtemos uma velocidade média que se aproxima tão perto
quanto quisermos da velocidade verdadeira do corpo no ponto A. Por outro lado, vemos que a
3 Hoje a fórmula (1) é deduzida das leis gerais da mecânica, mas historicamente foi exatamente esta fórmula que,
tendo sido inicialmente estabelecida experimentalmente por Galileu, serviu com uma parte da experiência
acumulada que permitiu a subsequente generalização pelas leis da mecânica.
2/141
segunda parcela do lado direito da expressão acima se torna cada vez menor à medida que
decrescemos Δ t , assim a velocidade média v av se aproxima de g t , um fato que é
conveniente escrever como se segue:
v = lim v av = lim
Δ →0 Δt→ 0
Δs
( g
)
= lim g t + Δ t = g t .
Δ s Δ t →0 2
Consequentemente, gt é a verdadeira velocidade do corpo em queda livre no tempo t.
Exemplo 2. Um reservatório com base quadrada de lado a e paredes verticais com altura h está
cheio de água até o topo como mostra a Fig. 1. Qual será a força que a água exerce sobre as paredes
verticais do reservatório?
Fig. 1
Para responder a esta questão dividimos o reservatório em n camadas horizontais cada uma com
h
altura . De uma lei bem conhecida sabemos que a pressão exercida em cada ponto do
n
reservatório é igual ao peso específico da água multiplicado pela altura da coluna d'água acima do
ponto. Assim, a pressão na parte inferior de cada camada, expressa em unidades convenientes,4 seria
respectivamente igual a:
h 2h 3h (n−1) h
, , ,⋯, ,h .
n n n n
Obtemos uma expressão aproximada da força desejada F atuando sobre qualquer uma das paredes
verticais do reservatório somando as contribuições de cada camada. Se assumirmos que a pressão é
praticamente constante em cada camada o valor de F fica:
F≈ ( ) ( )
a h h a h 2h
n n
+
n n
+⋯+
n n ( )
a h ( n−1)h a h n h
+
n n
=
a h2
n2 ( )
(1+2+⋯+ n) , ( )
4 N. T. - Por unidades conveniente entendemos aquelas em que o valor numérico do peso específico da água seja igual
à unidade: ρ = 1 .
3/141
F≈ ( )
a h2
n2 ⏟
(1+ 2+⋯+n)
n (n+1)
=
n2 2( )
a h2 n( n+1)
=
a h2
2 ( )(1+ 1n ) .
2
Para encontrar o verdadeiro valor da força, dividimos o reservatório em camadas cada vez mais
1
finas aumentando o valor de n indefinidamente. À medida que n cresce a magnitude de na
n
fórmula acima decresce cada vez mais. No limite obtemos a fórmula exata para a força P:
F = lim
n→ ∞ {( )( )} ( )
a h2
2
1+
1
n
=
a h2
2
→ P= ( )
a h2
2
.
A ideia do método de limites é simples e se resume no seguinte. De maneira a se determinar o valor

exato de certa grandeza, primeiramente determinamos não o valor da grandeza em si, mas alguma
aproximação. Entretanto, fazemos aqui não uma aproximação simples, mas estabelecemos uma
série delas, cada uma mais precisa que a outra. Do exame desta cadeia de aproximações, isto é, do
exame do próprio processo de aproximação, determinamos de maneira unívoca o valor exato da
grandeza. Por este método, que em essência é profundamente dialético, 5 obtemos um valor
constante bem definido como resultado de um processo ou movimento.
O método matemático de limites evoluiu como resultado do trabalho persistente de muitas gerações
de matemáticos estudando problemas que não podiam ser solucionados por métodos simples da
aritmética, álgebra, e geometria elementar.
Quais foram os problemas cuja solução levou aos conceitos fundamentais da análise, e quais foram
os métodos para solução que surgiram a partir destes problemas? Passaremos agora a examinar
alguns deles.
Os matemáticos do século XVII gradualmente descobriram que um grande número de problemas

vinculados a vários tipos de movimento, com a consequente dependência de certas variáveis sobre
outras, e também muitos problemas geométricos que não podiam ser solucionados pelos métodos
conhecidos, podiam ser reduzidos a dois tipos. Exemplos simples de problemas do primeiro tipo
são: 1) encontrar a velocidade em qualquer instante de um dado movimento não uniforme, ou,
generalizando, encontrar a taxa de variação de uma dada grandeza, e 2) traçar uma tangente a uma
curva conhecida. Estes problemas (e o nosso primeiro exemplo é um deles) nos leva ao ramo da
análise que recebeu o nome de “cálculo diferencial”. Os exemplos mais simples do segundo tipo de
problema são: encontrar a área de uma figura curvilínea (também chamado problema de
quadratura6), ou encontrar a distância percorrida por um corpo em movimento não uniforme,
5 N. T. - Dialético aqui no sentido filosófico de se usar um processo de reconciliação de uma contradição. Ou seja,
neste processo partimos do conhecimento da força exercida por finas camadas do reservatório sobre a parede
vertical (que não é o resultado que procuramos, portanto, a contradição) para estabelecer por um processo de limite a
pressão total atuando na parede que é o resultado pretendido.
6 N. T. - O problema de quadratura remonta aos primeiros matemáticos gregos, e é assim chamado porque
procuravam construir com régua e compasso um quadrado com área igual à de um círculo dado. De fato, os
matemáticos atenienses concentravam seus esforços especialmente em três problemas:
1) A duplicação do cubo.
4/141
generalizando, encontrar o efeito total da ação de uma grandeza que muda continuamente (compare
com o nosso segundo exemplo). Este grupo de problemas levou a outro ramo da análise chamada de
“cálculo integral”. Assim, dois problemas fundamentais foram identificados: o problema das
tangentes e o problema das quadraturas.
Neste capítulo descreveremos em detalhes as ideias fundamentais para solução destes dois
problemas. Aqui é particularmente importante o teorema de Newton e Leibnitz que mostra ser o
problema de quadratura o inverso, em um sentido bem conhecido, do problema das tangentes. Para
solucionar o problema das tangentes, e outros problemas que possam ser reduzidos a ele, foi
desenvolvido um algoritmo apropriado, um método completamente geral que levava diretamente a
solução do problema, chamado de método das derivadas ou da diferenciação.
A história da criação e evolução da análise e o papel no seu desenvolvimento desempenhado pela

geometria analítica de Descartes já foi descrita no Capítulo 1. Constatamos que na segunda metade
do século XVII e primeira metade do século XVIII uma mudança completa ocorreu em toda
matemática. Nas subdivisões que já existiam, como aritmética, geometria elementar, e rudimentos
de álgebra e trigonometria, foram acrescentados métodos mais gerais como a geometria analítica,
cálculo diferencial e integral, e a teoria das equações diferenciais na sua forma mais simples. Com
isto era possível agora resolver problemas cujas soluções estavam até então inacessíveis.
Mostrou-se que se a lei de formação de uma dada curva não for muito complicada, então é sempre
possível construir uma tangente em um ponto arbitrário pertencente a curva. Para isto é necessário
apenas fazer os cálculos com a ajuda das regras do cálculo diferencial, as chamadas derivadas, que
em muitos casos são bastante imediatos. Até então só se sabia traçar as tangentes a uma
circunferência e a uma ou duas outras curvas, e nenhum matemático suspeitava da existência de
uma solução geral para o problema.
Se conhecermos a distância percorrida em qualquer instante de tempo por um ponto em movimento,

então pelo mesmo método podemos encontrar imediatamente a velocidade do ponto em dado
instante e também sua aceleração. Ao contrário, se conhecermos a aceleração de um ponto em
qualquer instante de tempo, podemos encontrar sua velocidade e a distância percorrida fazendo uso
da operação inversa da diferenciação, ou seja, usando a operação de integração. Disto resulta, por
exemplo, que não é muito difícil de provar a partir das leis do movimento de Newton e da lei
universal da gravitação que os planetas se movem ao redor do sol em órbitas elípticas de acordo
com as leis estabelecidas por Kepler.
De grande importância na prática é o problema dos valores máximo e mínimo que uma grandeza
assume, também chamado de problema de máximo e mínimo. Por exemplo, desejamos construir a
partir de uma tora de madeira com seção reta circular e raio conhecido uma viga com seção reta
retangular que apresente a maior resistência ao dobramento. Qual seria a razão entre os lados desta
seção retangular? Uma argumentação simples sobre o comportamento da rigidez de uma viga com
seção reta retangular (aplicando conceitos do cálculo integral), seguida pela solução de um
problema de máximo, que envolve o cálculo de uma derivada, mostra que para se construir uma
2) Quadrar um círculo.
3) Trisseção de um ângulo.
Todos estes problemas parecem simples, mas hoje já se sabe que eles são insolúveis através dos métodos de régua e
compasso pelos quais os matemáticos gregos tentavam resolvê-los. Veja “A História das Ciências Físicas” Sir James
Jeans, Capítulo 2 – Jônia e a Grécia antiga (600 a.C. – 320 a.C.).
5/141
viga com a maior rigidez requerida pelo problema, precisamos que sua seção reta retangular
apresente uma razão entre altura e base igual a √ 2 :1 . Os problemas de máximo e mínimo são
solucionados de maneira tão simples quanto aqueles problemas de traçar tangentes.
Nos vários pontos de uma linha curva que seja diferente da circunferência, a curvatura, em geral, é
diferente em cada ponto. Como poderemos calcular o raio de um círculo com a mesma curvatura de
um ponto sobre uma dada curva, isto é, com o mesmo raio de curvatura da curva neste ponto?7
Pode-se mostrar que isto é igualmente simples, basta aplicar a operação de diferenciação duas
vezes. Destaque-se que o raio de curvatura desempenha um importante papel em muitas questões da
mecânica.
Antes da invenção dos novos métodos de cálculo, só era possível calcular a área de polígonos, do
círculo ou de um setor ou segmento do círculo, e de outras duas ou três figuras. Além disto,
Arquimedes tinha desenvolvido anteriormente uma maneira de calcular a área do segmento de uma
parábola. O método extremamente engenhoso que ele utilizou neste problema estava baseado em
propriedades especiais da parábola e consequentemente passava a ideia que todo novo problema
relacionado com o cálculo de área provavelmente necessitaria de um método particular de
investigação mais engenhoso e difícil do que aquele usado por Arquimedes. Desta maneira os
matemáticos ficaram muito felizes quando surgiu o teorema de Newton e Leibnitz que demonstrava
ser o inverso do problema das tangentes a solução para o problema de quadratura. Isto propiciava
um método para cálculo de áreas limitadas por curvas de uma variedade enorme de tipos. Assim
ficou claro que existia um método geral adequado para cálculo da área de um número infinito de
figuras diferentes. A mesma observação era também verdade para volume, superfícies,
comprimentos de curvas, massa de corpos heterogêneos, e assim por diante.
Os novos métodos impulsionaram ainda mais a mecânica. Parecia que não havia problemas
mecânicos que os novos cálculos não pudessem clarificar e resolver.
Pouco antes, Pascal tinha explicado o aumento do vácuo de Toricelli com a altitude como
consequência do decrescimento da pressão atmosférica. Mas qual seria a lei que governava este
decrescimento? Esta questão é imediatamente respondida investigando uma simples equação
diferencial.
Sabe-se que os marinheiros devem dar duas ou três voltas com o cabo de atracação em volta do
cabrestante8 para que um homem seja capaz de manter um grande navio atracado no berço. Mas por
que isto deve ser assim? Pode-se demonstrar que do ponto de vista matemático este problema é
quase idêntico ao precedente e é solucionado facilmente.
Assim, após a criação da análise matemática seguiu-se um período profícuo de desenvolvimento de

suas aplicações nos mais variados ramos da tecnologia e ciências naturais. Como ela é
fundamentada na abstração de características especiais de um problema em particular, a análise
matemática reflete as propriedades mais intrínsecas do mundo material. Esta é a razão pela qual ela
fornece os meios adequados para investigação de um leque tão grande de questões práticas. O
7 N. T. - Para definição de raio de curvatura veja “Differential Geometry”, Erwin Kreyszig, Capítulo 2, Seção 12. Vale
ressaltar que o raio de curvatura de uma linha reta é infinito, enquanto o raio de curvatura de uma circunferência é
constante.
8 N. T. - Cabrestante: Cilindro horizontal móvel, acionado por manivela ou por motor, e em volta do qual se enrolam
cordas ou cabos de aço, providos geralmente de cadernal, para levantar grandes pesos ou âncoras de navio.
6/141
movimento mecânico de um corpo sólido, o movimento de líquidos e gases e em especial de suas

partículas, as leis do escoamento da massa de um fluído, a condução do calor e da eletricidade, a
evolução de uma reação química, todos estes fenômenos são estudados nas ciências
correspondentes pelo método da análise matemática.
Ao mesmo tempo em que suas aplicações se alargavam, o próprio objeto da análise matemática
estava sendo continuamente enriquecido com a criação e desenvolvimento de novas subdivisões tais
como a teoria das séries, aplicações da análise em geometria, e a teoria das equações diferenciais.
Entre os matemáticos do século XVIII havia uma opinião largamente difundida de que qualquer
problema das ciências naturais poderia ser solucionado por meio da geometria analítica e do cálculo
diferencial e integral, desde que se encontrasse a descrição matemática correta do problema.
Em geral, os matemáticos avançam gradualmente dos problemas mais simples das ciências naturais
e tecnologia para os mais complicados, e isto demanda um desenvolvimento contínuo de seus
métodos. Para solucionar estes problemas torna-se necessário criar outros ramos da matemática, por
exemplo: cálculo variacional, teoria das funções de variáveis complexas, teoria dos campos,
equações integrais, e análise funcional. No entanto, todos estes novos métodos de cálculo foram
essencialmente extensões imediatas e generalizações de métodos notáveis descobertos no século
XVII. Os grandes matemáticos do século XVIII, David Bernoulli (1700 – 1782), Leonard Euler
(1707 – 1783) e Lagrange (1736 – 1813) que difundiram os novos caminhos da ciência,
constantemente tomavam como ponto de partida os problemas fundamentais das ciências exatas.
Este desenvolvimento fecundo da análise matemática continuou no século XIX nas mãos de
matemáticos famosos como Gauss (1777 – 1855), Cauchy (1789 – 1857), M. V. Mikhail
Ostrogradski (1801 – 1862), Pafnuti Lvovitch Chebyshev (1821 – 1894), Riemann (1826 – 1866),
Abel (1802 – 1829), Weierstrass (1815 – 1897), todos eles fizeram contribuições importantes para o
desenvolvimento da análise matemática.
O notável matemático russo, Nikolai Ivanovich Lobachevsky (1792 – 1856), teve uma influência
decisiva no desenvolvimento de certas questões da análise matemática. Devemos mencionar
também outros proeminentes matemáticos que estavam ativos na virada do século XX, entre eles:
A. A. Markov (1856 – 1922), A. M. Lyapunov (1857 – 1918), H. Poincaré (1854 – 1912), F. Klein
(1849 – 1925), D. Hilbert (1862 – 1943).
A segunda metade do século XIX testemunhou um profundo exame crítico e esclarecimento dos
fundamentos da análise matemática. Os poderosos métodos matemáticos que tinham sido
desenvolvidos anteriormente de uma forma nem sempre bem entendida eram agora explicitados em
uma base uniforme e sistemática, satisfazendo a um avançado nível de rigor matemático. Estes
métodos constituem as ferramentas que junto com a aritmética, álgebra, geometria e trigonometria,
nos dão a interpretação matemática do mundo que nos rodeia, descrevem a evolução dos eventos
reais, e soluciona importantes problemas práticos relacionados com estes eventos.
Geometria analítica, cálculo diferencial e integral, e a teoria das equações diferenciais são estudadas
em todos os institutos técnicos, assim estes ramos da matemática são conhecidos por milhões de
pessoas. Os elementos destas ciências são também ensinados em muitas escolas técnicas; do mesmo
modo algumas questões sobre estes tópicos são introduzidas nas escolas secundárias.
Em tempo mais recente o uso generalizado de computadores que fazem milhões de cálculos por
7/141
segundo introduziu uma nova era na matemática. Estas máquinas, aliadas aos ramos da matemática
que mencionamos acima, abrem novas e instigantes possibilidades para humanidade.
Hoje a análise matemática e as ramificações que ela originou compõem uma ciência matemática de
grande diversidade, consistindo de várias disciplinas abrangentes e independentes, embora
proximamente relacionadas entre si. E cada uma destas disciplinas está sendo continuamente
desenvolvida e aperfeiçoada.
Hoje um papel muito mais significativo do que no passado é desempenhado pela análise para
atender às necessidades da vida diária, ou seja, problemas fundamentais relacionados com o
fantástico desenvolvimento da tecnologia atual. De grande importância são os problemas de
aerodinâmica em velocidades hipersônicas que estão sendo solucionados com grande sucesso.
Muitos problemas difíceis da física matemática hoje alcançaram um estágio em que podem ser
resolvido por métodos numéricos muito práticos. A física contemporânea, tais como as teorias da
mecânica quântica que estudam os problemas peculiares do microcosmo atômico, não somente
requer os ramos mais avançados da análise matemática atual para solução dos seus problemas,
como não poderia mesmo descrever seus conceitos fundamentais sem o uso da análise matemática.
A finalidade deste capítulo é dar uma apresentação menos formal adequada ao leitor familiarizado
com a matemática elementar. Aqui mostramos o desenvolvimento e as aplicações mais simples dos
conceitos básicos da análise matemática como: função, limite, derivada, e integral. Como os vários
ramos especiais da análise serão abordados em outros capítulos deste livro, o presente capítulo tem
um caráter mais elementar e o leitor que já tenha feito o primeiro curso regular de análise pode
omiti-lo sem prejuízo do entendimento do resto do livro.
2.2 Função
Conceito de uma função. Os vários objetos ou fenômenos que observamos na natureza são
organicamente conectados uns com os outros, isto é, eles são interdependentes. As mais simples
relações deste tipo são conhecidas a muito tempo pelo homem e as informações sobre elas foram
coligidas e formuladas como leis da física. Estas leis indicam que as várias grandezas que
caracterizam um dado fenômeno são tão proximamente relacionadas entre elas que algumas delas
são completamente determinadas pelos valores das outras. Por exemplo, o comprimento dos lados
de um retângulo determina completamente sua área, o volume de uma dada quantidade de gás em
uma dada temperatura é determinado pela pressão do gás, enquanto o alongamento de uma haste
metálica é determinado por sua temperatura. Foram uniformidades deste tipo que originaram o
conceito de função.
Imagine uma fórmula algébrica em que associando valores numéricos a cada grandeza literal
presente na fórmula encontramos o valor da grandeza expressa por esta fórmula. Esta é a ideia
básica de uma função. Consideraremos agora alguns exemplos de funções expressos por fórmulas.
Exemplo 1. Suponha que em determinado instante de tempo t=0 um ponto material que estava
em repouso começou a cair como resultado da ação da gravidade. Então a distância s percorrida
pelo ponto no tempo t é expressa pela fórmula:
8/141
g t2
s= (1).
2
Onde g é a aceleração da gravidade.
Fig. 2
Fig. 3
Exemplo 2. Com um quadrado de lado a construímos uma caixa retangular com altura x, veja Fig.
2. O volume V da caixa é calculado pela fórmula:
V = x (a−2 x)2 (2).
A fórmula (2) nos permite encontrar o volume da caixa para toda altura x sujeita a restrição:
a
0≤x≤ .
2
9/141
Exemplo 3. Seja um poste de iluminação erguido no centro de uma arena de patinação de gelo
circular com uma luminária na altura h; veja Fig. 3. A intensidade luminosa na borda do círculo
pode ser expressa pela fórmula:
A sen (α )
T= (3).
h 2+ r 2
h
Onde r é o raio do círculo, tan (α )= , e A é certa grandeza que caracteriza a potência luminosa
r
da luminária. Se a altura h da luminária for conhecida podemos calcular T pela fórmula (3).
Exemplo 4. Seja a equação quadrática:
x 2 + p x−1=0 (4).
Suas raízes são dadas pela fórmula:
p
x=− ± 1+
2 4√
p2 (5).
O aspecto característico das fórmulas em geral e dos exemplos em particular que demos acima é
que elas nos permite para um dado valor de uma das variáveis que chamamos de variável
independente (por exemplo, o tempo t, a altura da caixa x, a altura da luminária h, o coeficiente p da
equação quadrática) calcular o valor da outra variável que é chamada de variável dependente ou
função de uma variável (isto é, a distância s, o volume V, a intensidade luminosa T, a raiz da
equação x).
Cada uma das fórmulas introduzidas acima é um exemplo de função: a distância s percorrida pelo
ponto é uma função do tempo t; o volume V da caixa é uma função da altura x; a iluminação T na
borda da arena é uma função da altura do poste h; as duas raízes da equação quadrática (4) são
funções do coeficiente p.
Deve ser observado que em alguns casos a variável independente pode assumir qualquer valor
numérico desejado como no Exemplo 4 onde o coeficiente p da equação quadrática (4) pode ser
qualquer número arbitrário. Em outros casos a variável independente toma valores arbitrários dentro
de algum conjunto (ou coleção) de números determinado antecipadamente. Este é o caso do
Exemplo 2, onde o volume da caixa é uma função da sua altura x que pode assumir qualquer valor
a
do conjunto numérico satisfazendo a desigualdade 0 ≤ x < . Do mesmo modo, no Exemplo 3
2
a intensidade luminosa T na borda da arena é uma função da altura da luminária que teoricamente
pode assumir qualquer valor satisfazendo a desigualdade h > 0 . Mas na prática h deve obedecer
a desigualdade 0 < h ≤ H , onde H é determinado pelas características construtivas da edificação
da arena.
Agora introduziremos outros exemplos do mesmo tipo. Seja a fórmula:
10/141
y=√ 1−x 2 .
Esta fórmula determina uma função real, isto é, expressa uma relação entre os números reais x e y,
somente para aqueles valores de x que satisfazem as desigualdades −1≤x ≤+ 1 , por outro lado, a
fórmula y=log(1−x 2 ) é uma função real apenas para os valores de x que satisfazem as
desigualdades −1< x <+1 .
Então fica claro que é necessário levar em conta o fato que as funções eventualmente podem não ser
definidas para todos os valores numéricos da variável independente, mas somente para aqueles
valores pertencentes a determinados conjuntos. Muitos destes conjuntos frequentemente
correspondem a algum intervalo do eixo dos x com ou sem seus pontos extremos.
Agora estamos em condições de dar a definição da matemática moderna do que é uma função.
A grandeza y (dependente) é uma função da grandeza x (independente) se existe uma regra que
para cada valor de x pertencente a um certo conjunto de números corresponde um valor bem
definido de y.
O conjunto de valores de x aparecendo nesta definição é chamado de domínio da função.
Todo conceito novo enseja a introdução de um novo simbolismo. A transição da aritmética para
álgebra foi possível pela construção de fórmulas que eram válidas para números arbitrários. A
pesquisa por soluções mais gerais destas fórmulas deu origem ao simbolismo literal da álgebra.
O problema da análise é o estudo das funções, ou seja, da relação de dependência de uma variável
para outra. Consequentemente, do mesmo modo como a transição para álgebra ocorreu a partir de
números bem específicos para números arbitrários mais gerais indicados por letras, na análise
também houve uma transição correspondente de fórmulas específicas para fórmulas arbitrárias. A
frase “y é uma função de x” é escrita convencionalmente como:
y= f ( x ) .
Da mesma maneira que letras diferentes são usadas para indicar números diferentes, na análise
usamos notações diferentes para indicar diferentes tipos de dependência entre variáveis, isto é, para
indicar funções diferentes. Assim, escrevemos: y=F (x ) , y=ϕ ( x) , ⋯ .
Gráficos de funções. Uma das ideias mais fecunda e brilhante da segunda metade do século XVII
foi a ideia de se relacionar o conceito de função e a representação geométrica de uma linha. Esta
inter-relação pode ser exemplificada por meio de um sistema de coordenadas cartesianas que o
leitor, de uma maneira geral, certamente deve estar familiarizado do seu curso de matemática da
escola secundária.
Vamos construir no plano um sistema retangular de coordenadas cartesianas. Isto significa que
devemos escolher no plano duas retas ortogonais (o eixo das abcissas e o eixo das ordenadas), e
sobre cada uma delas assinalamos uma direção positiva. Com isto para cada ponto M do plano
atribuímos dois números (x , y) que são as coordenadas do ponto. Estes números expressam em um
dado sistema de medida a distância do ponto M ao eixo das ordenadas e ao eixo das abcissas
11/141
respectivamente, tomados com o sinal apropriado.9
Com tal sistema de coordenadas podemos representar as funções graficamente na forma de certas
linhas. Suponha que nos é dada uma função:
y= f ( x ) (6).
Como sabemos isto significa que para todo valor de x pertencente ao domínio de definição da
função dada é possível determinar de alguma maneira, por exemplo, através de cálculos, um valor
correspondente de y. Suponha que x tome todos os valores numéricos do domínio da função, e para
cada valor de x determinamos o valor de y de acordo com a regra definida por (6). Daí, construímos
no plano os pontos com coordenadas x e y obtidas desta maneira. Assim, para todo ponto M’ sobre o
eixo x (veja Fig. 4) existirá um ponto correspondente M com coordenadas x e y= f ( x ) . O
conjunto de todos os pontos M forma certa linha que chamamos de gráfico da função y= f ( x ) .
Fig. 4
Fig. 5
Desta forma o gráfico da função f (x ) é o lugar geométrico dos pontos cujas coordenadas
satisfazem a equação (6).
Na escola nos familiarizamos com gráficos de funções bem simples. Assim é provável que o leitor
reconheça que a função y=k x +b , onde k e b são constantes, é o gráfico de uma linha reta
formando um ângulo α com a direção positiva do eixo dos x, onde tan (α )=k e o ponto (0, b) é a
interseção da reta com o eixo dos y. Esta função é chamada de uma função linear. Veja Fig. 5.
9 O número x é a abcissa e y é a ordenada do ponto M.
12/141
A função linear ocorre frequentemente em muitas aplicações. Lembramos que muitas leis da física
são representadas com considerável precisão por funções lineares. Por exemplo, o comprimento l de
um corpo pode ser considerado com boa aproximação como uma função linear de sua temperatura t.
Assim, escrevemos:
l=l 0 +α L 0 t .
Onde na equação acima α é o coeficiente de dilatação linear do material do corpo, e l 0 é o

comprimento do corpo para t=0 .10 Um segundo exemplo: Se x é o tempo e y a distância
percorrida por um ponto em movimento, então a função linear y=k x +b obviamente expressa o
fato que o ponto se move com velocidade uniforme k, e o número b denota a distância no tempo
x=0 do ponto a um ponto fixo de referência de onde medimos nossas distâncias. As funções
lineares são extremamente úteis devido a sua simplicidade e também porque é possível se
considerar mudanças não uniformes como sendo aproximadamente lineares mesmo que seja apenas
para pequenos intervalos da variável independente.
Fig. 6
Mas em muitos casos é necessário fazer o uso de uma dependência funcional não linear.
Recordemos por exemplo a lei de Boyle-Mariotte que relaciona o volume v de um gás com a sua
pressão absoluta p:11
10 N. T. - Lembrando que, em geral, o zero de uma escala de temperatura qualquer está associado a algum valor de uma
escala absoluta de temperatura, isto é, nas escalas baseadas no conceito termodinâmico de temperatura. Por
exemplo, na escala Celso a temperatura 0 ºC corresponde a 273,15 °K.
11 N. T. - A pressão absoluta é aquela medida numa escala de pressão em que o zero da escala é o vácuo perfeito,
13/141
c
v= .
p
Na equação acima a grandeza p e v são inversamente proporcionais. O gráfico de uma relação como
esta é representado por uma hipérbole (veja Fig. 6).
A equação acima que expressa a lei física de Boyle-Mariotte se aplica apenas para o caso em que p
e v são positivos. Ela é representada, portanto, pelo ramo da hipérbole que fica no primeiro
quadrante da Fig. 6.
A classe geral dos processos oscilatórios inclui os movimentos periódicos, os quais usualmente são
descritos pelas funções trigonométricas que estamos familiarizados. Por exemplo, se uma mola está
posicionada na vertical e a distendemos afastando da sua posição de equilíbrio, então, desde que
permaneçamos dentro dos limites de elasticidade da mola, um ponto A sobre a mola descreverá uma
oscilação vertical que pode ser expressa com muita precisão pela lei:
x=a cos ( p t + α ) .
Onde x é o deslocamento vertical do ponto A em relação a sua posição de equilíbrio, t é o tempo, e

os números a, p e α são certas constantes determinadas pelo material, dimensões, e alongamento
inicial da mola.
Fig. 7
Deve se ter em mente que uma função pode ser definida em vários domínios por fórmulas diferentes
determinadas pelas circunstâncias aplicáveis ao caso. Por exemplo, a relação Q= f (t) entre a
temperatura de um grama de água (ou gelo) e a quantidade de calor Q contida nesta massa d’água
quando t varia entre -10 °C e +10 °C é uma função bem determinada, mas difícil de se expressar
portanto, a medida p da pressão do gás será sempre um número positivo.
14/141
com uma única fórmula.12 Entretanto, é fácil representá-la com duas fórmulas. De fato, desde que o
calor específico do gelo é 0,5 e da água é igual a 1, se assumirmos que Q=0 em -10 °C, esta
função pode ser representada por duas fórmulas como:
• Q=0,5 t +5 para t variando no intervalo −10 ° C ≤ t < 0° C .
• Q=t+85 para t variando no intervalo 0 ° C < t ≤ +10 ° C .
Observe que para t=0 esta função é indefinida, ou seja, ela assume múltiplos valores. Por
conveniência, eventualmente, poderíamos assumir que em t=0 ela tomaria um valor bem
definido, por exemplo, f (0)=45 . O gráfico da função Q= f (t) está mostrado na Fig. 7.
Introduzimos até aqui muitos exemplos de funções dadas por fórmulas. A possibilidade de
representar uma função por meio de fórmulas é extremamente importante do ponto de vista
matemático, com efeito, estas fórmulas nos dão condições muito favoráveis de investigar as
propriedades das funções usando métodos matemáticos.
Mas não devemos imaginar que a fórmula é o único método de definir uma função. Existem muitos
outros métodos; por exemplo, o gráfico de uma função, que nos dá uma descrição geométrica visual
da função. O exemplo a seguir também nos dá uma boa ilustração de outro método.
Para registrar a variação da temperatura do ar durante um período de 24 horas, as estações

meteorológicas usam um instrumento chamado termógrafo. Um termógrafo consiste em um tambor
que gira em torno de um eixo acionado por uma engrenagem de relógio, e um mecanismo curvado
de latão que é extremamente sensível às mudanças de temperatura. Deste modo, uma pena presa ao
mecanismo por um sistema de alavancas sobe quando a temperatura aumenta e, ao contrário, desce
quando a temperatura diminui. No tambor está enrolado uma tira de papel gráfico sobre a qual a
pena traça uma linha contínua formando o gráfico da função: T = f (t ) . Esta função expressa a
interdependência entre o tempo e a temperatura do ar. Deste gráfico podemos determinar, sem
necessidade de cálculos, o valor da temperatura do ar em qualquer instante de tempo t.
Este exemplo nos mostra que um gráfico determina ele próprio uma função, independentemente se
esta função é dada por uma fórmula ou não.
Incidentalmente, retornaremos a esta questão no Capítulo XII e provaremos o seguinte enunciado

importante: Todo gráfico contínuo pode ser representado por uma fórmula, ou, como se costuma
dizer, por uma expressão analítica. Este enunciado é também verdadeiro para muitos gráficos
descontínuos.13
Lembramos que este enunciado, que tem uma grande importância teórica, somente foi estabelecido
completamente na metade do século XIX. Até esta época os matemáticos entendiam pelo termo
“função” apenas uma expressão analítica (fórmula). Eles equivocadamente imaginavam que muitos
gráficos descontínuos não correspondiam a nenhuma expressão analítica, pois assumiam que se
uma função fosse dada por uma fórmula, então seu gráfico deveria possuir certas propriedades
12 Isto não significa dizer que tal expressão é impossível. No capítulo XII mostraremos como representar esta função
usando apenas uma fórmula.
13 Naturalmente o enunciado acima só será completamente claro para o leitor depois de darmos uma definição precisa
do significado exato em matemática para os termos “fórmula” e “expressão analítica”.
15/141
particularmente desejáveis em comparação com outros gráficos.
No século XIX, descobriu-se que todo gráfico contínuo poderia ser representado por uma fórmula
mais ou menos complicada. Assim, o papel excepcional das expressões analíticas como meio de
definição de funções ficou enfraquecido e surgiu uma nova definição mais flexível para o conceito
de função. Esta é a definição que demos acima. Por esta definição uma variável y é chamada uma
função da variável x se existir uma regra pela qual todo valor de x no domínio de definição da
função corresponde um valor bem determinado de y, isto independentemente da maneira como esta
regra é estabelecida: fórmula, gráfico, tabela, ou qualquer outra.
Devemos mencionar aqui que na literatura matemática a definição de função dada acima é
frequentemente associada com o nome do matemático alemão Peter G. L. Dirichlet (1805 – 1859),
mas é digno de se enfatizar que esta definição foi dada simultaneamente e de forma independente
pelo matemático russo N. I. Lobachevsky. Finalmente, sugerimos como exercício que o leitor faça
π
( )
os gráficos das seguintes funções: x 3 , √ x , sen ( x ) , sen (2 x ) , sen x+ 4 , ln( x) ,
( x +|x|)
ln (1+ x) , |x−3| , .
2
Devemos também observar que o gráfico de uma função em que todos os valores de x satisfazem a
relação f (x )= f (−x ) é simétrico com respeito ao eixo dos y. Por outro lado, uma função em
que a relação f (−x )=− f (x ) é satisfeita para todo x possui um gráfico simétrico com respeito
a origem do sistema de coordenadas. Também como exercício considere de que maneira podemos
obter o gráfico da função f (x +a ) a partir do gráfico de f (x ) , quando a é uma constante.
Finalmente, encontre como podemos usar os gráficos das funções f (x ) e ϕ ( x) para
encontrar os valores da função composta y= f [ ϕ ( x )] .
2.3 Limites
Na Seção 2.1 foi mencionado que a análise matemática moderna usa um método especial, que foi
desenvolvido ao longo de muitos séculos e hoje serve como seu instrumento básico. Estamos
falando aqui do método dos infinitesimais, ou, o que é essencialmente a mesma coisa, o método dos
limites. Tentaremos agora dar algumas ideias destes conceitos. Com este propósito consideraremos
o exemplo a seguir.
Suponha que desejamos calcular a área delimitada por: uma parábola cuja equação é y=x 2 , pelo
eixo dos x, e pela linha reta x=1 . Veja Fig. 8. A matemática elementar não nos fornece meios
para solucionar este problema, mas aqui está a maneira como devemos proceder.
Dividimos o intervalo [0, 1] ao longo do eixo dos x em n partes iguais nos pontos:
1 2 n−1
0, , ,⋯, ,1 .
n n n
Em cada um destes intervalos construímos um retângulo cujo lado esquerdo se prolonga até a
parábola.
16/141
Fig. 8
Com isto obtemos o sistema de retângulos sombreados da Fig. 8. A soma Sn destas áreas é dada
por:
( )( ) ( ) ( )
2 2 2 2 2 2
1 1 1 2 1 n−1 1 1 +2 +⋯+(n−1) (n−1) n(2 n−1) 14
Sn = 0 + + +⋯+ = 3
= .
n n n n n n n n 6 n3
14 Para provar que a soma dos quadrados dos k primeiros números naturais, k = 1 ,2 ,⋯ ,(n−1) , vale:
2 2 2 2 2 2 ( n−1) n( 2n−1)
1 +2 +⋯+k = = 1 +2 +⋯+( n−1) = .
6
Inicialmente tomamos a identidade:

3 3 3 2 3 2
(k +1) −k = k + 3k +3k +1− k = 3 k +3 k +1 .
Para diferentes valores k = 1 ,2 ,⋯ ,(n−1) , somamos separadamente os lados esquerdo e direito.
Observamos que o somatório das expressões do lado esquerdo é uma soma telescópica, isto é, ela se reduz a soma da
n −1
primeira e da última parcela: ∑ (b k+1 −b k) = bn−b1 . Veja “Cálculo, con funciones de una variable, con una
k =1
introducción al álgebra lineal”, Tom M. Apostol, Volume I, Capítulo 10, Seção 10.7, página 472 [496]. Adicionando
o lado esquerdo e fazendo as simplificações obtemos:
⏟ ⏟ −2 +⋯+(⏟
n−2+ 1) −( n−2) +(⏟
3 3 3 3 3 3 3 3 3
(1+ 1) −1 +(2+1) n−1+1) −( n−1) = n −1
.
23 33 ( n−1 )3 n3
Para o lado direito, fica:
17/141
Agora expressamos S n na seguinte forma:
Sn =
n3 3 n 2 n
3
1
− 3+ 3 = +
3n 6 n 6n 3 ⏟
1
2
−
6n 2 n
1 1
= +α n
3 ( ) (7).
αn
Na equação (7) a quantidade 1 1 que depende de n tem uma forma bastante

− αn =
6n 2n
2
complicada, entretanto ela possui certa propriedade que a torna importante: Se n cresce além de
todos os limites, então α n se aproxima de zero. Esta propriedade pode ser expressa da seguinte
3( n−1) n
⏟ ⏟ ⏟ = 3σ n +
2 2 2
3(1 +2 +⋯+( n−1) ) +3(1+2+⋯+( n−1)) +1+1+⋯+1 +( n−1)
σn
2 .
( n−1 )n (n −1)
2
2 2 2
Daí, tirando o valor de σ n = 1 +2 +⋯+(n−1) , escrevemos:
2 2
3(n−1) n 3n −3n 3n n
n 3−1 = 3 σ n + +(n −1) → 3 σ n = n 3− − n = n3− + ,
2 2 2 2
3 2 3 2 3 2 2 2
n 3n n 2 n −3n + n 2 n −2 n −n + n 2n ( n−1)−n(n−1)
σn= − + = = = ,
3 6 6 6 6 6
2 2
2n ( n−1)−n( n−1) ( n−1)(2n −n) (n−1) n(2 n−1)
σn= = = .
6 6 6
Portanto:
( n−1)n(2 n−1)
σn= .
6
Outra maneira de se provar esta identidade é através do processo de indução matemática. Veja “Cálculo, con
funciones de una variable, con una introducción al álgebra lineal”, Tom M. Apostol, Volume I, Introdução, Parte IV,
página 40 [64]. Com efeito para demonstrar que a soma dos quadrados dos k primeiros números naturais,
k = 1,2 ,⋯,( n−1) é dada pela expressão abaixo, procedemos do seguinte modo:
2 2 2 2 2 2 ( n−1)n( 2n−1)
σ k = 1 +2 +⋯+k = = 1 +2 +⋯+( n−1) = .
6
Inicialmente provamos que esta expressão é válida para k = 1 , isto é:
k = ( n−1) = 1 → n = k +1 = 1+1=2 .
Então, substituindo o valor n=2 na fórmula, temos:
2 (2−1) 2(2×2−1)
σ 1= 1 = =1 .
6
Portanto, a fórmula é válida para k = 1 . Agora assumimos que se a fórmula for válida para (k −1) isto
implica na expressão que se deseja provar. Para os (k −1) primeiros números naturais devemos substituir na
fórmula n por (n−1) . Daí, tiramos:
18/141
maneira: Se for dado um número positivo arbitrário ϵ , então é possível escolher um inteiro N
suficientemente grande tal que para todo n maior que N o número α n será menor que ϵ em
valor absoluto.15
A quantidade α n é um exemplo de um infinitesimal no sentido em que esta palavra é usada na

matemática moderna.
Da Fig. 8 vemos que se aumentarmos o número n além de todos os limites, a soma das áreas dos
retângulos sombreados S n se aproximará da área desejada da figura curvilínea. Por outro lado, a
equação (7), tendo em vista o fato que α n se aproxima de zero quando n aumenta além de todos
1
os limites, mostra que a soma S n ao mesmo tempo se aproxima de . Disto segue que a área
3
2 2 2 2 2 2 ( n−2)( n−1)(2(n−1)−1)
σ k−1 = 1 +2 +⋯+(k −1) = 1 +2 +⋯+(n− 2) = ,
6
2
(n− 2)(n−1)( 2( n−1)−1) (n−2)( n−1)(2 n−3) ( n −n− 2n+2)(2n−3)
σ k−1 = = = ,
6 6 6
2
(n −3n+ 2)( 2n−3) 2n 3−3 n 2−6 n2+ 9n+4n−6 2 n3−9n2 +13 n−6
σ k−1 = = = .
6 6 6
2 2
Mas, pela hipótese, temos que σ k = σ k −1 +k = σ k−1+( n−1) . Então, escrevemos:
( 2 n −9n6+13 n−6 )+( 6 n −126 n+6 ) = 2n −36 n +n

3 2 2 3 2
2
σ k = σ k −1 +(n−1) = .
Finalmente:
3 2 2 2
2 n −2n −n +n 2n ( n−1)−n(n−1) (n−1) n(2 n−1)
σk= = = .
6 6 6
15 Por exemplo, se ϵ = 0,001 podemos tomar N = 500 . De fato, sabemos que para qualquer n inteiro positivo
1 1
vale a desigualdade < (n−1) . Assim:
6n 2 2 n . Isto pode ser visto facilmente desenvolvendo o quadrado de
2 2 2
(n−1) = n −2n +1 ≥ 0 → n ≥ 2n−1 .
Daí, temos:
1 1 1 1 1 1 1 1
≤ < → > 2> → <
n 2 2n−1 2 n 2 n n 6n 2
6n 2 2 n .
Então, para um n arbitrário qualquer, tal que n > 500 , podemos escrever:
|α n| = |61n − 2n1 |= 21n − 6n1 < 2n1 < 21N = 2×500

2 2
1
= 0,001 .
Da mesma maneira, seria possível arbitrar outros pequenos valores ϵ , por exemplo: ϵ 1 = 0,0001 ,
ϵ 1 = 0,00001 , … , etc., e para cada um deles escolher valores apropriados, N = N 1 , N 2 ,⋯ como fizemos
acima.
19/141
1
S que procuramos é igual a , e com isto resolvemos nosso problema.
3
Assim, o método em discussão pode ser resumido do seguinte modo. De maneira a encontrar certa
quantidade S, nós introduzimos outra quantidade Sn, isto é, uma quantidade variável que se
aproxima de S através de valores particulares S1, S2, S3,… , que depende de alguma lei definida
sobre os números naturais n = 1 , 2 , … . Então, do fato que Sn pode ser representada pela soma
1
de uma constante e um infinitesimal α n , concluímos que Sn aproxima-se do valor , e,
3
1
portanto, S é igual a . Na linguagem moderna da teoria dos limites dizemos que quando n
3
1
cresce a quantidade variável Sn aproxima-se de um valor limite, que neste caso é .
3
Daremos agora uma definição precisa dos conceitos introduzidos aqui. Se uma quantidade variável
αn (n = 1 , 2 ,…) tem a propriedade que para todo número positivo arbitrariamente pequeno
ϵ é possível se escolher um inteiro N tão grande que para todo n > N temos |α n| < ϵ ,
então dizemos que α n é um infinitesimal e escrevemos:
lim α n = 0 ou α n →0 .
n→∞
Por outro lado, se uma variável x n pode ser representada como uma soma:
x n = a +α n .
Onde a é uma constante e α n um infinitesimal, então dizemos que a variável x n , quando n

cresce além de todos os limites, aproxima-se do número a. Daí, escrevemos:
lim x n = a ou x n →a .
O número a é chamado de limite de x n . Em particular, o limite de um infinitesimal é obviamente

zero.
Consideremos agora os seguintes exemplos de quantidades variáveis para (n = 1 , 2 ,…) :
1
, 1 , (−1)n , n−1 1
= 1− , v n = (−1) .
n
xn = yn = − zn = un =
n n2 n n n
É claro que x n , y n e z n são infinitesimais. O primeiro deles se aproxima de zero com

valores positivos decrescentes, o segundo com valores negativos crescentes, enquanto que o terceiro
se aproxima de zero com valores alternados positivos e negativos. Além disto, temos que u n →1 ,
enquanto v n não tem nenhum limite, pois quando n cresce a expressão não se aproxima de
nenhum número constante, mas continua a oscilar tomando valores alternados 1 e -1.
Outro conceito importante em análise matemática é o de uma quantidade infinitamente grande que
20/141
é definida como uma variável x n com a seguinte propriedade. Dado um número positivo
arbitrariamente grande M é sempre possível se encontrar um número N tal que para todo n > N
vale a desigualdade:
|x n| > M .
Para expressar o fato que uma quantidade x n é infinitamente grande escrevemos:
lim x n = ∞ ou xn → ∞ .
Também se diz neste caso que a quantidade x n se aproxima do infinito. Quando ela é positiva ou
negativa a partir de determinado valor de n, expressamos esta situação como: x n → +∞ e
x n → −∞ respectivamente. Por exemplo, para n = 1 , 2 , … , escrevemos:
1
lim n2 = +∞ , lim (−n)3 = lim (−n 3) = −∞ , lim log 1 =−∞ , lim tan π + = −∞ .
n 2 n ( )
Pode se observar facilmente que se uma quantidade αn é infinitamente grande, então
1 é infinitamente pequena e vice-versa.
β=
αn
Duas quantidades x n e y n podem ser adicionadas, subtraídas, multiplicadas e dividida uma

pela outra resultando em novas quantidades que em geral são também variáveis, ou seja, obtemos
como resultado a soma x n + y n , a diferença x n− y n , o produto ( x n y n ) , e o quociente
( )
xn
yn
das quantidades x n e y n . Então os valores particulares destas expressões serão
dados por:
x 1± y 1 , x 2± y 2 , x 3± y 3 , …
( x 1 y1 ) , ( x 2 y 2) , ( x 3 y3 ) , …
( ) ( ) ( )
x1
y1
, x2
y2
, x3
y3
,…
Evidentemente é possível provar que se as variáveis x n e y n se aproximam de limites finitos

quando n cresce, então a soma, a diferença, o produto, e o quociente destas variáveis também se
aproximam de limites iguais a soma, a diferença, o produto, e o quociente dos limites das variáveis
x n e y n . Daí escrevemos:
x
lim (x n ± y n) = lim x n±lim y n ; lim (x n y n ) = (lim x n)(lim y n) ; lim n =
yn ( )
lim x n
lim y n .
Entretanto, para o caso do quociente é necessário assumir que o limite do denominador (lim y n)
21/141
não seja igual a zero. Se lim y n = 0 e lim x n ≠ 0 , então a razão entre xn e y n não terá
um limite finito, mas se aproximará do infinito.
O caso em que o numerador e denominador simultaneamente se aproximam de zero é de especial

interesse e ao mesmo tempo importante. Aqui fica impossível se estabelecer de antemão se o
quociente
( )xn
yn
se aproximará de algum limite, e, se o limite existe, qual será o valor deste
limite, pois a resposta a esta questão dependerá inteiramente da maneira como x n e y n se

aproximam de zero. Por exemplo, seja as quantidades definidas pelas expressões abaixo:
xn =
1
, 1 , (−1)n para (n = 1, 2 ,…) .
yn = zn =
n n2 n
Então, temos:
( )
yn
xn
=
1
n
→ 0 ,
( )xn
yn
=n → ∞ .
Por outro lado, a quantidade

( )
xn
zn
= (−1) evidentemente não se aproxima de nenhum limite.
n
Assim, quando temos o caso em que o numerador e o denominador de uma fração se aproximam de
zero não podemos saber o resultado de antemão usando teoremas gerais, portanto, para cada fração
deste tipo em particular é necessário que se faça uma investigação especial.
Veremos mais tarde que o problema fundamental do cálculo diferencial, que pode ser considerado
como sendo o problema de determinar a velocidade em um dado instante de tempo para um
movimento não uniforme, se reduz a determinar o limite do quociente entre duas grandezas
infinitesimais, quais sejam: o incremento na distância percorrida e o acréscimo no tempo.
Até aqui temos considerados variáveis x n tomadas sobre uma sequência de valores numéricos
x 1 , x 2 , x 3 , … x n , … , em que o índice n percorre a sequência dos números naturais
n = 1, 2, 3,… . Entretanto, é possível considerar o caso em que n varia continuamente, por
exemplo, como o tempo, e aqui determinar também o limite da variável x n . As propriedades de
tais limites são completamente análogas àquelas formuladas anteriormente para o caso das
variáveis discretas, isto é, descontínuas. Também notamos que não existe nenhum significado
especial no fato de n crescer além de todos os limites. Ademais é igualmente possível se considerar
o caso em que n variando continuamente se aproxima de algum valor especificado n 0 .
(sen x)
A título de exemplo investigaremos a variação da quantidade quando x se aproxima de
x
zero. A Tabela 1 mostra o valor desta quantidade para certos valores de x.
22/141
Tabela 1
x (sen x)
x
0.50 0.9589 …
0.10 0.9983 …
0.05 0.9996 …
… …
Na tabela acima os valores de x são tomados em radianos.
Fig. A1
(sen x)
Fica claro da Tabela 1 que quando x se aproxima de zero a quantidade se aproxima de 1.
x
Naturalmente, devemos dar ainda uma prova rigorosa para este fato. Esta prova pode ser obtida, por
exemplo, da seguinte desigualdade que é válida para todos os ângulos diferentes de zero do
primeiro quadrante:
sen x < x < tan x .
23/141
Inicialmente mostramos na Fig. A1 um círculo de raio unitário onde estão indicados as medidas que
correspondem as funções trigonométricas.
16
Lembramos que em análise a medida de ângulo é sempre feita em radianos, isto é, colocamos o
ângulo a ser medido com seu vértice no centro de um círculo de raio unitário. O comprimento do
arco de circunferência compreendido entre os lados do ângulo é sua medida em radianos. Assim um
ângulo de 180° é o mesmo que um ângulo de π radianos, um ângulo de 90° mede π radianos,
2
um ângulo de 45° mede π radianos, e um ângulo de 360° mede 2 π radianos.
4
Existe, porém, outra maneira de se definir a medida angular em radianos. Nesta definição a medida
em radiano de um ângulo é igual a duas vezes a área correspondente ao setor circular definido pelo
ângulo em um círculo de raio unitário. Portanto, na figura acima o ângulo ^ AOC de x radianos
seria igual a duas vezes a área do setor circular S AOC .
^
x = 2S^
AOC .
Com efeito, a área do setor circular S ^ AOC é igual ao comprimento do arco x vezes o raio R
dividido por 2 (fórmula semelhante a área de um triângulo).
Rx 1x x
S^
AOC
= = = → x = 2 S^
AOC .
2 2 2
Fig. A2
Por exemplo, como a área do círculo unitário é R2 π = 12 π = π , segue que a área de um

quadrante do círculo é igual a S ^
AOC
= π . Daí, a medida do ângulo que subentende o quadrante
4
de círculo fica:
16 N. T. - O texto realçado foi incorporado pela tradução, e está baseado no livro: “Introduction to Calculus and
Analysis”, Richard Courant e Fritz John, Volume I, Capítulo 1, Seção 1.3, página 50, e Seção 1.8, página 84.
24/141
x = 2S^
AOC
= 2π = π .
4 2
Que é o resultado esperado. Para provar as desigualdades comparamos as áreas dos triângulos
S Δ OAB , S Δ OAC , e a área do setor circular S ^
AOB de um círculo unitário como mostra a Fig.
A2, onde 0 < x < π .
2
Evidentemente, da Fig. A2 podemos escrever as desigualdades:
S Δ OAB < S ^
AOB
< S Δ OAC .
Ou ainda, usando a segunda definição para medida de um ângulo em radianos para expressar a área
do setor circular, temos:
1 1 1
S Δ OAB < S ^
AOB
< S Δ OAC → sen x < x < tan x .
2 2 2
1
Dividindo as desigualdades por sen x e eliminando o fator , fica:
2
x 1
1< < .
sen x cos x
Naturalmente, as desigualdades acima são válidas para 0 < |x| < π , pois temos que
2
sen (+ x ) = −sen (− x) e cos (+ x) = cos (−x ) , ou seja as desigualdades valem para o primeiro
e quarto quadrante. De fato:
(−x ) (−x ) x 1 1
= = e = .
sen (−x ) −sen x sen x cos(− x) cos x
Por outro lado, tomando o inverso dos termos das desigualdades e mudando os respectivos sinais de
desigualdades, escrevemos:
sen x
cos x < <1 .
x
sen x
Então o valor do quociente está limitado entre 1 e cos x . Mas sabemos que cos x se
x
aproxima de 1 quando x → 0 . Segue que o quociente sen x se aproxima de 1 à medida que x
x
se aproxima de 0. Isto é exatamente o limite que queríamos provar:
lim
x→ 0
( (senx x )) = 1 .
25/141
Com isto demonstramos que as nossas desigualdades são válidas tanto quando x se aproxima de
zero com valores positivos como quando esta aproximação acontece com valores negativos. Mais a
frente faremos uso deste resultado.
Agora discutiremos a seguinte questão. Uma quantidade variável pode ou não ter um limite, a
questão é se é possível dar um critério para determinar a existência de um limite para a variável.
Aqui examinaremos apenas um caso importante e suficientemente geral para o qual tal critério pode
ser dado. Suponha que uma quantidade variável x n cresça sempre, ou, pelo menos, nunca
decresça, isto é, ela eventualmente fica constante antes de voltar a crescer. Isto implica que ela
satisfaz as desigualdades:
x1 ≤ x2 ≤ x3 ≤ … .
Suponha também que nenhum de seus valores excede a determinado número M, isto é, x n ≤ M
para (n = 1, 2 ,…) . Se assinalarmos os valores de x n e o número M sobre o eixo x, veremos
que os pontos correspondentes a x n se movem para a direita ao longo do eixo x, mas
permanecem a esquerda do ponto M. Nesta situação, naturalmente, os pontos da quantidade variável
x n inevitavelmente se aproximam de certo ponto limite a que está situado à esquerda de M, ou,
quando muito, coincide com M. Quando isto acontece dizemos que o limite lim x n = a existe.
A argumentação acima tem um caráter intuitivo, mas podemos considerá-la como uma prova.
Naturalmente, na álgebra moderna uma prova completa deste fato é dada com base na teoria dos
números reais. Por exemplo, considere a quantidade variável:
( )
n
1
u n = 1+ para (n = 1, 2 ,…) .
n
Os valores iniciais de u n são respectivamente: u 1 = 2 , u 2 = 2,25 , u 3 ≈ 2,37 ,

u 4 ≈ 2,44 , … , que parecem ser crescentes. Do teorema binomial de Newton é possível provar
que este crescimento se verifica quando n cresce arbitrariamente. Além disto, é fácil demonstrar que
para todo n a desigualdade u n < 3 é válida. Consequentemente nossa quantidade variável deve
ter um limite que não é maior que 3. Veremos que este limite tem um importante papel na
matemática física e em certo sentido é a escolha natural para a base dos logaritmos de números.
Como exercício provaremos a desigualdade u n < 3 . Pelo teorema binomial de Newton a

expansão de ( x + y )n é dada por:17
() () () () () ( )x
n n n n n n
( x + y )n = x n −0 y 0 + x n−1 y 1 + x n−2 y 2 + x n−3 y 3 +⋯+ x n− j y j +⋯+ n−n
yn .
0 1 2 3 j n
( )
n
Aplicando este resultado ao binômio 1 , fica:
1+
n
17 N. T. - Veja “Mathematics of Choice or How to Count without Counting”, Ivan Morton Niven, Capítulo 3, Seção
3.4, página 36 [47].
26/141
( ) = ( )( ) ( )( ) ( )( ) ( )( ) 1 +( )( ) 1 +( )( )
n n−0 n−1 n−2 2 1
1 n
1 0
n
1 1
n
1 2
n
1 2
n
1 1
n
1 0 n .
1+ 1+ 1+ 1 +⋯+ 1
n 0 n 1 n 2 n n−2 n n−1 n n n
()
n
Onde o símbolo representa o número de combinações de n objetos p a p. As vezes se usa
p
também a notação C (n , p) . Assim, temos a fórmula:
( ) = C ( n , p) = p!( n−n! p)!

n
.
p
( )
n
Substituindo na expansão de 1 , obtemos:
1+
n
( ) = n(n−1)(n!0!n−2)⋯1 ( n1 )+ n(n−1)(n−2)⋯1 ( n )
n
1 1
1+ +
n (n−1)!1! n n−1
.
n( n−1)(n−2)⋯1 1
(n−2)!2! ( n ) 2! n n )+1
+⋯+
n (n−1) 1
+ n (
n−2
1
2
Ou ainda:
( ) = n!1 (⏟
1− )(1− )⋯(1− ) ( 1− )(1− )⋯(1−
n )
n
1 1 2 n−1 1 1 2 n−2
1+ + +
n n n n (n−1)! ⏟ n n
<1 <1 .18
1
1−
(n−2)! ⏟
1
n ( )( ) (
2
1− ⋯ 1−
n
n−3
n
+⋯+
1 1
1− +1+1
2! ⏟ n ) ( )
<1 <1
Na equação acima assinalamos as expressões que são menores que a unidade. Com isto, podemos
escrever a seguinte desigualdade:
( ) ≤ n!1 + ( n−1)!
n
1 1 1 1 1 1 1 1 1 1
1+ + +⋯ + +1+1 ≤ + + +⋯ + 1 +1+1 .
n (n−2)! 3! 2! 2 2 n−1 n−2
2n−3 2
2 2
Reescrevemos agora esta desigualdade na forma:
( ) [ ]
n n
1 1 1 1 1 1−(1 /2)
1+ ≤ 1+ 1+ 1 + 2 +⋯ n −2 + n −1 = 1+ .
n 1
⏟ 2 2 2 2 1−
soma n termos de uma pg. 2
Na expressão acima usamos o fato que a soma dos n primeiros termos de uma progressão
geométrica é igual a:
18 N. T. - Veja “Introduction to Calculus and Analysis”, Richard Courant e Fritz John, Volume I, Capítulo 1, Seção 1.7,
página 79.
27/141
S n = 1+r + r 2 +⋯+ r n−1 = 1+ r ⏟

(1+r + r 2 +⋯+ r n−2 ) = 1+r (S n−r n−1 )
n−1
,
S n−r
n 1−r n
S n (1−r ) = 1−r → S n = .
1−r
1
Onde a razão da progressão é igual a: r= < 1 . Se fizermos o número de termos da progressão
2
geométrica tender para infinito, temos:
1 1 .
r= < 1 → lim S n =
2 n→∞ ( 1−r )
Daí, fica:
( ) 1−(1 /2) n
n
1 1
u n = 1+ ≤ 1+ < 1+ =3
n 1 1
1− 1−
2 2
Com isto provamos a desigualdade u n < 3 .
É usual indicar o limite lim un pela letra e. Ele é igual a:

n→∞
( ) = 2,718281828459045⋯
n
1
e = lim u n = lim 1+ .
n →∞ n →∞ n
Uma análise mais detalhada mostrará que e não é um número racional.19
Também é possível mostrar que o limite em consideração existe e é igual a e não somente quando n
tende para mais infinito, n → +∞ , mas também quando n tende para menos infinito, n → −∞ .
Além disso, nos dois casos n pode assumir valores diferentes dos números inteiros.
Mencionaremos agora uma importante aplicação na física do conceito de um limite. Esta aplicação
se deve ao fato notável que somente usando o conceito de limite, isto é, o processo de passagem ao
limite, é possível para nós dar uma definição de muitas grandezas concretas encontradas na física.
Considere também o seguinte exemplo geométrico. Na geometria elementar as primeiras figuras

estudadas são aquelas delimitadas por segmentos de reta. Em seguida surge um problema mais
difícil que é encontrar o comprimento de uma circunferência pertencente a um círculo com raio
conhecido.
Se analisarmos as dificuldades associadas com a solução deste problema, encontraremos que elas se
19 Com relação a isto devemos notar que as operações de adição, subtração, multiplicação, e divisão (excluindo a
p
divisão por zero) com números racionais, isto é, números da forma , onde p e q são números inteiros, leva
q
sempre a números racionais. Mas este não é necessariamente o caso para a operação de se achar um limite. Vale
dizer: O limite de uma sequência de números racionais pode ser um número irracional.
28/141
reduzem ao seguinte. Inicialmente devemos dar um significado para o comprimento da

circunferência, isto é, devemos dar uma definição precisa deste comprimento. Aqui é essencial que
a definição seja dada em termos dos comprimentos de segmentos de reta, e também que ela nos
faculte a possibilidade de efetivamente calcular o comprimento da circunferência.
Naturalmente, fica subentendido que o resultado deste cálculo deve estar de acordo com a
experiência prática. Por exemplo, se considerarmos a circunferência de um anel formado por um fio
metálico, então, se o cortarmos e distendê-lo, a medida do comprimento do fio distendido deve
coincidir, dentro dos limites da precisão das medidas, com o comprimento calculado.
Da geometria elementar sabemos que a solução deste problema se reduz a seguinte definição. O
comprimento de uma circunferência é definido como sendo o limite alcançado pelo perímetro de
um polígono regular20 inscrito na circunferência quando o número de lados do polígono aumenta
além de todos os limites. Portanto, a solução do problema está baseada essencialmente no conceito
de limite.
O comprimento de uma curva suave arbitrária é definido da mesma maneira. Nos parágrafos
seguintes encontraremos um número de exemplos de grandezas geométricas e físicas que somente
podem ser definidas usando o conceito de limite.
Os enunciados definitivos dos conceitos de limite e infinitesimal foram dados no início do século
XIX. As definições introduzidas aqui estão associadas ao nome do matemático francês Augustin-
Louis Cauchy (1789 – 1857), antes dele os matemáticos utilizavam estes conceitos de forma menos
clara. Os conceitos que usamos hoje de limite, de infinitesimal como uma quantidade variável, e de
número real, resultaram do desenvolvimento da análise matemática e foram, ao mesmo tempo, os
meios usados para estabelecer e esclarecer muitos das suas descobertas.
2.4 Funções Contínuas
As funções contínuas formam a classe de funções básica para as operações da análise matemática. A
ideia geral de uma função contínua pode ser estabelecida do fato que seu gráfico é contínuo, isto é,
sua curva pode ser traçada sem necessidade de levantar o lápis do papel.
Uma função contínua dá a expressão matemática de uma situação frequentemente encontrada na

vida prática, qual seja: que um pequeno acréscimo na variável independente corresponde um
pequeno acréscimo na variável dependente, isto é, na função. Exemplos excelentes de funções
contínuas são dadas pelas diversas leis que governam o movimento dos corpos s = f (t) ,
expressando a dependência da distância s com o tempo t. Como o tempo e a distância são contínuos,
uma lei que rege o movimento de um corpo, s = f (t) , estabelece entre estas variáveis uma
relação bem definida caracterizada pelo fato que um pequeno acréscimo no tempo corresponde um
pequeno acréscimo na distância.
A humanidade chegou ao conceito abstrato de continuidade observando os chamados meios densos

presentes no ambiente ao seu redor, isto é, os sólidos, os líquidos, e os gases; por exemplo, os
metais, a água, e o ar. Na realidade, como sabemos hoje, todo meio físico representa a acumulação
20 Aqui é importante frisar que o polígono não precisa ser regular. A única condição essencial exigida é que o maior
lado do polígono irregular inscrito na circunferência se aproxime de zero quando o número de lados cresce.
29/141
de um enorme número de partículas independentes em constante movimento. Entretanto, as

dimensões destas partículas e as distâncias entre elas são tão pequenas em comparação com as
dimensões do meio em que o fenômeno da física microscópica acontece, que muito destes
fenômenos podem ser estudados com suficiente precisão se considerarmos o meio como sendo
aproximadamente sem interstício, ou seja, como estando continuamente distribuído no espaço
ocupado. É sob tal hipótese que muitas ciências físicas estão baseadas, por exemplo, a
hidrodinâmica, a aerodinâmica, e a teoria da elasticidade. O conceito matemático de continuidade
naturalmente tem um papel importante nestas ciências e também em muitas outras.
Considere uma função arbitrária y = f ( x) e algum valor específico da variável independente

x 0 . Se a função reflete um processo contínuo, então para valores de x que diferem ligeiramente
de x 0 corresponderão valores de f (x ) que diferem apenas ligeiramente do valor da função
no ponto x 0 : f (x 0 ) .21 Desta forma se o incremento x− x 0 da variável independente for
pequeno, então o incremento correspondente f (x )− f ( x 0 ) da função também será pequeno. Em
outras palavras, se o incremento da variável independente x− x 0 se aproxima de zero, então o
incremento f (x )− f ( x 0 ) da função deve também se aproximar de zero, um fato que pode ser
expresso da seguinte maneira:
lim [ f ( x )− f (x 0 )] = 0 (8).
(x− x0 )→ 0
Esta relação constitui a definição matemática de continuidade de uma função no ponto x 0 , ou

seja, a função f (x ) é dita ser contínua no ponto x 0 se a igualdade (8) for válida.
Finalmente damos a seguinte definição. Uma função é dita ser contínua em um dado intervalo se ela
é contínua para todo ponto x 0 do intervalo, isto é, se para todo ponto deste intervalo a igualdade
(8) for satisfeita.
Assim, de maneira a se introduzir uma definição matemática da propriedade de uma função

representada pelo fato que seu gráfico é contínuo no sentido usual desta palavra, foi necessário
primeiramente se definir a continuidade local, qual seja, a continuidade da função no ponto x 0 ,
para então, com base nesta definição, estabelecer a definição de continuidade da função em todo o
intervalo.
Esta definição, introduzida por Cauchy no início do século XIX, hoje é adotada de maneira geral na
análise matemática contemporânea. Os testes com muitos exemplos reais têm mostrado que ela
corresponde muito bem a noção prática que temos de uma função contínua, por exemplo, as funções
representadas por gráficos contínuos.
Como exemplo de funções contínuas o leitor pode considerar as funções elementares bem
21 N. T. - Pode acontecer que o mesmo valor de f ( x) é associado para todos os valores de x, tal que o
contradomínio da variável x consiste de um único valor. Neste caso especial o valor da função f ( x) não varia,
isto é, f ( x) é uma função constante. Assim, incluiremos este caso no conceito de função, mesmo quando isto
possa parecer estranho para um iniciante que imagina ser mais natural a ideia da função f ( x) sempre variar
com x. De fato, a decisão de olhar uma função constante como o caso especial de uma variável cujo contradomínio
de variação consiste apenas de um único elemento não nos causará nenhum problema, pelo contrário, ele nos será
muito útil. Veja “What is Mathematics? An Elementary Approach to Ideas and Methods”, Richard Courant, Herbert
Robbins, Ian Stewart, Capítulo VI, Seção 1.
30/141
conhecidas da matemática estudada na escola secundária como: x n , sen ( x ) , cos (x) ,

log ( x ) , arc sen x , arc cos x . Todas estas funções são contínuas nos intervalos em que são
definidas.
Quando funções contínuas são adicionadas, subtraídas, multiplicadas, ou divididas (exceto quando
esta divisão for por zero), o resultado também é uma função contínua. No entanto, no caso de
divisão a continuidade costuma ser destruída naqueles valores de x 0 para os quais o
denominador da função zera. O resultado da divisão neste caso é uma função que é descontínua no
ponto x 0 .
1
A função y= serve como exemplo de uma função que é descontínua no ponto x = 0 .
x
Outras funções com descontinuidades estão representadas nos gráficos da Fig. 9a, Fig. 9b, Fig. 9c,
Fig. 9d, Fig. 9e.
Fig. 9a
31/141
Fig. 9b
Fig. 9c
Fig. 9d
32/141
Fig. 9e
Recomendamos ao leitor examinar estes gráficos cuidadosamente. Ele notará que as

descontinuidades apresentadas pelas funções são de natureza diferente: Em alguns casos o limite da
função f (x ) existe quando x se aproxima do ponto x 0 onde a função sofre uma
descontinuidade, mas este limite é diferente de f (x 0 ) (veja Fig. 9b). Em outros casos, como na
Fig. 9c, o limite simplesmente não existe (o valor da função sen
1
x () na Fig. 9c oscila
violentamente quando x se aproxima de zero). Pode também acontecer que quando x se aproxima de
x 0 por um dos lados f (x )− f ( x 0 ) → 0 , enquanto pelo outro lado f (x )− f ( x 0 ) não tende
para zero (veja Fig. 9d). Naturalmente, neste caso a função possui uma descontinuidade, mas
podemos dizer que em tal ponto sua “descontinuidade é lateral”. Todos estes casos estão
representados nos gráficos da Fig. 9.
Como exercício aconselhamos ao leitor considerar a seguinte questão: Qual valor deve ser dado
para as funções abaixo nos pontos onde elas não são definidas, isto é, nos pontos onde o
denominador da função é igual a zero, de forma que elas possam ser contínuas nestes pontos:
sen ( x ) 1−cos( x) x 3−1 tan( x)

, , , .
x x2 x−1 x
Será também possível encontrar tais números para as funções:
1 x −2
tan (x ) , , ?
x−1 x 2−4
Estas funções descontínuas na matemática representam os numerosos processos descontínuos que

encontramos na natureza. No caso de uma súbita explosão, por exemplo, o valor da velocidade de
33/141
um corpo muda de forma descontínua. Muitas transições qualitativas acontecem em tais

descontinuidades. Na Seção 2.2 introduzimos a função Q= f (t) expressando a maneira pela
qual a quantidade de calor em uma dada massa de água (ou gelo) depende da temperatura. Nas
proximidades do ponto de fusão do gelo a quantidade de calor Q= f (t) muda de maneira
descontínua como função da temperatura t.
Em análise matemática, funções contínuas e funções com descontinuidades isoladas são

encontradas frequentemente. Como exemplo mais complicado de uma função, onde o número de
descontinuidades é infinito, apresentamos a chamada função de Riemann que é igual a zero em
1 p p
todos os pontos irracionais e igual a nos pontos racionais da forma x = , onde é
q q q
uma fração irredutível. Esta função é descontínua em todos os pontos racionais e contínua nos
pontos irracionais.22 Com uma pequena alteração podemos facilmente obter um exemplo de uma
função que é descontínua em todos os pontos. Para isto é suficiente fazer a função igual à unidade
nos pontos racionais. A propósito, lembramos que mesmo para estas funções complicadas a análise
matemática moderna descobriu leis muito interessantes que são investigadas por um ramo
independente da análise chamado de teoria das funções de uma variável real. Esta teoria se
desenvolveu com extraordinária rapidez durante a primeira metade do século XX.
2.5 Derivada
O próximo conceito fundamental da análise é o conceito de derivada. Vamos agora abordar dois
problemas que historicamente deram origem a este conceito.
Velocidade. No início do presente capítulo definimos a velocidade de um corpo caindo em queda

livre. Para isto fizemos uso da passagem ao limite da expressão da velocidade média definida para
pequenas distâncias para obter a velocidade em um dado ponto da trajetória em um determinado
instante de tempo. O mesmo procedimento pode ser usado para se definir a velocidade instantânea
de um movimento arbitrário não uniforme. De fato, suponha que a função a seguir expresse a
dependência da distância s percorrida por um ponto material no tempo t.
s = f (t) (9).
Para encontrar a velocidade do ponto material no instante t = t 0 , considere o intervalo de tempo

de t 0 a t 0+ h , onde (h ≠ 0) . Durante este intervalo de tempo o ponto cobre a distância:
Δ s = f (t 0 + h)− f (t 0 ) .
A velocidade média v av do ponto material nesta pequena parte da sua trajetória dependerá do
valor de h, e representará com grande precisão a velocidade real do ponto no instante de tempo
t 0 à medida que h se tornar cada vez mais diminuto. Disto segue que a velocidade verdadeira do
ponto no instante t 0 será igual ao limite da razão entre o acréscimo da distância para o acréscimo
de tempo, quando este último se aproxima de zero sem eventualmente se tornar igual a zero:
22 N. T. - Para demonstração desta proposição veja: “Some horrible functions”, John O'Connor, arquivo: Some horrible
functions .pdf. Veja também: “Introduction to Calculus and Analysis”, Richard Courant e Fritz John, Volume I,
Capítulo 1, problema 4, página 109.
34/141
f (t 0+ h)− f (t 0 )
v = lim .
h→ 0 h
De maneira a se calcular a velocidade para as diversas formas de movimento, devemos descobrir

como encontrar este limite para as diferentes funções f (t) que lhes estão associadas.
Tangente. Somos agora levados a investigar um limite rigorosamente análogo ao anterior devido a
outro problema, desta vez um problema geométrico, ou seja, o problema de se traçar uma tangente
por um ponto pertencente a uma curva plana arbitrária.
Suponha que C seja o gráfico da função y = f ( x) e A um ponto sobre a curva C com abcissa
x 0 . Veja Fig. 10.
Fig. 10
Fig. 11
35/141
Qual seria a linha que poderíamos chamar tangente à curva C no ponto A? Em geometria elementar
esta questão não aparece, pois a única curva estudada, qual seja, a circunferência de um círculo, nos
permite definir a tangente como uma linha reta que possui apenas um ponto em comum com a
curva. No entanto, tal definição para outras curvas claramente não corresponde a nossa imagem
intuitiva de “tangência”. Assim, considerando as duas retas L e M na Fig. 11, a primeira reta L
obviamente não é tangente a curva traçada, no caso uma curva senoidal, embora ela tenha apenas
um ponto de contato com a curva. Por outro lado, a segunda reta M possui muitos pontos de contato
com a curva e ainda assim é uma tangente à curva em cada um destes pontos.
Para definirmos uma tangente vamos considerar outro ponto A´ sobre a curva C da Fig. 10 com
abcissa x 0 +h , distinto do ponto A. Tracemos a secante AA´ e designemos o ângulo que ela forma
com o eixo dos x de β. Agora permitimos que o ponto A´ se aproxime de A seguindo o traçado da
curva C. Se a secante correspondente AA´ se aproximar de uma posição limite, então a reta T que
está nesta posição limite é chamada de tangente a curva C no ponto A. Evidente o ângulo α formado
pela reta T com o eixo dos x deve ser igual ao limite do ângulo variável β.
O valor tan β é facilmente determinado do triângulo Δ ABA' da Fig. 10 pela expressão:
BA' f (x 0 + h)− f (x 0 )
tan β = =
AB h
Fazendo o limite, fica:
f ( x 0+ h)− f ( x 0 )
tan α = lim tan β = lim .
A' → A h →0 h
Isto é, a tangente trigonométrica do ângulo correspondente à inclinação da reta tangente é igual ao

limite da razão entre o crescimento da função f (x ) no ponto x 0 em relação ao acréscimo
correspondente da variável independente, quando este último se aproxima de zero sem realmente
nunca se igualar a zero.
Corrente elétrica. Daremos ainda outro exemplo que nos leva a calcular um limite similar.
Suponha que uma corrente elétrica variável está percorrendo um condutor. Assuma que a função
Q = f (t) expressa a quantidade de eletricidade (cargas elétricas) que passou por uma
determinada seção reta do condutor até o tempo t. No intervalo de tempo de t 0 a t 0+ h passará
pela seção reta do condutor uma quantidade de eletricidade Δ Q igual a f (t 0+ h)− f (t 0 ) .
Portanto, o valor médio da corrente no condutor que flui nesta seção reta será igual a:
ΔQ f (t 0 + h)− f (t 0)
I av = = .
h h
O limite desta razão quando h →0 dará o valor da corrente no instante de tempo t 0 :
f (t 0 +h)− f ( t 0 )
I = lim .
h→ 0 h
36/141
Todos os três problemas discutidos, a despeito do fato de se referirem a ramos diferentes da ciência,
quais sejam, mecânica, geometria, e a teoria da eletricidade, nos levou a uma mesma operação
matemática atuando sobre uma dada função, isto é, encontrar o limite da razão entre o crescimento
da função para o acréscimo correspondente da variável independente h quando h →0 .
Poderíamos continuar aumentando a lista de problemas diferentes cujas soluções adotam esta
mesma operação. Isto nos levaria, por exemplo, a questão sobre a velocidade de uma reação
química, ou sobre a densidade de uma massa não homogênea, e assim por diante. Tendo em vista o
papel excepcional desta operação sobre funções, ela recebeu um nome especial, diferenciação, e o
resultado da operação é chamado de derivada da função.
Assim, a derivada da função y = f ( x) , ou mais precisamente o valor da derivada em um dado

ponto x, é o limite23 da razão entre o acréscimo da função f (x +h)− f ( x) para o acréscimo h da
variável independente quando este último se aproxima de zero. Frequentemente escrevemos
h = Δ x e f (x +Δ x)− f ( x) = Δ y . Neste caso damos a definição de derivada em uma forma
mais concisa como:
Δy
lim .
Δ x→ 0 Δx
O valor da derivada obviamente depende do ponto x em que ela é calculada. Portanto, a derivada da
função y = f ( x) é também uma função de x. É usual se indicar a derivada de uma função pelas
expressões:
f ( x+ h)− f ( x ) Δy
f ' ( x ) = lim = lim .
h →0 h Δ x→ 0 Δ x
Outras notações para derivada também são encontradas na literatura, por exemplo:
d dy
f ( x ) , ou , ou y ´ , ou y ´x .
dx dx
dy
Devemos enfatizar que a notação lembra uma fração, embora ela seja apenas um símbolo de
dx
uma derivada. Na próxima seção o numerador e o denominador desta “fração” tomará um
significado independente de maneira que a razão entre eles coincidirá com a definição de derivada,
e assim esta forma de se referir a derivada estará justificada completamente.
Os resultados dos exemplos que demos podem ser agora formulados da seguinte maneira. A
velocidade de uma massa pontual para a qual a distância percorrida s é dada pela função
s = f (t) é igual à derivada desta função:
v = s' = f ' (t) .
Dizendo de uma maneira mais sucinta, a velocidade é a derivada da distância com respeito ao
tempo.
23 Aqui se subentende que estamos falando do caso onde o limite em questão de fato existe. Se este limite não existe,
então dizemos que no ponto x a função não tem derivada.
37/141
A tangente trigonométrica do ângulo formado pela reta tangente a curva y = f ( x) com o eixo
das abcissas no ponto com abcissa x é igual à derivada da função f (x ) neste ponto.
tan α = y ' = f ' ( x ) .
A intensidade de corrente I no tempo t quando Q = f (t) é a quantidade de eletricidade (cargas

elétricas) que passou pela seção reta de um condutor até o instante t é igual à derivada:
I = Q' = f ' (t) .
Faremos agora a seguinte observação. A velocidade em determinado instante de tempo de um

movimento não uniforme é um conceito puramente físico que advém da experiência prática. A
humanidade chegou a este conceito como resultado de numerosas observações de diferentes
movimentos concretos. O estudo do movimento não uniforme de um corpo em diferentes partes de
sua trajetória, a comparação de diferentes movimentos deste tipo acontecendo simultaneamente, e
em particular o estudo dos fenômenos das colisões de corpos, tudo isto representou um acúmulo de
experiência prática que levou a se estabelecer o conceito físico de velocidade em um dado instante
de tempo de um movimento não uniforme. Mas a definição exata de velocidade necessariamente
depende do método que se usa para definir seu valor numérico, e só foi possível definir este valor
com o conceito de derivada.
Em mecânica a velocidade no instante de tempo t de um corpo que se desloca obedecendo à relação

s = f (t) é definida como valor que a derivada de f (t) assume em t.
A discussão no início da presente seção mostrou por um lado as vantagens de se introduzir a

operação de se encontrar a derivada de uma função, e por outro deu uma justificativa razoável para
a definição formulada acima da velocidade em um dado instante de tempo.
Assim, quando levantamos a questão de encontrar a velocidade de um ponto dotado de movimento

não uniforme, estávamos, por assim dizer, apenas com a noção empírica do valor desta velocidade,
mas não com sua definição exata. Agora, como resultado da nossa análise, chegamos a uma
definição exata do valor da velocidade em um dado instante, isto é, a derivada da distância com
respeito ao tempo. Este resultado é extremamente importante do ponto de vista prático, pois nosso
conhecimento empírico de velocidade foi grandemente enriquecido pelo fato de agora podermos
fazer um cálculo numérico exato.
Naturalmente, o que dissemos se ajusta perfeitamente a intensidade da corrente e muito outros

conceitos expressando a taxa de evolução de algum processo físico, químico, e assim por diante.
Esta situação pode servir de exemplo para inúmeros outros processos de natureza similar, onde a
experiência prática levou a formação de um conceito relacionando o mundo externo (velocidade,
trabalho, densidade, área, e outros), e então a matemática nos permite definir este conceito
precisamente de maneira à que possamos usá-lo em cálculos práticos.
Mencionamos no início deste capítulo que o conceito de derivada surge principalmente em

decorrência de muitos séculos de esforços dirigidos à solução de dois problemas: traçar uma
tangente a uma curva e encontrar a velocidade de um movimento não uniforme. Estes dois
38/141
problemas e também o cálculo de áreas que foi discutido mais tarde fez parte do interesse dos
matemáticos desde os tempos mais remotos. Entretanto, até o século XVI o enunciado e o método
de solução para cada problema deste tipo trazia um caráter extremamente particularizado. O acervo
de todo este material tão extensivo foi reduzido a um sistema teórico completo no século XVII com
os trabalhos de Newton e Leibnitz. Além disso, importantes contribuições para os fundamentos da
análise matemática de hoje foi dada também por Euler.
Contudo, deve ser dito que tanto Newton como Leibnitz, bem como os matemáticos que viveram
neste período, deram muito pouco embasamento lógico para as grandes descobertas matemáticas
que alcançaram. A maior parte dos métodos de argumentação e conceitos com que operavam era
confusa quando examinamos do ponto de vista atual. Os próprios matemáticos deste tempo tinham
bastante consciência deste fato, como mostra as discussões acirradas que encontramos em suas
correspondências. Entretanto, é importante frisar que os matemáticos do século XVII e século
XVIII desenvolveram suas atividades puramente matemáticas em estreito contato com a pesquisa de
outros investigadores pertencentes a vários ramos da ciência natural como física, mecânica,
química, tecnologia. Em geral, a proposição de um problema matemático surgia de uma necessidade
prática ou do desejo de entender algum fenômeno da natureza, e tão logo o problema era
solucionado, esta solução era submetida de uma maneira ou de outra a um teste prático. Em
decorrência deste fato, a despeito da falta de certa base lógica, os matemáticos desta época foram
capazes de avançar na direção correta com contribuições extremamente valiosas.
Exemplos de cálculos de derivadas. A definição de derivada como o limite mostrado abaixo nos
permite calcular a derivada de qualquer função que represente um fenômeno físico:
f ( x+ h)− f (x )
f ' ( x ) = lim .
h →0 h
Naturalmente, aqui deve ser considerado também aqueles casos em que a função simplesmente não
apresenta derivada em um ponto ou mesmo vários pontos, em outras palavras, aqueles casos em que
f ( x+ h)− f ( x )
a razão não se aproxima de um limite finito quando h → 0 .
h
Obviamente isto ocorre em todos os pontos de descontinuidade da função f (x ) , ou seja,

naqueles pontos onde o numerador da expressão abaixo não se aproxima de zero quando o
denominador h tende para zero.
f ( x+ h)− f ( x )
(10).
h
A derivada poderá também deixar de existir mesmo nos pontos onde a função é contínua. O
exemplo mais simples é dado em qualquer ponto onde o gráfico da função forma um ângulo como
aquele mostrado na Fig. 12. Em um ponto como este o gráfico da curva não possui uma tangente
bem definida, sendo assim a função também não possui derivada. Frequentemente nestes pontos a
expressão (10) apresenta valores diferentes quando h se aproxima de zero pela direita ou pela
esquerda de x. Consequentemente, quando h se aproxima de zero de maneira arbitrária a razão (10)
não apresenta um limite consistente. Além disto, um exemplo de uma função mais complicada que
também não possui derivada é dado pela expressão a seguir:
39/141
y=
{ x sen ( 1x ) para
0 para x = 0 .
x≠0 ,
.
O gráfico desta função está mostrado na Fig. 13.
Fig. 12
Fig. 13
40/141
A função da Fig. 13 não possui derivada em x = 0 como fica evidente do seu gráfico. De fato, a
secante OA não se aproxima de uma posição definida mesmo quando A → 0 a partir de um lado
da função. Com efeito, observamos neste caso que a secante OA oscila indefinidamente entre as
retas OM e OL quando o ponto A percorre a função se aproximando da origem. Assim, a razão (10)
correspondente não apresenta um limite mesmo quando h preserva o mesmo sinal quando se
aproxima de zero.
Finalmente, observamos que é possível definir em bases puramente analíticas por meio de fórmula,
uma função contínua que não possui derivada em qualquer ponto do seu domínio. O exemplo de
uma função como esta foi dado pela primeira vez no século XIX pelo notável matemático alemão
Karl Theodor Wilhelm Weierstrass (1815 – 1897).24 Daí se verifica que a classe de funções
diferenciáveis é consideravelmente menor que a de funções contínuas.
Passaremos agora ao cálculo das derivadas de funções mais simples.
1. Seja a função y = c , onde c é uma constante. Uma constante pode ser considerada como um
caso especial de uma função que permanece igual ao mesmo número para qualquer valor arbitrário
de x. Seu gráfico é uma linha reta paralela ao eixo dos x e situada a uma distância igual a c. Esta reta
forma com o eixo dos x um ângulo α igual a zero: α = 0 . Naturalmente, a derivada de uma
constante é identicamente nula, ou seja, y ' = (c)´ = 0 . Do ponto de vista da mecânica, esta
equação significa que a velocidade de um ponto estacionário é igual a zero.
2. Seja a função y = x 2 . Então temos:
f ( x+ h)− f (x ) ( x + h)2−x 2 2 x h+ h2
= = = 2 x +h .
h h h
Quando h → 0 obtemos o limite 2 x .25 Portanto, escrevemos:
y ' = (x 2 )' = 2 x .
3. Seja a função y = x n , onde n é um número inteiro positivo. Daí, fica:
f ( x+ h)− f (x ) ( x + h) −x
=
n
=
( x +n x
n
n n−1
h+
n (n−1) n−2 2
2! )
x h +⋯+ hn − x n
h h h .
n( n−1) n−2
= n x n−1 + x h+⋯+h n−1
2!
Evidentemente, todos os termos do lado direito da equação acima a partir do segundo se anulam
quando h → 0 . Assim, obtemos:
y ' = (x n )' = n x n−1 .
Esta fórmula permanece verdadeira para n arbitrário, quer seja um número positivo, negativo,
24 N. T. - Veja https://en.wikipedia.org/wiki/Weierstrass_function.
25 Aqui estamos sempre assumindo que h ≠ 0 .
41/141
fracionário ou mesmo irracional, embora a prova para esta generalização seja diferente. Assim, a
seguir faremos uso deste fato sem prová-lo. Por exemplo:
' 1 (1/ 2−1) 1 −1 /2 1

( √ x) = ( x 1/ 2)' = x = x = para (x > 0) ;
2 2 2√x
' 1 (1/ 3−1) 1 −2 /3 1

( √3 x) = ( x 1/ 3)' = x = x = 3 2 para (x ≠ 0) ;
3 3 3√x
()1 '
x
−1 '
= ( x ) = −1 x
(−1−1 ) −2 1
= −1 x =− 2 para ( x ≠ 0) ;
x
( x π )' = π x π −1 para ( x > 0) .
4. Seja a função y = sen x . Inicialmente lembramos as identidades trigonométricas:
( h2 )+ cos(2 h2 ) sen x
sen (x +h) = cos x sen 2 .
Mas:
( h2 ) = 2 cos( h2 ) sen( h2 )
sen 2 e cos 2 ( h2 ) = cos ( h2 )−sen ( h2 )
2 2
.
Substituindo, temos:
sen (x +h) = cos x 2 cos

[ ( h2 ) sen( h2 )]+[ cos ( h2 )−sen ( h2 )] sen x
2 2
.
Com estas identidades a expressão sen (x +h)−sen x pode ser escrita como:
sen (x +h)−sen x = cos x 2 cos

[ ( h2 ) sen( h2 )]+[ cos ( h2 )−sen ( h2 )] sen x−sen x
2 2
,

[ ( ) ( )]
h
2
sen
h
2 [⏟
() () ]
+sen x cos 2
h
2
−sen 2
h
2
−1
,
−2sen
2
( h2 )

[ ( ) ( )]
h
2
sen
h
2
−2 sen x sen 2 ( h2 ) ,
42/141
sen (x +h)−sen x = 2 sen

[cos x cos( h2 )−sen x sen ( h2 )] ,
( h2 ) ⏟
( h2 )
cos x +
sen (x +h)−sen x = 2 sen ( h2 ) cos( x+ h2 ) .
Agora, usando este resultado na expressão da derivada de sen x , fica:
sen ( x+ h)−sen x 2 sen ( h/2 ) cos ( x +h /2 ) sen ( h/2 )

lim = lim = lim cos ( x + h/2 ) .
h→ 0 h h→0 h h→0 h/2
sen ( h/2 )
Como já mostramos, o limite da primeira fração acima, lim , é a unidade. Por outro
h→ 0 h/2
lado, lim cos ( x+ h/ 2 ) é obviamente cos x . Portanto, a derivada da função sen x é igual a
h→ 0
cos x :
y ' = (sen x)' = cos x .
Sugerimos ao leitor provar que: (cos x)' = −sen x .
5. No Capítulo 2, Seção2.3, mostramos a existência do limite:
( ) = e = 2,718281828459045⋯
n
1
lim 1+ .
n→∞ n
Mencionamos também que no cálculo deste limite não é necessário que n assuma somente valores
1
inteiros positivos. Aqui é importante apenas que o infinitesimal , que é adicionado a unidade,
n
e o expoente n, que cresce além de todos os limites, sejam o inverso um do outro.
Fazendo uso destes resultados podemos facilmente encontrar a derivada do logaritmo

y = log a ( x ) :
log a ( x+ h)−log a (x) 1

( ) ( ) ( )
x
x+h x h 1 h
= log a = log a 1+ = log a 1+ h
.
h h x hx x x x
( )
x
h h
A continuidade da função logarítmica nos permite substituir a quantidade 1+ sob o sinal do
x
logaritmo por seu limite que é igual a e. Assim, temos:
( ) =e
x
h h
lim 1+ .
h→ 0 x
43/141
x
No limite acima o expoente quando h → 0 faz o papel de n → ∞ na expressão do limite
h
( )
n
1
lim 1+ . Com isto obtemos a regra para diferenciação do logaritmo:
n→∞ n
1
y ' = (log a x )' = log a e .
x
Naturalmente, se a base a do logaritmo for igual a e, temos:
1 1
log e e = 1 → y ' = (log e x)' = log e e = .
x x
Assim, a regra para derivada do logaritmo torna-se particularmente simples se escolhermos o

número e como base do logaritmo. Os logaritmos tomados com esta base são chamados de
logaritmos naturais e são designados por ln( x) . Portanto, podemos escrever:
1
(ln x )' = .
x
2.6 Regras para Diferenciação
Dos exemplos dados acima pode parecer que o cálculo da derivada de cada nova função requer a
invenção de novos métodos. Mas este não é o caso. O desenvolvimento da análise em grande parte
só foi possível devido à descoberta de um método simples e padronizado para encontrar a derivada
de uma função “elementar” arbitrária, isto é, uma função de uma variável que pode ser expressa por
meio de uma fórmula consistindo da combinação finita de operações algébricas fundamentais (+ – ×
÷), funções trigonométricas, operação de potenciação, operação de logaritmo, constantes. Os
fundamentos deste método são as chamadas regras de diferenciação. Estas regras são compostas
por um número de teoremas que nos permite reduzir a complexidade dos problemas de derivação.
Explanaremos aqui as regras da diferenciação e tentaremos de uma forma muito breve deduzi-las.
Se o leitor desejar apenas formar uma ideia geral da análise poderá omitir a presente seção,
lembrando apenas que existem maneiras de se encontrar realmente a derivada de qualquer função
elementar. Neste caso, naturalmente, será necessário que ele tome como válidos os cálculos dos
exemplos dados a seguir.
Derivada da soma. Assuma que y seja uma função de x dada pela expressão:
y = ϕ ( x)+ψ ( x) .
Onde u = ϕ ( x) e ν = ψ ( x) são funções conhecidas de x. Assumimos também que podemos

encontrar as derivadas das funções u e ν. Como poderemos então encontrar a derivada da função y?
A resposta é simples:
y ' = (u +ν )' = u ' + ν ' (11).
44/141
De fato, seja um incremento em x igual a Δ x . Então u, ν e y terão um incremento

correspondente Δ u , Δ ν e Δ y de acordo com a equação abaixo:
Δ y = Δ u +Δ ν .
Desta maneira, podemos escrever:
Δ y Δ u Δ ν 26
= + .
Δx Δx Δx
Passando ao limite para Δ x → 0 , obtemos mais uma vez a fórmula (11). Naturalmente, isto
acontece se as funções u e ν tiverem derivadas.
De modo análogo, podemos deduzir a fórmula da derivada para a diferença entre duas funções:
y ' = (u−ν )' = u ' −ν ' (12).
Derivada de um produto. A regra para diferenciação de um produto é um pouco mais complicada.

A derivada do produto de duas funções, onde cada uma delas tem sua própria derivada, existe e é
igual à soma do produto da primeira função pela derivada da segunda função mais o produto da
segunda função pela derivada da primeira função. Isto é:
(u v)' = u v ' + v u' (13).
De fato, seja Δ x um incremento na variável x. Então as funções u, v e y = u v serão

incrementadas de Δ u , Δ v e Δ y respectivamente, satisfazendo a seguinte relação:
Δ y = (u +Δ u)(v +Δ v)−u v = u Δ v + v Δ u+ Δ u Δ v+ uv−uv ,
Δ y = (u +Δ u)(v +Δ v)−u v = u Δ v + v Δ u+ Δ u Δ v .
Daí, tiramos:
Δy Δv Δu Δv
=u +v +Δ u .
Δx Δx Δx Δx
Fazendo a passagem ao limite Δ x → 0 , as duas primeiras parcelas no lado direito da equação

acima reproduzem o lado direito da fórmula (13), enquanto o terceiro termo desta soma se anula. 27
Consequentemente, no limite obtemos a regra dada por (13).
No caso particular em que a função v é uma constante, v = c , temos:
26 Aqui Δx é sempre diferente de zero.

Δv
27 O terceiro termo aqui se anula quando Δ x → 0 , pois se aproxima de um número finito igual à
Δx
derivada v ' , que assumimos existir por hipótese, enquanto Δ u → 0 , visto que a função u, cuja derivada
também assumimos que existe, é contínua.
45/141
(c u)' = c u ' +u c' = c u ' (14).
Na equação acima usamos o fato que a derivada de uma constante é zero.
u
Derivada de um quociente. Seja a função y=
, onde as funções u e v possuem derivada para
v
um dado x, com v ≠ 0 para este valor de x. Então:
u+Δ u u v Δ u−u Δ v
Δy= − = .
v +Δ v v ( v+ Δ v )v
Daí, temos:
Δu Δv
−u
v
Δy Δx Δx Δy v u ' −u v ' .
= → lim =
Δx (v + Δ v)v Δ x→0 Δ x v2
Aqui novamente fizemos uso do fato que para uma função v que tenha derivada, necessariamente
quando Δ x → 0 então Δ v → 0 . Deste modo:
()u ' v u ' −u v '

v
=
v2
(15).
Daremos agora alguns exemplos da aplicação destas regras.
(2 x 3−5)' = 2( x 3)' −(5)' = 2(3 x 2 )−0 = 6 x 2 ;
( x 2 sen x)' = x 2 (sen x)' +( x 2 )' sen x = x 2 cos x +2 x sen x ;
( ) cos x (sen x )' −sen x (cos x)' cos x cos x−sen x(−sen x)
'
' sen x
( tan x) = = =
cos x cos2 x cos 2 x
.
cos 2 x+sen 2 x 1 2
(tan x)' = = = sec x
cos 2 x cos 2 x
Recomendamos ao leitor provar que (cot x )' = csc 2 x .
Derivada da função inversa. Considere a função y = f ( x) , que é contínua e cresce (decresce)

no intervalo [a, b].28 Por crescer (decrescer) queremos dizer que à medida que os valores de x
crescem (decrescem) no intervalo [a, b] os valores de y correspondentes também crescem
(decrescem). Veja Fig. 14.
Seja c = f ( a) e d = f (b) . No gráfico do lado esquerdo da Fig. 14 fica evidente que para
28 N. T. - Aqui introduzimos o conceito e representação de intervalo aberto e intervalo fechado. Um intervalo é

chamado de aberto e o designamos como (a, b) se a < x <b , isto é, se os pontos das extremidades do intervalo
não pertencem ao intervalo. Por outro lado, um intervalo é chamado de fechado e o representamos como [c, d] se
c ≤ x ≤d , ou seja, quando os pontos das extremidades pertencem ao intervalo.
46/141
cada valor de y no intervalo [c, d] corresponde exatamente um valor de x no intervalo [a, b], tal que
y = f ( x) . Do mesmo modo, para o gráfico do lado direito da Fig. 14 para cada valor de y no
intervalo [d, c] corresponde apenas um valor de x no intervalo [a, b], de sorte que y = f ( x) .
Desta maneira, sobre o intervalo [c, d] (ou [d, c]) podemos determinar completamente uma função
x = ϕ ( y) , que é chamada de função inversa de y = f ( x) . Vemos da Fig. 14 que a função
ϕ ( y ) é contínua. Este fato é provado na análise matemática moderna estritamente por métodos
analíticos. Agora seja Δ x e Δ y incrementos associados respectivamente a x e y. Fica claro
que:
Δy 1
=
Δx Δ x , se Δ y ≠ 0 .
Δy
Fig. 14
No limite isto nos dá uma relação simples entre as derivadas da função direta e inversa, qual seja:
Δy 1 1
lim = → y 'x =
Δ x→ 0 Δx Δx x 'y (16).
lim
Δ y→0 Δy
dy d dx d
Aqui y 'x = = f ( x ) e x 'y = = ϕ ( y) , lembrando também que como estamos
dx dx dy dy
trabalhando em um intervalo contínuo em que a função é crescente (decrescente) quando Δ x →0
temos que Δ y →0 e vice-versa.
Vamos agora usar este resultado para encontrar a derivada da função y = a x . Temos que a
função inversa de y = a x é x = log a y cuja derivada encontramos anteriormente no final da
Seção 2.5. Assim, podemos escrever:
47/141
dy 1 1
= y ' = (a x )'x = = = y (log e a) = a x ( ln a)
dx '
(log a y) y 1 (17).29
(log a e )
y
Em particular (e x )' = e x .
Tomemos como outro exemplo a função y = arc sen x , cuja inversa é x = sen y . Assim,
temos:
dy 1 1 1 1
= ( arc sen x)'x = = = = .
dx (sen y ) y cos y √ 1−(sen y)
' 2
√ 1−x 2
Tabela de derivadas. Na Tabela 2 listamos as derivadas das funções elementares mais simples.
Tabela 2
As fórmulas da Tabela 2 foram calculadas e explicadas anteriormente com exceção das duas últimas
que o leitor, se desejar, pode deduzir facilmente usando a regra da diferenciação de uma função
inversa.
Cálculo da derivada de uma função de função. Resta considerar a última e mais difícil regra de
diferenciação. O leitor de posse desta regra e de tabelas de derivadas estará perfeitamente apto a
diferenciar qualquer função elementar.
1
29 N. T. - Aqui usamos o resultado: = log e a . De fato, se k
log a e = k → e =a , mas
(loga e)
1 1 1
log e e = 1 → log e ( a k ) = k loge a = 1 → loge a = = = log e a = ln a .
k log a e . Portanto, (loga e)
48/141
De sorte a aplicar a regra que daremos a seguir é necessário que esteja perfeitamente claro como a
função que queremos diferenciar é construída, isto é, quais operações devem ser aplicadas sobre a
variável x e em que ordem para produzir a variável dependente y.
Por exemplo, para calcular a função y = sen x 2 é necessário primeiramente elevar x a segunda
potência e então tomar o seno do valor assim obtido. Este procedimento pode ser descrito da
seguinte maneira: y = sen u , onde u = x 2 .
Por outro lado, para se calcular a função y = sen 2 x é necessário encontrar o seno de x, e então
elevar o valor encontrado a segunda potência, um procedimento que pode ser escrito como:
y = u2 , onde u = sen x .
Aqui estão outros exemplos:
1. y = (3 x +4)3 , y = u3 , u = 3 x + 4 .
2. y = √ 1− x 2 , y = u1 /2 , u = 1−x 2 .
3. y = ek x , y = eu , u = kx .
Em casos mais complicados podemos ter uma cadeia de relações simples que pode ter várias etapas
como no exemplo:
4. y = cos3 x 2 , y = u3 , u = cos v , v = x 2 .
Se y é uma função da variável u tal que:
y = f (u) (18).
E u, por sua vez, é uma função da variável x:
u = ϕ ( x) (19).
Então y, sendo uma função de u, é também certa função de x que podemos designar como:
y = F (x ) = f ( u) = f [ ϕ ( x)] (20).
Considerando casos ainda mais complicados podemos formar, por exemplo, a função:
y = Φ ( x ) = f {ϕ [ψ ( x)]} .
A função acima é equivalente às equações:
y = f (u) , u = ϕ ( v ) , v = ψ (x ) .
Poderíamos também ter definido funções com sequências de relações ainda maiores.
49/141
Agora mostraremos como calcular a derivada da função F ( x) definida pela equação (20) se
conhecermos a derivada de f (u) com respeito à u e a derivada de ϕ ( x) com respeito à x.
Suponha que se dê um incremento Δ x na variável x. Então pela equação (19) u receberá certo
incremento Δ u e por (18) y receberá um incremento Δ y . Assim, podemos escrever:
Δ y Δ y Δu
= .
Δx Δu Δx
Δu
Agora deixamos Δx se aproximar de zero. Então: → u 'x . Além disto, da continuidade
Δx
Δy
de u temos também que Δ u → 0 , portanto, → y 'u . Aqui estamos assumindo que as
Δu
derivadas y 'u e u 'x existem.
Com isto provamos a importante fórmula que nos dá a derivada de uma função de função, também
chamada de regra da cadeia:30
y 'x = y 'u u'x (21).
Usando a fórmula (21) e a Tabela 2 de derivadas das funções elementares, calcularemos agora as
derivadas que apresentamos nos exemplos acima:
1. y = (3 x +4)3 = u 3 → y 'x = (u3 )'u (3 x + 4)'x = (3 u 2)(3) = 9(3 x +4)2 .
1 −1/ 2 x
2. y = √ 1− x 2 = u1 /2 → y 'x = ( u1 /2 )'u (1− x 2)'x = u (−2 x) = − .
2 √ 1−x 2
3. y = e k x = e u → y 'x = (e u)'u u 'x = ( e u)(k ) = k e kx .
Seja: y = f (u) , u = ϕ (v ) , e v = ψ (x ) , então:
y 'x = y 'u u'x = y 'u (u ' ' ' ' '

⏟ v v x) = y u u v v x
.
u'x
Dos exemplos acima fica claro como podemos generalizar a regra da derivada para o caso de um
número finito arbitrário de funções em cadeia. Para o exemplo 4, obtemos.
4. y = cos3 x 2 → y'x = (u 3)'u (cos v)'v ( x 2 )'x = (3 u2 )(−sen v)( 2 x) = −6 x (cos 2 x 2)(sen x 2 ) .
Na nossa explanação de como se calcular a derivada de uma função de função, introduzimos

variáveis intermediárias u, v, … . De fato, após um pouco de prática o leitor poderá dispensar estas
variáveis intermediárias, mantendo em mente simplesmente as funções que elas representam.
30 Na dedução desta fórmula assumimos tacitamente que quando Δ x se aproxima de zero, Δ u nunca poderá
ser igual a zero. Entretanto, a fórmula permanecerá verdadeira mesmo quando esta hipótese não se verifica.
50/141
Funções elementares. Para encerrar a presente seção observamos que as funções cujas derivadas
estão listadas na Tabela 2 podem ser usadas para definir as chamadas funções elementares. As
funções elementares são definidas como sendo aquelas que podem ser obtidas a partir destas
funções simples (Tabela 2), fazendo uso das quatro operações aritméticas e da operação de se
construir uma função de função, onde cada uma destas operações é tomada um número finito de
vezes.
Por exemplo, o polinômio x 3−2 x 2+ 3 x−5 é uma função elementar, pois é obtido através de
operações aritméticas aplicadas sobre certo número de funções da forma x k . A função
ln ( √ 1− x 2) também é elementar, desde que é obtida a partir do polinômio u = 1−x 2 pela
operação v = u 1/ 2 , e, posteriormente, aplicando a operação ln v .
As regras para diferenciação discutidas anteriormente são suficientes para obter-se a derivada de
qualquer função elementar na medida em que se conheça as derivadas das funções elementares mais
simples.
2.7 Máximo e Mínimo; Investigando os Gráficos de Funções
Uma das aplicações mais simples e importante da derivada é a teoria do máximo e mínimo.
Suponha que certa função y = f ( x) seja definida no intervalo fechado a ≤ x ≤ b , e também
que neste intervalo ela não apenas seja contínua como também tenha derivada em todos os pontos
do intervalo aberto a < x < b .31 O fato de podermos calcular a derivada da função em todos os
pontos do intervalo aberto nos permite formar uma imagem clara do seu gráfico. Nos trechos do
intervalo onde a derivada é sempre positiva a tangente ao gráfico da função apontará para cima.
Nestes trechos a função é crescente, isto é, quanto maior for o valor de x maior será o valor
correspondente de f (x ) . De outra parte, nos trechos onde a derivada é sempre negativa a função
decrescerá e seu gráfico será descendente.
Máximo e mínimo. Na Fig. 15 desenhamos o gráfico da função y = f ( x) definida no intervalo

fechado [a, b]. Neste gráfico são de especial interesse os pontos com abcissas x 0 , x 1 e x 3 .
No ponto com abcissa x 0 se diz que a função possui um máximo local; com isto queremos
expressar que neste ponto f (x 0 ) é maior que todos os pontos da vizinhança. De forma mais
precisa, f (x 0 ) ≥ f ( x) para todo x em certo intervalo em torno de x 0 .
Um mínimo local é definido de maneira análoga.
Para nossa função um máximo local ocorre nos pontos x0 e x 3 , e um mínimo local no ponto
x1 .
Todo ponto de máximo ou mínimo que se encontre no interior do intervalo fechado [a, b], isto é,
que não coincida com as extremidades do intervalo [a, b], possui derivada igual a zero.
31 N. T. - A fórmula da derivada de uma função f ( x) em um ponto x0 requer o cálculo do limite da função à
esquerda e à direita do ponto, portanto, se a função é definida em um intervalo fechado a derivada nas extremidades
do intervalo não está determinada.
51/141
Este último enunciado é de grande importância e segue imediatamente da definição de derivada

Δy
como o limite da razão . De fato, nos afastando uma pequena distância do ponto de máximo,
Δx
Δy
temos que Δ y ≤ 0 . Assim, para um incremento positivo Δ x a razão é negativa, e
Δx
para um incremento negativo Δ x a razão será positiva. O limite desta razão, que por hipótese
existe, não pode ser simultaneamente positivo e negativo, portanto, a única possibilidade que resta é
ser zero. Por inspeção do diagrama vemos que isto significa que nos pontos de máximo e mínimo 32
a tangente ao gráfico é horizontal. Na fig. 15 devemos observar que os pontos x 2 e x 4
também possuem tangentes na horizontal do mesmo modo que os pontos x 0 , x 1 e x 3 ,
embora nos pontos x 2 e x 4 a função não possua nem máximo nem mínimo. Em geral, podem
existir mais pontos nos quais a derivada da função é igual a zero (chamados de pontos
estacionários) do que os pontos de máximos e mínimos.
Fig. 15
Determinação do maior e menor valor de uma função. Em numerosas questões técnicas é

necessário encontrar o ponto x no qual uma dada função atinge seu valor máximo ou mínimo em
um dado intervalo.
No caso de estarmos interessados no maior valor devemos encontrar x 0 sobre o intervalo

fechado [a, b] para o qual todos os valores de x pertencentes [a, b] a desigualdade f (x 0 ) ≥ f ( x)
se verifica.
Mas aqui surge uma questão fundamental, qual seja: se é verdade que um ponto como este, em
geral, sempre estará presente no intervalo. Usando os métodos da análise matemática moderna é
possível provar o seguinte teorema de existência: Se a função f (x ) é contínua em um intervalo
finito, então existirá pelo menos um ponto no intervalo para o qual a função apresentará um valor
máximo (mínimo) sobre o intervalo fechado [a, b].
32 N. T. - Como é
usual deixaremos de mencionar no texto a palavra “local” ao nos referir aos pontos
de máximo e mínimo, embora ela esteja subentendida.
52/141
Do que dissemos anteriormente, segue que estes pontos de máximos ou mínimos devem ser
procurados inicialmente entre os “pontos estacionários”. Este fato é a base do método bem
conhecido de se encontrar o máximo e o mínimo em um intervalo aberto de definição da função.
Primeiramente encontramos a derivada de f (x ) e então resolvemos a equação obtida fazendo

'
f (x ) igual a zero:
'
f (x ) = 0 .
Se x 1 , x 2 , … , x n são as raízes desta equação, então comparamos os números f (x 1) ,

f (x 2 ) , … , f (x n ) entre si. Naturalmente é necessário levar em conta que o máximo e o
mínimo da função podem estar localizados não dentro do intervalo, mas nas suas extremidades,
como é o caso do mínimo da função mostrado na Fig. 15, ou em um ponto onde a função não possui
derivada como na Fig. 12. Desta maneira, aos pontos x 1 , x 2 , … , x n devemos adicionar as
extremidades a e b do intervalo, e também, se existir, aqueles pontos em que a função não possui
derivada. Daí, o que resta é comparar os valores da função para todos estes pontos e escolher entre
eles o de maior ou menor valor.
Com respeito ao enunciado do teorema da existência é importante adicionar que este teorema, via
de regra, não é válido no caso em que a função f (x ) é contínua somente no intervalo aberto (a,
b), isto é, no conjunto de pontos x satisfazendo a desigualdade a < x < b . Deixamos para o leitor
1
considerar o fato que a função não possui nem máximo nem mínimo no intervalo aberto (0,
x
1).
Daremos a seguir alguns exemplos.
A partir de uma peça metálica quadrada de lado a queremos construir uma caixa retangular com o
maior volume possível. Se nos quatro cantos do quadrado original cortarmos quadrados menores
com lado x como aqueles feitos no exemplo 2 da Seção 2.2, obtemos uma caixa com volume:
V ( x)= x(a−2 x )2 .
Com isto nosso problema passa a ser encontrar o valor x para o qual a função V ( x) tenha um
a
valor máximo no intervalo 0 ≤ x ≤ . De acordo com nossa regra para determinar os máximos
2
e mínimos de uma função, primeiramente encontramos sua derivada e igualamos a zero:
V ' ( x) = ( a−2 x) 2−4 x( a−2 x ) = 0 .
Solucionando a equação acima, encontramos duas raízes:
a a
x1 = , x2 = .
2 6
A estes valores incluímos a extremidade à esquerda do intervalo (a extremidade direita coincide
53/141
com x 1 ) e comparamos os valores da função nestes pontos:
V (0) = 0 ; V ( a6 ) = 272 a 3
; V ( a2 ) = 0 .
2 3 a
Assim a caixa terá seu maior volume igual a a quando x for igual a .
27 6
Como segundo exemplo examinaremos o problema do poste de iluminação no centro de uma arena
de patinação. Veja Seção 2.2, exemplo 3. Em que altura h devemos colocar uma luminária de sorte
que a borda da arena possa receber a maior iluminação possível?
Considerando a fórmula (3) da Seção 2.2, nosso problema se reduz a determinar o valor de h para o
A sen (α )
qual T = 2 2 alcança seu maior valor. Aqui em vez de se utilizar h é mais conveniente se
h +r
encontrar o ângulo α (veja Fig. 3 do Capítulo 2) que dá o maior valor de T. Assim, temos:
h = r tan α .
Logo:
T=
A sen (α )
2
h +r 2
=
Asen ( α )
2
(r tan α ) + r 2
= 2 (
A sen ( α )
r 1+tan α2
r
A
)
= 2 sen (α ) cos 2 (α ) .
Então, devemos encontrar o máximo da função T ( α ) entre todos os valores de α que satisfaçam
a desigualdade 0 < α < π . Para isto determinamos a derivada de T ( α ) e igualamos a zero:
2
A
T ' (α ) = 2
( cos3 α −2 sen 2 α cos α ) = A2 cos α ( cos 2 α −2sen 2 α ) = 0 .
r r
A equação acima pode ser dividida em duas:
cos α = 0 e cos 2 α −2sen 2 α = 0 .
A primeira equação tem por raiz α = π que coincide com a extremidade esquerda do intervalo
2
π
aberto
(0 , 2 ) . Podemos colocar a segunda equação na forma:
1
cos 2 α −2sen 2 α = 0 → tan 2 (α ) = .
2
Como α varia no intervalo 0 < α < π , temos para segunda raiz α = 35° 15 ' . Este é o valor
2
para o qual a função T ( α ) atinge seu valor máximo, pois nas extremidades do intervalo o valor
de T é nulo. Assim, o valor de h procurado será:
54/141
r
h = r tan α = ≈ 0 ,7 r .
√2
Mas agora suponha que a estrutura que dispomos não permite instalar a luminária em uma altura
superior a certo valor H. Assim sendo, o ângulo α não poderia variar de 0 a π , mas somente
2
dentro de um limite menor: 0 < π ≤ arc tan
2 ( )H
r
. Por exemplo, seja r = 12 metros e
r
H = 9 metros . Neste caso, é possível de fato posicionar a luminária na altura h = , que
√2
equivale a pouco mais de 8 metros, e é isto que devemos fazer. Entretanto, se H for menor que 8
metros, por exemplo, se temos a nossa disposição um poste com apenas 6 metros, constatamos que
a derivada da função T (α ) não se anula em nenhum ponto do intervalo fechado
[ ( )]
0 , arc tan
H
r
. Assim, o máximo da função T ( α ) é obtido quando posicionamos a
luminária na maior altura disponível, isto é, H = 6 metros .
Fig. 16a
Fig. 16b
55/141
Até aqui temos considerado funções definidas sobre um intervalo finito. No entanto, se o intervalo
de definição da função é infinito em comprimento, mesmo funções contínuas podem deixar de
apresentar valores de máximo e mínimo, embora possam continuar a crescer ou decrescer além de
todos os limites quando x se aproxima do infinito.
Assim as funções y = k x+ b (veja Fig. 5, Capítulo 2, Seção 2.2), y = arc tan x (veja Fig.
2
16a), y = ln x (veja Fig. 16b) não possuem nem máximo nem mínimo. A função y = e−x
(veja Fig. 16c) apresenta seu máximo no ponto x = 0 , mas não possui mínimo. Por outro lado, a
x
função y = 2 (veja Fig. 16d) tem seu mínimo no ponto x = −1 e máximo no ponto
(1+ x )
x=1 .
Fig. 16c
Fig. 16d
No caso de um intervalo de comprimento infinito a investigação pode ser reduzida ao método dado
acima, sendo necessário apenas que se considere no lugar dos valores da função nas extremidades
do intervalo, f (a ) e f (b) , os limites a seguir:
A = lim f ( x) e B = lim f ( x ) .
x→−∞ x→+∞
Derivadas de ordem mais altas. Temos visto que para o estudo detalhado do gráfico de uma
função devemos examinar as mudanças em sua derivada f ' ( x ) . Esta derivada é ela própria uma
função de x, logo, podemos também encontrar sua derivada.
56/141
A derivada da derivada é chamada de segunda derivada e é designada por:
[ y ' ]' = y ' ' ou [ f ' ( x)]' = f ' ' (x ) .
Analogamente podemos calcular a terceira derivada:
[ y ' ' ]' = y ' ' ' ou [ f ' ' ( x)]' = f ' ' ' (x) .
Generalizando, podemos calcular a enésima derivada ou, como é chamada, a derivada de ordem n:
y(n ) = f (n) (x ) .33
Naturalmente, devemos ter em mente que para certo valor de x, ou mesmo todos os valores de x,
esta sequência pode ser descontinuada para derivada de alguma ordem, por exemplo, para derivada
de ordem k. Pode acontecer que a derivada f (k ) ( x ) exista, mas não a derivada f (k +1) ( x) .
Derivadas de ordem arbitrária aparecerão mais tarde quando estudarmos na Seção 2.9 a fórmula de
Taylor. No momento nos limitaremos às derivadas de segunda ordem.
Significado da segunda derivada; convexidade e concavidade. Em mecânica a segunda derivada

tem uma interpretação simples. Seja s = f (t) a lei de movimento de um ponto ao longo de uma
linha reta. Então, s' será a velocidade do ponto, e s' ' será a velocidade com que a velocidade
está mudando, ou simplesmente a “aceleração” do ponto no instante de tempo t. Por exemplo, para
um corpo caindo em queda livre sob a força gravitacional, temos:
g t2
s= +v 0 t+ s0 , s' = g t + v 0 , s' ' = g .
2
Ou seja, a aceleração de um corpo em queda livre é uma constante igual a g.
A segunda derivada tem também uma interpretação geométrica simples. Exatamente como a
primeira derivada determina se uma função está crescendo ou decrescendo, o sinal da segunda
derivada determina o lado em direção ao qual o gráfico da função é encurvado.
Suponha, por exemplo, que sobre um dado intervalo a segunda derivada de uma função seja sempre
positiva. Então a primeira derivada da função cresce neste intervalo, portanto, f ' ( x ) = tan α
aumenta continuamente no intervalo, por conseguinte, o ângulo α que mede a inclinação da
tangente à curva da função também aumenta (veja Fig. 17). Deste modo, quando deslizamos sobre o
gráfico da função ele se curva sempre para o mesmo lado, neste caso para a parte superior do
gráfico, dizemos também que o gráfico da função é “convexo quando visto pelo lado de baixo”.
De outra parte, no trecho de uma curva onde a segunda derivada é sempre negativa (veja Fig. 18), o
gráfico da função é “convexo quando visto pelo lado de cima”.34
( n)
33 N. T. - No texto a notação: f ( x) , o expoente n entre parênteses significa a ordem da derivada da função
f ( x) .
34 A definição mais precisa de “convexidade quando visto pelo lado de cima” é a propriedade da função que dado uma
corda unindo dois pontos quaisquer da função, o gráfico da função entre estes pontos se encontra acima da corda.
57/141
Fig. 17
Fig. 18
Critérios de máximos e mínimos; estudo dos gráficos de curvas. Se em todo intervalo de

variação de x a curva da função é convexa quando vista pelo lado de cima do gráfico, e se em
determinado ponto x 0 deste intervalo a derivada é igual a zero, então neste ponto a função
necessariamente terá seu máximo. Por outro lado, quando no intervalo a função for convexa quando
vista pelo lado de baixo ela terá neste ponto seu mínimo. Esta simples consideração frequentemente
nos permite decidir após encontrar um ponto em que a derivada é nula, se neste ponto a função
possui um máximo ou mínimo local.35
Analogamente, na “convexidade pelo lado de baixo”, que também chamamos simplesmente de “concavidade”, o
gráfico da função entre os pontos se encontra abaixo da corda.
35 Em casos mais complicados onde a segunda derivada muda de sinal no intervalo, o problema de determinar o caráter
58/141
Exemplo 1. Examinemos a forma do gráfico da seguinte função:
x3 5 x2
f (x ) = − +6 x−2 .
3 2
Tomando a primeira derivada e fazendo igual a zero temos:
f ' ( x ) = x 2−5 x+ 6 = 0 .
As raízes da equação obtida desta maneira são x 1 = 2 e x 2 = 3 . Enquanto os valores

correspondentes da função f (x ) para estas abscisas são respectivamente:
2 1
f (2) = 2 e f (3) = 2 .
3 2
Fig. 19
do ponto estacionário é resolvido por meio da fórmula de Taylor (veja Seção 2.12).
59/141
Marcamos estes dois pontos no diagrama. Também assinalamos o ponto com coordenadas x = 0
e y = f (0) = −2 onde o gráfico intercepta o eixo dos y. Por outro lado, a segunda derivada da
5
função assume a forma f ' ' = 2 x−5 e se reduz a zero para x = . Assim, temos que:
2
5 5
f ' ' ( x) > 0 para x> e f ' ' ( x) < 0 para x< .
2 2
Daí, concluímos que o ponto com as coordenadas abaixo é um ponto de inflexão do gráfico da
função:
x=
5
2
, y= ( 52 ) = 2 127 .
À esquerda deste ponto a curva é convexa quando vista de cima, e à direita convexa quando vista de
baixo.
É evidente agora que o ponto com abcissa x = 2 é um máximo local da função, e o ponto com
abcissa x = 3 é um mínimo local da função.
Com base nestes resultados concluímos que o gráfico da função y= f ( x) tem o aspecto
mostrado na Fig. 19. À direita do ponto (0, -2) a curva cresce à medida que x aumenta e alcança seu
máximo no ponto (2 ,2
2
3 ) , passando a decrescer logo em seguida, ou seja, neste trecho ela é
convexa quando vista de cima. No ponto

1
2 ,2
2 12
7
( )
, onde f ' ' = 0 , a convexidade muda
para concavidade. Então no ponto (

3 ,2
1
2 )
a função alcança seu mínimo. Deste ponto em diante
ela cresce para o infinito. Isto decorre do fato que o primeiro termo da função contém a maior
potência de x (terceira potência), portanto, se aproxima do infinito mais rapidamente que o
segundo36 e terceiro termos. Pela mesma razão o gráfico da função se aproxima de −∞ quando x
assumes grandes valores negativos.
Exemplo 2. Provaremos agora que a desigualdade e x ≥ 1+ x é válida para qualquer valor

arbitrário de x. Para isto consideraremos a função f (x ) = e x −x−1 . A primeira derivada desta
função é dada por: f ' ( x ) = e x −1 , e se reduz a zero apenas em x = 0 . De outra parte, a
segunda derivada é positiva para todo valor de x: f ' ' ( x) = e x > 0 . Consequentemente, o gráfico
da função f (x ) é convexo quando visto de baixo. Segue que f (0) = 0 é um mínimo da
função e e x −x−1 ≥ 0 para todo valor de x. Daí, provamos a desigualdade e x ≥ 1+ x .
O estudo dos gráficos possui um grande número de aplicações diferentes. Por exemplo, eles
frequentemente mostram de forma clara o número de raízes reais de uma dada equação. Assim, de
maneira a demonstrar que a equação x e x = 2 possui apenas uma raiz real, podemos estudar os
3
36 N. T. - Também se diz que o termo em x predomina na expressão da função, mesmo na presença do segundo
termo em x 2 com sinal negativo.
60/141
2
gráficos das funções y = ex e y= , como mostra a Fig. 20. Vemos facilmente que estes
x
x 2
gráficos se interceptam em um único ponto de sorte que a equação e = tem exatamente uma
x
raiz.
Os métodos de análise matemática são aplicados amplamente nos problemas de cálculos

aproximados de raízes de uma equação. Este assunto será abordado no Capítulo 4, Seção 4.5.
Fig. 20
4.8 Incremento e diferencial de uma Função
Diferencial de uma função. Considere uma função y = f ( x) que tenha derivada. O

incremento desta função correspondente a um acréscimo Δ x , Δ y = f (x +Δ x )− f (x ) , tem a
Δy
propriedade que a razão se aproxima de um limite finito igual à derivada f ' (x ) quando
Δx
Δx → 0 :
Δy
lim → f ' (x) .
Δ x→ 0 Δx
Este resultado pode ser escrito como uma igualdade:
61/141
Δy
= f ' ( x )+ α .
Δx
Na igualdade acima o valor de α depende de Δ x de maneira que quando Δ x → 0 , α

também se aproxima de zero. Assim, o incremento de uma função pode ser expresso na forma:
Δ y = f ' (x) Δ x+ α Δ x .
Onde α → 0 se Δ x → 0 .
O primeiro termo da soma no lado direito da equação acima depende de Δ x de uma maneira
muito simples, ou seja, ele é proporcional a Δ x . Este termo é chamado de diferencial da função
no ponto x associado a um dado incremento Δ x , e é designado por:
dy = f ' ( x )Δ x .
O segundo termo tem a propriedade que quando Δ x → 0 ele se aproxima de zero mais
rapidamente que Δ x . Isto se deve a presença do fator α; portanto, se diz que ele é um
infinitesimal de ordem maior que Δ x . No caso em que f ' ( x ) ≠ 0 , ele também é um
infinitesimal de ordem maior que o primeiro termo da soma.
Fig. 21
Com isto queremos dizer que para valores de Δ x suficientemente diminutos, o segundo termo
da soma é muito pequeno e sua razão para Δ x é também arbitrariamente pequena.
A decomposição do incremento Δ y em duas parcelas das quais a primeira, que é a parte

principal, depende linearmente de Δ x , e a segunda, que é insignificante para pequenos valores
de Δ x , estão ilustradas no diagrama da Fig. 21. Na figura o segmento BC corresponde a Δ y ,
BC = Δ y , e AB corresponde a Δ x , AB = Δ x . Daí, temos:
BC = BD+ DC , BD = [tan β ]Δ x = [ f ' ( x)]Δ x = dy .
62/141
Sendo DC um infinitesimal de ordem maior que Δ x .
Em problemas práticos o diferencial é usado frequentemente como o valor aproximado do

incremento de uma função. Por exemplo, suponha que queiramos determinar o volume das paredes
de uma caixa cúbica fechada cujas dimensões internas são 10 cm x 10 cm x 10 cm, sendo a
espessura da parede igual a 0,05 cm. Se uma grande precisão não for necessária, podemos proceder
como se segue. O volume das paredes da caixa representam um incremento Δ y da função
y = x 3 para x = 10 e Δ x = 0 ,05+0 ,05 = 0 ,1 . Assim, encontramos como uma
aproximação o seguinte resultado:
Δ y ≈ dy = ( x 3)' Δ x = 3 x 2 Δ x = 3×102×0,1 = 30 cm 3 .
Para se ter uma simetria na notação se costuma designar o incremento da variável independente
Δ x por dx e o chamamos também de diferencial. Com esta notação o diferencial dy de uma
função pode ser escrito como:
dy = f ' ( x )Δ x → dy = f ' ( x ) dx .
Assim, a derivada da função f (x ) será a razão do diferencial da função dy para o diferencial da

' dy
variável independente dx: f (x) = .
dx
O diferencial de uma função historicamente originou-se do conceito de “indivisível”. Este conceito,

que no seu tempo, do ponto de vista moderno, nunca foi claramente definido, era, no século XVIII,
um dos fundamentos da análise matemática. As ideias relacionadas com o conceito de “indivisível”
sofreram modificações com o decorrer dos séculos. O indivisível, e mais tarde o diferencial de uma
função, foram representados como infinitesimais de fato, isto é, como sendo alguma coisa na
natureza que tinha magnitude constante extremamente pequena, e, no entanto, era diferente de
zero.37 A definição dada nesta seção é aquela aceita pela análise matemática dos dias de hoje. De
37 N. T. - Infinitesimais têm uma longa e pitoresca história. Eles surgem na matemática do filósofo grego atomista
Demócrito por volta de 450 AC. A teoria atomista dos filósofos gregos Leucipo de Mileto (data incerta) e seu
discípulo Demócrito (470 AC. – 400 AC) postulava que o universo consistia apenas de minúsculos átomos imutáveis
e do espaço vazio entre eles. Os átomos eram não somente indivisíveis, como seu nome sugere (α-τεμνειν, ou seja,
aquilo que não pode ser dividido), mas eram também uniformes, sólidos, duros e incompressíveis. Posteriormente, o
conceito de infinitesimal na matemática foi abolido pelo matemático Eudóxio de Cnido aproximadamente em 350
AC ao introduzir o que veio a ser a matemática “euclidiana” oficial. Tomando a forma de “indivisíveis”, eles
reaparecem na matemática no final da idade média e, mais tarde, têm um papel importante no desenvolvimento do
cálculo. Seu status lógico duvidoso levou a sua rejeição pelos matemáticos do século XIX que o substituíram pelo
conceito de limite. Nos anos mais recentes, entretanto, o conceito de infinitesimal foi restaurado em bases mais
rigorosas.
Tradicionalmente, uma quantidade infinitesimal é aquela que, embora não necessariamente coincidente com zero,
em algum sentido é menor que qualquer quantidade finita. Para a engenharia, um infinitesimal é uma quantidade tão
pequena que seu quadrado e todas as potências maiores podem ser descartadas. Na teoria dos limites o termo
“infinitesimal” é algumas vezes aplicado a qualquer sequência cujo limite é zero. Uma magnitude infinitesimal pode
ser interpretada como o que resta de um contínuo depois que ele é submetido a um processo exaustivo de divisão,
em outras palavras, como um contínuo é examinado em escala microscópica. É neste sentido que curvas contínuas
são algumas vezes entendidas como sendo “compostas” de segmentos de reta infinitesimais.
Referência: Veja o site https://plato.stanford.edu/entries/continuity/#1, e o arquivo: Continuity and

Infinitesimals.pdf.
63/141
acordo com esta definição o diferencial de uma função dy é uma magnitude finita para cada
incremento Δ x e, ao mesmo tempo, é proporcional a Δ x . Outra propriedade fundamental do
diferencial dy que o distingue de Δ y só pode ser reconhecido através de um processo, qual seja:
se considerarmos um incremento Δ x que está se aproximando de zero, então a diferença entre
dy e Δ y será arbitrariamente pequena, mesmo quando comparada com Δ x .
A substituição de pequenos incrementos de uma função pelo diferencial forma a base de muitas
aplicações da análise infinitesimal no estudo da natureza. O leitor verá estas aplicações de forma
bastante clara particularmente no caso de equações diferenciais que serão tratadas neste livro nos
Capítulos 6 e 7.
Assim, de maneira a se determinar a função que representa um dado processo físico, tentamos
inicialmente construir uma equação que relaciona esta função através de alguma forma bem
definida com suas derivadas de diversas ordens. O método de obter uma equação como esta, que
chamamos de equação diferencial, frequentemente se dá através da substituição de incremento das
funções desejadas pelos diferenciais correspondentes.
Fig. 22
Para ilustração do método resolveremos o seguinte problema. Em um sistema de coordenadas

retangulares Oxyz, considere a superfície obtida pela rotação de uma parábola cuja equação no
plano Oyz é dada por: z = y 2 . Esta superfície é chamada de paraboloide de revolução (veja Fig.
22). Designemos por v o volume do corpo limitado pelo paraboloide e o plano paralelo ao plano
definido por Oxy, e situado a uma distância z deste plano. Fica evidente que v é uma função de z
para ( z > 0) .
Para determinar a função v, tentamos encontrar seu diferencial dv. O incremento Δ v da função v
é igual ao volume delimitado pelo paraboloide e dois planos paralelos ao plano Oxy situados
64/141
respectivamente a uma distância z e z+Δ z .
Facilmente se observa que a magnitude de Δ v é maior que o volume do cilindro com raio √ z
e altura Δ z , mas menor que o volume do cilindro com raio √ z +Δ z e altura Δ z . Assim,
temos:
π z Δ z < Δ v < π ( z+ Δ z )Δ z .
Daí, escrevemos a seguinte igualdade:
Δ v = π (z +θ Δ z )Δ z = π z Δ z + π θ (Δ z )2 .
Onde na equação acima θ é algum número que depende de Δz e satisfaz a desigualdade

0 <θ <1 .
Portanto, tivemos sucesso em representar o incremento Δ v na forma de uma soma onde a

primeira parcela é proporcional a Δ z , enquanto a segunda parcela é um infinitesimal de ordem
maior que Δ z quando Δ z → 0 . Segue que a primeira parcela é o diferencial da função v:
dv = π z Δ z .
Ou ainda, usando o fato que Δ z = dz para a variável independente z, fica:
dv = π z dz .
A equação assim obtida relaciona os diferenciais dv e dz associados respectivamente as variáveis v e

dv
z, sendo por isto chamada de uma equação diferencial. Se considerarmos que = v ' , onde
dz
v ’ é a derivada de v com respeito a variável z, nossa equação diferencial pode ser reescrita na
forma:
v' = π z .
Esta é uma equação diferencial muito simples. Para solucioná-la devemos encontrar uma função de
z cuja derivada seja igual a π z . Problemas deste tipo serão abordados na sua forma mais geral
nas Seções 2.10 e 2.11, neste momento pedimos apenas ao leitor para verificar que a solução da
π z2
nossa equação é dada por v = +C , onde C é um número que podemos escolher
2
arbitrariamente.38 No nosso caso o volume do corpo obviamente será zero para z = 0 (veja Fig.
22), de sorte que C = 0 . Com isto a função v que dá o volume do paraboloide de revolução fica:
π z2
v= .
2
Teorema do valor médio e exemplos de sua aplicação. O diferencial de uma função expressa o
valor aproximado do incremento da função em termos do incremento da variável independente e da
derivada da função no ponto inicial do incremento. Se o incremento da variável independente for de
38 Esta fórmula dá todas as soluções da equação diferencial que estamos investigando.
65/141
x=a para x = b ,temos:
⏟
f (b)− f (a) ≈ f ' ( a)(b−a )
.
Δ f ( x)
Entretanto, é possível obter uma equação que dá a solução exata do incremento da função se
substituirmos a derivada f ' (a) no ponto inicial do incremento pela derivada de algum ponto
intermediário convenientemente escolhido no intervalo aberto (a, b). Dizendo de maneira mais
precisa: se y = f ( x) for uma função contínua no intervalo fechado a ≤ x ≤ b e
diferenciável no intervalo aberto a < x < b , então existe um ponto ξ pertencente ao interior
deste intervalo, tal que seguinte igualdade é verdadeira:
⏟
f (b)− f (a) = f ' ( ξ )(b−a )
(22).
Δ f ( x)
A interpretação geométrica do “teorema do valor médio”, também chamado de fórmula de Lagrange

ou fórmula da diferença finita, é extraordinariamente simples. Seja A e B pontos sobre o gráfico da
função f (x ) correspondentes respectivamente as abcissas x = a e x = b . Interliguemos
os pontos A e B formando a corda AB mostrada na Fig. 23.
Fig. 23
Agora movemos o segmento de reta AB para cima ou para baixo, mantendo-o paralelo a orientação
da corda original. No instante em que o segmento de reta AB intercepta o gráfico pela última vez,
ele será tangente ao gráfico em determinado ponto C. Neste ponto, que corresponde a abcissa
x = ξ na figura, a linha tangente ao gráfico terá o mesmo ângulo de inclinação α da corda AB.
Entretanto, para corda AB, temos:
f (b)− f ( a)
tan α = .
b−a
De outra parte, no ponto C podemos escrever:
66/141
tan α = f ' (ξ ) .
Daí, tiramos a equação:
f ( b)− f (a)
= f ' ( ξ ) → f (b)− f (a) = f ' (ξ )(b−a) .
b−a
Esta equação corresponde exatamente o teorema do valor médio.39
A fórmula (22) tem uma característica peculiar porque o ponto ξ que aparece na expressão não é
conhecido. Sabemos apenas que ele pertence ao intervalo aberto (a, b). A despeito de sua
indeterminação, a fórmula tem uma grande importância teórica e faz parte da prova de muitos
teoremas da análise matemática. O interesse prático imediato desta equação também é relevante,
pois ela nos capacita a estimar o crescimento de uma função quando conhecemos os limites entre os
quais sua derivada pode variar. Por exemplo, seja a função:
f (x ) = sen x , logo f ' ( x ) = cos x .
Daí, o módulo da diferença | f (b)− f ( a)| pode ser escrito como:
⏟
|sen ⏟
b−sen a| = |cos ξ |(b−a ) ≤ (b−a)
'
Δ f (x)=Δ sen x f (ξ )
Aqui a, b e ξ são ângulos expressos em radianos e ξ é algum valor no interior do intervalo (a, b).
Apesar do valor ξ ser desconhecido na expressão acima, sabemos que |cos ξ | ≤ 1 , portanto, vale
a desigualdade |sen b−sen a| ≤ 1 .
Da fórmula (22) fica claro que uma função cuja derivada for igual a zero para todos os pontos do
intervalo deve ser uma constante. Com efeito, pela fórmula (22) em nenhuma parte do intervalo seu
incremento pode ser diferente de zero. De modo análogo, o leitor poderá facilmente provar que a
função cuja derivada em todos os pontos do intervalo for positiva será uma função crescente. De
outra parte, se a derivada for negativa a função será decrescente. Daremos a seguir, sem prova, uma
das muitas generalizações do teorema do valor médio.
Seja duas funções arbitrárias ϕ ( x) e ψ ( x ) que são contínuas no intervalo fechado [a, b].
Considere também que estas funções admitam derivadas em todo o intervalo aberto (a, b) e que
ψ ' (x ) ≠ 0 neste intervalo. Então a seguinte equação se verifica:
ϕ ( b)−ϕ (a ) ϕ ' ( ξ )
= (23).40
ψ ( b)−ψ (a ) ψ ' ( ξ )
39 É bom lembrar que estes argumentos nos dão apenas uma interpretação geométrica do teorema do valor médio, e
jamais poderão ser aceitos como uma prova rigorosa do teorema.
40 A fórmula (23) pode ser deduzida simplesmente aplicando o teorema do valor médio à função:
ϕ (b)−ϕ (a)
f ( x) = ϕ ( x)− ψ ( x) .
ψ (b)−ψ ( a)
67/141
Onde ξ é algum ponto do intervalo aberto (a, b).
Deste teorema podemos deduzir um método geral para calcular o limite da expressão:
ϕ (x)
lim (24).
x→ 0 ψ (x )
Se no limite acima temos : ϕ (0) = ψ (0) = 0 , da fórmula (23) podemos escrever:
ϕ ( x)−ϕ (0) ϕ ' (ξ ) ϕ ( x) ϕ ' ( ξ )

= → = .
ψ ( x)−ψ (0) ψ ' ( ξ ) ψ ( x) ψ ' ( ξ )
Onde ξ pertence ao intervalo 0 < ξ < x , portanto, ξ → 0 junto com x. Isto nos permite
ϕ (x)
conhecer o limite dado pela expressão (24), lim , calculando o limite das derivadas
x→ 0 ψ (x )
ϕ '(x)
lim ' , sendo que em muitos casos este último limite é mais fácil de calcular.
x→ 0 ψ ( x )
Esta regra, chamada de regra de L’Hõpital, também pode ser escrita para x→a quando
ϕ (a) = ψ (a) = 0 . Seguindo a mesma argumentação, temos:
ϕ (x ) ϕ ' (a) 41
lim = lim ' .
x→ a ψ ( x ) x→ a ψ ( a)
ϕ (b)−ϕ (a)
De fato, fazendo f ( x) = ϕ ( x)−k ψ ( x) , onde k= , e aplicando o teorema do valor médio
ψ (b)−ψ ( a)
'
para o intervalo fechado [a, b], f (b)− f (a) = f ( ξ )(b−a) , temos:
'
f (b)− f (a) = ϕ (b)−k ψ (b)− ϕ (a)+k ψ ( a) = [ ϕ (ξ )−k ψ ' ( ξ )](b− a) ,
'
f (b)− f (a) = ϕ (b)−ϕ (a)−k ( ψ (b )−ψ (a)) = [ ϕ ( ξ )− k ψ ' ( ξ )](b−a) .
Substituindo o valor de k e simplificando, fica:
[ (ψϕ (b)−
ϕ ' (ξ )−
ϕ (a)
(b)−ψ ( a) ) ]
ψ ' (ξ ) (b−a) = ϕ (b)−ϕ (a)−
( ψ (b)−ψ ( a) )
ϕ (b)−ϕ (a)
( ψ (b)−ψ (a)) = 0 ,
[ (ψϕ (b)−
ϕ ' (ξ )−
(b)−ψ ( a) )
ϕ (a)
]
ψ ' (ξ ) (b−a ) = 0 .
Como (b−a ) ≠ 0 , obtemos:
( )
'
ϕ (b)−ϕ (a) ' ϕ (ξ ) ϕ (b)−ϕ (a)
ϕ ' ( ξ )− ψ (ξ ) = 0 → ' = .
ψ (b)−ψ ( a) ψ (ξ ) ψ (b)−ψ (a)
41 Na verdade, estes limites nos levam a uma indeterminação do tipo 0 /0 , ou seja, uma indeterminação onde o
numerador e o denominador da fração se aproximam de zero ao mesmo tempo. Esta mesma regra é válida para
encontrar o limite de uma expressão fracionária em que o numerador e o denominador se aproximam
simultaneamente do infinito. Este método, que é bem conveniente para se encontrar limites como estes, ou como se
68/141
x−sen x
Exemplo. Para ilustrar o método vamos encontrar o limite: lim . Usando a regra de
x→ 0 x3
L’Hôpital três vezes sucessivamente, obtemos:
x−sen x 1−cos x sen x cos x 1

lim = lim = lim = lim = .
x→0 6 x 6 6
3 2
x→ 0 x x→0 3x x→ 0
2.9 Fórmula de Taylor
A função p ( x ) = a0 + a1 x +a 2 x 2 +⋯+a n x n , onde os coeficientes a k são constantes, é

chamada de polinômio de grau n. Em particular, y = a x +b é um polinômio do primeiro grau, e
y = a x 2 +b x+ c um polinômio do segundo grau. Polinômios podem ser considerados como a
mais simples das funções. De sorte a calcular seu valor para um dado x, tudo que é necessário são
operações de adição, subtração e multiplicação, nem mesmo a operação de divisão é necessária.
Polinômios são funções contínuas para todo x e possuem derivadas de todas as ordens. Por outro
lado, a derivada de um polinômio é outro polinômio cujo grau é o grau do polinômio original menos
um. Além disto, a derivada de ordem n+1 e maiores de um polinômio de grau n são iguais a
zero.
a0 + a1 x +⋯+a n x n
Se acrescentarmos aos polinômios funções da forma y = , para as quais
b 0+ b1 x+⋯+ bm x m
necessitamos também das operações de divisão, e também funções do tipo √ x e √3 x , e,
finalmente, fizermos combinações destas funções, obtemos essencialmente todas as funções cujos
valores podem ser calculados com os métodos que aprendemos na escola secundária.
Também na escola secundária tivemos alguma noção sobre certo número de outras funções do tipo:
√5 x , log x , sen x , arc tan x , … , etc.

Embora tenhamos então assimilado as propriedades mais importantes destas funções, não
encontramos resposta na matemática elementar para a indagação: Como calculá-las? Que tipo de
operação é necessário, por exemplo, se aplicar a x de sorte a obter log x ou sen x ? A resposta
a esta questão é dada por métodos desenvolvidos pela análise matemática. Nesta seção
examinaremos um destes métodos.
Fórmula de Taylor. Suponha que sobre um intervalo contendo o ponto a exista uma dada função
f (x ) com derivadas de todas as ordens. Então o polinômio do primeiro grau
p 1( x) = f (a )+ f ' ( a)( x−a) terá o mesmo valor de f (x ) no ponto x = a , e também,
como podemos verificar facilmente, o mesmo valor da derivada de f (x ) neste ponto. O gráfico
do polinômio é uma linha reta que é tangente ao gráfico de f (x ) no ponto a. É possível ainda
diz: remover indeterminações, será usado, por exemplo, na Seção 10.3 do Capítulo 10. O método apresentado aqui é
conhecido com o nome de regra de L’Hôpital em homenagem ao matemático francês Guillaume François Antoine,
marquês de l'Hôpital (1661 – 1704), que escreveu o primeiro livro sobre cálculo diferencial. Sobre a regra de
L’Hôpital veja também “Cálculo, con funciones de una variable, con una introducción al álgebra lineal”, Tom M.
Apostol, Volume I, Capítulo 7, Seção 7.12, Seção 7.14, página 357 [381] e 363 [387].
69/141
escolher um polinômio do segundo grau como:
' f ' ' (a)

p 2 (x ) = f ( a)+ f (a )( x−a )+ ( x−a )2 .
2
Agora este polinômio tem em comum com f (x ) além do valor no ponto x = a ,

p 2 (a ) = f (a) , os valores da primeira e segunda derivada. Isto assegura que seu gráfico no
ponto a segue mais de perto o gráfico da função f (x ) . É natural especular-se que se
construirmos um polinômio que no ponto x = a tenha os valores de suas primeiras n derivadas
iguais às de f (x ) no mesmo ponto, então este polinômio será uma aproximação ainda melhor de
f (x ) nos pontos x que pertençam à vizinhança de a. Desta maneira obtemos a seguinte
aproximação da função f (x ) que é chamada de fórmula de Taylor:
f ' ' (a) f (n) (a)

f (x ) ≈ f ( a)+ f ' (a )( x−a)+ (x−a)2 +⋯+ ( x−a )n (25).
2 n!
O lado direito da fórmula (25) é um polinômio de grau n em ( x−a) . Para cada valor de x este
polinômio pode ser calculado se conhecermos os valores f (a ), f ' (a) , f ' ' ( a) ,⋯ , f (n) (a ) .
Para funções que tenham derivadas de ordem n+1 ,42 o lado direito da fórmula (25) difere do
lado esquerdo por um pequeno valor que se aproxima de zero mais rapidamente que ( x−a)n
quando x → a , como podemos verificar facilmente.
De fato, observamos que o limite quando x → a do erro da aproximação (25), expresso até o
termo com derivada de ordem n, dividido por ( x−a)n corresponde a uma indeterminação do tipo
0
, isto é:
0
[ ( )
]
' f (n−1 ) (a) n −1 f (n) ( a) n
f ( x)− f ( a)+ f (a)( x−a )+⋯+ ( x−a) + ( x−a)
( n−1)! (n)! 0 .
lim =
x→ a ( x−a) n
0
Para resolver esta indeterminação pela regra de L’Hôpital devemos derivar o numerador e
denominador n vezes. Assim, obtemos sucessivamente:
[ ( )
]
f (n−1) (a ) f (n ) (a)
f ' ( x)− f ' ( a)+⋯+ ( n−1)(x−a)n−2 + (n)( x−a)n−1
(n−1)! (n)! 0 ;
lim =
x→ a n ( x−a)n−1 0
42 N. T. - A derivada de ordem (n+1) é mencionada aqui porque ela nos garante uma expressão exata para o erro
da aproximação polinomial de ordem n da fórmula (25) como veremos logo a seguir.
70/141
[ ( )
]
'' '' f (n−1) (a) n−3 f (n) (a)
f ( x)− f (a )+⋯+ (n−1)(n−2)(x−a) + (n)(n−1)( x−a)n−2
( n−1)! (n)! 0 ;
lim =
x→ a n( n−1)(x−a) n−2
0
⋮
⋮
[ ( ) ]
f (n) (a)
(n)! ⏟
(n)
f ( x )− (n)( n−1)(n−2)⋯(2)(1)
(n )! 0
lim = =0 .
x→ a n! n!
Vemos que na última etapa, que corresponde a derivada de ordem n, ficamos com o limite igual a
zero e a indeterminação está levantada.
Daí, concluímos que realmente o erro da aproximação (25) se aproxima de zero mais rapidamente
que a função do denominador ( x−a)n quando x → a .
Além disto, este é o único polinômio de grau n que difere de f (x ) nas vizinhanças do ponto a
por uma quantidade que se aproxima de zero quando x → a mais rapidamente que ( x−a)n .43
Se f (x ) for um polinômio algébrico de grau n, então a aproximação (25) torna-se uma
igualdade.
Finalmente, e isto é muito importante, podemos dar uma expressão simples para a diferença entre o
lado direito de (25) e o valor exato de f (x ) . Para fazer a aproximação (25) uma igualdade,
devemos adicionar um termo ao lado direito que chamamos de “termo restante”. Assim, temos:
f ' ' (a ) f (n) (a ) f (n+1) ( ξ )

( x−a)n +1
' 2 n
f (x ) = f ( a)+ f (a)( x−a )+ ( x−a ) +⋯+ ( x−a) + (26).
2! n! n+1!
Onde o termo restante é dado por:44
f (n+1 ) (ξ )
Rn +1 (x) = ( x−a) n+1 .
n+ 1!
Este termo tem a peculiaridade que a derivada que aparece na sua expressão é calculada em cada
caso não no ponto a, mas em um ponto convenientemente escolhido ξ, que apesar de desconhecido
se situa no interior do intervalo (a, x).
A prova da igualdade (26) é de certo modo trabalhosa, mas muito simples na sua essência. Daremos
aqui uma versão um pouco artificial da prova, embora ela tenha o mérito de ser concisa.
De maneira a encontrar quanto o lado esquerdo da aproximação (25) difere do lado direito,
43 N. T. - Observe que a função ( x−a) n é ela própria um polinômio de grau n.

44 Esta é uma das possíveis forma de se expressar o termo restante Rn +1 ( x) . Veja “Introduction to Calculus and
Analysis”, Richard Courant e Fritz John, Volume I, Capítulo 5, Seção 5.4, página 447.
71/141
considere a razão entre a diferença dos lados direito e esquerdo em (25) e a quantidade
−( x−a n +1) :
[
f ( x)− f (a)+ f ' (a)(x −a)+
f ' ' (a)
2!
( x−a)+⋯+
n+1
f (n) (a)
n!
(x−a)n ] (27).
−( x−a )
Também introduzimos a função com variável u, tomando x como uma constante, do seguinte modo:
' f ' ' (u) 2 f n −1 ( u) n−1 f n (u )

ϕ (u) = f ( u)+ f (u)( x−u)+ ( x−u) +⋯+ ( x−u) + ( x −u)n 1 .
(2)! ( n−1)! (n)!
Então, o incremento da função acima ϕ (u) quando passarmos de u=a para u= x é

igual ao numerador em (27). De fato:
' f ' ' (u) f (n−1) (u) n−1 f (n) (u)

ϕ ( x)−ϕ (a) = f ( x )+ f ( x )( x− x)+ ( x−x )+⋯+ (x− x) + ( x−x )n
⏟ (2)! (n−1)! (n)!
=0
[ ]
(n−1)
f (n) ( a)
''
' f (a ) f ( a) n−1 .
− f (a )+ f ( a)( x−a)+ ( x−a)+⋯+ ( x−a) + ( x−a )n =
(2)! (n−1)! (n)!
[ '
= f (x )− f ( a)+ f (a )( x−a)+
f ' ' ( a)
2!
( x−a )+⋯+
f (n−1) (a)
( n−1)!
n −1
(x −a) +
f (n )(a)
n!
(x−a)n ]
Do mesmo modo, o denominador de (27) é igual ao incremento quando passamos de u=a para
u = x na função:
ψ (u) = ( x−u)n+1 .
Com efeito, podemos escrever:
ψ ( x )−ψ (a ) = (⏟
x−x) n+1 −(x −a)n +1 = −( x−a )n+1 .
=0
Agora fazendo uso do teorema do valor médio generalizado que apresentamos anteriormente,
escrevemos:
ϕ ( x)−ϕ (a) ϕ ' (ξ )

= ' .
ψ ( x)−ψ (a) ψ ( ξ )
Calculando a derivada de ϕ (u) , obtemos:
72/141
' ' '' f (3) (u)

' 2 f ''
ϕ (u) = f (u)+ f (u)( x−u)− f (u)+ ( x−u) − 2( x−u)+⋯
( 2)! 2!
(n ) (n−1) (n+1 ) (n) .
f (u) n−1 f (u) n−1 f (u) n f (u) n−1
⋯+ (x−u) − ( n−1)(x −u) + ( x−u) − (n)(x−u)
(n−1)! (n−1)! ( n)! (n)!
Rearranjando os termos para enfatizar as simplificações:
f '' f (3) (u)

ϕ ' (u) = f ' (u)− f ' (u )+ f ' ' ( u)( x−u)−
2( x−u)+ ( x−u)2 + ⋯
2! (2)!
(n−1) (n) (n ) (n +1) .
f (u ) n−1 f (u ) n −1 f (u) n −1 f (u) n
⋯− (n−1)( x−u) + ( x−u) − (n)( x−u) + (x−u)
(n−1)! (n−1)! (n)! (n)!
Finalmente;
' f (n +1) (u )
ϕ ( u) = ( x−u)n .
(n)!
Para derivada de ψ (u) = ( x−u)n+1 , temos:
ψ ' (u) = −( n+1)( x−u) n .
Substituindo estes resultados no teorema do valor médio, fica:
ϕ ( x)−ϕ (a) ϕ ' (ξ )

= '
ψ ( x)−ψ (a) ψ ( ξ )
= (
f (n +1) ( ξ )
( n)!
( x−ξ )n )( 1
−(n+1)( x−ξ )n
= −
)
f (n+1) ( ξ )
(n+1)!
,
ϕ ( x)−ϕ (a) ϕ ' (ξ ) f (n +1) (ξ )

= =− .
ψ ( x)−ψ (a) ψ ' ( ξ ) (n+ 1)!
Fazendo a igualdade desta última expressão com a quantidade (27) encontramos a fórmula de
Taylor expressa por (26):
[
f ( x)− f (a)+ f ' (a)(x −a)+
f ' ' (a)
2!
( x−a)+⋯+
f (n) (a)
n!
(x−a)n
=−
]
f (n +1) ( ξ ) ,
−( x−a )n+1 (n+1)!
[ '
f (x )− f ( a)+ f (a)( x−a )+
f ' ' (a)
2!
( x−a )+⋯+
f (n ) (a )
n!
n
( x−a) = ]
f (n+1) ( ξ )
( n+1)!
( x−a)n +1 ,
f ' ' (a ) f (n) (a ) f (n+1) ( ξ )

f (x ) = f ( a)+ f ' (a)( x−a )+ ( x−a )2+⋯+ ( x−a) n+ ( x−a)n +1 .
2! n! ( n+1)!
A fórmula de Taylor (26) não somente nos dá uma maneira de se fazer o cálculo aproximado de
uma função f (x ) , como também nos permite estimar o erro desta aproximação. Como um
73/141
exemplo simples considere a função: f (x ) = sen x .
Os valores da função f (x ) = sen x e de suas derivadas de qualquer ordem são conhecidos para
x = 0 . Vamos usar estes valores para escrever a fórmula de Taylor de f (x ) = sen x ,
escolhendo a = 0 e nos limitando ao caso de n = 4 . Assim, escrevemos sucessivamente:
f (x ) = sen x , f ' ( x ) = cos x , f ' ' ( x) = −sen x ,
f ' ' ' ( x) = −cos x , f (4 ) ( x) = sen x , f (5) ( x) = cos x ;
f (0) = 0 , f ' (0) = 1 , f ' ' (0) = 0 ,
f ' ' ' (0) = −1 , f (4 ) (x) = 0 , f (5) ( ξ ) = cos ξ .
Portanto, obtemos:
x3 x5 x5
sen x = x− + R5 , onde R5 = cos ξ = cos ξ .
6 5! 120
Embora se desconheça o valor exato de R5 , ainda podemos estimar facilmente o termo restante
π
considerando o fato que cos ξ ≤ 1 . Para todos os valores de x entre 0 e 4 , temos:
|R5| = | x5
120 |
cos ξ <
1 π
120 4 ( )
5
<
1
400
.
Daí, concluímos que no intervalo fechado [0 , π4 ] a função sen x pode ser aproximada com
1
uma precisão melhor que pelo polinômio do terceiro grau:
400
x3
sen x = x− .
6
Se tomarmos mais termos na expansão de Taylor da função sen x , obteremos um polinômio de

grau maior que se aproximaria de forma mais exata da função sen x .
As tabelas trigonométricas e outras funções são calculadas por métodos semelhantes.
As leis da natureza, em geral, podem ser expressas com boa aproximação por funções que possuem
derivadas de todas as ordens, isto nos permite aproximá-las por polinômios, onde o grau do
polinômio é determinado pela precisão desejada.
Série de Taylor. Antes de iniciar este tópico daremos os conceitos matemáticos de série e de
sequência, embora voltaremos a abordar este assunto na Seção 2.14. Na linguagem corrente as
palavras “série” e “sequência” são utilizadas para designar um conjunto de coisas ou eventos
74/141
dispostos em uma ordem.45
Em matemática, estas palavras têm significados técnicos diferentes. A palavra “sequência” tem um
sentido análogo a da linguagem corrente. Com ela se deseja indicar um conjunto de objetos postos
em ordem, onde a cada inteiro positivo “n” é possível associar um número “an”. A palavra “série” se
usa no contexto matemático com um sentido completamente distinto como veremos a seguir.
A partir de uma sequência de números reais é possível se formar uma nova sequência somando os
termos sucessivamente.
Assim, dado uma sequência com um número infinito de termos: a1, a2,…,an,…, pode se formar a
sequência de somas parciais definidas como:
S 1 = a1 ; S 2 = a 1 +a 2 ; S 3 = a1 + a2 + a3 ;⋯ .
Podemos definir, portanto, o termo de ordem “n” desta nova sequência como sendo a soma dos “n”
primeiros termos da sequência original {an}.
n
S n = a 1 +a 2 +a 3 +⋯+a n = ∑ a k .
k=1
A sequência com um número infinito de somas parciais46 {Sn}, se chama série infinita ou
simplesmente série, e se representa por um dos seguintes símbolos:
∞
a 1+ a 2 +a 3 +⋯ ; a1 + a 2+ a 3+⋯+ a n+⋯ ; ∑ ak
k=1
Estes símbolos indicam que a sequência de somas parciais se obtém da sequência {an} por adição
de termos sucessivos.
Se na fórmula (25) tomarmos um número de termos cada vez maior, então a diferença entre
f (x ) e o lado direito de (25), expresso pelo termo restante Rn +1 (x) , pode tender a zero.
Naturalmente, isto nem sempre ocorrerá para todas as funções nem para todos os valores de x. No
entanto, existe uma extensa classe de funções, as chamadas funções analíticas, para as quais o
termo restante Rn +1 (x) de fato se aproxima de zero quando n → ∞ , pelo menos para todos os
valores de x dentro de certo intervalo em volta do ponto a. Para estas funções a fórmula de Taylor
nos permite calcular o valor de f (x ) com qualquer grau de precisão. Passaremos agora a
examinar tais funções em mais detalhes.
Se Rn +1 ( x) → 0 quando n → ∞ , então segue da fórmula (26) que:
n→ ∞
[
f (x ) = lim f (a )+ f ' (a)( x−a )+
f ' ' (a )
2
( x−a) 2+⋯+
f (n ) (a )
n!
( x −a)n ] .
45 N. T. - O texto realçado foi incorporado a esta tradução e está baseado no livro: “Calculus – introducción con
vectores y geometría analítica”, Tom M. Apostol, Volume I, Capítulo 10, Seção 10.2, página 462 [486] e seguintes.
46 N. T. -{Sn} é o conjunto das somas parciais {S1, S2, ...Sn,...}, construído a partir da sequência definida pelos termos
do conjunto {an}, portanto, ambos conjuntos têm um número infinito de termos.
75/141
Neste caso dizemos que f (x ) foi expandida em uma série infinita convergente de potências
crescentes de ( x−a) :
' f ' ' (a )

f (x ) = f ( a)+ f (a)( x−a )+ ( x−a )2+⋯+ .
2
Esta série é chamada de série de Taylor, e se diz que f (x ) é a soma de uma série infinita de
termos. Vejamos alguns exemplos onde na série de potências faremos a = 0 .
n(n−1) 2 n( n−1)(n−2) 3
1. (1+ x )n = 1+ n x + x + x +⋯ (válido para |x| < 1 e n um número
2! 3!
real arbitrário).
x3 x5 x7
2. sen x = x− + − +⋯ (válido para todo x).
3! 5! 7!
x 2 x 4 x6
3. cos x = 1− + − +⋯ (válido para todo x).
2! 4! 6!
x2 x3
4. e x = 1+ x + + +⋯ (válido para todo x).
2! 3!
x3 x 5
5. arc tan x = x − + −⋯ (válido para |x| < 1 ).
3 5
O primeiro destes exemplos é o famoso teorema binomial de Newton, válido para todo n, mas no
tempo de Newton a prova se limitava a n inteiro. Este exemplo serviu como modelo para
estabelecer a fórmula geral de Taylor. As últimas duas fórmulas para x = 1 nos permite calcular
com qualquer aproximação arbitrariamente escolhida os números e e π.
A fórmula de Taylor, que nos abre a possibilidade de realizar muitos cálculos em análise matemática
aplicada, é extremamente importante do ponto de vista prático.
Muitas leis da natureza, processos físicos e químicos, movimento dos corpos, e outros fenômenos,
são expressos com grande precisão por funções que podem ser expandidas pela série de Taylor. A
teoria sobre estas funções pode ser formulada de uma maneira completa e mais clara se as
considerarmos como sendo funções de variáveis complexas como veremos no Capítulo 9.
A ideia de aproximar uma função por polinômio ou de representá-la por uma soma de um número
infinito de funções mais simples aprofundou o desenvolvimento da análise com consequências
notáveis e hoje este tópico forma um ramo autônomo, qual seja: o da teoria da aproximação de
funções (veja Capítulo 12).
2.10 Integral
Do Capítulo 1 e da Seção 2.1 deste capítulo o leitor já tomou conhecimento que o conceito de
76/141
integral, e de maneira mais geral do cálculo integral, teve sua origem histórica na necessidade de se
resolver problemas reais, um exemplo característico é o cálculo da área de uma figura curvilínea. A
presente seção é dedicada a estas questões. Nela discutiremos as conexões mencionadas
previamente entre os problemas do cálculo diferencial e do cálculo integral, que não foram
totalmente elucidadas até o século XVIII.
Área. Suponha que uma curva situada acima do eixo dos x forme o gráfico da função y = f ( x) .
Aqui nos propomos a calcular a área S delimitada pela linha y = f ( x) , pelo eixo dos x, e pelas
linhas retas paralelas ao eixo dos y que passam pelos pontos x = a e x = b .
Para resolver este problema procedemos do seguinte modo. Dividimos o intervalo fechado [a, b] em
n partes, não necessariamente iguais. Designamos o primeiro intervalo de Δ x 1 , o segundo de
Δ x 2 , e assim por diante até alcançar o último intervalo Δ x n . Em cada intervalo escolhemos
pontos ξ 1 , ξ 2 , … , ξ n , e construímos a soma:
S n = f ( ξ 1 ) Δ x 1+ f ( ξ 2) Δ x 2+⋯+ f ( ξ n )Δ x n (28).
Naturalmente, a magnitude de S n é igual à área dos retângulos hachurado da fig. 24.
Fig. 24
Quanto mais subdividirmos o intervalo fechado [a, b], mais próximo o resultado da soma S n
será igual à área S que procuramos. Se prosseguirmos com uma sequência de construções como
esta, dividindo o intervalo [a, b] em partes sucessivamente menores, então as somas S n se
aproximarão cada vez mais de S.
A possibilidade de dividir o intervalo [a, b] em partes desiguais faz necessário se definir o

significado de subdivisões “sucessivamente menores”. Assumimos não somente a hipótese que n
cresce além de todos os limites, mas também que o maior comprimento Δ x i da enésima
subdivisão se aproxima de zero. Assim, escrevemos:
77/141
n
S= lim
max. Δ x i →0
[ f (ξ 1)Δ x1 + f ( ξ 2) Δ x 2+⋯+ f ( ξ n )Δ x n ] = lim ∑ f (ξ i )Δ x i
max. Δ x i →0 i =1
(29).
Desta maneira o cálculo da área desejada fica reduzido a se encontrar o limite (29).
Note que quando enunciamos o problema, tínhamos apenas uma ideia empírica do significado da
área da nossa figura curvilínea, mas faltava uma definição precisa. Agora, entretanto, obtivemos
uma definição exata do conceito de área: A área é o limite (29). Portanto, temos não somente a
noção intuitiva de área como também sua definição matemática com base na qual podemos calcular
o valor numérico da área (compare com as observações no fim da Seção 2.3 sobre velocidade e
comprimento de uma circunferência).
Até aqui admitimos que f ( x ) ≥ 0 . Se f (x ) mudar de sinal como na Fig. 25, então o limite
(29) será a soma algébrica das partes da área situadas entre a curva f (x ) e o eixo dos x, onde as
partes acima do eixo dos x serão tomadas com sinal positivo e aquelas localizadas abaixo serão
tomadas com o sinal negativo.
Fig. 25
Integral definida. Devido à necessidade de se calcular o limite (29) surge muitos outros problemas.
Por exemplo, suponha que um ponto esteja se movendo ao longo de uma linha reta com velocidade
variável v = f (t ) . Como poderíamos determinar a distância s coberta pelo ponto entre os
instantes de tempo t = a e t = b ?
Considere que a função f (t) seja contínua, isto é, para pequenos intervalos de tempo a
velocidade muda muito pouco. Dividamos o intervalo fechado [a, b] em n partes de comprimento
Δ t 1 , Δ t 2 , … , Δ t n . Para calcular um valor aproximado da distância percorrida em cada
intervalo Δ t i , supomos que a velocidade neste período de tempo seja constante e igual a seu
valor em um ponto intermediário ξ i . A distância total percorrida será então expressa
aproximadamente pela soma:
n
sn = ∑ f (ξ ) Δ t i .
i =1
78/141
Com isto o valor exato da distância s percorrida pelo ponto entre os instantes de tempo a e b será o
limite dos somatórios como este para subdivisões do intervalo [a, b] cada vez menores, ou seja, será
o limite (29):
( )
n
S = lim
n →∞
lim ∑ f (ξ i )Δ x i
max. Δ x i → 0 i=1
.
Seria fácil dar muitos exemplos de problemas práticos que levam ao cálculo de um limite como
este. Discutiremos alguns deles posteriormente, mas por um momento os exemplos que já demos
serão suficientes para indicar a importância desta ideia. O limite (29) é chamado de integral
definida da função f (x ) tomada no intervalo fechado [a, b], e é indicado pelo símbolo:
b
∫ f ( x ) dx .
a
A expressão f ( x ) dx é chamada de integrando; a e b são os limites de integração, sendo a o

limite inferior e b o limite superior.
Relação entre cálculo diferencial e cálculo integral. Como exemplo de cálculo direto de uma
integral indefinida podemos tomar o exemplo 2 da Seção 2.1. Observa-se que o problema
considerado neste exemplo se reduz ao cálculo da integral definida:
h
∫ a x dx .
o
Outro exemplo foi considerado na Seção 2.3, onde resolvemos o problema de encontrar a área
limitada pela parábola y = x 2 . Aqui a questão se reduz ao cálculo da integral;
1
∫ x 2 dx .
0
Fomos capazes de calcular estas duas integrais diretamente porque tínhamos à mão fórmulas
simples para a soma dos n primeiros números naturais e também a soma dos seus quadrados.
Entretanto, para uma função arbitrária f (x ) , se os pontos ξ i e os incrementos Δ x i são
dados para atender algum problema em particular, em geral, não seremos capazes de realizar a soma
(28), isto é, de expressar o resultado em uma fórmula simples como fizemos. Além disto, mesmo
quando expressar este somatório é possível, não existe nenhum método geral que nos conduza até
ele. Na verdade, vários métodos, cada qual com sua particularidade especial, devem ser usados
nestes casos.
Assim, somos confrontados com o problema de encontrar um método geral para o cálculo das
integrais definidas. Historicamente esta questão interessou os matemáticos por um longo período de
tempo, pois havia muito aspectos práticos envolvidos na determinação de um método geral de se
encontrar a área de uma figura curvilínea, bem como os volumes de corpos limitados por uma
superfície curva, e assim por diante.
79/141
Já mencionamos que Arquimedes desenvolveu uma maneira de calcular a área do segmento de uma
parábola e de outras figuras. À medida que o tempo passava o número de problemas especiais
envolvendo áreas, volumes, centro de gravidade de sólidos, e outras particularidades, que podiam
ser solucionados com estes recursos gradualmente aumentaram, mas no início o progresso na busca
de um método geral avançou lentamente. O método geral não pôde ser descoberto até que suficiente
material teórico e computacional fosse acumulado através das demandas da vida prática. O trabalho
de recolher e generalizar este material aconteceu pouco a pouco até o fim da idade média. Seu
desenvolvimento vertiginoso subsequente foi uma consequência direta do rápido crescimento dos
meios de produção na Europa como resultado da substituição dos antigos métodos de manufatura do
regime feudal pelos novos métodos criados pelo capitalismo que começava a se instalar.
A acumulação de fatos conectados com integrais definidas aconteceu simultaneamente com as

investigações correspondentes relacionadas à derivada de uma função. O leitor já sabe da Seção 1
que este imenso esforço preparatório foi coroado com sucesso no século XVII com os trabalhos de
Newton e Leibnitz. É neste sentido que Newton e Leibnitz são os criadores dos cálculos diferencial
e integral.
Uma das contribuições fundamentais de Newton e Leibnitz foi o fato que eles finalmente
esclareceram a profunda inter-relação entre os cálculos diferencial e integral, que nos deu, em
particular, o método geral para calcular integrais definidas para uma ampla classe de funções.
Para expor esta inter-relação, voltamos a um exemplo da mecânica. Suponha que um corpo pontual
esteja se movendo ao longo de uma linha reta com velocidade v = f (t ) , onde a variável
independente t é o tempo. Sabemos que a distância σ percorrida pelo ponto entre os instantes de
tempo t = t 1 e t = t 2 é dado pela integral definida:
t2
σ = ∫ f (t)dt .
t1
Agora assumimos que a lei de movimento do corpo pontual seja conhecida, isto é, que conhecemos
a função s = F (t ) expressando a dependência com o tempo t da distância s percorrida pelo
corpo calculada a partir de um ponto inicial A sobre a linha reta. A distância σ coberta no intervalo
de tempo [t 1 , t 2 ] obviamente é igual à diferença:
σ = F (t 2 )−F (t 1 ) .
Desta maneira somos levados por considerações físicas a escrever a igualdade:

t2
σ = ∫ f (t) dt = F (t 2)− F (t 1) .
t1
Esta igualdade expressa a interconexão entre a lei do movimento do corpo pontual e sua velocidade.
Do ponto de vista matemático a função F (t) , como vimos na Seção 2.5, pode ser definida como
uma função cuja derivada para todos os valores de t em um dado intervalo é igual a f (t) , isto é:
80/141
F '(t ) = f ( t) .
Devido a esta relação, também se diz que F (t) é a função primitiva de f (t) .
Devemos ter em mente que se a função f (t) possui pelo menos uma primitiva, então junto com
esta primitiva ela terá um número infinito de funções primitivas, visto que se F (t) é uma
primitiva de f (t) , do mesmo modo, a função F (t)+C , onde C é uma constante arbitrária,
também será uma primitiva de f (t) . Assim, esgotamos todo o conjunto de primitivas de
f (t) , pois, se F 1 (t ) e F 2 (t) forem primitivas da mesma função f (t) , então a
diferença entre elas, ϕ (t) = F 1 (t)− F 2 (t ) , possui derivada ϕ ' (t ) igual a zero em todo ponto
do intervalo. De fato:
F 1' (t )=F '2 (t ) = f (t) → ϕ ' (t) = F '1 (t )−F '2 (t) = f (t)− f (t ) = 0 .
Portanto, é ϕ (t) = F 1 (t)− F 2 (t ) uma constante.47
Sobre o enfoque da física os vários valores da constante C determinam as leis dos movimentos do
corpo que diferem uma das outras apenas pelo fato que elas correspondem a todas as escolhas
possíveis do ponto inicial do movimento.
Assim, somos levados a conclusão que para uma ampla classe de funções f (x ) , incluindo todos
os casos onde a função f (x ) pode ser considerada como sendo a velocidade de um corpo
pontual em um dado instante de tempo x, a seguinte igualdade é válida:48
b
∫ f ( x ) dx = F (b)− F ( a) (30).
a
Onde F ( x) é a primitiva de f (x ) .
A igualdade (30) é a famosa fórmula de Newton e Leibnitz que reduz o problema de se calcular a
integral indefinida de uma função a encontrar sua primitiva. Desta maneira, ela faz uma conexão
entre os cálculos diferencial e integral.
Muitos problemas específicos que foram estudados por grandes matemáticos são automaticamente
solucionados por esta fórmula que estabelece ser a integral definida de uma função f (x ) no
intervalo fechado [a, b] igual à diferença entre os valores de alguma primitiva da função tomada nos
limites à esquerda e à direita do intervalo.49 É usual se escrever a diferença (30) como:
47 Com efeito, pelo teorema do valor médio podemos escrever:

'
ϕ (t )−ϕ (t 0) = ϕ (ν )( t−t 0 ) = 0 .
Onde ν pertence ao intervalo [t ,t 0 ] , portanto, ϕ (t ) = ϕ (t 0 ) = constante para todo t .

48 É possível provar matematicamente sem o recurso de exemplos da mecânica, que se a função f ( x) for contínua
(ou mesmo sendo descontínua, seja integrável no sentido de Lebesque. Veja Capítulo XV) no intervalo [a, b], então
existe uma primitiva F ( x) que satisfaz a igualdade (30).
49 Esta fórmula foi generalizada de várias maneiras. Veja, por exemplo, a fórmula de Ostrogradsky, Seção 2.13.
Mikhail Vasilyevich Ostrogradsky (1801 – 1862) foi um importante matemático russo.
81/141
b
F ( x)|a = F (b)− F ( a) .
( )
'
x3 x3
Exemplo 1. A igualdade = x 2 , nos mostra que a função é uma primitiva da função
3 3
x2 . Assim, pela fórmula de Newton e Leibnitz, temos:
|
a a
x3 a3 0 a3
∫ x 2
dx = −
3 0
= −
3 3
=
3
.
0
Exemplo 2. Suponha que q e q´ sejam duas cargas elétricas sobre uma linha reta, situadas a uma
distância r uma da outra. A força de atração F entre elas estará dirigida ao longo da reta e será igual
a:
a
F= .
r2
'
Onde: a = k q q , sendo k uma constante. O trabalho W feito por esta força quando a carga q fica
estacionária, mas q´ se move ao longo da reta no intervalo [ R1 , R2 ] , pode ser calculado dividindo
o intervalo [ R1 , R2 ] em partes menores Δ r i . Em cada uma destas partes podemos considerar
a força Fi como sendo aproximadamente constante, de sorte que o trabalho feito em cada
a
()
subintervalo será igual a: F i Δ r i = 2 Δ r i . Fazendo com que estes subintervalos sejam cada
ri
vez menores, vemos que o trabalho W será igual à integral:
R2
()
n
a a
W = lim ∑ 2
Δ r i = ∫ 2 dr .
n →∞ i=1 ri R r 1
O valor desta integral pode se calculado imediatamente se nos lembrarmos de que:
( )
'
a a
2
= − .
r r
Daí, tiramos:
| = a ( R1 − R1 ) .
R2
a
W =−
r R1 1 2
Em particular, o trabalho feito pela força F quando a carga q´, inicialmente a uma distância R1
da carga q se move para o infinito é igual a:
W = lim a
R2 →∞ ( 1
−
1
R1 R2
=
a
R1
.)
82/141
Dos argumentos mencionados acima para a fórmula de Newton e Leibnitz, fica claro que esta
fórmula dá a expressão matemática de uma inter-relação existente no mundo objetivo. 50 Este é um
belo e importante exemplo de como a matemática dá expressão a leis objetivas. Devemos lembrar
que em suas investigações matemáticas Newton sempre se apoiou no ponto de vista da física. Seus
trabalhos sobre os fundamentos dos cálculos diferencial e integral não podem ser separados dos
seus trabalhos sobre os fundamentos da mecânica.
Os conceitos de análise matemática, tais como o de derivada ou integral, quando foram

considerados por Newton e seus contemporâneos não estavam ainda completamente desvinculados
de suas origens físicas e geométricas, por exemplo, da velocidade e área. De fato, eles tinham um
caráter metade matemático e metade físico. As condições existentes nesta época eram insuficientes
para produzir uma definição puramente matemática destes conceitos. Consequentemente, o
investigador só poderia manipulá-los corretamente em situações complicadas se permanecesse em
contato muito próximo com os aspectos práticos do seu problema mesmo durante os estágios
(matemáticos) intermediários da sua argumentação.
Deste ponto de vista o trabalho criativo de newton teve características diferentes do trabalho de
Leibnitz.51 Newton era guiado em todas as etapas de suas descobertas pela perspectiva física de se
analisar o problema. Por outro lado, as investigações de Leibnitz não tinham uma conexão imediata
com a física, um fato, que na ausência de definições matemáticas precisas, o levou a conclusões
equivocadas. Por outro lado, uma das principais características de sua atividade criativa foi seu
desejo pelas generalizações, isto é, seu esforço para encontrar métodos gerais para os problemas de
análise matemática.
O maior mérito de Leibnitz foi ter criado um simbolismo matemático expressando a essência do
assunto. As notações de tais conceitos fundamentais da análise matemática como o diferencial dx, o
d
diferencial de segunda ordem d 2 x , a integral ∫ y dx , a derivada , foram propostos por
dx
Leibnitz. O fato de usarmos estas notações até hoje comprova como esta simbologia foi bem
escolhida.
Uma vantagem de se escolher bem o simbolismo é que isto faz com que as provas e cálculos fiquem
mais concisos e fáceis. Eles também, algumas vezes, nos ajudam a evitar conclusões falsas. Leibnitz
era muito consciente deste fato, e dava uma atenção especial em todos os seus trabalhos na escolha
50 N. T. - O mundo objetivo é o mundo externo ao indivíduo (ou seja, é a realidade externa), mas que pode ser
compreendido por ele. Fala-se, portanto, em razão objetiva (a realidade é racional em si mesma) e em razão
subjetiva (a razão é uma capacidade intelectual e moral dos seres humanos). A razão objetiva é a afirmação de que o
objeto do conhecimento ou a realidade é racional; a razão subjetiva é a afirmação de que o sujeito do
conhecimento e da ação é racional. Para muitos filósofos, a Filosofia é o momento do encontro, do acordo e da
harmonia entre as duas razões ou racionalidades.
A física sempre considerou que a Natureza obedece às leis universais da razão objetiva sem depender da razão
subjetiva. Em outras palavras, as leis da Natureza existem por si mesmas, são necessárias e universais por si mesmas
e não dependem do sujeito do conhecimento.
Chama-se realismo a posição filosófica que afirma a existência objetiva ou em si da realidade externa como uma
realidade racional em si e por si mesma e, portanto, que afirma a existência da razão objetiva. Há filósofos, porém,
que estabelecem uma diferença entre a realidade e o conhecimento racional que dela temos. Dizem eles que, embora
a realidade externa exista em si e por si mesma, só podemos conhecê-la tal como nossas ideias a formulam e a
organizam e não tal como ela seria em si mesma. Não podemos saber nem dizer se a realidade exterior é racional em
si, pois só podemos saber e dizer que ela é racional para nós, isto é, por meio de nossas ideias. Veja “Convite à
Filosofia”, Marilena Chauí, Capítulos 1 e 2.
51 Vale mencionar que as descobertas de Newton e Leibnitz foram feitas independentemente.
83/141
das notações.
Naturalmente, a evolução dos conceitos da análise matemática (derivada, integral, e assim por
diante) continuou após Newton e Leibnitz, e continua até os dias de hoje. Entretanto, existe uma
etapa desta evolução que deve ser mencionada em especial. Ela ocorreu no começo do século XIX e
está relacionada particularmente com o trabalho de Cauchy.
Cauchy deu uma definição formal convincente do conceito de um limite, e usou este conceito como
base para suas definições de continuidade, derivada, diferencial, e integral. Neste capítulo estas
definições foram introduzidas sempre que abordamos o tópico correspondente. Elas até hoje são
usadas largamente na análise matemática.
A grande importância destas realizações funda-se no fato que hoje é possível operar de uma maneira
puramente formal não somente na aritmética, álgebra, geometria elementar, mas também neste novo
e amplo ramo da matemática, isto é, na análise matemática, obtendo resultados corretos quando
assim procedemos.
Com respeito às aplicações práticas dos resultados da análise matemática, hoje é possível dizer que
se os dados originais se verificam no mundo real, então os resultados dos nossos argumentos
matemáticos também serão válidos neste mundo. Isto é, se tivermos confiança na precisão dos
dados originais, então não existe necessidade de fazermos uma verificação prática da correção dos
resultados matemáticos, é suficiente apenas indagar sobre a correção da argumentação formal.
Este enunciado evidentemente requer a seguinte ressalva. Os argumentos matemáticos feitos com
base nos dados originais tomados do mundo real são verdadeiros somente dentro de certa precisão.
Isto significa que em toda etapa da nossa argumentação matemática o resultado obtido incorrerá em
certo erro que poderá se acumular à medida que o número de etapas do processo argumentativo
aumenta.52
Retornando agora à integral definida, abordaremos uma questão de importância fundamental. Para
quais funções f (x ) definidas no intervalo fechado [a, b] é possível garantir a existência da
b
integral definida ∫ f ( x ) dx , ou seja, a existência de um número para o qual o somatório

a
n
∑ f ( ξ i)Δ x i tende como limite quando ( max.Δ x i → 0) ? Aqui devemos ter em mente que
i=1
este número é o mesmo para todas as possíveis subdivisões do intervalo [a, b] e todas as escolhas
dos pontos ξ i .
As funções para as quais a integral definida existe, isto é, o limite (29) existe, são ditas serem
integráveis no intervalo [a, b]. Investigações realizadas no século XIX mostraram que todas as
funções contínuas são integráveis.
52 Por exemplo, segue formalmente que se a = b e b = c , então a = c . Entretanto, na prática, a relação

aparece do seguinte modo: O fato que a = b é conhecido dentro de certa precisão ϵ , e suponha que
b = c também é conhecido com a mesma precisão, segue que: a = c com precisão igual a 2ϵ .
Escrevendo de maneira mais sucinta:
a = b±ϵ e b = c±ϵ , então a = c± 2ϵ .
84/141
No entanto, existem também funções descontínuas que são integráveis. Entre estas, por exemplo,
aquelas funções que são limitadas e crescem ou decrescem no intervalo [a, b].
Por outro lado, a função que é igual a zero nos pontos racionais do intervalo [a, b] e igual à unidade
nos pontos irracionais serve como exemplo de uma função não integrável, pois, para uma
subdivisão arbitrária do intervalo [a, b], a soma S n será zero ou igual à unidade dependendo se
escolhemos os pontos ξ i como números racionais ou irracionais.
Observamos que em muitos casos a fórmula de Newton e Leibnitz nos permite encontrar uma
resposta prática para a questão de calcular uma integral definida. Entretanto, existe o problema em
aberto de se encontrar a função primitiva de uma dada função, isto é, encontrar uma função que
tenha por derivada a função dada. Passaremos a discutir esta questão na próxima seção. A propósito,
lembramos também que o problema de se encontrar a primitiva de uma função é de grande
importância em outros ramos da matemática, particularmente na solução de equações diferenciais.
2.11 Integrais Indefinidas; Técnicas de Integração
Uma primitiva arbitrária de uma função dada f (x ) é usualmente chamada de uma integral
indefinida de f (x ) e recebe a notação:
∫ f ( x ) dx .
Desta maneira, se F ( x) for uma primitiva completamente determinada da função f (x ) ,

então a integral indefinida de f (x ) será dada por:
∫ f ( x ) dx = F (x )+C (31).
Onde C em (31) é uma constante arbitrária.
Observamos também que se a função f (x ) for definida no intervalo [a, b], e se F ( x) for
uma primitiva de f (x ) , sendo x um ponto no intervalo [a, b], então a fórmula de Newton
Leibnitz nos permite escrever:
x
F ( x) = F (a)+∫ f (t ) dt .53
a
Aqui a integral do lado direito se diferencia da primitiva F ( x) apenas por uma constante
F ( a) . Portanto, esta integral, se a considerarmos como uma função do limite superior x, isto é,
se tomarmos x como uma variável independente, será uma primitiva bem determinada da função
f (x ) . Consequentemente, a integral indefinida de f (x ) pode ser escrita também como:
53 N. T. - De fato:
F ( x) = F (a)+∫ f (t ) dt → F ( x) = F (a)+ [ F ( x)− F ( a) ] = F ( x)

⏟
a .
F ( x)−F (a)
85/141
∫ f ( x ) dx = ∫ f (t )dt+C .
a
Onde C na expressão acima é uma constante arbitrária. Daremos agora uma tabela fundamental de
integrais indefinidas, Tabela 3, que pode ser obtida diretamente da tabela correspondente de
derivadas da Seção 2.6, Tabela 2.
Tabela 3
x a +1
∫ x dx =
a
a +1
+C para a ≠ −1 ;
dx
∫ x
= ln|x|+C ; 54
ax
∫ a dx =
x
ln a
+C ;
∫ e x dx = e x+C ;
∫ sen x dx = −cos x+ C ; (32)
∫ cos x dx = sen x +C ;
∫ sec2 x dx = tan x +C ;
dx
∫ = arc sen x+ C = −arx cos x +C 1 , para C 1−C = π ;
√1−x 2 2 ( )
dx
∫ 1+ x 2 = arc tan x +C .
As propriedades gerais das integrais indefinidas também podem ser deduzidas das propriedades
correspondentes das derivadas. Por exemplo, da regra de diferenciação da soma obtemos a fórmula:
∫ [ f ( x)±ϕ ( x)] dx = ∫ f ( x ) dx±∫ ϕ (x )dx+ C .
De outra parte, da regra expressando o fato que um fator constante k pode ser colocado fora do sinal
de diferenciação, obtemos:
∫ k f (x )dx = k ∫ f (x )dx .
Por exemplo:
' ' 1 ' ' 1 1

54 Para x>0 , ( ln|x|) = ( ln x ) = ; para x<0 , ( ln|x|) = ( ln (− x) ) = (−1) = .
x (− x) x
86/141
[ ]
1
− +1
∫ ( 3 4
3 x 2 +2 x − + −1 dx =
√x x 3
+ )
3 x3 2 x2
2
−3
x 2
1
− +1
+4 ln|x|− x+C .
2
Existem vários métodos para se calcular integrais indefinidas. Um destes métodos que abordaremos
a seguir é chamado de método da substituição ou método da mudança de variável e está baseado na
seguinte igualdade:
∫ f ( x ) dx = ∫ f [ ϕ (t )] ϕ ' (t )dt+C (33).
Onde x = ϕ (t) é uma função diferenciável. A relação (33) deve ser entendida no sentido que se
na função F ( x) = ∫ f (x ) dx do lado esquerdo da igualdade (33) fizermos x = ϕ (t) ,
obtemos uma função F [ ϕ (t)] cuja derivada é igual à expressão sob o sinal de integração no lado
direito da igualdade (33). Este fato segue imediatamente do teorema sobre a derivada de uma
função de função.
Daremos a seguir alguns exemplos do método da substituição.
1. Seja a integral ∫ e k x dx , fazendo a substituição:
1
k x = t → kdx = dt →dx = dt .
k
Então:
1 1 1 t ek x
∫ e dx = ∫ e k dt = k ∫ e dt = k e +C = k +C .
kx t t
x dx
2. Seja a integral ∫ , fazendo a substituição:
√ a 2−x 2
t = √ a 2− x 2 → dt = −
x dx
√a 2 −x 2
→ dx = − ( √a 2 −x 2
x ) dt .
Daí, fica:
∫ x2dx 2 = ∫
√ a −x ( x
√ a −x 2
2 )(⏟
− )
√ a2 −x 2
x
dt = −∫ dt = −t +C = −( √ a2 −x 2 ) +C
.
dx
3. Seja a integral ∫ √ a 2− x 2 dx , fazendo a substituição:
x = a sen u → dx = a cos u du e x 2 = a 2 sen 2 u .
87/141
Obtemos:
∫ √ a 2− x 2 dx = ∫ (√ a 2−a 2 sen 2 u ) a cos u du = a 2∫ ( √1−sen 2 u ) cos u du = a2 ∫ cos 2 u du ,
∫√a − x
2 2
dx = a
2
∫ cos 2
u du = a
2
∫( 2 )
1+ cos 2 u
du =
a2
2
u+(sen 2 u
2
+C , )
∫ √ a 2− x 2 dx = a2 (u + 2 sen u2 cos u )+C = a2 ( u+sen u cos u )+C
2 2
.
Mas, sen u =
x
a
e cos u = √ 1−sen 2 u = 1−
√ x2
a2
, logo:
sen u cos u =
x
a √
x2 x
1− 2 = 2 √ a 2−x 2 .
a a
Finalmente:
∫ √ a 2− x 2 dx = a2
2 ( x x
arc sen + 2 √ a 2−x 2 +C .
a a )
Como pode ser visto dos exemplos, o método da substituição ou mudança de variável aumenta de
forma significativa a classe de funções elementares que somos capazes de integrar, isto é, para as
quais podemos encontrar primitivas que são elas próprias funções elementares. Ainda assim, se
observa que do ponto de vista prático do processo que leva ao resultado, estamos, de maneira geral,
em uma posição pior com respeito a integração do que com a diferenciação.
Da Seção 2.6 vimos que a derivada de uma função elementar arbitrária é ela própria uma função
elementar que podemos efetivamente calcular fazendo uso das regras de diferenciação. Mas a
afirmação oposta, em geral, não é verdadeira, pois existem funções elementares cujas integrais
1 sen x
indefinidas não são funções elementares. Alguns exemplos são: e− x t , , , e
ln( x ) x
assim por diante. Para encontrar as integrais destas funções devemos fazer uso de métodos
aproximados e também introduzir novas funções que não podem ser reduzidas a funções
elementares. Não nos deteremos aqui analisando esta questão, mas notamos simplesmente que
mesmo na matemática elementar é possível encontrar muitos exemplos em que a operação direta
nos leva a certa classe de números, enquanto a operação inversa não reproduz esta mesma classe.
Assim, o quadrado de um número racional é novamente um número racional, mas a raiz quadrada
de um número racional nem sempre é um número racional. Analogamente, a diferenciação de uma
função elementar retorna novamente uma função elementar, mas a operação de integração de uma
função elementar pode nos levar a uma função que não pertence à classe de funções elementares.
Algumas integrais que não podem ser expressas em termos de funções elementares têm grande
importância na matemática e em suas aplicações. Um exemplo é:
88/141
∫ e−t dt
2
.
0
A integral acima desempenha um importante papel na teoria da probabilidade (veja Capítulo 11).
Outros exemplos são as integrais:
ϕ ϕ
dθ
∫ e ∫ (√1−k 2 sen2θ ) d θ , para k 2 < 1 .
0 √ 1−k sen θ
2 2
0
Estas integrais são chamadas de integrais elípticas de primeira e segunda espécie respectivamente.55
Um grande número de problemas de física necessitam do cálculo destas integrais (veja Capítulo 5,
Seção 5.1, Exemplo 3). Tabelas detalhadas destas integrais para vários valores dos argumentos k e ϕ
têm sido calculadas com grande precisão usando métodos de aproximação.
Deve ser enfatizado que a prova do próprio fato de uma dada função elementar não poder ser
integrada em termos de funções elementares é em cada caso um desafio muito complicado. Estas
questões ocuparam a atenção de notáveis matemáticos no século XIX, e tiveram um importante
papel no desenvolvimento da análise matemática. Em particular, resultados fundamentais foram
obtidos por Chebyshev56 que deu uma resposta completa para a questão de expressar em termos de
funções elementares integrais na forma:
∫ x m (a +b x s) p dx .
Onde m, s, e p são números racionais. Até sua época três relações, obtidas por Newton, eram
conhecidas para os expoentes m, s, e p, que implicavam a integrabilidade desta integral em termos
de funções elementares. Chebyshev provou que em todos os outros casos a integral não poderia ser
expressa em termos de funções elementares.
Agora introduziremos outro método de integração chamado de integração por partes. Ele está
baseado na fórmula que já apresentamos para a derivada do produto de duas funções u e v:
(u v)' = u v '+ u ' v .
Esta fórmula pode ser reescrita como:
u v ' = (u v)'−u ' v .
Façamos então a integração dos lados da equação acima tendo em mente que:
∫ (u v)' dx = u v +C .
Finalmente obtemos a igualdade:

55 N. T. - Veja “Advanced Calculus”, Wilfred Kaplan, Capítulo 4, Seção 4.2, página 222. Em especial o Problema 4.
56 N. T. - Pafnuty Lvovich Chebyshev (1821 – 1894) foi um famoso matemático russo conhecido por suas
contribuições nos campos da probabilidade (probabilidade: é medida da chance de ocorrer um determinado evento),
estatística (estatística: é o ramo da matemática que trabalha com a organização, análise, interpretação e apresentação
de coleções de dados), mecânica e teoria dos números.
89/141
∫ u v ' dx = u v−∫ u ' v dx .
Esta é a chamada fórmula da integração por partes. Não escrevemos explicitamente a constante C,
pois consideramos que ela está inserida em uma das integrais indefinidas que ocorrem nesta
equação.
Apresentaremos agora algumas aplicações desta fórmula. Suponha que tenhamos de calcular a
integral ∫ x e dx . Nesse caso tomamos u = x e v ' = e x . Assim, temos também que
x
u ' = 1 e v = e x . Consequentemente obtemos:
∫ x e x dx = x e x −∫ 1(e x )dx = x e x −e x +C .
De outra parte, para resolver a integral ∫ ln x dx é conveniente fazer u = ln x e v' = 1 .

' 1
Logo: u = e v = x . Portanto:
x
∫ ln x dx = x ln x−∫ dx = x ln x− x+C .
No exemplo típico que daremos a seguir é necessário aplicar o método da integração por partes duas
vezes para então se encontrar a expressão da integral desejada das equações assim obtidas. Seja a
integral ∫ e sen x dx . Para resolvê-la inicialmente tomamos u = sen x e v ' = e x . Daí,
x
obtemos: u ' = cos x e v = e x . Aplicando a integração por partes, fica:
∫ e x sen x dx = e x sen x −∫ e x cos x dx .
Considerando agora a integral ∫ e cos x dx do segundo membro da equação acima fazemos

x
u = cos x e v ' = e x . Daí, tiramos u ' = −sen x e v = e x . Aplicando novamente o

método da integração por partes, temos:
∫ e x cos x = e x cos x−∫ e x (−sen x)dx = e x cos x +∫ e x sen x dx .
Substituindo em ∫ e x sen x dx = e x sen x −∫ e x cos x dx , fica:
∫ e x sen x dx = e x sen x −[ e x cos x +∫ e x sen x dx ] = e x sen x −e x cos x−∫ e x sen x dx ,
2 ∫ e x sen x dx = e x sen x−e x cos x .
Finalmente:
x
∫ e x sen x dx = 12 [ e x sen x−e x cos x ] = e2 [ sen x−cos x ] +C .
Aqui terminamos esta seção. Com ela esperamos que o leitor tenha adquirido pelo menos uma ideia
90/141
superficial da teoria de integração. Não apresentamos muitos dos diferentes métodos desta teoria.
Em particular omitimos a questão relevante da integração de frações racionais, uma teoria na qual o
conhecido matemático e físico russo Ostrogradski deu importantes contribuições.
2.12 Funções de Várias Variáveis
Até agora falamos apenas de funções de uma variável, mas, na prática, frequentemente é necessário
lidar também com funções que dependem de duas, três, ou mais variáveis. Por exemplo, a área de
um retângulo S é uma função de sua base x e de sua altura y: S = x y . Por outro lado, o volume
de um paralelepípedo retangular é dado por: V = x y z , que é uma função de suas três
dimensões. Também a distância r entre dois pontos A e B é uma função das seis coordenadas destes
pontos:
r = √( x 1−x 2 )2+( y 1− y 2 )2 +(z 1−z 2 )2 .
A conhecida fórmula que expressa a dependência de um volume v de uma quantidade definida de

gás com sua pressão p e temperatura absoluta T é dada por:
p v = RT .
Onde R é uma constante.
As funções de várias variáveis, do mesmo modo que as funções de uma variável, são definidas em
muitos casos somente para uma determinada região de valores das variáveis. Veja, por exemplo, a
função:
u = ln(1− x 2− y 2−z 2) (34).
Esta função é definida apenas para os valores de x, y, e z que satisfazem a condição:
x2 + y2 + z 2 < 1 (35).
Para valores de x, y, e z que não satisfazem a desigualdade (35) os valores assumidos pela função u
não são números reais. Obviamente, o conjunto de pontos do espaço cujas coordenadas satisfazem a
desigualdade (35) pertence a uma esfera de raio unitário com centro na origem do sistema de
coordenadas. Entretanto, os pontos sobre a superfície esférica não são incluídos no conjunto de
definição da função u, ou seja, os pontos sobre a superfície esférica devem ser removidos da esfera.
Uma esfera como esta é dita ser aberta. Assim, a função (34) é definida apenas para aqueles
conjuntos de três números (x , y , z) que são coordenadas dos pontos da esfera aberta G. É usual
enunciar este fato de uma maneira concisa dizendo que a função (34) está definida na esfera G.
Vejamos outro exemplo. A temperatura de um corpo V desigualmente aquecido é função das

coordenadas x, y, e z dos pontos do corpo. Esta função não é definida para todos os conjuntos de
três números (x , y , z), mas apenas para aqueles conjuntos que são coordenadas dos pontos do corpo
V.
91/141
Finalmente, como terceiro exemplo, considere a função:
u = ϕ ( x)+ ϕ ( y)+ϕ ( z ) .
Onde ϕ é uma função de uma variável definida no intervalo fechado [0, 1]. Naturalmente, a função
u é definida somente para os conjuntos de três números (x , y , z) que são coordenadas dos pontos de
um cubo:
0≤ x ≤1 , 0≤ y≤1 , 0≤ z ≤1 .
Agora daremos a definição formal de uma função de três variáveis. Suponha que seja dado um
conjunto E de tríades de números (x , y , z), isto é, de pontos do espaço. Se para cada uma destas
tríades de números do conjunto E corresponde um número definido u de acordo com alguma regra,
então u é uma função de x, y, e z, ou seja, u é definida no conjunto de tríades (pontos) pertencente a
E, um fato que escrevemos na forma:
u = F ( x , y , z) .
Poderíamos também ter escrito no lugar de F outras letras como: f, ϕ, ψ.
Na prática, o conjunto E, em geral, é um conjunto de pontos que pertence a algum corpo ou

superfície geométrica: esfera, cubo, uma região anular, e assim por diante. Com isto dizemos
simplesmente que a função é definida neste corpo ou superfície. Assim, funções com três, quatro e
mais variáveis são definidas de maneira análoga.
Definição de função implícita. Chamamos atenção que as funções de duas variáveis podem servir
em determinadas circunstâncias como uma maneira de se definir funções de uma variável. Dado
uma função F ( x , y) de duas variáveis, construímos a equação:
F ( x , y) = 0 (36).
Em geral, esta equação define um determinado conjunto de pontos (x , y) da superfície sobre os

quais a nossa função se anula. Estes conjuntos de pontos frequentemente representam curvas que
podem ser consideradas como gráfico de uma função ou de várias funções de uma variável tais
como y = ϕ ( x) ou x = ψ ( y) . Nestes casos estas funções são ditas estarem definidas
implicitamente pela equação (36). Por exemplo, seja a equação:
x 2 + y 2−r 2 = 0 .
Esta equação nos dá a definição implícita de duas funções de uma variável, qual seja:
y = + √ r 2 −x 2 e y = −√ r 2−x 2 .
Entretanto, é necessário ter em mente que uma equação na forma (36) eventualmente não define
uma função real. Por exemplo, a equação x 2 + y 2 +1 = 0 obviamente não pode definir nenhuma
função real, pois nenhum par de números reais satisfaz a equação.57
57 N. T. - Temos definido função como uma relação w = f ( z) que associa apenas um valor de w para cada valor
de z pertencente ao domínio de definição da função E, ou seja, uma função é definida como uma relação de um para
92/141
Representação geométrica. As funções de duas variáveis podem sempre ser visualizadas como
superfícies por meio de um sistema de coordenadas espaciais. Assim, a função de duas variáveis
f (x , y ) em um sistema de coordenadas retangular tridimensional é representada por uma
superfície, que é o lugar geométrico dos pontos M cujas coordenadas x, y, e z, satisfazem a equação
(37). Veja Fig. 26.
y = f ( x , y) (37).
Fig. 26
Existe outro método extremamente importante de se representar a função (37), o qual tem ampla
aplicação prática. Neste método escolhemos uma sequência de números z 1 , z 2 , … , e
desenhamos sobre o plano Oxy as curvas: z 1 = f (x , y) , z 2 = f ( x , y ) , etc., que são
chamadas de curvas de nível da função f (x , y ) . Se o conjunto destas curvas de níveis
correspondem a valores de z que são suficientemente próximos uns dos outros é possível formar
uma boa ideia das variações da função f (x , y ) , exatamente como a partir das curvas de nível de
um mapa topográfico avaliamos a variação de altitude de um terreno.
A Fig. 27 apresenta um mapa das curvas de nível da função z = x 2 + y 2 , onde o diagrama do lado
direito mostra como a esta função é reconstituída a partir das curvas de nível. Um mapa semelhante
está representado na Fig. 50 do Capítulo 3 para as curvas de nível da função z = x y .
um. Algumas vezes, principalmente quando tratamos com funções complexas, é conveniente ampliar a definição de
função permitindo que vários valores de w, ou mesmo um número infinito de valores, seja associado a algum ou a
todos os valores de z. Estas funções são denominadas como sendo uma relação de um para muitos, por exemplo, a
função Ln z do Capítulo 9, Seção 9.1, onde z é uma variável complexa. Veja também “Complex Analysis with
Applications”, Richard A. Silverman, Capítulo 3, seção 3.13, página 24 [38].
93/141
Fig. 27
Derivadas parciais e diferencial. Faremos a seguir algumas observações sobre a diferenciação de

funções de várias variáveis. Como exemplo tomamos uma função arbitrária de duas variáveis:
z = f ( x , y ) . Se fixarmos a variável y, isto é, se considerarmos que a variável y não está
variando, então nossa função de duas variáveis torna-se uma função apenas da variável x. Se a
derivada desta função com respeito a x existe, ela é chamada derivada parcial com respeito a x da
função z = f ( x , y ) e é expressa pelos símbolos:
∂z ∂f
, ou , ou f 'x ( x , y) .
∂x ∂x
A última destas três notações indica claramente que a derivada parcial é tomada com relação a
varável x em uma função qualquer de duas variáveis x e y. A derivada parcial com respeito a y é
definida de maneira semelhante.
Geometricamente a função f (x , y ) retrata uma superfície em um sistema retangular

tridimensional de coordenadas. A função correspondente para um valor de y constante representa
uma curva plana (veja Fig. 28) obtida da intersecção da superfície com um plano paralelo ao plano
∂z
Oxz e situado a uma distância y deste plano. A derivada parcial obviamente é igual à
∂x
tangente trigonométrica do ângulo formado pela tangente à curva no ponto (x , y) e a direção
positiva do eixo x.
De maneira geral, se considerarmos uma função z = f (x 1 , x 2 ,⋯, x n ) de n variáveis, x 1 ,

∂z
x 2 , … , x n , a derivada parcial é definida como a derivada desta função com respeito
∂ xi
a x i , calculada fixando os valores das outras variáveis: x 1 , x 2 ,⋯, x i−1 , x i +1 ,⋯, x n .
94/141
Podemos dizer que a derivada parcial de uma função com respeito a variável x i é a taxa de
variação da função na direção da mudança de x i . Seria também possível definir uma direção
arbitrária não necessariamente coincidente com nenhum eixo de coordenadas para o cálculo desta
taxa de variação. Aqui não nos deteremos para investigar este assunto.58
Fig. 28
Exemplos.
x ∂z 1 ∂z x
1. z= , = , =− 2 .
y ∂x y ∂y y
1 ∂u 1 2x x
2. u = , =− 2 2 2 = − 2 2 2 3 /2
√x 2 2
+ y +z
2 ∂x x + y +z 2 √x + y +z
2 2 2
(x + y + z )
É necessário algumas vezes formar a derivada parcial de uma derivada parcial, isto é, as chamadas
derivadas parciais de segunda ordem. Para as funções de duas variáveis existem quatro derivadas de
segunda ordem que são:
∂2 u ∂2 u ∂2 u ∂ 2 u 59
, , , .
∂ x2 ∂x∂ y ∂ y∂ x ∂ y2
Entretanto, se estas derivadas são contínuas não é difícil provar que a segunda e a terceira destas
derivadas de segunda ordem mostradas acima, também chamada de “permutação das derivadas”,
58 N. T. - Veja derivada direcional em “Advanced Engineering Mathematics”, Erwin Kreyszig, Capítulo 9, Seção 9.7,
Definição 2, página 396.
2 2
∂ u ∂ u
59 N . T. - A ordem de precedência das derivadas parciais nas notações e devem ser lidas da
∂ x∂ y ∂ y∂ x
2
∂ u
direita para esquerda. Por exemplo, na notação primeiramente fazemos a derivada de u em relação a y
∂ x∂ y
para em seguida tomar a derivada em relação a x.
95/141
coincidem, isto é, a ordem com que as diferenciações parciais são aplicadas é irrelevante para o
resultado da operação:60
∂2 u ∂2 u
= .
∂x∂ y ∂ y∂x
x
Por exemplo, no caso da primeira função dada z= acima temos:
y
∂2 z
∂ x2
=0 ,
∂2 z
∂x∂ y ∂ x y
x
( )
1
= ∂ − 2 =− 2 ,
y
∂2 z
= ∂ −
∂ y∂ z ∂ y
1
y ( )
1
=− 2 ,
y
∂2 z
∂y 2
2x
= 3 .
y
Portanto, vemos que a permutação das derivadas parciais dá o mesmo resultado.
Agora, do mesmo modo que fizemos para funções de uma variável, vamos introduzir o conceito de
diferencial para funções de várias variáveis. Para dar esta definição considere a função de duas
variáveis z = f ( x , y ) . Se esta função possui derivadas parciais contínuas, podemos provar que
o incremento Δ z = f (x + Δ x , y +Δ y )− f (x , y ) associado aos incrementos Δ x e Δ y dos
seus argumentos pode ser expresso na forma:
∂f ∂f
Δz = Δ x+ Δ y +α √ Δ x 2+ Δ x 2 .
∂x ∂y
∂f ∂f
Onde e são as derivadas parciais da função f (x , y ) no ponto (x , y), e a
∂x ∂y
magnitude de α depende de Δ x e Δ y de tal maneira que α → 0 quando Δ x → 0 e
Δy → 0 .
∂f ∂f
A soma dos dois primeiros componentes dz =
Δ x+ Δ y é linearmente dependente61 de
∂x ∂y
Δ x e Δ y , e, como fizemos para função de uma variável, é chamado de diferencial da função
f (x , y ) . A terceira parcela devido à presença do fator α tende a zero com Δ x e Δ y , ou
seja, é um infinitesimal de maior ordem que a magnitude ρ = √ Δ x 2 + Δ y 2 que descreve a
variação de x e y.
Daremos agora uma aplicação do conceito de diferencial de uma função multivariável. O período de
oscilação de um pêndulo é calculado pela fórmula:
T = 2π
√ l
g
.
60 N. T. - Veja “Introduction to Calculus and Analysis”, Richard Courant e Fritz John, Volume II, Capítulo 1, Seção 1.4,
página 36.
61 Em geral, uma função na forma A x+B y+C , onde A, B, e C são constantes, é chamada de uma função linear em
x e y. Se C = 0 , ela é chamada de uma função linear homogênea. Aqui temos omitido a palavra “homogênea”.
Dando uma definição mais geral, dizemos que uma função f ( x , y ,⋯) é homogênea de grau h se satisfaz a
h
equação: f (t x , t y ,⋯) = t f ( x , y ,⋯) . Evidentemente, a função f ( x , y) = A x+B y é uma função
1
homogênea de grau 1, pois: f (t x , t y) = t ( A x+B y) = t f ( x , y) . Veja “Introduction to Calculus and
Analysis”, Richard Courant e Fritz John, Volume II, Capítulo 1, Adendo A-4, página 119.
96/141
Onde l é o comprimento e g a aceleração da gravidade. Suponha que l e g são conhecidos dentro de

uma precisão Δ l e Δ g respectivamente. Então o erro no cálculo de T seria igual ao
incremento Δ T correspondente aos incrementos nos argumentos de Δ l e Δg .
Substituindo Δ T pela aproximação dT, teremos:
Δ T ≈ dT = π (√ √ Δl
lg
l
− 3Δ g
g ) .
Os sinais de Δ l e Δg são desconhecidos, mas, obviamente, podemos estimar ΔT usando

a inequação:
|Δ T| ≤ dT = π (√ 1
lg √ l
|Δ l|+ 3 |Δ g|
g ) .
Donde, dividindo por T, obtemos:
|Δ T|
T
≤π
1
T( )( √1l g |Δ l|+√ gl |Δ g|) = π ( 21π √ gl )( √ 1l g |Δ l|+ √ gl |Δ g|) =
3 3
.
= ( |Δ l|+ |Δ g|) < ( |Δ l|+ |Δ g|)
1 1 1 1 1
2 l g l g
Logo:
|Δ T|
T
<
1
l( 1
|Δ l|+ |Δ g|
g ) .
Ou seja, podemos considerar que, na prática, o erro relativo para o período T é “igual” à soma dos
erros relativos de l e g.
Para termos uma simetria na notação, semelhante ao que fizemos anteriormente para o caso de
função com uma variável, escrevemos os incrementos das variáveis independentes Δ x e Δ y
como dx e dy e também os chamamos de diferenciais. Com esta notação o diferencial da função
u = f ( x , y , z ) pode ser escrito na forma:
∂f ∂f ∂f
du = dx + dy + dz .
∂x ∂y ∂z
As derivadas parciais desempenham um importante papel sempre que lidamos com funções
multivariáveis, como acontece em muitas aplicações da análise matemática em física e tecnologia.
No Capítulo 6 trataremos do problema de reconstruir uma função a partir das propriedades de suas
derivadas parciais.
Nos parágrafos seguintes daremos alguns exemplos simples de aplicações de derivadas parciais em
análise matemática.
97/141
Diferenciação de funções implícitas. Suponha que desejamos encontrar a derivada de y, onde y é

uma função de x definida implicitamente pela relação entre estas variáveis:
F ( x , y) = 0 (38).
Se x e y satisfazem a relação (38) e dermos um incremento Δ x à variável x, então y terá um

incremento Δ y tal que x +Δ x e y+ Δ y satisfazem novamente a equação (38).
62
Consequentemente, temos:
∂F ∂F
F ( x +Δ x , y + Δ y)−F ( x , y ) = Δ x+ Δ y +α √ Δ x 2 + Δ y 2 = 0. .
∂x ∂y
∂F
Assim, se tivermos ≠ 0 , seque que:
∂y
∂F
Δy ∂x
lim = y 'x =− .
Δ x→ 0 Δ x ∂F
∂y
Desta maneira obtivemos um método de encontrar a derivada de uma função y definida

implicitamente sem necessidade de resolver a equação (38) para y.
Problemas de máximo e mínimo. Se uma função de duas variáveis z = f ( x , y ) , por exemplo,

tiver seu máximo local no ponto ( x 0 , y 0 ) , isto é, se f (x 0 , y 0 ) ≥ f ( x , y) para todos os pontos
(x , y) na vizinhança de ( x 0 , y 0 ) , então este ponto deve também ser o ponto de cota máxima para
qualquer curva formada pela interseção da superfície z = f ( x , y ) com um plano passando pelo
ponto ( x 0 , y 0 ) paralelo ao plano Oxz ou ao plano Oyz. Portanto, neste ponto teremos:
f 'x ( x 0 , y 0) = 0 e f 'y (x 0 , y 0 ) = 0 (39).
As mesmas equações também são válidas para um mínimo local. Por conseguinte, os maiores e
menores valores de uma função devem ser procurados primeiramente naqueles pontos em que as
condições dadas pelas equações (39) sejam satisfeitas. No entanto, não devemos nos esquecer dos
pontos situados na fronteira do domínio de definição da função e também dos pontos onde a função
não possui derivada, se é que tais pontos existem.
Para estabelecer se um ponto (x , y) satisfazendo (39) é realmente um ponto de máximo ou de

mínimo usamos frequentemente de vários argumentos indiretos. Por exemplo, se por alguma razão
fica claro que a função é diferenciável e atinge seu mínimo no interior de uma região, e que existe
apenas um ponto nesta região que satisfaz as condições expressas pelas equações (39), então,
obviamente, o mínimo deve estar neste ponto.
Por exemplo, suponha que desejamos construir uma caixa metálica retangular sem tampa com um
volume definido V, usando a menor quantidade possível de material. Se designarmos os lados da
62 Aqui estamos assumindo que F ( x , y) tem derivadas contínuas com respeito a x e y.
98/141
V
base da caixa por x e y, então sua altura h será igual a: . Portanto, a superfície S será dada
xy
pela função de duas variáveis x e y:
S = x y+
V
xy
( 2 x+ 2 y) = x y+ 2 V (
1 1
+
x y ) (40).
Como x e y nos termos do problema devem ser positivo, a questão se reduz a encontrar o mínimo da
função S (x , y ) para todos os possíveis pontos (x , y) pertencentes ao primeiro quadrante do
plano xy que chamaremos de G.
Se o mínimo de S (x , y ) se encontra em algum ponto da região G, então as derivadas parciais de

S (x , y ) neste ponto devem se anular:
∂S
∂x ∂x [
= ∂ x y+ 2 V
1 1
+
x y ( )] = y− 2xV = 0 2 ,
∂S
[
= ∂ x y+ 2V
∂y ∂y
1 1
+
x y ( )] = x− 2yV = 02 .
Isto é, y x 2 = 2V e x y 2 = 2V . Destas equações encontramos que as dimensões da caixa

devem ser;
√ √
3
V V V V 3 V V
x = y =√ 2 V
3
e h= = 2= 3 =3 = =3 (41).
xy x (√ 2 V )
2
√4 V 2
4V
2
4
Aparentemente resolvemos nosso problema, mas ainda não provamos que a nossa solução é correta.
Um matemático rigoroso diria: “Aqui se supôs desde o início que sob determinadas condições a
caixa com a superfície mínima existiria realmente e, a partir desta hipótese, foram encontradas suas
dimensões. Desta maneira, obtivemos apenas o seguinte resultado: Se existe um ponto (x , y) em G
para o qual a função S alcança seu mínimo, então as coordenadas deste ponto devem
necessariamente ser determinadas pelas equações (41). Mas agora devemos mostrar que o mínimo
de S existe de fato em algum ponto de G para podermos admitir a legitimidade do nosso resultado”.
Esta observação é bastante razoável, pois devemos nos assegurar, por exemplo, que a nossa função
S não possui nenhum máximo na região G, um fato que demonstraremos a seguir. Vejamos como é
possível nos convencer que neste caso a função realmente atinge seu mínimo em algum ponto (x , y)
da região G. O teorema fundamental em que estará baseado nossa argumentação possui uma
demonstração rigorosa providenciada pela análise matemática. Seu enunciado é o seguinte: Se uma
função f de uma ou de várias variáveis é contínua em todos os pontos de uma região finita H que é
limitada e inclui sua fronteira, então existe um ponto em H no qual esta função atinge seu mínimo
(máximo).63 Com este teorema podemos facilmente completar nossa análise do problema.
Considere um ponto arbitrário ( x 0 , y 0 ) da região G. Neste ponto suponha que S (x 0 , y0 ) = N .

Escolhemos também um número R satisfazendo duas desigualdades, quais sejam: R > N e
2 V R > N . Daí, construímos um quadrado Ω R com lado igual a R2 como mostra a Fig.
63 N. T. - Veja “Introduction to Calculus and Analysis”, Richard Courant e Fritz John, Volume II, Capítulo 1, Adendo
A-2, página 112. Para uma demonstração mais formal veja “Mathematical Analysis, Second Edition”, Tom M.
Apostol, Capítulo 4, Teorema 4.28, página 83.
99/141
1 64
29, onde AB = CD = .
R
Agora calcularemos o limite inferior dos valores da nossa função S (x , y )

nos pontos da região
1
G que margeiam o quadrado ΩR . Se o ponto na região G possui abcissa x < , então
R
podemos escrever:
S (x , y ) = x y + 2V ( 1x + 1y ) > 2 V 1x > 2 V 1
= 2 V R > N = S ( x0 , y0 )
( )
1
R
.
1
Isto significa que para todos os pontos com abcissa x< o valor assumido por S (x , y ) é
R
maior que S (x 0 , y0 ) = N .
Fig. 26
1
Analogamente, se o ponto da região G possui ordenada y< , então temos também que
R
S (x , y ) > S ( x 0 , y 0) = N . De fato:
S (x , y ) = x y + 2V ( 1x + 1y ) > 2 V 1y > 2 V 1
= 2 V R > N = S ( x 0 , y 0)
( )
1
R
.
2
64 N. T. - Observe que o quadrado de lado R que construímos está inserido na região G como mostra a Fig. 26.
100/141
1
Por outro lado, se o ponto da região G possui abcissa x> e está situado acima da linha AF, ou
R
seja, se a ordenada do ponto for y > R2 , temos:
S (x , y ) = x y + 2V ( 1x + 1y ) > x y > ( R1 ) R = R > N = S ( x , y )

2
0 0 .
1
Do mesmo modo, se o ponto da região G possui ordenada y> e está situado à direita da linha
R
CE, ou seja, se a abcissa do ponto for x > R 2 ,escrevemos:
S (x , y ) = x y + 2V ( 1x + 1y ) > x y > R ( R1 ) = R > N = S ( x , y )

2
0 0 .
Assim, para todos os pontos da região G que margeiam o quadrado Ω R , a desigualdade

S (x , y ) > N se verifica, e como em S (x 0 , y0 ) = N o ponto ( x 0 , y 0 ) deve pertencer ao
quadrado, consequentemente, o mínimo da nossa função em G é igual ao valor mínimo que esta
função alcança no quadrado Ω R .
Mas a função S (x , y ) é contínua neste quadrado e na sua fronteira, portanto, pelo teorema
enunciado acima existe no quadrado um ponto (x , y) para o qual nossa função assume seu valor
mínimo para os pontos do quadrado, logo, neste ponto ocorre o mínimo da função para toda região
G. Deste modo a existência do mínimo da função foi provada.
Esta argumentação pode servir de exemplo da maneira de como é possível discutir a existência de
um máximo ou um mínimo de uma função definida sobre um domínio não limitado.
Fórmula de Taylor. Do mesmo modo que as funções de uma variável, as funções multivariáveis
podem também ser representadas por uma fórmula de Taylor. Por exemplo, a expansão da função
u = f ( x , y) na vizinhança do ponto ( x 0 , y 0 ) tem a seguinte forma se nos limitarmos a
primeira e a segunda potência de ( x− x 0) e ( y− y 0 ) :
f ( x , y) = f ( x 0 , y 0 )+[ f 'x ( x 0 , y 0)( x−x 0 )+ f 'y ( x 0 , y 0)( y − y 0)]+

1 '' .
+ [ f xx ( x 0 , y 0)( x−x 0 )2 +2 f ''xy (x 0 , y 0 )(x 0− y 0 )( y− y 0 )+ f ''yy( x 0 , y 0 )( y− y 0)2 ]+ R3
2!
Se a função f (x , y ) tiver derivadas parciais de segunda ordem contínuas, o termo restante

R3 se aproximará de zero mais rapidamente que r 2 = ( x− x 0)2 +( y− y 0) 2 . Isto é, R3 se
aproximará de zero mais rapidamente que o quadrado da distância entre os pontos ( x , y ) e
( x 0 , y 0 ) quando r → 0 .65 A fórmula de Taylor nos oferece um método largamente usado para
definir e calcular os valores aproximados de muitas funções.
Observe que com a ajuda desta fórmula podemos também responder a questão levantada
65 N. T. - Este enunciado é equivalente ao que demonstramos para fórmula de Taylor de funções de uma variável na
Seção 2.9.
101/141
anteriormente,66 qual seja: Estabelecer com segurança se uma dada função f (x , y ) com
∂f ∂f
derivadas parciais nulas em determinado ponto do seu domínio, = = 0 , possui neste
∂x ∂y
ponto um máximo ou um mínimo da função. De fato, se estas condições são satisfeitas em um
ponto ( x 0 , y 0 ) , então para os pontos ( x , y ) na vizinhança de ( x 0 , y 0 ) o valor da função
dada pela fórmula de Taylor diferirá de f (x 0 , y 0 ) pela quantidade:
1
f (x , y )− f ( x 0 , y 0 ) =
2!
[ A(x− x 0)2 + 2 B( x− x 0)( y − y 0)+C ( y− y 0 )2 ] + R3 (42).
Onde A, B, e C designam respectivamente as derivadas parciais de segunda ordem f ''xx , f ''xy ,

f ''yy no ponto ( x 0 , y 0 ) .
De (42) tiramos a função:
Φ ( x , y) = A( x−x 0 )2 +2 B( x−x 0 )( y− y 0 )+C ( y− y 0) 2 .
Se esta função for positiva para valores arbitrários de ( x− x 0) e ( y− y 0 ) que não se anulem
simultaneamente, então o lado direito da equação (42) será positivo para pequenos valores de
( x− x 0) e ( y− y 0 ) , pois para ( x− x 0) e ( y− y 0 ) suficientemente pequenos sabemos que
1
a quantidade R3 é menor em valor absoluto que Φ (x , y ) . Assim, segue que no ponto
2
( x 0 , y 0 ) a função f (x , y ) atinge seu mínimo. Por outro lado, se a função Φ (x , y) for
negativa, para valores arbitrários de ( x− x 0) e ( y− y 0 ) o lado direito de (42) será negativo
para pequenos valores de ( x− x 0) e ( y− y 0 ) , de sorte que no ponto ( x 0 , y 0 ) a função
f (x , y ) terá um máximo. Em casos mais complicados é necessário se considerar termos de
maior ordem da fórmula de Taylor.67
Os problemas que lidam com máximo ou mínimo de funções de três ou mais variáveis podem ser
tratados de maneira completamente análoga. Como exercício o leitor poderá provar que se temos as
massas m1 , m2 , … , mn , dispostas no espaço segundo os pontos P 1 ( x 1 , y 1 , z 1) ,
P 2 ( x 2 , y 2 , z 2 ) , … , P n ( x n , y n , z n ) , o momento de inércia M deste sistema de massas em
relação ao ponto P (x , y , z ) , definido como a soma dos produtos das massas pelo quadrado de
n
suas distâncias ao ponto P, M ( x , y , z) = ∑ mi [( x−x i ) +( y − y i) +(z− z i) ] , terá um mínimo se
2 2 2
i=1
o ponto P coincidir com o chamado centro de gravidade do sistema, isto é, o ponto dado pelas
coordenadas:
n n n
∑ mi xi ∑ mi y i ∑ mi z i
i =1 i=1 i =1
x= n , y= n , z= n .
∑ mi ∑ mi ∑ mi
i=1 i =1 i=1
66 N. T. - Veja Seção 2.7.

67 N. T. - Veja Adendo 2.1. - Valores estacionários de funções multivariáveis.
102/141
Máximo e mínimo com condições auxiliares. Ao se estudar as funções multivariáveis nos

deparamos com muitos problemas específicos que diz respeito aos máximo e mínimos da função.
Ilustraremos este aspecto com um exemplo simples. Suponha que entre todos os retângulos inscritos
em um círculo de raio R, desejamos encontrar aquele com maior área. A área de um retângulo é
igual ao produto dos seus lados xy, onde x e y são números positivos satisfazendo neste caso a
equação: x 2 + y 2 = (2 R)2 , como fica claro da Fig. 30.
Fig. 30
Assim, somos instados a encontrar o máximo da função f (x , y ) = x y para todos os valores de

x e y satisfazendo a equação: x 2 + y 2 = ( 2 R)2 .
Problemas deste tipo, onde é necessário se encontrar o máximo (o mínimo) de uma função
f (x , y ) apenas para aqueles valores x, y que satisfaçam a determinada relação ϕ ( x , y) = 0 ,
são muito comuns na prática.
Naturalmente, seria possível resolver a equação ϕ ( x , y) = 0 para y e substituir a solução na

função f (x , y ) , e desta maneira pesquisar o máximo da função de uma variável x. Mas este
método, em geral, é complicado e algumas vezes impossível de se aplicar.
Para solução de tais problemas a análise matemática desenvolveu um procedimento mais

conveniente chamado de multiplicadores de Lagrange.68 A ideia que fundamenta este método é
bastante simples. Considere a função F ( x , y) = f (x , y )+ λ ϕ ( x , y) , onde λ é um número
positivo arbitrário. Obviamente, para os valores de x, y satisfazendo a condição ϕ ( x , y) = 0 , os
valores de F ( x , y) coincidem com aqueles de f (x , y ) .
Agora, procuramos encontrar o máximo da função F ( x , y)

sem impor nenhuma condição às
∂F ∂F
variáveis x e y. Então, no ponto de máximo temos que a relação = = 0 deve ser
∂x ∂y
válida.69 Em outras palavras:
68 N. T. - Joseph-Louis Lagrange (nome afrancesado), nascido Giuseppe Ludovico De la Grange Tournier (1736 –
1813), foi um notável matemático e astrônomo do iluminismo italiano com significantes contribuições nos campos
da análise matemática, teoria dos números, mecânica clássica, e mecânica celeste.
69 Naturalmente, aqui estamos nos referindo a um máximo que ocorre no domínio de definição da função F ( x , y) .
Também estamos assumindo que as funções f ( x , y) e Φ ( x , y) são diferenciáveis.
103/141
∂f ∂ϕ ∂f ∂ϕ
+λ =0 (43), +λ =0 (44).
∂x ∂x ∂y ∂y
Os valores x e y que determinam o ponto de máximo da função F ( x , y) , por serem uma solução
das equações (43) e (44), dependem do coeficiente λ presente nestas equações. Suponha que
tenhamos sucesso em escolher um número λ tal que as coordenadas do ponto de máximo da função
F ( x , y) satisfaça a condição:
ϕ ( x , y) = 0 (45).
Neste caso, este ponto será exatamente um máximo local do problema original.
De fato, podemos considerar o problema geometricamente como se segue. A função f (x , y ) é

definida em uma determinada região G (veja a Fig. 31).
Fig. 31
A condição ϕ ( x , y) = 0 , em geral, será satisfeita nos pontos pertencentes a uma curva Γ. Somos
solicitados a encontrar as coordenadas x e y para os quais a função f (x , y ) atinge um máximo
sobre os pontos pertencentes a curva Γ. Isto é, um máximo da função f (x , y ) não considerando
toda a região G, mas sobre a curva Γ. Por outro lado, se F ( x , y) atinge seu máximo sobre um
ponto situado sobre a curva Γ, então F ( x , y) não aumenta de valor para pequenos
deslocamentos em direções arbitrárias a partir deste ponto, e, em particular, para deslocamentos ao
longo da curva Γ. Mas para estes deslocamentos ao longo de Γ os valores de F ( x , y) e
f (x , y ) coincidem, isto significa dizer também que para estes deslocamentos ao longo de Γ a
função f (x , y ) não aumenta, em outras palavras, ela possui também neste ponto um máximo
local sobre Γ.
Estes argumentos apontam um método simples de resolver o problema. Solucionamos as equações

(43), (44), (45) para as incógnitas x, y, e λ, obtendo uma ou mais soluções:
( x 1 , y 1 , λ 1) , ( x 2 , y 2 , λ 2 ) , … (46).
104/141
Aos pontos ( x 1 , y 1) , ( x 2 , y 2 ) , … assim determinados, nós acrescentamos aqueles pontos de

G em que a curva Γ deixa a região. Então, deste conjunto de pontos escolhemos aquele em que a
função f (x , y ) apresenta seu maior (menor) valor.
Naturalmente, os argumentos aqui estão longe de ser uma prova legítima do método. De fato, nem
mesmo provamos que os pontos de máximos locais de f (x , y ) sobre a curva Γ podem ser
obtidos dos pontos máximos da função F ( x , y) para algum valor de λ. Entretanto, é possível
provar, como é feito nos livres textos de análise matemática, que em todo ponto ( x 0 , y 0 ) onde
f (x , y ) tem um máximo local sobre a curva Γ, este máximo será obtido pelo método indicado,
desde que neste ponto as derivadas parciais ϕ 'x (x 0 , y 0 ) e ϕ 'y ( x 0 , y 0) não se anulem
simultaneamente.
No livro “Cours de mathématiques supérieures”, V. I. Smirnov, Capítulo 5, Seção V-2.8, página 416
[418], o leitor encontrará um exemplo simples deste caso especial que leva a perda da solução se
aplicarmos o método de Lagrange mecanicamente. Isto é, se o método de Lagrange for empregado
em um ponto que, embora atenda a equação (45) e todos os requisitos mencionados antes, tenha
derivadas parciais nulas:
ϕ 'x (x 0 , y 0 ) = 0 e ϕ 'y ( x 0 , y 0) = 0 .
Parábola semicúbica y 2−x 3 = 0 → y 2 = x 3

15
10
ponto cuspidal
5
0
y
-1 0 1 2 3 4 5 6
-5
-10
-15
x
Fig. A370
O enunciado deste exemplo é o seguinte. Encontre a menor distância entre o ponto (-1 , 0) e os
pontos situados sobre a parábola semicúbica y 2 = x 3 . Devemos, portanto, encontrar o mínimo da
função f (x , y ) = (x +1) 2+ y 2 sujeito a condição ψ ( x , y ) = y 2 −x 3 = 0 . É evidente da
geometria da curva que o mínimo é alcançado no ponto com coordenadas (0 , 0) situado sobre a
70 N. T. - Veja planilha: Cap 2 - Cúspide prob_Smirnov.
105/141
parábola semicúbica, que é um ponto singular de ψ (neste caso um ponto cuspidal, também
chamado de ponto de reversão). Veja Fig. A3.
O método dos multiplicadores de Lagrange nos dá duas equações. Com efeito, construindo a função
F ( x , y) , vem:
F ( x , y) = f (x , y )+ λ ψ ( x , y) = (x +1)2 + y 2 + λ ( y 2−x 3 ) .
Daí, obtemos:
∂F ∂F
= 2( x+ 1)−3 λ x 2 = 0 e = 2 y +2 λ y = 0 .
∂x ∂y
Fazendo x = 0 e y = 0 a primeira equação passa a ser uma igualdade absurda 2 = 0 ,

enquanto a segunda é satisfeita para quaisquer valores de λ. Neste caso fica evidente que o método
dos multiplicadores de Lagrange não pode nos dá como resposta o ponto (0 , 0) onde existe um
mínimo relativo (mínimo local) do problema.71
Agora vamos usar o método dos multiplicadores de Lagrange para solucionar o problema proposto
no início desta subseção: De todos os retângulos inscritos em um círculo de raio R, desejamos
encontrar aquele com maior área. Neste caso, temos: f (x , y ) = x y ,
2 2 2
ϕ ( x , y) = x + y −4 R = 0 , e F ( x , y) = f (x , y )+ λ ψ ( x , y) . Escrevendo as equações (43),
(44), e (45) para o problema, obtemos:
∂F ∂f ∂ϕ ∂F ∂f ∂ϕ
= +λ = 0 → y +2 λ x = 0 (43), = +λ = 0 → x+2λ y = 0 (44).
∂x ∂x ∂x ∂y ∂y ∂y
ϕ ( x , y) = 0 → x 2 + y 2 = 4 R 2 (45).
Levando em conta que x e y são números positivos, encontramos:
y+ 2 λ x = x +2 λ y → y (1−2 λ ) = x( 1−2 λ ) → x = y ,
x 2 + y 2 = 4 R 2 → 2 x 2 = 4 R2 → x = y = R √ 2 .
E ainda:
y x 1
y+ 2 λ x = 0 → λ = − =− =− .
2x 2x 2
Vemos que os valores de x e y são iguais, de sorte que o retângulo com área máxima inscrito em um
círculo de fato é um quadrado.
O método de Lagrange pode ser estendido para funções com três ou mais variáveis. Também pode
estar presente qualquer número de condições auxiliares do tipo expresso pela equação (45) para as
quais introduzimos os respectivos multiplicadores auxiliares. Naturalmente o número das condições
auxiliares deve sempre ser menor que o número de variáveis.
71 N. T. - Para mais detalhes sobre máximo e mínimo de funções multivariáveis veja “Introduction to Calculus and
Analysis”, Richard Courant e Fritz John, Volume II, Capítulo 3, Seção 3.7, página 325, subseções c, d, e.
106/141
Daremos a seguir mais alguns exemplos de problemas envolvendo máximos e mínimos de funções
com condições auxiliares.
Exemplo 1. Para que altura h e raio r a construção de um tanque cilíndrico de volume V requer a
menor quantidade de chapa metálica. Isto é, para quais valores de h e r a soma da área lateral e da
base circular do tanque será mínima?
Este problema, obviamente, se reduz a encontrar o mínimo da função com variáveis r e h dada por:
f (r , h) = 2 π r h+ π r 2 , obedecendo à condição π r 2 h = V que pode ser escrita como:
ϕ (r , h) = π r 2 h−V = 0 .
Resolvendo este problema pelo método de Lagrange, construímos a função:
F (r , h) = f ( r , h)+ λ ϕ (r , h) → F (r , h) = 2 π r h+ π r 2 + λ ( π r 2 h−V ) .
Formando as equações (43) e (44) correspondentes, temos:
∂F ∂F
= 2 π h+ 2 π r + 2 λ π r h = 0 e = 2π r+λ π r2 = 0 .
∂r ∂h
Daí, tiramos:
2
2 π r + λ π r 2 = 0 → π r (2+ λ r ) = 0 → λ = − .
r
Substituindo o valor de λ em 2 π h+ 2 π r + 2 λ π r h = 0 , vem:
2 π h+ 2 π r + 2 λ π r h = 2 π h+ 2 π r +2 − ( 2r ) π r h = 2 π h+2 π r −4 π h = 2 π r −2 π h = 0 ,
E, finalmente:
2 π r −2 π h = 0 → r = h .
Portanto, o tanque cilíndrico com um dado volume V que requer um mínimo de área de chapa é
aquele em que o raio da base é igual à altura:
r = h → π r2 h = π r3 = V → r = h = √( π )
3 V .
Exemplo 2. Suponha que uma partícula em movimento deva passar do ponto A ao ponto B (veja
Fig. 32). No trecho AM da trajetória a partícula se move com velocidade v 1 , e no trecho MB com
velocidade v 2 . A questão é: Qual seria o ponto M sobre a linha DD´ tal que a trajetória da
partícula do ponto A ao ponto B seja feita no menor tempo possível?
107/141
Tomemos como incógnitas os ângulos α e β mostrados na Fig. 32. Os comprimentos a e b das

perpendiculares baixadas dos pontos A e B à reta DD´ e a distância c entre eles são conhecidos.
Concluímos facilmente que o tempo decorrido para cobrir o caminho AB é expresso pela forma:
a b
f (α , β ) = + .
v 1 cos α v 2 cos β
É solicitado encontrar o ponto mínimo desta expressão, isto é, as coordenadas (α , β ) do ponto

mínimo, condicionado ao fato que α e β são relacionados pela equação:
a tan α + b tan β = c .
Fig. 32
Aplicando o método do multiplicador de Lagrange para resolução do problema, podemos escrever

para a condição auxiliar:
ϕ ( α , β ) = a tan α +b tan β −c = 0 .
Então:
a b
F ( α , β ) = f (α , β )+ λ ϕ ( α , β ) = + + λ (a tan α + b tan β −c) .
v1 cos α v 2 cos β
∂F ∂F
Calculando as derivadas parciais e , fica:
∂α ∂β
∂F
∂α
=−
a sen α
(
v 1 cos α
2
+λ
a
) (
cos 2 α
=0 ,
)
∂F
∂β
=−
b sen β
(
2
v 2 cos β
+λ
a
) (
cos 2 β
=0 .
)
Tirando o valor de λ em cada uma das equações acima, vem:
108/141
λ
( cosa α ) = va ( cossen αα ) → λ = senv α
2
1
2
1
e λ ( cosa β ) = va ( cossen ββ ) → λ = senv β
2
2
2
2
.
Igualando as duas expressões para λ tiramos a relação entre α e β que deve valer no ponto mínimo
da função f (α , β ) :
sen α sen β v sen α

λ= = → 1= .
v1 v2 v2 sen β
A fórmula acima é bem conhecida e expressa a lei da refração da luz, também chamada de lei de
Snell.72 Consequentemente, um raio de luz será refratado ao passar de um meio a outro de sorte que
o tempo despendido para percorrer a trajetória entre um ponto localizado no primeiro meio até um
ponto no segundo meio seja o menor possível. 73 Conclusões deste tipo são interessantes, não
somente porque nos proporciona meios para fazer cálculos, mas também porque expressam pontos
de vista filosóficos. Estes conceitos inspiram pesquisadores das ciências exatas a se aprofundarem
cada vez mais nas leis gerais da natureza.
Finalmente, vamos observar que os multiplicadores λ introduzidos nas resoluções dos problemas
pelo método de Lagrange não são meramente números auxiliares. Em cada caso eles estão de
maneira muito próxima inter-relacionados com a natureza essencial do problema em particular,
portanto, possuem uma interpretação concreta.
2.13 Generalizações do Conceito de Integral
Na Seção 2.10, definimos a integral definida de uma função f (x ) no intervalo fechado [a, b]
n
como o limite da soma: ∑ f ( ξ i)Δ x i , quando o comprimento do maior segmento Δ xi da
i=1
subdivisão do intervalo [a, b] se aproxima de zero. Apesar da classe de funções f (x ) para as
quais este limite existe seja muito ampla, isto é, embora a classe de funções integráveis no intervalo
72 N. T. - Willebrord Snellius (1580 – 1626), conhecido também por Snell, foi um astrônomo e matemático holandês.
Seu nome está relacionado com a lei da refração da luz, embora hoje se saiba que esta lei já era conhecida pelo
matemático e físico persa Ibn Sahl em 984.
73 N. T. - O matemático e físico Hero de Alexandria (c.10 DC – c.70 DC) mostrou que um raio de luz sempre segue a
menor trajetória quando se desloca de um ponto a outro no ar. Isto se verifica mesmo quando o raio é refletido em
um ou mais espelhos. Como a luz sempre viaja com a mesma velocidade no ar, a menor trajetória entre dois pontos
situados neste meio será uma linha reta que corresponde também a trajetória com o menor tempo.
Depois que Snell descobriu a verdadeira lei da refração da luz, o matemático e físico francês Pierre de Fermat (1607
– 1665), supondo que a velocidade da luz dependia da substância através da qual ela se propagava, mostrou que o
fenômeno da luz refratada obedecia ao princípio do tempo mínimo. Hoje sabemos que esta hipótese é verdadeira.
Assumindo esta premissa se pode demonstrar que o tempo total de qualquer trajetória dos raios luminosos é sempre
mínimo. Veja “A História das Ciências Físicas” Sir James Jeans, Capítulo 7 – Dois séculos depois de Newton (1701
– 1886).
Outra forma de ilustrar o princípio do tempo mínimo no fenômeno da refração é imaginar que, precisando socorrer
alguém que se afoga na praia, a melhor opção para o salva-vidas não é se dirigir em linha reta na direção da vítima,
mas, sabendo que ele se desloca mais rapidamente na terra que na água, ele deverá procurar um ponto ótimo onde a
distância a ser percorrida na terra seja um pouco maior de forma a decrescer a distância a ser percorrida na água.
Adaptado do livro “The Feynman Lectures on Physics” – Feynman, Leighton e Sands, página 26–4, volume I.
109/141
[a, b] seja extensa, e em particular inclui todas as funções contínuas e mesmo muitas funções
descontínuas, esta classe de funções possui uma grave deficiência. Se adicionarmos, subtrairmos, ou
multiplicarmos, ou ainda, se dividirmos sob certas condições duas funções integráveis f (x ) e
ϕ ( x) , obtemos novamente funções integráveis como podemos provar facilmente. Para o
f ( x) 1
quociente , isto será verdadeiro para todos os casos em que permanece limitado
ϕ ( x) ϕ (x)
em todo intervalo [a, b]. Entretanto, se a função é obtida como o limite de uma aproximação dada
por uma sequência de funções integráveis f 1 ( x) , f 2 (x ) , f 3 ( x) , … , válida para todos os
valores de x pertencentes ao intervalo [a, b]: f (x ) = lim f n ( x ) , então esta função limite
n→ ∞
f (x ) não necessariamente é integrável.74
Em muitos casos esta e outras circunstâncias dão lugar a consideráveis complicações, pois o
processo de passagem ao limite é largamente usado.
Uma maneira de contornar esta dificuldade foi descoberta fazendo uma generalização mais
abrangente do conceito de uma integral. A generalização mais importante destes conceitos foi a
integral de Lebesgue75 que o leitor encontrará no Capítulo 15 que versa sobre a teoria das funções
de variáveis reais. Aqui nos limitaremos a generalizações da integral sob outros aspectos que
também são de grande importância prática.
Integrais múltiplas. Já estudamos o processo de integração para funções de uma variável definida
sobre uma região unidimensional, isto é, sobre um intervalo. Um processo análogo pode ser
estendido para funções de duas, três, ou mais variáveis, definidas sobre regiões correspondentes.
Por exemplo, considere uma superfície definida em um sistema retangular de coordenadas por:
z = f (x , y) .
Fig. 33
74 N. T. - Veja os teoremas 32 e 33 do livro “Advanced Calculus”, Wilfred Kaplan, Capítulo 6, Seção 6.14, página 418.
75 N. T. - Henri Léon Lebesgue (1875 – 1941) foi um matemático francês conhecido por sua teoria da integração, que é
uma generalização do conceito de integração desenvolvido no século XVII.
110/141
Sobre o plano Oxy suponha que exista uma região G delimitada pela curva fechada Γ. Pede-se o
volume limitado pela superfície z = f ( x , y ) , pelo plano Oxy, e pela superfície cilíndrica
passando pela curva Γ com geratrizes paralelas ao eixo Oz (veja Fig. 33). Para solucionar este
problema dividimos a região plana G em uma rede de sub-regiões com linhas paralelas aos eixos
Ox e Oy, e designamos aquelas sub-regiões que são constituídas por pequenos retângulos bem
definidos como: G1 , G2 , … , Gn . Se esta malha for suficientemente fina, então
praticamente toda a superfície G será coberta por uma infinidade de retângulos. No interior de cada
um destes pequenos retângulos selecionamos um ponto. Assim, temos: ( ξ 1 ,η 1) , ( ξ 2 ,η 2) ,
… , ( ξ n , η n) . Assumindo por simplicidade que Gi designa não somente o retângulo, mas
também a sua área, construímos a soma:
n
S n = f ( ξ 1 ,η 1) G1 + f ( ξ 2 , η 2) G2 +⋯+ f ( ξ n , η n )G n = ∑ f (ξ i ,η i )G i (47).
i−1
É claro que se a superfície for contínua e a malha suficientemente fina, esta soma pode se aproximar
tanto quanto se queira do volume desejado V. Assim, obtemos exatamente o volume procurado se
tomarmos o limite da soma (47) para subdivisões cada vez menores, isto é, para subdivisões tais que
as maiores diagonais dos nossos retângulos se aproximem de zero:
n
lim ∑ f ( ξ i , η i) Gi = V
max. d (G i )→0 i=1
(48).
Portanto, sob o ponto de vista da análise matemática, é necessário para determinar o volume V
realizar certa operação matemática sobre a função f (x , y ) e seu domínio de definição G, uma
operação indicada pelo lado esquerdo da igualdade (48). Esta operação é chamada de integração de
uma função f (x , y ) sobre a região G, e seu resultado é a integral de f (x , y ) sobre G.
Costuma-se designar este resultado da seguinte forma:
n
∬ f ( x , y) dx dy = max.lim
d (G )→0
∑ f (ξ i , η i)Gi (49).
G i i=1
Do mesmo modo, podemos definir a integral de uma função de três variáveis sobre uma região
tridimensional G, representando certo corpo no espaço. Novamente se divide a região em partes,
desta vez com planos paralelos aos planos definidos pelo sistema de coordenadas. Destas partes
tomamos aquelas que representam paralelepípedos completos e numeramos: G 1 , G2 , … ,
Gn . Em cada um destes paralelepípedos escolhemos um ponto arbitrário: ( ξ 1 ,η 1 , ς 1) ,
( ξ 2 ,η 2 , ς 2) , … , ( ξ n , η n , ς n ) . Em seguida construímos a soma:
n
S n = ∑ f ( ξ i ,η i , ς i)Gi (50).
i−1
Onde Gi denomina o volume do paralelepípedo Gi . Finalmente, definimos a integral de

f (x , y , z ) sobre a região G como o limite do somatório (50) quando a maior diagonal d (G i)
tende para zero:
111/141
n
lim ∑ f (ξ i , η i , ς i )Gi = ∭ f ( x , y , z) dx dy dz
max. d (G i )→0 i=1
(51).
G
Consideremos agora um exemplo. Imagine uma região G preenchida por uma massa não
homogênea cuja densidade em cada ponto de G é dada por uma função conhecida ρ ( x , y , z ) . A
densidade ρ ( x , y , z ) em um ponto da massa é definida como o limite dado pela razão entre a
massa contida em uma pequena região contendo o ponto ( x , y , z) e o volume desta região
quando seu diâmetro se aproxima de zero.76 Para determinar a massa do corpo G é comum se
proceder do seguinte modo. Divide-se a região G em sub-regiões delimitadas por planos paralelos
aos planos do sistema de coordenadas cartesiano tridimensional e enumeramos os paralelepípedos
completos formados desta maneira por G1 , G2 , … , Gn .
Assumindo que os planos que dividem a região estejam suficientemente próximos uns dos outros
cometeremos um pequeno erro se desconsiderarmos as sub-regiões irregulares do corpo e
definirmos a massa de cada região Gi , isto é, a massa dos paralelepípedos completos, como o
produto: ρ ( ξ i , η i , ς i )G i , onde ( ξ i ,η i , ς i) é um ponto arbitrário de Gi . Como resultado, o
valor aproximado da massa M será expresso pela soma:
n
S n = ∑ ρ ( ξ i ,η i , ς i )G i .
i=1
E o valor exato da massa M será claramente o limite deste somatório quando a maior diagonal
Gi se aproxima de zero, isto é:
76 O diâmetro de uma região é definido como o supremo das distâncias entre dois pontos da região, isto é, o menor
limite superior das distâncias entre dois pontos da região. Daremos algumas definições da teoria dos conjuntos para
se entender a definição de diâmetro de uma região. Seja S um subconjunto de um conjunto P parcialmente ordenado
pela relação ≤ . Daí, dizemos:
• Um elemento M ∈P é dito um majorante, limite superior ou cota superior de S se: x ≤ M , ∀ x ∈ S .
• Um elemento m∈ P é dito um minorante, limite inferior ou cota inferior de S se: m ≤ x,∀ x ∈ S .
• Um elemento s ∈ P é dito um supremo de S se for o menor dos majorantes, isto é: x ≤ s,∀ x ∈ S , e

x ≤ s',∀ x ∈ S ⇒ s ≤ s' .
• Um elemento i ∈ P é dito um ínfimo de S se for o maior dos minorantes, isto é: i ≤ x, ∀ x ∈ S , e

i ' ≤ x , ∀ x ∈ S ⇒ i' ≤ i .
• Um majorante M ∈P é dito máximo de S se M ∈S .
• Um minorante m∈ P é dito mínimo de S se m∈S .
• Se um conjunto tem majorante, se diz que está limitado superiormente.
• Se um conjunto tem minorante, se diz que está limitado inferiormente.
Veja Capítulo 15, Seção 3 deste livro e “Introduction to Calculus and Analysis”, Richard Courant e Fritz John,
Volume I, Capítulo 1, Seção 1.1, página 97. Veja também: https://pt.wikipedia.org/wiki/Supremo_e_
%C3%Adnfimo.
112/141
n
M = ∭ ρ ( x , y , z) dx dy dz = lim ∑ ρ (ξ i ,η i , ς i ) Gi .
max. d (G i )→0 i=1
As integrais (49) e (51) são chamadas respectivamente de integral dupla e integral tripla.
Vamos agora examinar um problema que leva a uma integral dupla. Imagine que a água está fluindo
sobre uma superfície plana. Nesta superfície também, a água do subsolo aflora à superfície, ou a
água da superfície penetra no subsolo, com uma intensidade f (x , y ) que é diferente para cada
ponto da superfície. Considere uma região G limitada por uma curva fechada como mostra a Fig. 34
e assuma que para todo ponto de G conhecemos a intensidade f (x , y ) , isto é, a quantidade de
água que está aflorando do subsolo ou penetrando no subsolo em minuto por cm 2 da superfície.
Então teremos que f (x , y ) > 0 onde a água do subsolo aflora e f (x , y ) < 0 onde a água é
drenada para o subsolo. Qual a quantidade de água que se acumula na superfície G por minuto?
Fig. 34
Se dividirmos G em pequenas sub-regiões e considerarmos que a taxa de percolação seja

aproximadamente constante em cada uma destas sub-regiões, ao passarmos ao limite fazendo mais e
mais subdivisões em G, obteremos uma expressão para o total da água acumulada na superfície na
forma de uma integral:
∬ f ( x , y) dx dy .
G
As integrais duplas foram introduzidas pela primeira vez pelo matemático suíço Leonhard Euler
(1707 – 1783). Vale notar que as integrais múltiplas constituem um instrumento comumente usado
nos cálculos e investigações de uma grande variedade de problemas.
Seria também possível mostrar, embora não o faremos aqui, que o cálculo de integrais múltiplas
pode ser reduzido, via de regra, ao cálculo iterativo simples de integrais unidimensionais.
Integrais de linha e de superfície. Finalmente, devemos mencionar que ainda são possíveis outras
generalizações de integral. Por exemplo, o problema de se definir o trabalho feito por uma força
variável aplicada em um ponto material quando este se desloca ao longo de uma dada curva nos
113/141
leva, naturalmente, ao que chamamos de integral de linha, também chamada de integral curvilínea.
Por outro lado, o problema de encontrar a carga total sobre uma superfície em que a carga elétrica
está continuamente distribuída com uma dada densidade superficial de carga nos leva a um novo
conceito, qual seja, o da integral sobre uma superfície encurvada.
Como exemplo, suponha que um líquido escoa da esquerda para direita através do espaço paralelo
ao eixo das abcissas como mostra a Fig. 35, e que a velocidade da partícula do líquido no ponto
( x , y ) é dada pela função P (x , y ) , onde esta relação não depende da coordenada z. Se
desejarmos determinar a quantidade de líquido que flui por minuto através do contorno Γ,77
podemos proceder da seguinte maneira. Dividamos inicialmente em segmentos Δ s i o contorno Γ.
A quantidade de água que flui através de um segmento Δ s i é aproximadamente igual à coluna de
líquido com altura unitária que tem por base o paralelogramo hachurado da Fig. 35. Esta coluna
pode ser considerada com a quantidade de líquido que atravessa por minuto um segmento do
contorno. Mas a área do paralelogramo hachurado é igual a: P i ( x , y ) Δ s i cos α i , onde α é o
ângulo entre a direção x̄ do eixo das abcissas e a direção normal n̄ voltada para o exterior da
superfície cilíndrica cuja base é o contorno Γ. Esta normal n̄ é perpendicular a tangente que
podemos considerar como definindo a direção do segmento Δ s i .
Fig. 35
Somando as áreas de tais paralelogramos e passando ao limite, isto é, fazendo com que as
subdivisões Δ s i do contorno Γ tenham comprimentos cada vez menores, determinamos a
quantidade de água que flui por minuto através de Γ. Este resultado é simbolicamente expresso
como:
∫Γ P ( x , y)cos( n̄ , x̄) ds .
A expressão acima é chamada de integral de linha ou integral curvilínea. Se a direção do fluxo não
77 Para ser mais preciso, o líquido em questão flui através de uma superfície cilíndrica com geratriz perpendicular ao
plano xy que tem por base o contorno mostrado na Fig. 35 e altura igual à unidade.
114/141
for paralela ao eixo das abcissas como no exemplo da Fig. 35, então a velocidade em cada ponto
( x , y ) do contorno teria uma componente P (x , y ) na direção do eixo do x e uma
componente Q( x , y) ao longo do eixo do y. Neste caso, podemos mostrar por uma
argumentação análoga que a quantidade fluindo através do contorno seria igual a:
∫Γ [P ( x , y)cos( n̄ , x̄)+Q( x , y)cos (n̄ , ȳ)]ds .78
De outro lado, quando falamos da integral de uma função f (M ) sobre uma superfície
encurvada G, onde M ( x , y , z) são os pontos desta superfície, queremos nos referir ao limite do
somatório na forma:
[ ]
n
lim
Δ σ i →0
∑ f ( M i )Δ σ i = ∬ f ( x , y , z)d σ .
i=1 G
Ou seja, o limite do somatório quando as subdivisões Δσ i sobre a área da superfície encurvada

G tornam-se cada vez menores.
Existem métodos gerais para transformar integrais múltiplas, curvilíneas, e de superfícies em outras
formas de sorte a calcular seus valores de maneira exata ou aproximada.
Fórmula de Ostrogradski. Algumas importantes fórmulas gerais relacionando os diversos tipos de

integrais tais como a integral de volume com a integral de superfície deste volume, e também a
integral de superfície, quer seja esta superfície plana ou encurvada, com a integral de linha do seu
contorno, foram descobertas em meados do século XIX por Ostrogradski.
Aqui não tentaremos dar uma prova da fórmula geral de Ostrogradski que tem uma larga aplicação
em vários ramos das ciências, mas meramente a ilustraremos com um exemplo bem simples de um
caso particular.
Como fizemos antes, imagine que sobre uma superfície plana exista um fluxo horizontal de água
que também está se infiltrando no solo ou aflorando. Designemos por G uma região delimitada por
uma curva fechada Γ e assumamos que em cada ponto da região se conheça as componentes
P (x , y ) e Q( x , y) da velocidade da água nas direções dos eixos x e y respectivamente.
78 Da Fig. 35 vemos que para pequenos deslocamentos ao longo da curva Γ, o diferencial da coordenada y é igual a
dy = cos ( n̄ x̄) ds e o diferencial da coordenada x é igual a dx = −cos( n̄ ȳ)ds , veja o diagrama abaixo. Com
isto esta última integral pode ser escrita na forma:
∫ [ P ( x , y)cos(
⏟ cos( n̄ , ȳ) ds ] = ∫ [ P ( x , y)dy −Q ( x , y)dx ]
n̄ , x̄) ds + Q( x , y) ⏟ .
Γ Γ
dy −dx
y
n
dy = cos(n , x) ds
dx = - cos(n , y)
115/141
Vamos agora calcular a taxa com que a água do subsolo aflora à superfície em um ponto com
coordenadas ( x , y ) . Para isto, consideraremos um pequeno retângulo com lados Δ x e
Δ y , situado no ponto ( x , y ) .
Devido à velocidade P (x , y ) através do lado esquerdo vertical deste retângulo, existirá um

fluxo de aproximadamente P ( x , y ) Δ y unidades de água por minuto entrando no retângulo. Do
mesmo modo, através do lado direito do retângulo, neste mesmo tempo, haverá um fluxo que deixa
o retângulo com valor aproximado de P (x +Δ x , y) Δ y , nas mesmas unidades anteriores. Em
geral, a quantidade total de água que deixa uma unidade quadrada de superfície como resultado do
fluxo através dos lados verticais do retângulo à esquerda e à direita será aproximadamente de:
[ P( x +Δ x , y )−P ( x , y )]Δ y [ P ( x +Δ x , y)−P ( x , y)]

= .
ΔxΔ y Δx
Se fizermos Δ x se aproximar de zero, obteremos no limite:
[ P( x+ Δ x , y )−P (x , y )]Δ y [ P( x+ Δ x , y )−P ( x , y )] ∂ P

lim = lim = .
Δ x→ 0 ΔxΔ y Δ x→ 0 Δx ∂x
Da mesma forma, a vazão total de água por unidade de área na direção do eixo y será dada por:
∂Q
.
∂y
Isto significa que a intensidade de água do subsolo que aflora à superfície em um ponto com
coordenadas ( x , y ) será igual a:
∂ P ∂Q
+ .
∂x ∂y
Mas, em geral, como vimos anteriormente, a quantidade de água que emerge do subsolo será dada
pela integral dupla da função expressando a intensidade deste afloramento em cada ponto da região,
isto é:
∬( ∂∂ Px + ∂Q
∂y)
dx dy (52).
G
Além disto, como a água é um fluido incompressível, a quantidade de água calculada pela integral
(52) deve simultaneamente cruzar a curva fechada Γ que delimita a região G. Por outro lado, já
mostramos que nesta situação a quantidade de água que atravessa o contorno Γ é expressa por uma
integral de linha calculada sobre este contorno. Assim, temos:
∫Γ [P ( x , y)cos( n̄ , x̄)+Q( x , y)cos (n̄ , ȳ)]ds (53).
A igualdade das magnitudes (52) e (53) expressa a fórmula de Ostrogradski no seu caso
bidimensional mais simples:
116/141
∬( ∂∂ Px + ∂Q
∂y)
dx dy = ∫ [P ( x , y)cos( n̄ , x̄)+Q( x , y)cos ( n̄ , ȳ)]ds .
G Γ
Aqui explicamos de maneira simples o significado desta fórmula usando um exemplo da física, mas
ela pode ser provada matematicamente.
Desta maneira o teorema matemático de Ostrogradski reflete um fenômeno largamente difundido no

mundo real que no nosso exemplo foi interpretado de uma maneira fácil de visualizar através da
preservação de volume em um fluido incompressível.
Ostrogradski estabeleceu uma fórmula muito mais geral expressando esta inter-relação entre a
integral em um volume de um espaço multidimensional e sua superfície. 79 Em particular, para um
corpo G no espaço tridimensional limitado por uma superfície Ω esta relação é expressa como:
∭( ∂∂ Px + ∂Q
∂ y ∂z)
+
∂R
= ∫ [ P ( x , y )cos ( n̄ , x̄ )+ Q(x , y )cos( n̄ , ȳ )+ R( x , y )cos ( n̄ , z̄ )] d σ .80
G Ω
Onde dσ é um elemento da superfície Ω.
É interessante notar que a fórmula fundamental do cálculo integral também pode ser considerada
como o caso unidimensional da equação de Ostrogradski:
b
∫ f ( x ) dx = F (b)− F ( a) (54).
a
De fato, a equação (54) relaciona a integral sobre um intervalo com a “integral” sobre a fronteira
“zero-dimensional” deste intervalo que consiste dos dois pontos extremos do intervalo.
Fig. 36
A fórmula (54) pode ser ilustrada com a seguinte analogia. Imagine uma tubulação retilínea com
79 N. T. - Generalizando, definimos que em um espaço n-dimensional descrito pelas coordenadas x1 , x 2 , … ,

x n , uma superfície (n-1)-dimensional, também se diz hipersuperfície ou manifold, é definida pela equação
implícita:
ϕ ( x 1 , x2 ,⋯, xn ) = constante .
Onde na equação acima em cada ponto pelo menos uma das derivadas de primeira ordem de ϕ deve ser diferente de
zero. Veja “Introduction to Calculus and Analysis”, Richard Courant e Fritz John, Volume II, Capítulo 4, Seção 4.11,
página 453.
80 N. T. - Os teoremas apresentados aqui são conhecidos no ocidente como teorema de Gauss e teorema de Stokes. Veja
“Introduction to Calculus and Analysis”, Richard Courant e Fritz John, Volume II, Capítulo 5, Seção 5.11, página
622.
117/141
seção reta s constante igual à unidade: s = 1 , onde a água esteja fluindo com velocidade
F ( x) , ou seja, temos velocidades diferentes para seções retas diferentes (veja Fig. 36). Isto
acontece porque, através de poros existentes na parede da tubulação, a água entra ou sai da
tubulação em uma taxa que também é diferente de uma seção reta para outra.
Se considerarmos um trecho da tubulação de x até x +Δ x , a quantidade de água por unidade de

tempo que entra na tubulação pelos poros da parede ao longo do trecho deverá ser compensada pela
diferença F ( x +Δ x )−F ( x ) entre as quantidades que sai e entra na tubulação pelas seções retas
das extremidades deste trecho.81 Assim, a quantidade de água que se infiltra no trecho da tubulação
é igual à diferença F ( x +Δ x )−F ( x ) . Consequentemente a taxa de infiltração por unidade de
comprimento de tubulação, isto é, a razão da infiltração sobre um trecho da tubulação de
comprimento infinitesimal será igual a:
F ( x+ Δ x )−F ( x)
f (x ) = lim = F ' ( x) .
Δ x →0 Δx
Dizendo de outro modo, a quantidade de água que se infiltra no intervalo [a, b] ao longo da
tubulação deve ser igual à quantidade de fluxo adicional considerando as vazões que sai e entra nas
b
suas extremidades. Entretanto, a quantidade que se infiltra é igual a ∫ f ( x ) dx , e a quantidade

a
adicional de fluxo considerando as extremidades da tubulação é dada por F (b)−F (a) . A
igualdade destas duas magnitudes reproduz a fórmula (54).
2.14 Série
Conceito de série. Uma série em matemática é uma expressão na forma: u 0 +u 1+ u2 +⋯ . Os

números u k são chamados termos da série. Existe um número infinito de termos e eles são
arranjados em uma ordem bem definida tal que a cada número natural k = 0 ,1 , 2 ,⋯ exista um
valor correspondente u k .
O leitor deve ter em mente que não dissemos se é possível calcular o valor de tais expressões ou, no
caso de ser possível, como devemos proceder. A presença do sinal positivo entre os termos u k da
nossa expressão parece indicar que de alguma maneira todo os termos devem ser adicionados.
Entretanto, existe um número infinito de termos e a adição de números é definida somente para um
número finito de parcelas.
Designemos por S n a soma dos n primeiros termos da série. Chamaremos Sn de enésima

soma parcial da série. Com isto, obtemos uma sequência de números:
S 1 = u0 ,
S 1 = u 0 +u 1 ,
⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
S n = u0 + u1 +⋯+u n−1 ,
⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
81 N. T. - Observe que nestes cálculos a vazão V em qualquer ponto x da tubulação será igual ao produto da velocidade
F ( x) pela área s da seção reta da tubulação neste ponto. Isto é, V = s F ( x ) , mas s = 1 , logo
V = F ( x) . Daí termos representado a vazão pela função velocidade F ( x) .
118/141
Então, podemos falar de uma quantidade variável S n , onde n assume os valores: n = 1 , 2⋯ .
A série é dita ser convergente se, quando n → ∞ , a variável Sn se aproxima de um limite

finito bem estabelecido:
lim S n = S .
n→∞
O limite S é chamado soma da série, e neste caso escrevemos:
S = u 0+ u1 +⋯ .
Há de se considerar que a palavra “soma” aqui se usa em um sentido especial. A soma de uma série
convergente não é obtida pela operação de adição que estamos acostumados e sim como o limite de
uma sucessão de somas parciais. Também deve ser ressaltado que para séries convergentes o
∞
símbolo ∑ uk se utiliza tanto para indicar a série como sua soma apesar de serem coisas
k=0
conceitualmente distintas. A soma se representa por um número, portanto, não pode ser nem
convergente nem divergente. Uma vez feita esta distinção entre uma série e sua soma, o uso de um
único símbolo para representar as duas coisas não dará lugar a confusão.82
No caso em que quando n → ∞ o limite de S n não existe, então se diz que a série é
divergente. Neste caso não tem sentido falar de sua soma.83 Todavia, se todos termos u n têm o
mesmo sinal, então se costuma dizer que a soma da série é igual a infinito com o sinal
correspondente.
Para exemplificar, considere a série 1+ x + x 2 +⋯ , cujos termos formam uma progressão

geométrica com razão x.
A soma dos n primeiros termos é igual a:
1− x n
S n ( x) = para x≠1 (55).
1−x
Se |x| < 1 esta soma tem por limite:
1
lim S n ( x ) = .
n→∞ 1−x
Assim, para |x| < 1 podemos escrever:
82 N. T. - Veja “Calculus – introducción con vectores y geometría analítica”, Tom M. Apostol, Volume I, Capítulo 10,
Seção 10.5, página 470 [494].
83 Observamos também que é possível se dar definições generalizadas da soma de uma série em virtude das quais é
possível se associar a certa série divergente um conceito mais ou menos natural de “soma generalizada”. Tais séries
são ditas ser somáveis. Operações com somas generalizadas de séries divergentes algumas vezes são úteis na
matemática.
119/141
1
= 1+ x + x 2+⋯ .
1−x
Se |x| > 1 , temos obviamente lim S n = ∞ , e a série diverge. A mesma situação acontece para
n→∞
x = 1 como podemos ver imediatamente sem necessidade de recorrer à fórmula (55), pois esta
fórmula para x = 1 não tem sentido, visto que é uma indeterminação do tipo 0/0 .
Finalmente, para x = −1 os valores das somas parciais oscilam alternadamente entre +1 e 0,
de sorte que embora sejam limitados dizemos também que a série é divergente.
A cada série corresponde uma sequência bem definida de valores associada às somas parciais S 1 ,
S 2 , S 3 , S 4 , … , tal que a convergência da série depende do fato que as somas parciais se
aproximem de um limite.84 Inversamente, uma sequência arbitrária de números S 1 , S 2 , S 3 ,
S 4 … , corresponde uma série do tipo: S 1 +( S 2−S 1)+(S 3−S 2)+⋯ , cujas somas parciais
serão os números da sequência.85 Assim, a teoria das variáveis tomando seus valores sobre uma
sequência pode ser reduzido a teoria das séries correspondentes e vice-versa. Cada uma destas
teorias tem seu significado independente. Assim, é mais conveniente estudar em alguns casos a
variável diretamente e em outros considerar a série equivalente.
Queremos observar que há muito tempo as séries têm servido como um método importante para
representar diversos objetos matemáticos e calcular seus valores, mas acima de tudo isto se aplica às
funções. Naturalmente, a visão que os matemáticos têm em relação às séries mudou com o passar
do tempo e está relacionada com a evolução de suas ideias sobre o conceito de infinitesimais. Uma
definição clara de convergência e divergência de série foi formulada no começo do século XIX, ao
mesmo tempo, em que se associava estreitamente a esta definição o conceito de limite.
Se a série converge, então seu termo geral u n se aproxima de zero quando n cresce. De fato:
lim un = lim ( S n+1−S n ) = S −S = 0 .

n→∞ n→ ∞
Dos exemplos que daremos nos parágrafos seguintes, ficará claro que, em geral, o inverso deste
enunciado é falso. Entrementes, o critério ainda é útil, pois nos fornece uma condição necessária
para convergência de uma série. Por exemplo, a divergência de uma progressão geométrica com
razão x > 1 segue imediatamente do fato que seu termo geral x n não se aproxima de zero
quando n →∞ .
Se a série é composta por termos positivos, então a soma parcial S n cresce com n e nesta
situação existem apenas dois casos: Ou a variável S n cresce e permanece maior do que qualquer
84 N. T. - Vale dizer que a sequência S 1 , S 2 , S 3 … ,converge. Definição: Uma sequência { f ( n)} ,
onde f (n) é uma função cujo domínio é o conjunto de todos os inteiros n, é dita ter um limite L se, para todo
número positivo ϵ , existe outro número positivo N, que pode depender de ϵ , tal que: | f (n )− L| < ϵ ,
para todo n ≥ N . Neste caso, dizemos que a sequência { f ( n)} converge para L e escrevemos:
lim f (n) = L , ou f (n) → L quando n→∞ .

n →∞
Uma sequência que não converge é dita ser divergente. Veja “Calculus – introducción con vectores y geometría
analítica”, Tom M. Apostol, Volume I, Capítulo 10, Seção 10.2, página 464 [488].
85 N T. - De fato, a soma parcial dos n primeiros termos da série será: S 1 +(S 2 −S 1)+( S 3−S 2 )+⋯+( S n− S n−1 ) = S n .
120/141
número A previamente escolhido para valores de n suficientemente grande de sorte que a série
diverge, e isto implica que lim S n = ∞ ; ou existe um número A tal que para todo n o valor de
n→∞
S n não excede A. Assim a variável S n necessariamente se aproxima de um limite finito bem
definido não maior que A e a série é convergente.
Convergência de uma série. A questão de sabermos se uma dada série converge ou diverge pode
frequentemente ser resolvida comparando a série dada com outra série. Neste caso é comum se
fazer uso do seguinte critério.
Dado duas séries com termos positivos, u 0 +u 1+ u2 +⋯ e v 0 + v 1+ v 2 +⋯ , tal que para todos os
valores de n, começando em um determinado valor, vale a desigualdade u n ≤ v n , então se a
segunda série for convergente implica na convergência da primeira série, e se a primeira série for
divergente implica na divergência da segunda série.
Por exemplo, considere a chamada série harmônica:
1 1 1 1 1 1
1+ + + + + + +⋯ .
2 3 4 5 6 7
Os termos da série harmônica evidentemente não são menores que os termos da série abaixo:
1 1 1 1 1 1 1 1 1
1+ + + + + + + + +⋯+ +⋯
⏟2 ⏟4 4 ⏟
8 8 8 8 ⏟
16 16 .
uma vez duas vez quatro vezes oito vezes
1
Na série acima a soma dos termos assinalados com chaves é igual a . Fica claro que a soma
2
parcial S n da segunda série aproxima-se do infinito quando n cresce, consequentemente a série
harmônica diverge.
Outro exemplo, analisando a série:
1 1 1
1+ + + +⋯ (56).
2α 3α 4α
Onde α é um número positivo menor que a unidade. Fica claro também que a série (56) obviamente
diverge, desde que para um valor arbitrário de n, temos:
1 1
α > para 0 < α < 1 .
n n
Por outro lado, é possível provar que a série (56) para α >1 é convergente.86 Aqui provaremos
86 N. T. - Para demonstração veja “Introduction to Calculus and Analysis”, Richard Courant e Fritz John, Volume I,
(
1 1 1
Capítulo 7, Seção 7.2, página 524. A série ζ ( s) = lim 1+ s + s + s +⋯+ s
n→∞ 2 3 4 n
1
)
define uma função da variável s
para todo s > 1 chamada de função zeta. Observe que esta função é definida por um processo de limite. Veja
também “What is Mathematics? An Elementary Approach to Ideas and Methods”, Richard Courant & Herbert
121/141
apenas para o caso de α ≥ 2 . Para isto investiguemos a seguinte série composta por termos
positivos:
(1− 12 )+( 12 − 13 )+⋯+( n−1

1
− )+⋯
1
n
.
1
Esta série converge para unidade, uma vez que sua soma parcial Sn é igual a: S n = 1− .
n+1
Portanto, lim S n = lim 1−
n→∞ n →∞
( 1
n+1 )
=1 .
De outra parte, o termo geral u n desta série satisfaz a desigualdade:
un = ( n−1
1
− )=
1
n
1
>
(n−1) n n
1
2 .
1 1 1
Segue que a série 1+ + + +⋯ converge. Mais do que isto, a série (56) convergirá para
22 32 4 2
qualquer α > 2 .
Daremos agora sem prova outro critério muito útil para saber se uma série com termos positivos é
convergente ou divergente. Este é o chamado critério de d’Alembert. 87 Suponha que, quando n se
u n+1
aproxima do infinito, a razão entre termos consecutivos tenha um limite q. Então, para
un
q < 1 a sequência dos termos será convergente e a série convergirá, enquanto para q > 1 a
sequência dos termos será divergente e a série divergirá. Entretanto, se q = 1 a questão sobre a
convergência da série permanece aberta.
Um fato importante sobre séries infinitas é o seguinte. Se tivermos uma soma com um número
finito de parcelas o resultado da soma não muda quando permutarmos as parcelas; todavia, isto não
se aplica a uma série infinita.88 Existem séries convergentes para as quais é possível permutar seus
termos de maneira a mudar sua soma e mesmo torná-las séries divergentes. Séries deste tipo com
somas instáveis não apresentam umas das propriedades fundamentais da operação de soma a
permutabilidade das parcelas. Assim, é importante distinguir aquelas séries que preservam esta
propriedade. Estas séries são chamadas de séries absolutamente convergentes.
Deste modo, uma série u 0 +u 1+ u2 + u3 +⋯ é dita ser absolutamente convergente se a série

formada pelos valores absolutos dos seus termos for também convergente:
|u 0|+|u1|+|u2|+|u3|+⋯ .
Robbins & Ian Stewart, página 479 [504] em diante. Para determinação dos valores da função zeta veja planilha:
Função zeta.ods.
87 N. T. - Jean-Baptiste le Rond d'Alembert (1717 – 1783) foi um notável filósofo, matemático e físico francês. Entre
outras descobertas d'Alembert obteve a fórmula para solução das equações de ondas. Para demonstração do critério
de d’Alembert veja “Calculus – introducción con vectores y geometría analítica”, Tom M. Apostol, Volume I,
Capítulo 10, Seção 10.15, Teorema 10.13, página 489 [513].
página 517.
122/141
É possível provar que uma série u 0 +u 1+ u2 + u3 +⋯ absolutamente convergente é sempre

convergente. Em outras palavras, sua soma parcial S n aproxima-se de um limite finito.89 É óbvio
que toda série convergente cujos termos possuem o mesmo sinal é absolutamente convergente.
A série abaixo é um exemplo de uma série absolutamente convergente:
sen x sen 2 x sen 3 x

+ + +⋯ .
12 22 32
Tomando os valores absolutos dos termos da série acima,

1
2
2
2 | ||
sen x sen 2 x sen 3 x
+ +
3
2
+⋯ , vemos
|| |
1 1
que estes não são maiores que os termos da série convergente: 1+ 2 + 3 +⋯ que já
2 2
apresentamos, portanto, a série é absolutamente convergente.
Um exemplo de uma série que é convergente, mas não absolutamente convergente é o seguinte:
1 1 1 1 1 1 1
1− + − + − + +⋯+(−1)n−1 +⋯ .
2 3 4 5 6 7 n
A prova é deixada como exercício para o leitor.
Resolvendo o exercício proposto. De imediato vemos que os valores absolutos dos termos da série
acima correspondem aos termos da série harmônica que já provamos que é divergente. De fato:
| 12| |13|+|− 14|+|15|+|− 16|+|17|+⋯+|(−1) 1n| = 1+ 12 + 13 − 14 + 15 + 16 + 17 +⋯+ 1n +⋯ .

|1|+ − + n−1
Isto mostra que a série dada não é absolutamente convergente, resta mostrar que ela é convergente.
Para isto faremos uma aproximação da função ln( x+ Δ x ) usando a fórmula de Taylor:
f (2) (1) f (n ) (1) f (n+1) ( ξ )

f (x +Δ x) = f (1)+ f (1) (1)(Δ x)+ ( Δ x )2+⋯+ (Δ x)n + (Δ x )n+ 1
2 n! ⏟ .n+1!
termo restante: Rn+ 1
Para facilitar escrevemos as derivadas da função logaritmo, f (x ) = ln ( x) . Daí, temos:
1 1! 2! (n−1)!
f (1) ( x) = + , f (2) ( x) = − , f (3) ( x) = + ,…, f (n )( x) = (−1)n−1 .
x x2 x3 xn
Substituindo estes resultados na fórmula de Taylor para x = 1 e Δ x = 1 , fica:
Seção 10.18, página 496 [520].
123/141
1 2! 3! n−1! 1 1 1 1
ln (1+1) = ln 2 = 0+1− + − ⋯+(−1)n−1 + R n+1 = 1− + − +⋯+(−1)n−1 + Rn+1 .
2 3! 4! n! 2 3 4 n
Onde a expressão do termo restante Rn +1 é dada por:
Rn +1 = f (n+1)
(ξ )
(Δ x)n +1
n+1! [ n!
= (−1)n n +1
ξ ][ ]
(1)n +1
n+ 1!
.
Aqui ξ é algum valor entre 1 < ξ < 2 .
Mas o limite de Rn +1 quando n → ∞ é zero. De fato:
n→∞ n →∞ [
lim R n+1 = lim (−1)n
ξ
n!
n+1 ][ ]
(1)n+1
n+1! [ 1
= lim (−1)n n+1
n →∞ ξ ][ ] 1
n+1
=0 .
Donde concluímos que a série infinita do exemplo é igual a ln 2:
1 1 1 1
ln 2 = 1− + − +⋯+(−1)n−1 +⋯ .
2 3 4 n
Isto prova que a série em questão, construída a partir da série harmônica através da alternância de
sinais, é convergente embora não seja absolutamente convergente. Assim, através da alternância de
sinais transformamos uma série divergente em outra convergente.
Séries de funções; séries uniformemente convergentes. Na análise matemática frequentemente

nos deparamos com séries cujos termos são funções de x. Nos parágrafos precedentes encontramos
séries deste tipo, por exemplo: 1+ x + x 2 + x 3 +⋯ . Para alguns valores de x esta série converge,
enquanto, para outros diverge. As séries de funções convergentes para todos valores de x
pertencentes a determinado intervalo são de especial interesse em aplicações da matemática. Este
intervalo, entre outros, pode ser todo o eixo de números reais, apenas sua metade positiva, e assim
por diante. Daí, nas aplicações, surge a necessidade de se diferenciar as séries termo a termo,
integrá-las, decidir se a sua soma é contínua, e assim sucessivamente. Para o caso mais familiar da
soma de um número finito de termos, existem regras gerais bem simples. De fato, sabemos que a
derivada de uma soma de funções diferenciáveis é igual à soma de suas derivadas, a integral de uma
soma de funções contínuas é a soma de suas integrais, e a soma de funções contínuas também é uma
função contínua. Todas estas propriedades são válidas para uma soma com um número finito de
termos.
Entretanto, para séries infinitas estas regras simples, em geral, não se aplicam. Podemos dar muitos
exemplos de séries convergentes de funções em que a diferenciação e integração termo a termo não
se aplica. Da mesma maneira, uma série constituída por funções contínuas pode ter uma soma
descontínua. Por outro lado, muitas séries infinitas se comportam como somas finitas com respeito a
estas regras.
Investigações aprofundadas destas questões mostraram que estas regras podem ainda ser aplicadas
se as séries infinitas em questão forem não apenas convergentes em cada um dos pontos do
intervalo de definição, isto é, do domínio da variável x, mas também se forem uniformemente
124/141
convergentes em todo o intervalo. Desta maneira, na metade do século XIX, ficou estabelecido
definitivamente na análise matemática o importante conceito de séries uniformemente convergente
que passaremos a descrever.
Considere a série abaixo cujos termos são funções definidas no intervalo fechado [a, b].
S (x ) = u0 ( x)+u 1 ( x )+ u 2 (x)+⋯ .
Suponha que em cada valor de x no intervalo [a, b] esta série converge para alguma soma S (x ) .
A soma S n dos n primeiros termos da série, S (x ) = u0 ( x)+u 1 ( x )+⋯+ u n−1( x) , será também
uma certa função de x no intervalo [a, b].
Introduzimos agora uma grandeza η n que é igual ao menor limite superior dos valores
|S ( x)−S n ( x )| quando a variável x varre o intervalo [a, b]. Esta grandeza é escrita na forma:
η n = sup |S n (x )−S ( x)| .90

a≤ x≤b
No caso em que a quantidade S (x )−S n ( x) atinge seu valor máximo, o que certamente ocorrerá,
por exemplo, quando S (x ) e S n ( x) forem funções contínuas, então η n é simplesmente o
máximo da função |S ( x)−S n ( x )| no intervalo [a, b].
Como assumimos a hipótese de convergência da série, temos que para cada valor de x no intervalo
[a, b] vale o limite:
lim |S ( x )−S n ( x)| = 0 .

n→∞
Entretanto, a magnitude η n pode ou não se aproximar de zero. Se η n se aproxima de zero

quando n → ∞ , então a série é dita ser uniformemente convergente, e, caso contrário, se diz que
ela tem convergência não uniforme. No mesmo sentido é possível se falar de convergência uniforme
de uma sequência de funções S n ( x) sem necessariamente interpretá-las como somas parciais de
uma série.91
Exemplo 1. Seja a série de funções
1 1 1
− − −⋯ .
x+ 1 ( x+ 1)( x+ 2) ( x+ 2)(x +3)
Tomando para definição desta série os valores não negativos92 de x, isto é, o semieixo dos números
90 Veja Capítulo 15, Seção 3 deste livro. Seja S um subconjunto de um conjunto P parcialmente ordenado pela relação
≤ . Então um elemento s∈ P é dito um supremo de S se for o menor dos majorantes, isto é:
x ≤ s , ∀ x ∈ S , e x ≤ s ' , ∀ x ∈ S ⇒ s ≤ s ' . A abreviatura de supremo é “sup”. Veja também nota 76 deste
capítulo na subseção: Integrais múltiplas.
página 529.
92 N. T. - Definição: Se diz que um número real x é não negativo se x ≥ 0 . Do mesmo modo, um número real x é
dito ser não positivo se x ≤ 0 . Assim, o número zero é simultaneamente não negativo e não positivo. Veja
“Elementary Real and Complex Analysis”, Georgi E. Shilov, Capítulo 1, Seção 1.5, Definição 1.5.2, página 10 [20].
125/141
reais definido pelo intervalo [ 0 , ∞ ) .93 Podemos escrevê-la na forma:
1
+ ( 1
−
1
x+ 1 ( x + 2) ( x+1)
+
1
)(−
1
( x+ 3) ( x+ 2)
+⋯ . )
Daí, vemos que suas somas parciais são dadas pela expressão:
1
S n ( x) = .
x+ n
Então, temos:
S (x ) = lim S n ( x) = lim
n →∞ n→∞
( x 1+n ) = 0 .
Deste modo a série é convergente para todos os valores de x não negativos. Assim, a soma dos
termos da série infinita é zero: S ( x ) = 0 . Além disso, temos:
η n = sup |S n (x )−S ( x)| = sup

a≤ x≤b a≤ x≤b
( x 1+n −0) = 1n → 0 , quando (n → ∞) .
Notamos, portanto, que a série converge uniformemente para zero no semieixo dos números reais
[ 0 , ∞ ) . A Fig. 37 mostra o gráfico das somas parciais S n ( x) para alguns valores de n.
Fig. 37
Exemplo 2. Seja a série de funções:
x + x ( x−1)+ x 2( x−1)+⋯ .
Esta série pode ser escrita como:
93 N. T. - Aqui lembramos ao leitor que os sinais e símbolos matemáticos, seus significados, equivalentes verbais e
aplicações, são padronizados pela norma internacional ISO 80000-2. Estas recomendações visam principalmente a
utilização das notações em ciências naturais e tecnologia, mas também se aplicam em outras áreas onde a
matemática é usada. É importante que os textos de matemática sigam as notações padronizadas internacionalmente.
Veja arquivo: ISO 80000-22009 - Part 2 Mathematical signs and symbols.pdf.
126/141
x +( x 2−x )+( x3 −x 2)+⋯ .
Logo, temos para soma parcial da série: S n = x n . Daí, tiramos:
n →∞
{
S (x ) = lim S n ( x) = 0 se 0 ≤ x < 1 .
1 se x = 1
Desta maneira, a soma dos termos da série infinita é descontínua no intervalo [0, 1], com uma
descontinuidade localizada no ponto x = 1 . A quantidade |S n ( x)−S ( x )| é menor que a
unidade para todo x do intervalo [0, 1], mas para x na vizinhança de x = 1 ela é arbitrariamente
próxima da unidade. Assim, para n = 1 , 2 ,⋯ o limite superior η n dos valores
|S n ( x)−S ( x )| , fica:
η n = sup |S n ( x)−S ( x)| = 1 .

0≤ x≤1
Portanto, a série não converge uniformemente no intervalo [0, 1]. A Fig. 38 mostra gráficos da
função S n ( x) para alguns valores de n. Observe que o gráfico da soma dos termos da série
infinita S (x ) consiste do segmento 0 ≤ x < 1 do eixo dos x, omitindo o ponto extremo à
direita, mais o ponto (1 , 1) . É aqui que ocorre descontinuidade de S (x ) no intervalo [0, 1].
Fig. 38
Este exemplo mostra que a soma de uma série de funções contínuas que não converge
uniformemente pode de fato resultar em uma função descontínua.
Por outro lado, se considerarmos a série sobre o intervalo 0 ≤ x ≤ q com q < 1 , temos:
η n = sup |S n (x )−S ( x )| = max ( x n) = q n , e qn → 0 .

0≤ x≤q 0≤x≤q n→∞
Logo, neste intervalo a série converge uniformemente e sua soma é contínua. O fato que a soma de
séries uniformemente convergente de funções contínuas é também uma função contínua constituiu
uma regra generalizada como já foi apontado, e pode ser demonstrada rigorosamente.
127/141
Exemplo 3. Examinaremos agora uma série cuja soma parcial dos primeiros n termos S n ( x) é
representada no gráfico da Fig. 39 pela linha formando um ângulo. Observando este gráfico
constatamos obviamente que para todo n temos S n (0) = 0 . De outra parte, no intervalo
1
0 < x ≤ 1 para todo valor n ≥ , temos S n ( x) = 0 . Dizendo de outro modo, para cada
x
1 1
valor de n temos S n ( x) = 0 para x maior ou igual a : x≥ . Consequente para qualquer
n n
valor arbitrário de x no intervalo [0, 1] vale o limite:
S (x ) = lim S n ( x) = 0 .
n →∞
Por outro lado, o limite superior η n dos valores |S n ( x)−S (x )| , fica:
η n = sup |S n ( x )−S ( x )|= sup |S n ( x )| = n2 .

0≤x≤1 0≤x ≤1
Fig. 39
Portanto, a quantidade η n não se aproxima de zero, ao contrário, cresce sem limite quando n
cresce. Agora notamos que esta série não pode ser integrada termo a termo no intervalo [0, 1]. De
fato:
1 1
∫ S ( x)dx = 0 e ∫ S n( x) dx = 12 n2 1n = n2 .94
0 0
Daí, a série infinita:
1
1
94 N. T. - Observe que a integral ∫ S n ( x) dx é igual à área do triângulo da Fig. 39 que tem por base
n
e altura
0
1
n 2
: ∫ S n ( x) dx = 12 (n2 1n ) = n2 .
0
128/141
1 1 1 1
lim ∫ S n (x ) dx = ∫ S 1 (x )dx+∫ [S 2 ( x )−S 1 ( x )] dx +∫ [ S 3 (x )−S 2 ( x)]dx +⋯ .
n→∞ 0 0 0 0
Reduz-se à série divergente:
(
1 2 1
2 2 2
3 2
2 2
4 3
2 2 )(
1 1 1 1
+ − + − + − +⋯ = + + + +⋯ .
2 2 2 2 )( )
Disto concluímos que neste exemplo a integral da função limite da soma dos termos da série infinita
S (x ) é diferente da soma da integral dos seus termos:
[ ]
1 ∞ 1
∫ S ( x) dx ≠ lim
n→∞
∑ ∫ S n ( x ) dx .
0 n =1 0
Agora daremos sem prova as propriedades fundamentais das séries uniformemente convergentes:
1. A soma de uma série de funções contínuas que é uniformemente convergente no intervalo [a, b]:
é uma função contínua neste intervalo.95
2. Se uma série de funções contínuas converge uniformemente no intervalo [a, b]:
S (x ) = u0 ( x)+u 1 ( x )+ u 2 (x)+⋯ (57).
Então ela pode ser integrada termo a termo neste intervalo. Isto é, para todo x1 , x2
pertencente ao intervalo [a, b], temos a igualdade:
x2 x2 x2 x2
∫ S ( t)dt = ∫ u 0 (t) dt +∫ u 1( t) dt+∫ u2 (t)dt+⋯ .96

x1 x1 x1 x1
3. Se no intervalo [a, b] a série (57) converge e as funções u k ( x) têm derivadas contínuas, então
vale a igualdade obtida da diferenciação termo a termo da série (57) no intervalo [a, b] se o lado
direito da série de (58) mostrada abaixo convergir uniformemente :
S ' (x ) = u'0 ( x)+u '1 (x )+ u'2( x)+⋯ (58).97
Seção 11.3, Teorema 11.2, página 521 [545].
Seção 11.3, Teorema 11.4, página 522 [546]. Observe que neste teorema devemos tomar integrais definidas. Por
∞
exemplo, a série ∑ gν com gν = 0 converge uniformemente. Entretanto, se tomarmos a integral indefinida

ν =1
∞
∫ g ν dx = constante = c de cada termo, somos levados, geralmente, a série divergente ∑c .

ν =1
97 N. T. - Para demonstração deste teorema veja: “Introduction to Calculus and Analysis”, Richard Courant e Fritz
John, Volume I, Capítulo 7, Seção 7.4, página 538. A derivação termo a termo de uma série qualquer de funções é
um assunto mais delicado do que a integração termo a termo no que se refere a conservação de propriedades. Por
∞
(sen n x)
exemplo, a série ∑ 2 converge para todo valor de x já que esta série é dominada pela série convergente
n =1 n
129/141
Série de potências. Na Seção 2.9, uma função f (x ) definida em um intervalo [a, b] foi
chamada de analítica se possuísse neste intervalo derivadas de ordem arbitrária e se em uma
vizinhança suficientemente próxima de qualquer ponto x 0 do intervalo [a, b] ela pudesse ser
expandida por uma série de Taylor convergente:
' f ' ' ( x 0) 2

f (x ) = f ( x0 )+ f ( x 0 )( x− x 0)+ ( x− x 0) +⋯+ (59).
2
f (n) ( x0 )
Se introduzirmos a notação a n = , esta série pode ser escrita na forma:
n!
f (x ) = a0 + a1 ( x−x 0 )+ a 2 (x− x 0)2 +⋯ (60).
As séries deste tipo onde os números a 0 , a 1 , … são constantes independentes de x são

chamadas de série de potências. Como um exemplo considere a série de potências abaixo cujos
termos formam uma progressão geométrica:
1+ x + x 2 +⋯ (61).
Sabemos que para todos os valores de x no intervalo −1 < x < +1 esta série converge e sua
soma é dada por:
1
S (x ) = .
1− x
Para outros valores de x a série diverge.
Observa-se facilmente que a diferença entre a soma da série e a soma parcial dos seus n primeiros
termos é dada pela fórmula:
1 1−x n xn
S (x )−S n ( x) = − = (62).
1−x 1− x 1− x
Se −q ≤ x ≤q , onde q é um número positivo menor que a unidade, então:
qn
η n = max|S ( x)−S n (x )| = .
1−q
∞ ∞
( cos n x)
∑ n12 . Além disto, a convergência é uniforme em todo eixo real. Não obstante, a série ∑ n
obtida
n =1 n =1
por derivação termo a termo diverge quando x = 0 . Este exemplo demonstra que a derivada termo a termo de
uma série pode destruir sua convergência, ainda que a série original seja uniformemente convergente. Por
conseguinte, o problema de justificar o intercambio das operações de derivadas e soma é, em geral, mas sério que o
caso de integração. Com este exemplo o leitor pode comprovar que as manipulações permitidas em somatórios com
número de parcelas finitas nem sempre podem ser efetuadas com séries, mesmo no caso em que as séries que
estamos tratando sejam uniformemente convergentes. Veja “Calculus – introducción con vectores y geometría
analítica”, Tom M. Apostol, Volume I, Capítulo 11, Seção 11.5, página 523 [547].
130/141
Da expressão acima fica claro que η n se aproxima de zero quando n cresce, de sorte que a série
converge uniformemente no intervalo −q ≤ x ≤q para todos os valores de q < 1 .
1
Também é fácil verificar que a função S (x ) = possui derivadas de todas as ordens
1− x
n!
expressas por: S (n ) (x ) = n+1 , e que S (n ) (0) = n! . A soma dos n primeiros termos da
(1−x)
série de Taylor da função S (x ) coincide para x 0 = 0 com a soma dos n primeiros termos da
série (61). Além disto, sabemos que o termo restante da fórmula de Taylor dado pela igualdade (62)
se aproxima de zero quando n cresce para todo valor de x no intervalo −1 < x < +1 . Com isto
mostramos que a série (61) é a série de Taylor de sua função soma S (x ) para x 0 = 0 .
Outro fato interessante é o seguinte. No intervalo de convergência −1 < x < +1 da nossa série se
escolhermos um ponto arbitrário x 0 , é fácil se constatar que para todo x suficientemente
|x− x 0|
próximo de x 0 , ou seja, todo x satisfazendo a desigualdade < 1 , vale a igualdade:
1−x 0
)[ ( )]
2
( ) (
1 1 1 1 x− x 0 x− x 0
S (x ) = = = 1+ + +⋯ =
( )
1− x 1− x 0 x−x 0 1−x 0 1−x 0 1−x 0
1−
1− x 0 (63)
2
1 (x− x 0) ( x− x 0)
= + + +⋯
1−x 0 (1− x 0)2 (1−x 0 )3
O leitor pode provar sem dificuldade que:
S (n) ( x 0) 1
= .
n! ( 1−x 0 )n+1
Consequentemente, a série (63) é a série de Taylor de sua soma S (x ) e ela converge para uma
vizinhança suficientemente próxima de qualquer ponto x 0 pertencente ao intervalo de
convergência de (61). Como o ponto x 0 é arbitrário, isto significa que a função S (x ) é
analítica neste intervalo.
Todos os fatos que observamos para a série de potências (61) em particular é válido para qualquer
série de potências arbitrária.98 Dizendo de outro modo, em toda série de potência expressa na forma
(60), onde as constantes a k são escolhidas obedecendo à determinada lei, existe certo número
não negativo R, que também pode ser infinito, chamado de raio de convergência da série (60) com
as seguintes propriedades:
1. Para todos os valores de x no intervalo x 0− R < x < x 0+ R , que é chamado de intervalo de

convergência, a série converge e sua soma é uma função analítica de x neste intervalo. Aqui a
convergência é uniforme para todo intervalo [a , b] dentro do intervalo de convergência. A própria
série é a série de Taylor da função soma.
98 Para mais detalhes sobre este assunto veja o Capítulo 9.
131/141
2. Nas extremidades do intervalo de convergência a série pode convergir ou divergir dependendo

das suas características em particular. No entanto, ela divergirá certamente fora do intervalo fechado
x 0− R ≤ x ≤ x 0 + R .
Sugerimos ao leitor investigar as três séries de potências mostradas abaixo e se convencer que o raio
de convergência são respectivamente infinito, zero, e a unidade:
x x2 x3
a. 1+ + + +⋯ ;
1! 2! 3!
b. 1+ x +2! x 2 +3! x 3 +⋯ ;
x2 x3
c. 1+ x + + +⋯ .
2 3
Resolvendo os problemas propostos, temos:
a. Examinando a primeira série e fazendo uso do valor absoluto dos seus termos podemos escrever
a desigualdade:
x x2 x3 xn |x| |x 2| |x 3| |x n|
1+ + + +⋯+ +⋯ ≤ 1+ + + +⋯+ +⋯ .
1! 2! 3! n! 1! 2! 3! n!
Esta desigualdade é válida para x variando no intervalo −∞ < x <+ ∞ . Para provar que a série
original converge, demonstraremos que a série do lado direito da desigualdade converge. Aqui
usaremos o critério de d’Alembert que apresentamos anteriormente: Suponha que, quando n se
u n+1
aproxima do infinito, a razão entre os termos consecutivos da série, , tenha um limite q.
un
|x n|
Então, para q < 1 a série será convergente. Fazendo u n = e aplicando o teste na série do
n!
lado direito da desigualdade fica:
lim
n→∞ { } {
u n+1
un
= lim
|x n +1| n!
n →∞ (n+ 1)! |x |
n } { }
= lim
|x|
n→∞ ( n+1)
=0 .
Lembramos que no limite acima x é um número fixo pertencente ao intervalo −∞ < x <+ ∞ . Pelo
resultado do teste a série converge, pois o limite dos termos consecutivos é zero. Daí se conclui que
a série original também converge.
Mostraremos isto agora com mais detalhes. Seja k um número entre zero (limite da razão entre
termos consecutivos) e a unidade: 0 < k < 1 . Então deve existir um N para o qual a desigualdade
u n+1
< k se verifica para todo n ≥ N . Isto implica em:
un
u n+1 u u u u +1 u n
< k → n +1 < u n → n+1n < nn → nn+1 < n .
un k kk k k k
132/141
Este resultado mostra que a sequência {} un

k
n é decrescente para n ≥ N . Em particular,
un uN
quando n ≥ N , temos: ≤ . Escrevendo de outro modo:
kn kN
uN
u n ≤ c k n , onde c = .
kN
∞ ∞
Daí resulta que ∑ un é dominado pela série convergente ∑ kn . De fato, esta última série é
n= N n= N
convergente porque k pertence ao intervalo 0 < k < 1 . Isto demonstra que a série
2 3
x x x
1+ + + +⋯ é convergente e possui raio de convergência R infinito.99
1! 2! 3!
b. Usando a mesma argumentação acima, podemos escrever a desigualdade para k = 0 ,1 , 2 ,⋯ :
1+ x +2! x 2 +3! x 3 +⋯+ k ! x k +⋯ > x+ 3! x 3 +⋯+( 2 k +1)! x 2 k +1 +( 2 k +3)! x 2 k +3 +⋯ .
Fazendo u 2 k +1 = (2 k +1)! x 2 k+1 e aplicando o critério de d’Alembert para x>0 à série de

potências do lado direito da inequação, fica:
lim { } {
u 2 k +3
n→∞ u 2 k +1
= lim
(2 k +3)! x 2 k +3
n→∞ (2 k +1)! x
2 k +1 }
= lim {(2 k + 1)( 2 k + 3) x 2 } = ∞ para
n→∞
x>0 .
Portanto, para qualquer valor de x positivo a série diverge e o raio de convergência R é zero. Por
outro lado, quando x < 0 fazemos y = −x e escrevemos a série à direita da inequação com
termos positivos na forma:
−[⏟
y +3! y 3+⋯+(2 k +1)! y 2 k+1 +( 2 k +3)! y 2 k +3 +⋯] .
termos positivos
Evidentemente a série em y entre colchetes diverge e o raio de convergência R é zero. Por outra
parte, para x = 0 a série original converge para 1, isto é, converge para um único ponto do eixo
real. Daí, concluímos que a série original tem raio de convergência zero.
c. Do mesmo modo, para terceira série escrevemos:
x2 x3 x |x 2| |x 3| |x n|
1+ x + + +⋯+ +⋯ ≤ 1+|x|+ + +⋯+ +⋯ .
2 3 n 2 3 n
99 N. T. - Observe que nesta demonstração usamos o fato que a soma de um número finito de parcelas, designadas
pelos termos com n < N , com uma série convergente, designada pelos termos com n ≥ N , é uma série
convergente. Veja “Calculus – introducción con vectores y geometría analítica”, Tom M. Apostol, Volume I,
Capítulo 10, Seção 10.15, Teorema 10.13, página 489 [513].
133/141
|x n|
Fazendo un = e aplicando o critério de d’Alembert à série de potências do lado direito da
n
inequação, fica:
{ } { } { } { ( )}
u n+1 |x n +1| n n 1
lim = lim = lim |x| = lim |x| =|x|
n→∞ un n →∞ (n+ 1) |x |
n
n→∞ (n+1) n→∞ 1 .
1+
n
Do critério de d’Alembert temos que a série convergirá quando o limite acima for menor que a
unidade: |x| < 1 . Portanto, a condição de convergência se verifica quando −1 < x < +1 , e o
raio de convergência R é igual à unidade.
Pela definição dada anteriormente, em torno de uma pequena vizinhança próxima a qualquer ponto
arbitrário em que uma função analítica é definida, a função pode ser expandida por uma série de
potências que converge para a função. De maneira inversa, desta afirmação segue que a soma de
toda série de potências cujo raio de convergência é diferente de zero é uma função analítica no seu
intervalo de convergência.
Assim, vemos que as séries de potências estão organicamente conectadas com as funções analíticas.
Podemos mesmo dizer que nos seus intervalos de convergência as séries de potências representam a
maneira natural de se descrever funções analíticas, consequentemente elas são também o meio
natural de se aproximar as funções analíticas através de polinômios algébricos.100
1
Por exemplo, do fato que a função pode ser expandida em uma série de potências que é
1−x
convergente para o intervalo −1 < x < +1 :
1
= 1+ x + x 2+ x 3+⋯ .
1−x
Segue que a série de potência é uniformemente convergente em um intervalo arbitrário

−a < x ≤ + a , onde 0 < a < 1 . Isto implica na possibilidade de aproximação da função em
todo intervalo [-a, +a] através de somas parciais da série com qualquer grau de precisão pré-
definido.
1
Suponha que desejamos aproximar a função através de polinômios no intervalo fechado
1−x
[ 1 1
− ,+
2 2 ] com uma precisão igual a 0,01. Observe que para todo x neste intervalo temos a
desigualdade:
|1−x1 −1− x−⋯−x | =|x n n+1

+ x n+2 +⋯| ≤|x n +1|+|x n +2|+⋯≤
2
1
n+ 1
+
2
1
n +2
+⋯ =
1 101
2n
.
100 A aproximação de uma função analítica além dos limites do intervalo de convergência de uma série de potência
requer a utilização de outros métodos. Veja Capítulo 12.
101 N. T. - De fato calculando a soma S da série geométrica S = r n +1+r n +2 +r n+ 3+⋯ , temos:
134/141
Como 26 = 64 e 27 = 128 , o polinômio desejado que aproxima a função em todo intervalo
[ 1 1
− ,+
2 2 ]
com uma precisão igual a 0,01 terá a forma:
1
≈ 1+ x+ x 2+ x 3 + x 4 + x 5 + x 6 + x 7 .
1−x
Agora queremos ressaltar uma propriedade extremamente importante das séries de potências: As
séries de potências podem ser diferenciadas termo a termo em qualquer ponto do intervalo de
convergência. Esta propriedade tem larga aplicação na solução de vários problemas da matemática.
Por exemplo, suponha que estejamos interessados em encontrar a solução da equação diferencial
y ' = y , sujeita a condição auxiliar y (0) = 1 . Procuramos a solução na forma da série de
potência:
y = a 0+ a 1 x + a2 x 2 +⋯ .
Devido à condição auxiliar imposta, sabemos que a 0 = 1 . Assumindo que esta série converge,
podemos diferenciar termo a termo. Com isto obtemos o seguinte resultado:
y ' = a1 + 2 a 2 x +3 a 3 x 2 ⋯ .
Se substituirmos estas duas séries na equação diferencial y' = y e igualarmos os coeficientes

para cada potência de x, temos:
1 1 1
a1 = a0 = 1 , 2 a2 = a1 = 1 → a2 = , 3 a 3 = a2 = → a3 = ,….
2 2 2×3
1
Resumindo, o coeficiente a k será dado por: a k = para ( k = 1 , 2 , 3 ,⋯) .
k!
Finalmente, a solução desejada fica:
x x2 x3
y = 1+ + + +⋯ .
1! 2! 3!
Sabemos que esta série converge para todo valor de x e que sua função soma é igual y = ex .
Neste caso obtivemos como solução de uma equação diferencial uma série cuja soma é uma função
elementar bem conhecida. Entretanto, isto nem sempre acontece. Pode ocorrer que uma série
n +1
r
S = r n +1+r n +2 +r n+ 3+⋯ = r n +1+r (⏟
r n +1+r n +2 +r n+ 3) = r n +1 +r S → S = .
1−r
S
n+1
1 (1/ 2) 1
Logo, para r= , fica: S= = n .
2 1−1/ 2 2
135/141
convergente assim obtida tenha uma função soma que não é uma função elementar. Um exemplo é a
série:
[
y p ( x) = x p 1−
x2
+
x4
2(2 p+2) 2×4(2 p+2)( 2 p+ 4)
−⋯ . ]
Esta série é obtida como uma das soluções da equação diferencial de Bessel e possui importantes
aplicações práticas. Desta maneira as séries de potência podem servir para definir funções que não
estão limitadas às funções elementares.102
Leituras de referência.
– R. Courant, Differential and integral calculus, 2 vols., Interscience, New York, 1938.
– A. Dresden, Introduction to the calculus, Henry Holt, New York, 1940.
– F. Klein, Elementary mathematics from an advanced standpoint. Arithmetic- algebra-analysis,

Dover, New York, 1953.
– K. Knopp, Infinite sequences and series, Dover, New York, 1956.
102 N. T. - A chamada equação diferencial de Bessel é expressa na forma: x 2 y'' +x y' +( x2 −k 2 ) y 0 . Veja “Ordinary
Differential Equations - An Elementary Textbook for Students of Mathematics, Engineering, and the Sciences”,
Morris Tenenbaum e Harry Pollard, Lição 42A, página 609 [623].
136/141
ADENDOS
Adendo 2.1. Valores estacionários de funções multivariáveis
103
A ideia de pontos estacionários de uma função monovariável já foi discutida. Lembramos que a
df
função f (x ) possui um ponto estacionário em x = x 0 se o gradiente neste ponto for
dx
nulo. Uma função pode ter qualquer número de pontos estacionário, e a natureza destes pontos, isto
é, se eles são máximos, mínimos, ou ponto de inflexão, é determinada pelo valor da derivada de
segunda ordem neste ponto:
d2 f
(i) Será um mínimo se >0 ;
dx 2
d2 f
(ii) Será um máximo se 2
<0 ;
dx
d2 f df
(iii) Será um ponto estacionário de inflexão se =0 ,e muda de sinal à esquerda e à
dx 2 dx
direita do ponto.
103N. T. - Este adendo é uma tradução do livro: “Mathematical Methods for Physics and Engineering: A
Comprehensive Guide”, K. F. Riley, M. P. Hobson, S. J. Bence, Capítulo 5, Seção 5.8, página 162.
137/141
Consideraremos agora os pontos estacionários de funções multivariáveis. Veremos que a análise de

derivadas parciais é ideal para determinação da posição e natureza de tais pontos. É conveniente
abordarmos primeiramente o caso de funções com duas variáveis, mas, mesmo neste caso, podemos
constatar que a situação é mais complexa que para funções de uma variável como mostra a Figura.
5.2.
A Figura 5.2 mostra parte de um modelo tridimensional de uma função f (x , y ) . Na posição P e

B existe um pico e uma depressão respectivamente, ou, dizendo de maneira mais matemática, um
máximo e um mínimo local. Na posição S o gradiente da função em qualquer direção é zero, mas a
situação aqui é mais complicada, pois a seção paralela ao plano x = 0 mostrará um máximo,
enquanto a seção de um plano paralelo a y = 0 mostrará um mínimo. Um ponto como S é
conhecido como ponto de sela. A orientação da sela no plano xy é irrelevante, a direção mostrada na
Figura 5.2 visa apenas facilitar a discussão. Para qualquer ponto de sela o valor da função aumenta
para algumas direções que se afastam do ponto e decresce para outras.
Para funções de duas variáveis f (x , y ) fica claro que a condição necessária para ocorrência de
um ponto estacionário (máximo, mínimo ou ponto de sela) é:
∂f ∂f
= =0 (A1.1).
∂x ∂y
A anulação das derivadas parciais nas direções paralelas aos eixos de coordenadas é bastante para
nos assegurar que a derivada parcial em qualquer direção arbitrária (derivada direcional) é nula. A
derivada direcional pode ser considerada como a superposição de duas contribuições cada uma
delas ao longo de um dos eixos de coordenadas. Como estas contribuições são nulas, também será
nula a derivada parcial em qualquer direção arbitrária. Isto pode ser dito de maneira mais precisa
usando o diferencial total:
∂f ∂f
∂f = dx + dy .
∂x ∂y
Usando a equação (A1.1) vemos que embora as mudanças infinitesimais dx e dy possam ser
escolhidas independentemente, a mudança no valor do infinitesimal da função df é sempre zero em
um ponto estacionário.
Voltamos agora nossa atenção para determinação da natureza de um ponto estacionário de uma
função com duas variáveis, isto é, se o ponto é um máximo, um mínimo ou um ponto de sela da
função. Por analogia com o caso de funções com uma variável vemos que as derivadas parciais
∂2 f ∂2 f
e no ponto estacionário devem ser ambas positivas para termos um mínimo e
∂ x2 ∂ y2
ambas negativas para termos um máximo neste ponto. Entretanto, estas condições não são
suficientes, pois elas podem também serem verificadas em situações mais complicadas como os
pontos de sela. O que importa para um ponto estacionário seja um mínimo (ou máximo) é que a
segunda derivada parcial seja positiva (negativa) em todas as direções, e não apenas nas direções
dos eixos coordenados x e y.
Para estabelecermos o que constitui as condições suficientes, notamos inicialmente que f (x , y )
138/141
∂f ∂f
é uma função de duas variáveis e = = 0 . Com isto, a expansão da fórmula de Taylor
∂x ∂y
em um ponto estacionário fica:
f 'x ( x 0 , y 0)( x−x 0 )+ f 'y ( x 0 , y 0)( y− y 0)] +

f (x , y ) = f ( x 0 , y 0)+[⏟
=0
,
1
+ [ f ''xx ( x 0 , y 0)( x−x 0 )2 +2 f ''xy (x 0 , y 0 )(x−x 0 )( y− y 0 )+ f ''yy ( x 0 , y 0 )( y− y 0 )2 ]+ R3
2!
Escrevendo a notação das derivadas em uma forma mais compacta e simplificando, vem:
1
f (x , y )− f ( x 0 , y 0 ) = [ f xx ( x−x 0 )2 +2 f xy (x− x 0)( y− y 0 )+ f yy ( y− y 0 )2 ]+ R3 .
2!
Ou fazendo Δ x = x− x 0 e Δ y = y− y 0 , e omitindo o termo R3 , obtemos:
1
f (x , y )− f (x 0 , y 0 ) ≈ [ f xx (Δ x )2 +2 f xy Δ x Δ y+ f yy (Δ y)2 ] (A1.2).
2!
Rearranjando os termos entre colchetes como uma soma ponderada de dois quadrados,
encontramos:
[ ( ) ( )]
2
1 2f f xx Δ x Δ y f Δy ( f xy )2
f xx ( Δ x)2 + xy
f (x , y )− f ( x 0 , y 0 ) ≈ + f xx xy + (Δ y )2 f yy − ,
2 f xx f xx f xx
f (x , y )− f ( x 0 , y 0 ) ≈
1
f Δ x+
2 xx [ f xx(
f xy Δ y 2 2
+(Δ y ) f yy −
)
( f xy )2
f xx ( )] (A1.3).
Para que tenhamos um mínimo no ponto ( x 0 , y 0 ) é necessário que o lado direito de (A1.3) seja
positivo para todos os valores de Δ x e Δ y , como consequência devemos ter que: f xx > 0
e ( f yy −
f xx )
( f xy ) 2
> 0 . A primeira condição é análoga ao caso de uma variável, enquanto a
segunda pode ser escrita na forma: f yy f xx > ( f xy)2 . De modo semelhante, para um máximo é
necessário que o lado direito de (A1.3) seja negativo, neste caso as condições ficam: f xx < 0 e
f yy f xx > ( f xy)2 . A simetria da fórmula do lado direito de (A1.2) requer que tanto para o máximo
como para o mínimo f yy obedeça ao mesmo critério que f xx . Quando o lado direito de
(A1.3) for negativo (ou zero) para alguns valores de Δ x e Δ y , mas positivos para outros,
estamos diante de um ponto de sela. Nesta situação f yy f xx < ( f xy)2 . Em suma, todos os pontos
estacionários de uma função devem inicialmente satisfazer a equação, f x = f y = 0 e são
classificados do seguinte modo:
(i) Será um mínimo se ambos f xx e f yy forem positivos e f yy f xx > ( f xy)2 ;
(ii) Será um máximo se ambos f xx e f yy forem negativos e ; f yy f xx > ( f xy)2 ;
139/141
(iii) Será um ponto estacionário de sela se f xx e f yy tiverem sinais opostos ou

f yy f xx < ( f xy)2 .
Note, entretanto, que se f yy f xx = ( f xy) 2 , então f (x , y )− f (x 0 , y 0 ) pode ser escrito em uma

das quatro formas:
( )
1 1 2
1 .
f (x , y )− f (x 0 , y 0 ) ≈ ± Δ x| f xx|2 ±Δ y| f yy|2
2
Com efeito, a equação f yy f xx = ( f xy ) 2 implica que o produto f yy f xx é um número positivo,

portanto, f xx e f yy serão ambos positivos ou ambos negativos. Assim:
( f xy)2 = f yy f xx = | f yy|| f xx| → f xy =± √ f yy f xx = ±√| f yy|| f yy| ,
Por outro lado:
( f yy−
( f xy )2
f xx )( (f f )
)
= f yy− xx yy = ( f yy− f yy ) = 0 .
f xx
Então, da equação (A1.3), temos:
[ ( ) ( )] [ ( )]
2 2
1 f xy Δ y 2 ( f xy) 2 1 f Δy
f (x , y )− f (x 0 , y 0 ) ≈ f xx Δ x + +(Δ y ) f yy − = f xx Δ x+ xy ,
2 f xx ⏟ f xx 2 f xx
=0
[ ( ( ) )]
2
1 2 f xy f xy Δ y
f (x , y )− f (x 0 , y 0 ) ≈ f xx (Δ x) + 2 Δ x Δ y + ,
2 f xx f xx
f ( x , y )− f (x 0 , y 0 ) ≈
1
2 [ (
±| f xx| (Δ x)2 + 2 Δ x Δ y
f xy
(±| f xx|)
+(Δ y)2
| f yy|| f xx|
| f xx|2 ( ))] ,
Daí, vem:
f ( x , y )− f ( x 0 , y 0 ) ≈
1
2[( 2
± (Δ x ) | f xx|+ 2 Δ x Δ y
(
| f xx|
(±| f xx|)
2
)
f xy +( Δ y) | f xx|
| f yy|| f xx|
| f xx|
2
( ))] ,
[ ]
1
f (x , y )− f (x 0 , y 0 ) ≈ ± (Δ x )2| f xx|±2 Δ x Δ y (⏟
±√| f yy|| f yy|)+(Δ y )2| f yy|
2 ,
f xy
140/141
1
f (x , y )− f ( x 0 , y 0 ) ≈ ±
2 [( Δ x) 2| f xx|±2 Δ x Δ y ( √| f yy|| f yy|)+( Δ y )2| f yy|] ,
1 2
f (x , y )− f ( x 0 , y 0 ) ≈ ±
2
( Δ x| f xx|1 /2±Δ y| f yy|1/ 2) .
Δy
Para algumas escolhas da razão a expressão acima se anula, mostrando que para um
Δx
deslocamento do ponto estacionário nesta direção em particular f (x 0 +Δ x , y 0+ Δ y) não difere
de f (x 0 , y 0 ) até a segunda ordem de Δ x e Δ y . Quando isto acontece, é necessário
investigar a situação com mais detalhes. Em particular, se f xx , f yy e f xy forem zero,
então a expansão de Taylor deve ser tomada com termos de maior ordem. Como exemplo, estas
investigações mais criteriosas mostrariam que a função f (x , y ) = x 4+ y 4 possui um mínimo na
origem, enquanto a função g ( x , y) = x 4 + y 3 tem na origem um ponto de sela.
Outra maneira de se analisar a natureza dos pontos extremos de uma função multivariável é
utilizando as ferramentas da álgebra linear. Veja, por exemplo, “Calculus, Vol. II - Multi-Variable
Calculus and Linear Algebra, with Applications to Differential Equations and Probability”, Tom M.
Apostol, Capítulo 9, Seção 9.11, página 310 [335] e Seção 9.12, página 312 [337].
141/141

Análise Matemática

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Análise Matemática

Enviado por

Direitos autorais:

Formatos disponíveis

Capítulo 2 – Análise Matemática

Capítulo 2 – Análise Matemática

Por M. A. Lavrentyev e S. M. Nikolsky.1

O surgimento no final da idade média de novas condições de manufatura na Europa, isto é, o

Para avançar no desenvolvimento da navegação, e consequentemente na astronomia, e também no

O estado de repouso e imobilidade é desconhecido da natureza. Toda a natureza, das menores

Daí, tiramos que o incremento da distância percorrida pelo corpo é:

Consequentemente, gt é a verdadeira velocidade do corpo em queda livre no tempo t.

A ideia do método de limites é simples e se resume no seguinte. De maneira a se determinar o valor

Os matemáticos do século XVII gradualmente descobriram que um grande número de problemas

A história da criação e evolução da análise e o papel no seu desenvolvimento desempenhado pela

Se conhecermos a distância percorrida em qualquer instante de tempo por um ponto em movimento,

Assim, após a criação da análise matemática seguiu-se um período profícuo de desenvolvimento de

movimento mecânico de um corpo sólido, o movimento de líquidos e gases e em especial de suas

Onde g é a aceleração da gravidade.

V = x (a−2 x)2 (2).

Exemplo 4. Seja a equação quadrática:

Suas raízes são dadas pela fórmula:

Agora introduziremos outros exemplos do mesmo tipo. Seja a fórmula:

O conjunto de valores de x aparecendo nesta definição é chamado de domínio da função.

respectivamente, tomados com o sinal apropriado.9

9 O número x é a abcissa e y é a ordenada do ponto M.

Onde na equação acima α é o coeficiente de dilatação linear do material do corpo, e l 0 é o

Onde x é o deslocamento vertical do ponto A em relação a sua posição de equilíbrio, t é o tempo, e

• Q=0,5 t +5 para t variando no intervalo −10 ° C ≤ t < 0° C .

• Q=t+85 para t variando no intervalo 0 ° C < t ≤ +10 ° C .

Para registrar a variação da temperatura do ar durante um período de 24 horas, as estações

Incidentalmente, retornaremos a esta questão no Capítulo XII e provaremos o seguinte enunciado

particularmente desejáveis em comparação com outros gráficos.

Inicialmente tomamos a identidade:

Para diferentes valores k = 1 ,2 ,⋯ ,(n−1) , somamos separadamente os lados esquerdo e direito.

Para o lado direito, fica:

Agora expressamos S n na seguinte forma:

Na equação (7) a quantidade 1 1 que depende de n tem uma forma bastante

Inicialmente provamos que esta expressão é válida para k = 1 , isto é:

Então, substituindo o valor n=2 na fórmula, temos:

A quantidade α n é um exemplo de um infinitesimal no sentido em que esta palavra é usada na

( 2 n −9n6+13 n−6 )+( 6 n −126 n+6 ) = 2n −36 n +n

|α n| = |61n − 2n1 |= 21n − 6n1 < 2n1 < 21N = 2×500

Onde a é uma constante e α n um infinitesimal, então dizemos que a variável x n , quando n

O número a é chamado de limite de x n . Em particular, o limite de um infinitesimal é obviamente

Consideremos agora os seguintes exemplos de quantidades variáveis para (n = 1 , 2 ,…) :

É claro que x n , y n e z n são infinitesimais. O primeiro deles se aproxima de zero com

Para expressar o fato que uma quantidade x n é infinitamente grande escrevemos:

Duas quantidades x n e y n podem ser adicionadas, subtraídas, multiplicadas e dividida uma

Evidentemente é possível provar que se as variáveis x n e y n se aproximam de limites finitos

O caso em que o numerador e denominador simultaneamente se aproximam de zero é de especial

limite, pois a resposta a esta questão dependerá inteiramente da maneira como x n e y n se

Por outro lado, a quantidade

Na tabela acima os valores de x são tomados em radianos.

sen x < x < tan x .

Por exemplo, como a área do círculo unitário é R2 π = 12 π = π , segue que a área de um

Evidentemente, da Fig. A2 podemos escrever as desigualdades:

Os valores iniciais de u n são respectivamente: u 1 = 2 , u 2 = 2,25 , u 3 ≈ 2,37 ,

Como exercício provaremos a desigualdade u n < 3 . Pelo teorema binomial de Newton a

( ) = C ( n , p) = p!( n−n! p)!

Reescrevemos agora esta desigualdade na forma:

S n = 1+r + r 2 +⋯+ r n−1 = 1+ r ⏟

Com isto provamos a desigualdade u n < 3 .

É usual indicar o limite lim un pela letra e. Ele é igual a:

Uma análise mais detalhada mostrará que e não é um número racional.19

Considere também o seguinte exemplo geométrico. Na geometria elementar as primeiras figuras

reduzem ao seguinte. Inicialmente devemos dar um significado para o comprimento da