Escolar Documentos
Profissional Documentos
Cultura Documentos
Fun
co
es Convexas
Conte
udo
5.1
5.2
Fun
c
oes Convexas. Defini
c
oes e Propriedades B
asicas . . . . . . . . . . . .
5.1.1 Func
oes Convexas de uma Vari
avel . . . . . . . . . . . . . . . . . . . . . . .
5.1.2 Func
oes Convexas de V
arias Vari
aveis . . . . . . . . . . . . . . . . . . . . . .
Algumas Conseq
u
encias da Convexidade e da Convavidade . . . . . . . .
5.2.1 A Desigualdade de Jensen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.2 A Primeira Desigualdade de Young . . . . . . . . . . . . . . . . . . . . . . .
5.2.3 Medias Geometricas, Aritmeticas e Desigualdades Correlatas . . . . . . . . .
5.2.3.1 A Desigualdade de Minkowski . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
234
. 235
. 245
248
. 248
. 249
. 251
. 254
uncoes convexas ou c
oncavas desempenham um papel especial em areas como a Termodinamica, a Mecanica
Estatstica, a Teoria das Probabilidades, na Teoria das Equacoes Diferenciais, no Calculo Variacional e em
diversas outras. Pretendemos neste breve captulo apresentar suas definicoes e suas propriedades b
asicas para
futuro uso e referencia. Obtemos algumas desigualdades u
teis envolvendo funcoes convexas e c
oncavas, a mais
relevante sendo, talvez, a desigualdade de Jensen, apresentada na Proposicao 5.10, p
agina 248. Nestas Notas faremos uso
de propriedades de funcoes convexas ou c
oncavas em diversos momentos, por exemplo, no tratamento da funcao Gama
de Euler no Captulo 7, p
agina 271.
5.1
Funco
es Convexas. Definico
es e Propriedades B
asicas
Fun
co
es convexas e c
oncavas em espa
cos vetoriais reais
Seja V um espaco vetorial real e seja C V um conjunto convexo. Uma funcao f : C R e dita ser uma func
ao
convexa se para todos x, y C e todo [0, 1] valer a desigualdade
f x + (1 )y
f (x) + (1 )f (y) .
234
(5.1)
Captulo 5
Vers
ao de 4 de dezembro de 2013.
235/2078
f (x) + (1 )f (y) .
(5.2)
5.1.1
Fun
c
oes Convexas de uma Vari
avel
f (x) + (1 )f (y) .
(5.3)
f (x) + (1 )f (y) .
(5.4)
E. 5.1 Exerccio.
A nocao de convexidade (de concavidade) possui uma interpretacao geometrica muito simples para
funcoes de uma variavel real. Uma funcao f : I R e convexa (respectivamente, c
oncava) se e somente se dados dois pontos
quaisquer x < y de seu domnio o grafico de f no intervalo (x, y) ficar abaixo (respectivamente, acima) da linha reta que
conecta o par (x, f (x)) ao par (y, f (y)), tal como expresso nos graficos da Figura 5.1, pagina 235. Justifique essa afirmacao
com base nas definicoes.
f(y)
f(y)
f(x)
f(x)
E. 5.2 Exerccio. Seguindo a definicao, mostre que f (x) = |x| e f (x) = x2 sao funcoes convexas em R.
Vers
ao de 4 de dezembro de 2013.
Captulo 5
236/2078
E. 5.3 Exerccio (f
acil).
entao f g e convexa.
Se f : I R e convexa, e muito f
acil demonstrar, usando inducao finita, que para todos n N, todos x1 , . . . , xn I
e todos 1 , . . . , n [0, 1] tais que 1 + + n = 1 vale
f 1 x1 + + n xn
1 f (x1 ) + + n f (xn ) .
(5.5)
f 1 x1 + + n xn
1 f (x1 ) + + n f (xn ) .
(5.6)
Se f e c
oncava, temos
Provaremos apenas o caso convexo, pois o outro e analogo. Suponhamos a afirmacao valida para n 1, com n 3.
Podemos supor que haja ao menos dois s n
ao-nulos com 1 , . . . , n [0, 1] tais que 1 + + n = 1, pois se houver
apenas um, esse deve valer 1 e os demais 0 e n
ao haveria o que se demonstrar. Sem perda de generalidade, suponhamos
assim que n1 + n > 0. Ent
ao, como podemos escrever
1 x1 + + n xn = 1 x1 + + n2 xn2 + (n1 + n )
n1 xn1 + n xn
n1 + n
f 1 x1 + + n xn
= f
1 x1 + + n2 xn2 + (n1 + n )
n1 xn1 + n xn
n1 + n
n1 xn1 + n xn
n1 + n
n1 xn1 + n xn
n1 + n
n1
n
f (xn1 ) +
f (xn ) .
n1 + n
n1 + n
Vers
ao de 4 de dezembro de 2013.
Captulo 5
237/2078
Uma condi
c
ao equivalente `
a de convexidade
Para uma funcao f : I R, considere-se a funcao simetrica de duas variaveis Rf R : I 2 \ Id dada por
Rf (x, y) R(x, y) :=
f (x) f (y)
,
xy
x=y.
A proposicao que segue mostra que com a funcao R podemos apresentar uma definicao alternativa de convexidade (uma
outra caracterizacao distinta da nocao de funcao convexa sera encontrada na Proposicao 5.4, p
agina 242).
Proposi
c
ao 5.1 Uma func
ao f : I R e convexa se e somente se para todos x, y, z I, distintos, com y < z valer
R(x, y) R(x, z) ,
(5.7)
No Exerccio E. 5.4, p
agina 238, apresenta-se uma interpretacao geometrica da Proposicao 5.1.
Prova da Proposicao 5.1. Parte I: supondo f convexa provamos (5.7). Para provarmos (5.7) h
a tres casos a se considerar:
x < y < z, y < x < z e y < z < x.
Caso 1: x < y < z. Como y fica entre x e z, podemos escrever y = x + (1 )z adotando para tal =
(0, 1)). Da convexidade de f segue, ent
ao, que
f (y) f (x) + (1 )f (z) =
zy
zx
(notar que
zx
zy
(notar que
xz
xy
(notar que
yx
zy
f (x) +
f (z) .
xz
zx
,
yx
zx
ou seja, R(x, y) R(x, z).
Caso 2: y < x < z. Como x fica entre y e z, podemos escrever x = y + (1 )z adotando para tal =
(0, 1)). Da convexidade de f segue, ent
ao, que
f (x) f (y) + (1 )f (z) =
xy
zx
f (y) +
f (z) .
zy
zy
zx
xy
f (y) f (x) +
f (z) f (x)
zy
zy
,
yx
zx
ou seja, R(x, y) R(x, z).
Caso 3: y < z < x. Como z fica entre y e x, podemos escrever z = y + (1 )x adotando para tal =
(0, 1)). Da convexidade de f segue, ent
ao, que
f (z) f (y) + (1 )f (x) =
zy
xz
f (y) +
f (x) .
xy
xy
,
yx
zx
ou seja, novamente R(x, y) R(x, z). Com isso, (5.7) est
a estabelecida em todos os casos possveis em que y < z.
Vers
ao de 4 de dezembro de 2013.
Captulo 5
238/2078
Parte II: supondo (5.7) provamos que f e convexa. Por (5.7) sabemos que se y < z, ent
ao
f (x) f (y)
f (x) f (z)
xy
xz
para todo x, com x = y e x = z. Tomemos, em particular, x = y + (1 )z, com (0, 1). A u
ltima expressao fica
f y + (1 )z f (z)
f y + (1 )z f (y)
.
(1 )(z y)
(z y)
Cancelando-se o fator z y > 0 de ambos os lados, obtemos f y + (1 )z f (y) + (1 )f (z), provando a
convexidade de f .
E. 5.4 Exerccio. A Proposicao 5.1 possui a seguinte interpretacao geometrica. Sejam x, y, z I tres pontos do domnio
de definicao de uma funcao f tais que y < z. Considere-se o segmento de linha reta L1 conectando o ponto x, f (x) ao
ponto y, f (y) (ambos no grafico grafico de f ) e considere-se o segmento de linha reta L2 conectando o ponto x, f (x) ao
ponto z, f (z) (ambos tambem no grafico de f ). Entao, o que a Proposicao 5.1 afirma e que f e convexa se e somente se a
inclinacao de L1 for menor ou igual `a inclinacao de L2 . Vide o grafico no lado esquerdo da Figura 5.2, pagina 239. Justifique
essa afirmativa com base na Proposicao 5.1.
Algumas desigualdades de interesse
Antes de prosseguirmos apresentemos um resultado que sera futuramente evocado nestas Notas.
Lema 5.1 Seja f : I R convexa. Ent
ao, para quaisquer w, x, y, z I com w < x < y < z valem as desigualdades
f (x) f (y)
f (y) f (z)
f (w) f (x)
wx
xy
yz
(5.8)
f (w) f (x)
f (y) f (x)
f (z) f (x)
.
wx
yx
zx
(5.9)
Seja uma funcao g : I R. Para x I 0 definimos as derivadas laterais que denotamos por g+
(x) e g
(x) por
g+
(x) := lim
0
>0
g(x + ) g(x)
g
(x) := lim
0
>0
g(x) g(x )
,
g(x)
=
0
e
lim
g(x)
g(x
)
=
0.
E
a
vel
em
x se e somente se g+
(x) e g+
(x)
0
0
>0
>0
f
(x) f+
(x)
f (x ) f (x)
f
(x ) f+
(x )
x x
(5.10)
Captulo 5
Vers
ao de 4 de dezembro de 2013.
f(z)
239/2078
f(z)
L2
f(w)
f(w)
f(y)
L1
f(y)
f(x)
f(x)
` esquerda: gr
Figura 5.2: A
afico de uma funcao convexa. As inclinacoes dos segmentos de reta la indicados sao R(w, x),
` direita: grafico de uma funcao
R(x, y) e R(x, z). A figura deixa claro que R(w, x) R(x, y) R(x, z). A
convexa. As inclinacoes dos segmentos de reta la indicados sao R(w, x), R(x, y) e R(y, z). A figura deixa claro que
R(w, x) R(x, y) R(y, z).
0
sendo que f f+ em todo I . Outra afirmac
ao que disso pode ser extrada e que f e n
ao-diferenci
avel em uma colec
ao
no m
aximo enumer
avel de pontos.
Uma demonstracao mais geral da continuidade de funcoes convexas no interior do seu domnio de definicao sera
apresentada na Proposicao 5.9, p
agina 247.
Prova da Propossicao 5.2. Sejam w, x, y I 0 com w < x < y. Pela Proposicao 5.1, p
agina 237, temos R(x, w) R(x, y).
Fixemos w e x. Sabemos, tambem pela Proposicao 5.1, que a funcao y R(x, y) definida para y > x e decrescente
quando y diminui para x. Assim, o limite yx
lim R(x, y) existe, por ser decrescente e limitado inferiormente por R(x, w).
y>x
(x).
Sucede que, pela definicao de R, o limite yx
lim R(x, y) e precisamente a derivada lateral `a direita f+
y>x
Fixemos x e y. Sabemos, tambem pela Proposicao 5.1, que a funcao w R(x, w) definida para w > x e crescente
quando w cresce para x. Assim, o limite wx
lim R(x, w) existe, por ser crescente e limitado superiormente por R(x, y).
w<x
(x).
Sucede que, pela definicao de R, o limite wx
lim R(x, w) e precisamente a derivada lateral `a esquerda f
w<x
Isso estabeleceu a existencia dos limites laterais para todo ponto de I 0 e estabeleceu que f e contnua em todo ponto
de I 0 .
Sejam agora w, x, y, w , x , y seis pontos de I 0 tais que w < x < y < w < x < y . Fazendo uso da Proposicao
5.1, temos
R(w, x) R(x, y) R(y, w ) R(w , x ) R(x , y ) ,
ou seja,
f (x) f (w)
f (y ) f (x )
f (y) f (x)
f (w ) f (y)
f (x ) f (w )
xw
yx
w y
x w
y x
w<x
y>x
w x
w <x
f
(x) f+
(x)
que e (5.10).
y x
y >x
f (x ) f (x)
f
(x ) f+
(x ) ,
x x
(5.11)
Captulo 5
Vers
ao de 4 de dezembro de 2013.
240/2078
instrutivo chamar a atencao do leitor para o fato de a continuidade a que se refere a Proposicao 5.2 ser garantida
E
apenas no interior I 0 do domnio de definicao I. As funcoes f : [0, 1] R definidas por
f (x) :=
1,
x=0,
x2 , x (0, 1] ,
f (x) :=
1, x=0,
0 , x (0, 1] ,
f (y) (y x)f
(x) + f (x)
(5.12)
para todos x, y I.
Esse corol
ario tem a seguinte interpretacao geometrica: o grafico de uma funcao convexa est
a sempre acima das retas
tangentes ao mesmo (e isso e verdade mesmo em pontos em que a derivada e descontnua, em cujo caso temos duas retas
f (x ) (x x)f
(x) + f (x) ,
f (x )f (x)
,
x x
x x .
(5.13)
f (x )f (x)
x x
f
(x ) f+
(x ), que implicam que
f (x) (x x )f
(x ) + f (x ) ,
x > x .
f (x ) (x x)f
(x) + f (x) ,
x > x .
A Proposicao 5.2, p
agina 238, afirma que se uma funcao e convexa, ent
ao suas derivadas laterais sao crescentes. Sob
hip
oteses adequadas e possvel garantir a recproca dessa afirmacao. A proposicao que segue mostra a forma mais simples
dessa recproca.
Proposi
c
ao 5.3 Seja f : I R contnua em I e diferenci
avel em I 0 . Ent
ao, uma condic
ao necess
aria e suficiente para
= f (0 ) x x0
= (1 )(x1 x0 )f (0 ) ,
f (x1 ) f (x )
= f (1 ) x1 x
= (x1 x0 )f (1 ) .
Vers
ao de 4 de dezembro de 2013.
Captulo 5
241/2078
= (1 )(x1 x0 ) f (0 ) f (1 )
0,
pois f (0 ) f (1 ). Isso estabeleceu que f x0 + (1 )x1 f (x0 ) + (1 )f (x1 ) com (0, 1). Para {0, 1}
essa relacao e trivial e isso demonstra a convexidade de f .
O seguinte corol
ario e agora evidente e dispensa demonstracao.
Corol
ario 5.2 Seja f : I R contnua em I e duas vezes diferenci
avel em I 0 . Ent
ao, uma condic
ao necess
aria e
0
suficiente para que f seja convexa e que f (x) 0 para todo x I .
Esse corol
ario permite confortavelmente determinar se uma funcao f contnua e duas vezes diferenci
avel em seu
domnio de definicao I e convexa (o que se d
a caso f (x) 0 para todo x I 0 ) ou c
oncava (o que se d
a caso f (x) 0
para todo x I 0 ).
Exemplos 5.2 De posse do criterio estabelecido no Corolario 5.2, e facil demonstrar os seguintes fatos. A funcao ln x e
c
oncava em (0, ). As funcoes ex sao convexas em R. As funcoes xn com n N par sao convexas em R. As funcoes
xn com n N mpar sao convexas em [0, ) e c
oncavas em (, 0]. A funcao 1/(1 x2 ) e convexa no intervalo (1, 1)
e diverge para x 1. A funcao x + 1/x e convexa em (0, ) e c
oncava em (, 0). As funcoes cos x e sen x sao
c
oncavas nos intervalos em que sao positivas e convexas nos intervalos em que sao negativas.
E. 5.5 Exerccio (f
acil). Considere-se a funcao s : [0, 1] R dada por
s(x) :=
0,
x ln(x) ,
se x = 0 ,
se x (0, 1] .
Constate que s(x) 0 para todo x [0, 1], que s e uma funcao contnua, duas vezes diferenciavel em (0, 1] e c
oncava.
A Proposicao 5.3 tem ainda um outro corol
ario digno de nota:
Corol
ario 5.3 Seja I R um intervalo convexo do tipo que aqui consideramos e seja g : I R uma func
ao contnua,
e n
ao-decrescente. Ent
ao, a func
ao h : I R definida por
x
h(x) :=
g(u) du
a
A condi
c
ao do ponto m
edio
Vamos agora apresentar mais uma caracterizacao de funcoes convexas e contnuas, a qual possui diversas aplicacoes.
O que mostraremos e que uma funcao contnua f : I R e convexa se e somente se satisfizer a desigualdade f x+y
2
f (x)+f (y)
para
todos
x,
y
I.
Como
comentaremos,
foi
essa
caracteriza
c
a
o
que
deu
origem
hist
o
rica
`
a
teoria
das
fun
c
o
es
2
convexas.
Comecamos com o seguinte resultado, cuja demonstracao e assaz interessante:
Lema 5.2 Seja f : I R tal que
f
x+y
2
f (x) + f (y)
2
(5.15)
Captulo 5
Vers
ao de 4 de dezembro de 2013.
242/2078
x1 + + xn
n
f (x1 ) + + f (xn )
n
(5.16)
x1 + + x2n
2n
= f
x1 +x2
2
+ +
n
x2n1 +x2n
2
hip
otese
1
n
x1 + x2
2
+ + f
x2n1 + x2n
2
(5.15)
f (x1 ) + + f (x2n )
.
2n
x1 + + xn1
n1
1
nf
x1 ++xn1
n1
x1 + +xn1 .
x1 + + xn
n
f (x1 ) + + f (xn )
n
1
f (x1 ) + + f (xn1 )
+ f
n
n
hip
otese
Passando o termo
1
n1
x1 + + xn1
n1
x1 + + xn1
n1
f (x1 ) + + f (xn1 )
,
n1
provando que (5.16) vale para n 1. Isso prova os passos de inducao retrograda e completa a demonstracao.
O seguinte resultado apresenta uma caracterizacao muito u
til de funcoes convexas:
Proposi
c
ao 5.4 Seja f : I R, contnua. Ent
ao, f e convexa em I se e somente se satisfizer
f
x+y
2
f (x) + f (y)
2
(5.17)
para todos x, y I.
3 Essa estrat
egia foi inventada por Cauchy para demonstrar (5.33) e foi empregada no presente contexto por Jensen (para a refer
encia
original, vide nota de rodap
e4`
a p
agina 243). O texto original de Cauchy
e Cours danalyse de lEcole Royale Polytechnique, premier partie,
Analyse algebrique, Paris 1821.
Captulo 5
Vers
ao de 4 de dezembro de 2013.
243/2078
Prova. Se f for convexa em I, (5.17) e um caso particular da definicao de convexidade (tome-se = 1/2). Vamos provar
que se f e contnua em I e la satisfaz (5.17), ent
ao f e convexa em I.
claro que a1 x1 + a2 x2 / a1 + a2 e um
Sejam a1 , a2 N dois n
umeros naturais. Sejam tambem x1 , x2 I. E
elemento de I. Como
a1 x1 + a2 x2 = x1 + + x1 + x2 + + x2
a1 vezes
a2 vezes
a1 vezes
a1 x1 + a2 x2
a1 + a2
(5.18)
(5.19)
suficiente tomarmos r Q (0, 1). Como tal, r e da forma r = p/q com 0 < p < q, sendo p, q N. Se definirmos
E
1
2
a1 := p e a2 := q p, teremos a1 , a2 N e poderemos escrever r = a1a+a
e 1 r = a1a+a
. Com essas observacoes
2
2
torna-se evidente que a validade de (5.19) segue de (5.18).
Em (5.19), facamos agora o racional r convergir a [0, 1], arbitrario. A continuidade da f implica que teremos
f x1 + (1 )x2 f (x1 ) + (1 )f (x2 ). Como isso e valido para qualquer [0, 1] e quaisquer x1 , x2 I, a
convexidade de f fica estabelecida.
Nota hist
orica.
A noca
o de funca
o convexa foi introduzida por Jensen4 em 1906. A definica
o original de Jensen para funca
o convexa
era a relaca
o (5.17). Assumindo continuidade para f , Jensen ent
ao seguiu os passos que apresentamos na demonstraca
o da Proposica
o 5.4 e
demonstrou (5.3) assim como (5.5) (que ficou conhecida como desigualdade de Jensen).
Prova. Para todo [0, 1] tem-se, evidentemente, f (a) + (1 )f (b) max{f (a), f (b)}. Se x [a, b], ent
ao
x = 0 a + (1 0 )b para algum 0 [0, 1]. Logo, f (x0 ) = f 0 a + (1 0 )b 0 f (a) + (1 0 )f (b) max{f (a), f (b)}.
Claro e que essa desigualdade f (x0 ) max{f (a), f (b)} e uma igualdade se x0 for igual a a ou b.
O estudante deve notar que a recproca do Lema 5.3 n
ao e verdadeira: a funcao cosseno restrita ao intervalo I = [0, 2]
e contnua e satisfaz max{cos(x), x [a, b]} = max{cos(a), cos(b)} para todo compacto [a, b] [0, 2]. Mas a funcao
cosseno n
ao e convexa em [0, 2]. Em verdade, toda funcao f definida em um intervalo fechado [A, B], contnua, sem
nenhum maximo local exceto, eventualmente, os pontos A e B satisfaz max{f (x), x [a, b]} = max{f (a), f (b)} para
todo [a, b] [A, B].
A proposicao que segue, mencionada em [96], apresenta uma caracterizacao de convexidade para funcoes contnuas.
Ela mostra o que e necessario supor adicionalmente para que se obtenha uma recproca `a afirmacao do Lema 5.3.
4 Johan Ludwig William Valdemar Jensen (18591925). O trabalho original de Jensen
e: J. L. W. V. Jensen, Sur les fonctions convexes
et les in
egalit
es entre les valeurs moyennes, Acta Math. 30, 175193 (1906).
Captulo 5
Vers
ao de 4 de dezembro de 2013.
244/2078
Proposi
c
ao 5.5 Seja f : I R uma func
ao contnua. Ent
ao, f e convexa se e somente se para todo R o
m
aximo da func
ao (x) := f (x) + x em um intervalo compacto arbitr
ario [a, b] I for sempre assumido em um dos
extremos do mesmo. Em outras palavras, f e convexa se e somente se para todo R valer max{ (x), x [a, b]} =
max{ (a), (b)} em todo compacto [a, b] I.
trivial constatar que (x) := f (x) + x e convexa se e somente se f o for. Logo, pelo Lema 5.3, p
Prova. E
agina 243,
os maximos da funcao em um intervalo compacto arbitrario [a, b] I sao assumidos em um dos extremos do mesmo.
Vamos agora supor a recproca, ou seja, que os maximos da funcao em um intervalo compacto arbitrario [a, b] I
sao assumidos em um dos extremos do mesmo. Assim, temos f (x) + x M para todo x [a, b], onde M :=
max{f (a) + a, f (b) + b}. Escrevamos x [a, b] na forma x = a + (1 )b com [a, b]. Temos, portanto,
f a + (1 )b + a + (1 )b M , ou seja,
f a + (1 )b
M a + (1 )b .
x+h
1
2h
f (t) dt .
(5.20)
xh
A Proposica
o 5.6 est
a na raz da definica
o das chamadas func
oes sub-harm
onicas, tema do qual n
ao trataremos aqui.
1
2h
x+h
t
xh
dt. Logo,
(x)
x+h
1
2h
(t) dt ,
(5.21)
xh
com (x) := f (x) + x. Seja [a, b] I um intervalo compacto e seja um intervalo [x0 h, x0 + h] [a, b] com as
seguintes propriedades: 1o (y) (x0 ) para todo y [x0 h, x0 + h] e 2o existe y0 [x0 h, x0 + h] tal que
x0 +h
1
(y0 ) < (x0 ). Como e contnua, teremos 2h
(t) dt < (x0 ). Isso contraria (5.21) e, portanto, devemos
x0 h
ter (y) (x0 ) para todo y [x0 h, x0 + h]. Como isso vale para todo intervalo [x0 h, x0 + h] [a, b], segue
que max{ (x), x [a, b]} = max{ (a), (b)}. Pela Proposicao 5.5, p
agina 244, isso implica que f e convexa.
A desigualdade de Hermite-Hadamard
Proposi
c
ao 5.7 Seja f : I R uma func
ao convexa. Ent
ao, f satisfaz
f
a+b
2
1
ba
f (t) dt
a
f (a) + f (b)
2
(5.22)
Vers
ao de 4 de dezembro de 2013.
Captulo 5
245/2078
2
b
1
ca de variaveis t = (b a) + a = b + (1 )a para [0, 1], temos, pela convexidade
ba a f (t) dt. Com a mudan
de f ,
b
1
1
convex.
f (a) + f (b)
1
f (b) + f (a)(1 ) d =
,
f (t) dt =
f b + (1 )a d
ba a
2
0
0
completando a prova.
5.1.2
Fun
c
oes Convexas de V
arias Vari
aveis
Fun
co
es convexas em Rn
No que segue, consideraremos conjuntos convexos C Rn que sejam tambem de dimensao n, isto e, que sejam tais
que o menor subespaco que contem C seja Rn .
Seja C Rn um conjunto convexo. Uma funcao f : C R e dita ser uma func
ao convexa se para todos x, y C e
todo [0, 1] valer a desigualdade
f x + (1 )y
f (x) + (1 )f (y) .
(5.23)
f (x) + (1 )f (y) .
(5.24)
Hermite (18221901).
Salomon Hadamard (18651963).
g x + (1 )x , t + (1 )t
g x, t) + (1 )g x , t
Vers
ao de 4 de dezembro de 2013.
Captulo 5
246/2078
para todos (x, t), (x , t ) D e [0, 1]. Sugestao: Use o fato que
1
x + (1 )x
t + (1 )t
t
t + (1 )t
1
x+
t
(1 )t
t + (1 )t
1
x ,
t
note que a soma dos termos entre parenteses do lado direito vale 1 e use a convexidade de C e de f .
E. 5.7 Exerccio. Mostre que toda semi-norma em um espaco vetorial real e uma funcao convexa sobre o mesmo.
No caso em que f : C R e duas vezes diferenci
avel, a proposicao que segue fornece condicoes necessarias e suficientes
a convexidade.
`
Proposi
c
ao 5.8 Seja C Rn um conjunto convexo e seja f : C R uma func
ao contnua e duas vezes diferenci
avel
no interior C 0 de C. Ent
ao, f e convexa se e somente se
n
i, j=1
2f
x ai aj 0
xi xj
(5.25)
Nota.
A condica
o (5.25)
e satisfeita se e somente se todos os auto-valores da matriz Hessiana7 Hij (x) :=
forem n
ao-negativos.
2f
xi xj
x , i, j {1, . . . , n},
t [0, 1] .
gx, y t1 + (1 )t2
f x + t1 (y x) + (1 ) x + t2 (y x)
gx, y (t1 ) =
f x + t1 (y x) ,
gx, y (t2 ) =
f x + t2 (y x) ,
para todo [0, 1]. Dessas tres relacoes prova-se facilmente que f e convexa em C se e somente todas as funcoes gx, y ,
x, y C 0 , forem funcoes convexas de uma variavel.
A funcao g e duas vezes diferenci
avel, pois f o e. Assim, pelo Corolario 5.2, p
agina 241, f e convexa se e somente se
gx,
y (t)
=
i, j=1
Logo, teremos
gx,
y
2f
x + t(y x) (yi xi )(yj xj ) .
xi xj
2f
x ai aj 0
xi xj
Vers
ao de 4 de dezembro de 2013.
Captulo 5
247/2078
Proposi
c
ao 5.9 Seja V um espaco vetorial real dotado de uma norma , seja C V convexo, com interior C 0
n
ao-vazio, e seja f : C R uma func
ao convexa em C. Se f for limitada superiormente em C, ou seja, se possuir um
majorante superior finito S := sup{f (x), x C} < , ent
ao f e contnua em C 0 , o interior de C.
Se f : C R c
oncava em C e limitada inferiormente em C, ou seja, tal que I := inf{f (x), x C} > , ent
ao, f
e contnua em C 0 , o interior de C.
Prova. Provaremos apenas a afirmacao para funcoes convexas, pois a afirmacao para funcoes c
oncavas decorre imediatamente da mesma (trocando-se f por f ).
Vamos supor que existe z C 0 tal que f n
ao seja contnua em z. Ent
ao, existe > 0 tal que para cada > 0 e
possvel encontrar um x V tal que z x < mas com |f (z) f (x)| > (contrariamente, f seria contnua em z).
Como z C 0 e C 0 e um conjunto aberto, existe r > 0 tal que a bola aberta de raio r centrada em z, B(r, z) := y
V y z < r , est
a inteiramente contida em C 0 : B(r, z) C 0 .
Vamos escolher (0, 1] tal que
1
S f (z)
>
.
(5.26)
Que uma tal escolha sempre e possvel segue do fato que a imagem da funcao (0, 1] 1 1 e [0, ), como se ve
facilmente. Segue de (5.26) que
> S f (z) + ,
(5.27)
1
1
x
z.
1
1
1
1
f (x)
f (z) > (f (z) + )
f (z) = f (z) +
(5.27)
> S+ .
Assim, obtivemos, f (y) > S + > S, o que contraria a definicao de S, mostrando que a situacao a e impossvel.
Situac
ao b: f (x) < f (z) . Seja y V dado por
y :=
1
1
z
x.
Teremos y z = 1
xz < (1) = (1)r < r, de modo que y B(r, z) C 0 . Porem, temos z = y +(1)x
1
1
1
1
1
f (z)
f (x) > f (z)
(f (z) ) = f (z) +
(5.26)
> S.
Assim, obtivemos, f (y) > S, o que novamente contraria a definicao de S, mostrando que a situacao b tambem e impossvel.
A resolucao dessas contradicoes e que um tal ponto z C 0 onde f e descontnua n
ao pode existir.
Coment
arios `
a Proposi
c
ao 5.9
Se V for um espaco vetorial real normado e f : V R for um funcional linear em V, ent
ao f e uma funcao convexa
(e c
oncava) no conjunto convexo V. Se V n
ao for um espaco de dimensao finita, linearidade n
ao necessariamente faz de
f uma funcao contnua. H
a exemplos bem conhecidos de funcionais lineares descontnuos de um espaco normado em
Vers
ao de 4 de dezembro de 2013.
Captulo 5
248/2078
5.2
Algumas Conseq
u
encias da Convexidade e da Convavidade
5.2.1
A Desigualdade de Jensen
Vamos agora apresentar uma importante generalizacao da desigualdade (5.5). Por simplicidade, consideraremos aqui
funcoes convexas f : R R definidas em todo R, mas e facil perceber que e possvel tambem considerar funcoes
convexas definidas em intervalos menores, desde que as devidas restricoes sejam feitas `as demais funcoes envolvidas.
Proposi
c
ao 5.10 (Desigualdade de Jensen) Seja f : R R convexa. Seja p : R [0, ) uma func
ao positiva e
integr
avel, ou seja, tal que P := p(t) dt < . Seja g : R R uma func
ao integr
avel na medida p(t)dt, ou seja, tal
Pf
g(t) p(t) dt
f P g(t) p(t) dt .
(5.28)
Essa desigualdade e denominada desigualdade de Jensen. Um caso particular importante e aquele no qual a func
ao p
representa uma distribuic
ao de probabilidades e temos P = 1. Nele, a desigualdade de Jensen assume a forma
8 Todo
g(t) p(t) dt
f g(t) p(t) dt .
o Captulo 38, p
agina 2020,
e dedicado a operadores lineares n
ao-contnuos.
(5.29)
Captulo 5
Vers
ao de 4 de dezembro de 2013.
249/2078
O estudante deve perceber que (5.5) e um caso particular de (5.29). O estudante mais avancado deve tambem perceber
ao longo da demonstracao que (5.28) permacece valida se p(t)dt for substituida por qualquer medida positiva e finita d
em R (com P := R d) e que (5.29) permanece valida se p(t)dt for substituida por qualquer medida de probabilidade
d em R.
Prova da Proposicao 5.10. A desigualdade (5.12), p
agina 240, afirma que, para todo y R podemos escrever
f (y) x y + x ,
f P g(t)
x P g(t) + x .
Logo, como p e n
ao-negativa, temos tambem
f P g(t) p(t) x P g(t)p(t) + x p(t) .
Integrando-se, obtemos
f P g(t) p(t) dt x P
g(t) p(t) dt + x P = f
(x)P
f P g(t) p(t) dt P f
g(t) p(t) dt
5.2.2
xy
F (s) ds +
0
F 1 (t) dt .
(5.30)
A desigualdade (5.30) tem uma interpretacao geometrica muito simples, que descrevemos na Figura 5.3, p
agina 251.
Para generalizacoes da desigualdade (5.30), vide e.g. [96].
Prova da Proposicao 5.11. Como F : [0, ) [0, ) uma funcao contnua, n
ao-negativa, crescente, bijetora e satisfaz
F 1 (0) = 0, sua inversa F 1 : [0, ) [0, ) e igualmenete contnua, n
ao-negativa, crescente, bijetora e satisfaz
F 1 (0) = 0.
Defina-se, para x [0, ) e y [0, ) as funcoes
x
A(x) :=
0
9 William
F (s) ds
B(y) :=
0
F 1 (t) dt .
Captulo 5
Vers
ao de 4 de dezembro de 2013.
250/2078
C(y) :=
y F (s) ds .
0
C (y) = y F F
F 1 (y)
(y) +
0
F 1 (y)
y F (s) ds =
y
ds = F 1 (y) = B (y) ,
e como B(0) = 0 e C(0) = 0 (pois F 1 (0) = 0), segue que B(y) = C(y) para todo y [0, ).
Agora, a identidade B(y) = C(y) permite escrever
F 1 (F (x))
B F (x)
= C F (x)
F (x) F (s) ds =
(5.31)
y F (x) x + B F (x)
(5.31)
x, y 0 .
Demonstre alternativamente sua validade estudando os mnimos da funcao ex + (1 + y) ln(1 + y) (1 + x)(1 + y) pelo metodo
convencional.
Na desigualdade (5.30), o lado esquerdo e uma funcao simetrica de x e y, mas o lado direito n
ao e. Isso pode ser
remediado simetrizando-se o lado direito no intervalo comum a F e F 1 , a saber, [0, ) , onde = min{, }. Obtem-se,
ent
ao, nesse intervalo
xy
10 Aqui,
1
2
F (s) ds +
0
F (s) ds +
0
1
2
F 1 (t) dt +
h(y)
h(y)
J(y, s) ds = J y, h(y) +
0
v
alida para h(y) contnua e J(y, s) contnua e diferenci
avel, com
J(y,
y
s) contnua.
J
(y, s) ds ,
y
F 1 (t) dt
Vers
ao de 4 de dezembro de 2013.
Captulo 5
251/2078
F
1
x
Figura 5.3: O grafico de uma funcao contnua, bijetora, positiva e crescente F , com F (0) = 0. A area em cinza claro vale
x
y
F (s) ds. A area em cinza escuro vale 0 F 1 (t) dt. O ret
angulo de lados x e y e representado em linhas tracejadas e
0
x
y
sua
area xy e claramente menor ou igual `
a soma das duas areas acinzentadas, que vale 0 F (s) ds + 0 F 1 (t) dt. Essa
e a interpretacao geometrica da Primeira Desigualdade de Young (5.30).
5.2.3
M
edias Geom
etricas, Aritm
eticas e Desigualdades Correlatas
A desigualdade entre m
edia geom
etrica e m
edia aritm
etica
A concavidade da funcao ln x tem algumas conseq
uencias relevantes. Para n N, sejam x1 , . . . , xn n
umeros positivos
e sejam 1 , . . . , n [0, 1] tais que 1 + + n = 1. Como ln x e c
oncava, (5.6) garante-nos que
ln (1 x1 + + n xn ) 1 ln(x1 ) + + n ln(xn ) = ln x1 1 xnn
(5.32)
Note-se que se 1 , . . . , n (0, 1) essa desigualdade e valida mesmo que alguns xk s sejam nulos.
A expressao 1 x1 + + n xn e denominada media aritmetica ponderada do conjunto de n
umeros n
ao-negativos
{x1 , . . . , xn } (ponderada pelos fatores 1 , . . . , n ) e a expressao x1 1 xnn e denominada media geometrica ponderada
do conjunto {x1 , . . . , xn }. A desigualdade (5.32) afirma, portanto, que a media geometrica ponderada de um conjunto
finito de n
umeros n
ao-negativos e sempre menor que a sua media aritmetica ponderada. Em [96] o leitor poder
a encontrar
diversas outras demonstracoes da desigualdade (5.32).
Sejam x1 , . . . , xn n
umeros n
ao-negativos. Definimos suas medias geometrica e aritmetica (simples) por x1 xn
n
, respectivamente. Elas correspondem ao caso em que 1 = = n = n1 . Temos de (5.32), portanto,
e x1 ++x
n
x1 xn
1
n
x1 + + xn
,
n
1
n
(5.33)
Vers
ao de 4 de dezembro de 2013.
Captulo 5
252/2078
da mesma colecao. Esse resultado e originalmente atribuido a Cauchy11 e pode ser provado de diversas formas. Cauchy
obteve-o, n
ao usando a concavidade do logaritmo, como fizemos, mas por inducao (para uma tal prova, vide e.g. [96]).
A desigualdade de Young
Na demonstracao da chamada desigualdade de H
older em espacos Lp (assunto discutido nas Secoes 24.5.1 e 30.4.1,
p
aginas 1196 e 1384, respectivamente) faz-se uso de uma desigualdade elementar conhecida como desigualdade de Young12 .
Como a desigualdade de Young tem interesse por si so e algumas outras aplicacoes, vamos apresentar sua demonstracao.
Como ja discutimos, a funcao logaritmo e c
oncava como funcao do intervalo (0, ) sobre R. Assim, para todos
a, b (0, ) e todo [0, 1] tem-se ln a + (1 )b ln a + (1 ) ln b = ln a b1 . Tomando-se a exponencial
de ambos os lados, obtemos
a b1 a + (1 )b .
(5.34)
Note-se que se (0, 1), ent
ao (5.34) e tambem valida caso a = 0 e/ou b = 0. A desigualdade (5.34) e por vezes
denominada desigualdade de Young. Como se ve, trata-se meramente de um caso particular de (5.32) (para n = 2).
Por vezes a desigualdade de Young e apresentada de forma ligeiramente diferente. Sejam p e q ambos tais que
1 1
1 < p < e 1 < q < , mas tais que + = 1. Ent
ao, por (5.34), temos para a, b [0, ).
p q
a1/p b1/q
a b
+ ,
p q
(5.35)
sendo que a igualdade so e valida caso a = b (isso segue do fato de o logaritmo ser estritamente c
oncavo. Vide, porem,
nota logo abaixo).
A desigualdade dita de Young (5.35) e bastante elementar, mas ela foi originalmente provada a partir do resultado
mais geral e n
ao-trivial expresso na primeira desigualdade de Young, a desigualdade (5.30) da Proposicao 5.11, p
agina
249.
E. 5.9 Exerccio. Tomando F (s) = sp1 com 1 < p < , para s 0, obtenha da primeira desigualdade de Young (5.30)
a desigualdade (5.35).
H
a ainda uma terceira desigualdade para produtos de convolucao tambem denominada desigualdade de Young e
que e vagamente relacionada `
as desigualdades (5.35) e (5.30). Vide, e.g., [158].
Nota.
e contnua para x [0, ) e que, para x > 0, tem-se f (x) = 1 x1 e f (x) = (1 )x2 > 0. Assim, f (x) tem um u
nico mnimo
local em x = 1, onde f (1) = 0 (verifique). Fora isso, f (0) = q1 > 0 e lim f (x) = +. Desses fatos conclumos facilmente que f (x) 0 para
x
todo x 0, a igualdade s
o se dando caso x = 1. Isso fecha o que queramos provar.
E. 5.10 Exerccio. Mostre que no caso 0 < p < 1 a desigualdade (5.35) se reverte ( deve ser substitudo por ). Nesse
caso q < 0.
Desigualdades envolvendo somas de pot
encias
As desigualdades apresentadas na seguinte proposicao sao muito u
teis, especialmente para o prop
osito de demonstrar
que os conjuntos de seq
uencias p sao espacos vetoriais (vide Secao 24.5.1, p
agina 1196), o mesmo se dando com os
conjuntos de funcoes Lp (M, d) dos quais trataremos no Captulo 30, p
agina 1347.
Proposi
c
ao 5.12 Sejam a 0 e b 0 dois n
umeros reais n
ao-negativos.
11 Augustin
12 William
Captulo 5
Vers
ao de 4 de dezembro de 2013.
253/2078
(5.36)
(5.37)
2p1 ap + bp
II. Para todo p tal que p 1 tem-se
(a + b)
ap + b p .
(5.38)
b
a
1+
b
a
p
Para provar isso, tudo o que desejamos e provar que f (x) := (1 + x) 1 xp satisfaz f (x) 0 para todo x 0. De
fato, tem-se,
1
.
(5.39)
f (x) = pxp1 1
1p
1 + x1
ao-crescente. Como
Como 1 + x1 1 e 1 p > 0, segue que f (x) 0 para todo x 0. Com isso, provamos que f e n
f (0) = 0, segue que f (x) 0 para todo x 0. Isso provou (5.38).
Vamos agora provar que
2p1 ap + bp
(a + b)p .
(5.40)
a +b
2
a+b p
,
2
(5.41)
p
b
a
1+
b
a
Para provar isso, tudo o que desejamos e provar que f (x) := (1 + x)p 1 xp satisfaz f (x) 0 para todo x 0. Agora,
por (5.39),
p1
1
.
f (x) = pxp1 1 1 +
x
Como 1 + x1 1 e p 1 > 0, segue que f (x) 0 para todo x 0. Com isso provamos que f e crescente. Como f (0) = 0,
segue que f (x) 0 para todo x 0, provando o que queramos.
Vamos agora provar que
(a + b)p 2p1 (ap + bp ) .
p
Para x 0 e p > 1 a funcao (x) = x e convexa. Portanto, para qualquer com 0 1, tem-se
(a + (1 )b) (a) + (1 )(b) .
Para = 1/2, isso fica
Um corol
ario u
til e:
a+b p
2
a +b
2
(5.42)
Captulo 5
Vers
ao de 4 de dezembro de 2013.
254/2078
Corol
ario 5.5 Para 0 < q < 2 e para todos z, w C vale
|z + w|q + |z w|q 2 |z|q + |w|q .
(5.43)
(5.44)
O Corolario 5.5 pode ser usado para obter-se certas generalizacoes da identidade do paralelogramo (na forma de
desigualdades) em espacos p , com p 1. Vide relacoes (24.49) e (24.50), p
agina 1205.
Prova do Corolario 5.5. Para z, w C e com 0 < p < 1, tomemos a = |z + w|2 e b = |z w|2 na primeira desigualdade
em (5.36). Obtemos,
|z + w|2p + |z w|2p
p
|z + w|2 + |z w|2 .
21p
Agora, |z + w|2 + |z w|2 = 2|z|2 + 2|w|2 . Assim,
|z + w|2p + |z w|2p
2p |z|2 + |w|2
21p
Agora, tomemos a = |z|2 e b = |w|2 na segunda desigualdade em (5.36). Teremos |z|2 + |w|2
estabelecemos que
|z + w|2p + |z w|2p
2p |z|2p + |w|2p
21p
que e (5.43) com q = 2p.
Provemos agora (5.44). Para z, w C e com p 1, tomemos a = |z + w|2 e b = |z w|2 na primeira desigualdade
em (5.37). Obtemos,
p
p
|z + w|2p + |z w|2p |z + w|2 + |z w|2
= 2p |z|2 + |w|2 .
Agora, adotemos a = |z|2 e b = |w|2 na segunda desigualdade em (5.37). Obtemos, |z|2 + |w|2
Assim, temos
|z + w|2p + |z w|2p 22p1 |z|2p + |w|2p .
5.2.3.1
A Desigualdade de Minkowski
Uma importante desigualdade empregada do estudo de espacos metricos e na Analise Funcional e a chamada desigualdade
de Minkowski13 . Apresentaremos adiante demonstracoes dessa degualdade am algumas instancias, fazendo uso central
da convexidade da funcao f (x) = xp na regi
ao x > 0, sendo p 1. Outras demonstracoes dessa desigualdade podem ser
encontradas na Secao 24.5.1, p
agina 1196, e na Secao 30.4.1, p
agina 1384. A estrategia que seguimos na presente secao
provem de [206].
Proposi
c
ao 5.13 (Desigualdade de Minkowski para seq
u
encias finitas) Seja p 1. Para n N, sejam, ak C
e bk C, k = 1, . . . , n. Ent
ao, vale a desigualdade
1/p
ak + b k
k=1
1/p
ak
k=1
Minkowski (18641909).
1/p
bk
k=1
(5.45)
Captulo 5
Vers
ao de 4 de dezembro de 2013.
255/2078
A :=
ak
= 0
B :=
ak
k=1
ak + b k
Agora, como
convexa dos
A
A+B
B
A+B
n
umeros |aAk |
ak + b k
ak + b k
= 0.
ak
bk
B
A
+
A+B A
A+B B
= (A + B)
A |ak |
A+B A
k=1
1/p
B |bk |
A+B B
(5.46)
ak
bk
A
B
+
A+B A
A+B B
ak
A
A
A+B
bk
B
B
A+B
(A + B)p1 A1p ak
+ B 1p bk
Somando-se em k, teremos
n
ak + b k
k=1
1p n
(A + B)p1
ak
A
k=1
n
k=1
p
p1
A+B
bk
= (A + B)
+B 1p
k=1
= Ap
= (A + B)p .
= Bp
p 1/p
ak + b k
Um corol
ario imediato e
Corol
ario 5.6 (Desigualdade de Minkowski para seq
u
encias p-som
aveis) Seja p 1 e sejam {ak , k N} e
{bk , k N}, duas seq
uencias de n
umeros complexos tais que
ak
<
bk
k=1
< .
(5.47)
k=1
Ent
ao, vale a desigualdade
1/p
ak + b k
1/p
k=1
ak
1/p
k=1
bk
(5.48)
k=1
f (x) + g(x)
dx
1/p
f (x)
a
dx
1/p
g(x)
a
dx
(5.49)
Captulo 5
Vers
ao de 4 de dezembro de 2013.
256/2078
Os resultados de acima podem ser muitssimo generalizados (para funcoes p-integraveis em espacos mensuraveis).
Vide Secao 30.4.1, p
agina 1384.
O caso 0 < p < 1
E. 5.12 Exerccio. Usando o fato que f (x) = xp e uma funcao c
oncava na regiao x > 0 quando 0 < p < 1, mostre que
para tais valores de p vale
1/p
ak + b k
k=1
1/p
ak
k=1
1/p
bk
(5.50)
k=1
onde os ak s e bk s sao n
umeros reais n
ao-negativos. Note a reversao da desigualdade em (5.50) comparada a (5.45).