Você está na página 1de 18

La Gaceta de la RSME, Vol. 16 (2013), Nm. 4, Pgs.

709726

709

El diablo de los nmeros


Seccin a cargo de
Javier Cilleruelo Mateo

La resolucin de la conjetura ternaria de Goldbach es uno de esos


logros matemticos que hacen historia. Harald Helfgott, peruano afincado
en Pars, ha tenido la amabilidad de contarnos las estrategias que le han
llevado a la resolucin de la conjetura. Espero que los lectores disfruten,
como yo lo he hecho, de su estilo directo, transparente y con medidas dosis
de humor.
No se me ocurre mejor artculo para despedirme de los lectores como
responsable de esta seccin, que he intentado llevar con entusiasmo y me
ha dado muchas satisfacciones cientficas y personales.

La conjetura dbil de Goldbach


por

Harald Helfgott

1.

Introduccin

Leonhard Euler, uno de los matemticos ms importantes del siglo XVIII y de


todos los tiempos, y su amigo, el amateur y polmata Christian Goldbach, tuvieron
una regular y abundante correspondencia. En su clebre carta del 7 de junio de 1742,
Goldbach en verdad dio un enunciado de apariencia un tanto confusa, o por lo menos
poco familiar (todo nmero puede ser descompuesto en una suma de un nmero
arbitrario de primos). Euler rpidamente la redujo a la conjetura siguiente, que,
segn dijo, Goldbach ya le haba expuesto anteriormente:
Todo entero positivo puede expresarse como suma de, como mucho, tres
nmeros primos.
Nosotros diramos ahora todo entero positivo mayor que 5, ya que en la actualidad no se considera al 1 nmero primo. Por otro lado, la conjetura se ha dividido,
de manera natural, en dos:
La conjetura dbil (o ternaria) de Goldbach, que dice que todo entero impar
mayor que 5 puede escribirse como suma de tres nmeros primos, y

710

El diablo de los nmeros

Figura 1: Euler y la carta de Goldbach.

La conjetura fuerte (o binaria) de Goldbach, que afirma que todo entero par
mayor que 2 puede expresarse como suma de dos nmeros primos.
Como sus nombres sugieren, la conjetura fuerte implica a la dbil (fcilmente:
reste 3 a su nmero impar y despus exprese n 3 como suma de dos primos).
Se puede consultar [8, Ch. XVIII] para conocer la historia temprana de la conjetura. En resumen, parece que Waring volvi a proponer por su cuenta la conjetura
dbil a finales del siglo XVIII, y que en el siglo XIX se hizo algo de trabajo computacional (comprobando la conjetura para los nmeros enteros hasta 2 106 a mano),
pero poco progreso de verdad.
La conjetura fuerte sigue fuera de nuestro alcance. Hace unos meses mi preprint
[12] apareci el 13 de mayo de 2013 prob la conjetura dbil de Goldbach.
Los cimientos de la prueba descansan en los avances logrados a principios del siglo XX por Hardy, Littlewood y Vinogradov. En 1937, Vinogradov prob [29] que la
conjetura es cierta para todos los nmeros impares mayores que alguna constante C.
Hardy y Littlewood [10] ya lo haban demostrado unos aos antes, pero bajo la suposicin de que la hiptesis generalizada de Riemann fuera cierta; hablaremos de esto
ms adelante. Desde entonces, la constante C ha sido especificada y gradualmente
mejorada, pero el mejor valor (esto es, el ms pequeo) de C del que se dispona era
C = e3100 > 101346 (Liu-Wang [17]), lo cual era, de lejos, demasiado grande. Incluso
C = 10100 sera demasiado: como 10100 es ms grande que el producto del nmero
estimado de partculas subatmicas del universo por el nmero de segundos desde
el Big Bang, no habra ninguna esperanza de comprobar cada caso hasta 10100 por
ordenador (aun asumiendo que uno fuera un dictador aliengena usando el universo
entero como una computadora muy altamente paralela).
Yo reduje C a 1029 (y podra bajarlo ms si fuera necesario). D. Platt y yo
habamos comprobado la conjetura para todos los nmeros impares hasta 8.8 1030

711

La Gaceta ? Secciones

por ordenador (y podramos haber llegado ms lejos), as que este fue el final de la
historia.
***
Es justo que repasemos algunos de los principales avances entre la poca de
Vinogradov y la nuestra. En 1933, Schnirelmann prob [24] que todo entero n > 1
puede escribirse como la suma de, a lo ms, K primos, donde K era una constante no
especificada. Se trata de uno de los trabajos precursores de la combinatoria aditiva.
En 1969, Klimov dio un primer valor para la constante (K = 6 109 ); luego la mejor
a K = 115 (con G. Z. Piltay y T. A. Sheptickaja) y K = 55. Siguieron resultados de
Vaughan [27] (K = 27), Deshouillers [7] (K = 26) y Riesel-Vaughan [23] (K = 19).
Ramar mostr en 1995 que todo par n > 1 es la suma de a lo ms 6 primos [21];
sus mtodos se inscriben ms en la tradicin de Vinogradov que en la de Schnirelmann. Por ltimo, en 2012, Tao prob [25] que todo impar n > 1 es la suma de a lo
ms 5 primos.
Hubo otras lneas de aproximacin a la conjetura fuerte. Estermann [9] demostr,
usando ideas cercanas a las de Vinogradov, que casi todo nmero par (es decir, un
conjunto de densidad 1 en los pares) puede ser escrito como la suma de dos nmeros
primos. En 1973, J.-R. Chen lleg a probar [1] que todo par ms grande que una cierta
constante puede escribirse como la suma de un primo y el producto de dos primos.
Por cierto, el mismo Chen, junto con T.-Z. Wang, es responsable de las mejoras
cotas para C (en Goldbach ternario) antes de Liu y Wang: C = exp(exp(11.503)) <
4 1043000 [2] y C = exp(exp(9.715)) < 6 107193 [3].
***
Cules son los elementos de la demostracin? Demos primero un paso atrs y
echemos una mirada a la estructura general del mtodo del crculo, introducido
por Hardy y Littlewood.

2.

El mtodo del crculo: anlisis de Fourier en los enteros

El anlisis de Fourier es algo que usamos cada vez que sintonizamos una radio:
hay una seal, y la descomponemos en sus componentes en diferentes frecuencias.
En trminos matemticos: se nos da una funcin f : R C (esto es, una funcin de
una sola variable real; en el caso de la radio la variable es el tiempo) y definimos la
R
transformada de Fourier fb : R C como fb(r) = R f (x)e(xr) dx, donde escribimos
e(t) por e2it . Entonces, como se aprende en cualquier curso de anlisis de Fourier,
R
f (x) = R fb(r)e(xr) dr, siempre que f decaiga suficientemente rpido y se comporte
bien. (Esta es la frmula de inversin de Fourier.)
En otras palabras, x 7 f (x) ha sido descompuesta como una suma de funciones
exponenciales (complejas), con la funcin exponencial (compleja) x 7 e(xr) presente
con intensidad fb(r). (Esto es equivalente a una descomposicin en ondas sinusoidales
x 7 sen (2xr) y x 7 cos (2xr), ya que eiz = cos (z) + i sen (z).) Volviendo al

712

El diablo de los nmeros

0
TUNING

1/5

4/5

3/4

1/4

1/3

2/3

3/5

2/5
1/2

Figura 2: El dial de la radio de un verdadero especialista en teora de nmeros.

ejemplo de la radio: fb(r) es grande cuando r est cerca de la frecuencia de alguna


estacin de radio, y pequeo en otro caso. (Lo que la radio recibe es una superposicin
f de lo que transmiten todas las estaciones; el trabajo del receptor de radio consiste
precisamente en descifrar la contribucin de las frecuencias r alrededor de un r0
dado.)
Podemos hacer lo mismo si f es una funcin que va de los enteros Z a C. De
hecho, las cosas son ahora msPsimples se llega a definir fb como una suma en vez
de como una integral: fb() = n f (n)e(n). Algo interesante aqu es que fb()
no cambia en absoluto si sumamos 1, o cualquier otro entero m, a . Esto es as
porque, para m entero,
e(( + m)n) = e2in (e2i )mn = e(n) 1mn = e(n).
(Gracias de nuevo, Euler.) Por tanto, podemos restringir al intervalo [0, 1] o, de
forma ms abstracta, podemos pensar en como un elemento del cociente R/Z.
Topolgicamente, R/Z es un crculo lo cual es lo mismo que decir que, como no
importa si sumamos o restamos 1 a nuestra frecuencia, podramos tambin hacer
que la aguja del dial de nuestra radio recorra un crculo marcado con nmeros de 0
hasta 1, en vez de que se deslice en (un segmento de) la recta real (como en la radio
sobre mi mesa). De all viene el nombre de mtodo del crculo.
R1
La descomposicin de f ahora se ve como sigue: f (n) = 0 fb()e(n) d, a
condicin de que f decaiga suficientemente rpido.
Por qu nos importa todo esto? La transformada de Fourier es til inmediatamente si estamos trabajando en problemas aditivos, como las conjeturas de Goldbach. La razn detrs de esto es que la transformada de una convolucin es igual al
producto de las transformadas: f[
g = fbb
g . Recordemos que la convolucin (aditiva)
de f, g : Z C est definida por
X
(f g)(n) =
f (m)g(n m).
mZ

713

La Gaceta ? Secciones

Figura 3: El do Hardy-Littlewood e I. M. Vinogradov.

Podemos ver entonces que (f g)(n) puede ser distinto de cero slo si n puede
ser escrito como n = m1 + m2 para algunos m1 , m2 tales que f (m1 ) y g(m2 ) sean
distintos de cero. De forma similar, (f g h)(n) puede ser distinto de cero slo si
n puede escribirse como n = m1 + m2 + m3 para algunos m1 , m2 y m3 tales que
f (m1 ), g(m2 ) y h(m3 ) sean todos distintos de cero. Ello sugiere que, para estudiar
la conjetura ternaria de Goldbach, sea conveniente elegir f, g, h de forma que tomen
valores distintos de cero slo en los primos. Por ejemplo, si f = g = h es la funcin
que vale 1 en los primos y 0 en el resto, es claro que (f gh)(n) coincide exactamente
con el nmero de representaciones de n como suma de tres primos.
Hardy y Littlewood definieron f (n) = g(n) = h(n) = 0 para n compuesto (o
cero o negativo) y f (n) = g(n) = h(n) = (log n)en/x para n primo (donde x es un
parmetro que ser fijado ms adelante). Aqu el factor en/x est para proporcionar decaimiento rpido, por lo que todo converge. Como veremos ms adelante,
la eleccin de Hardy y Littlewood de en/x (en vez de alguna otra funcin de decaimiento rpido) es de hecho muy inteligente, aunque no la mejor posible. El trmino
log n aparece por razones tcnicas (bsicamente, resulta que tiene sentido ponderar
un primo p por log p porque aproximadamente uno de cada log p enteros alrededor
de p es primo).
Vemos que (f g h)(n) 6= 0 si y slo si n puede ser escrito como la suma de tres
primos. Nuestra tarea es, entonces, mostrar que (f g h)(n) (es decir, f f f (n)) es
distinto de cero para todo n impar mayor que una constante. Como la transformada
de una convolucin es igual al producto de las transformadas, tenemos que
Z 1
Z 1
(f g h)(n) =
f\
g h()e(n) d =
(fbgb b
h)()e(n) d.
0

714

El diablo de los nmeros

Figura 4: Grfica de |f ()|.

Nuestro trabajo es, por lo tanto, mostrar que la integral


Z 1
Z 1
(fbgb b
h)()e(n) d =
(fb())3 e(n) d
0

es distinta de cero.
Resulta que fb() es particularmente grande cuando est cerca de un racional
con denominador pequeo; es como si realmente hubiera estaciones de radio transmitiendo las frecuencias (de denominador pequeo) marcadas en el dial dibujado
arriba cuando la aguja del dial est cerca de una de ellas, hay una seal fuerte
y clara (i.e., la intensidad fb() es grande), y cuando estamos lejos de todas ellas,
podemos escuchar sloPun leve zumbido. En la figura 4 se representa el valor de
|f ()| cuando f () = p60 log p e(p). Esto sugiere la siguiente estrategia: calcular
fb() para todo dentro de arcos pequeos alrededor de los racionales con denominadores pequeos (los arcos mayores llamados as porque aportan una mayor
contribucin, a pesar de ser pequeos); acotar fb() para fuera de los arcos mayores (todo lo que hay fuera de los arcos mayores se denomina arcos menores); por
ltimo, mostrar que la contribucin de los arcos menores a la integral es menor, en
valor
que la contribucin de los arcos mayores, forzando as que la integral
R 1 absoluto,
b())3 e(n) d sea distinta de cero.
(
f
0
Es a esta estrategia general a la que se denomina mtodo del crculo. Hardy y
Littlewood la introdujeron para tratar una amplia variedad de problemas aditivos;
por ejemplo, fue tambin parte de su enfoque sobre el problema de Waring, que
trata de enteros que son suma de potencias k-simas de enteros. El mtodo fue
desarrollado plenamente por Vinogradov, quien fue el primero en dar buenas cotas

715

La Gaceta ? Secciones

incondicionales para fb() cuando est en los arcos menores (un logro considerado
muy notable en su tiempo). El mtodo del crculo es tambin mi estrategia general:
lo que he hecho es dar estimaciones mucho mejores para los arcos mayores y menores
que las que tenamos previamente, para unas funciones f , g y h elegidas con mucho
cuidado.
(Incidentalmente: si quisiramos tratar la conjetura binaria, o fuerte, de Goldbach con el mtodo del crculo nos toparamos pronto con un obstculo maysculo:
el ruido procedente de los arcos menores abruma la contribucin de los arcos mayores. Ver la exposicin de este problema en el artculo [26], en el blog de T. Tao.)

3.

Funciones L de Dirichlet y sus ceros

Antes de que podamos comenzar a trabajar en los arcos mayores, necesitamos


hablar sobre las funciones L. La reina de estas funciones es la funcin zeta, (s),
estudiada para s complejo por Riemann, cuyo nombre ahora lleva. Est dada por

X
1
(s) =
s
n
n=1

cuando la parte real <(s) de s es mayor que 1. Cuando <(s) 1, la serie diverge,
pero la funcin puede definirse (de forma nica) por continuacin analtica (y esto
puede hacerse explcitamente usando, por ejemplo, Euler-Maclaurin, como en [5,
p. 32]), con un polo en s = 1.
La conexin entre la funcin (s) (pero con s > 1 y real) y los primos haba sido
descubierta anteriormente por Euler, quien demostr la notable identidad
1

X
Y
1
1
=
1 s
,
ns
p
p
n=1
donde el producto se extiende sobre todos los primos. Euler dedujo fcilmente de esta
identidad que la suma de los inversos de los primos es infinita. Se debe a Riemann,
sin embargo, la generalizacin de la funcin (s) al plano complejo y el esbozo de
la estrategia para demostrar lo que hoy conocemos como el teorema de los nmeros
primos, felizmente demostrado por Hadamard y de la Valle-Poussin:
|{p primo : p x}|

x
,
log x

donde | | representa el cardinal de un conjunto. Si la funcin (s) es la que permite estudiar la distribucin de los primos, las funciones L de Dirichlet son las que
nos proporcionan informacin sobre la distribucin de los primos en progresiones
aritmticas. Estn definidas por
L(s, ) =

X
(n)
,
ns
n=1

716

El diablo de los nmeros

Figura 5: Dirichlet y Riemann.

para <(s) > 1, y por continuacin analtica para <(s) 1. Aqu es cualquier
carcter de Dirichlet; para cada dado, L(s, ) es una funcin de s. Un carcter
de Dirichlet (de mdulo q) es una funcin : Z C de perodo q (esto es,
(n) = (n+q) para todo n), con las propiedades adicionales de que es multiplicativa
((ab) = (a)(b) para a, b cualesquiera) y que (n) = 0 cuando n y q no son
coprimos. (La forma sofisticada de decir todo esto es que es un carcter de (Z/qZ)
en Z.)
Un cero de una funcin f es un s C tal que f (s) = 0. Un cero no trivial de (s),
o de L(s, ), es un cero de (s), o de L(s, ), tal que 0 < <(s) < 1. (Los otros ceros
son llamados triviales porque es fcil decir dnde estn, a saber, en ciertos enteros
no positivos.) La hiptesis de Riemann asevera que todos los ceros no triviales de la
funcin zeta de Riemann yacen en la recta crtica, lo cual significa que <(s) = 1/2.
La hiptesis generalizada de Riemann para funciones L de Dirichlet dice que, para
todo carcter de Dirichlet , todo cero no trivial de L(s, ) satisface <(s) = 1/2.
Como tanto la hiptesis de Riemann (HR) como la hiptesis generalizada de
Riemann (HGR) siguen sin ser demostradas, cualquier resultado probado usando
cualquiera de ellas ser condicional; ahora bien, nosotros queremos probar resultados
incondicionales. Lo que s puede ser demostrado, y utilizado, son resultados parciales
en la direccin de la HGR. Tales resultados son de dos tipos:
Regiones libres de ceros. Desde finales del siglo XIX (de la Valle-Poussin)
sabemos que hay regiones con forma de reloj de arena (ms precisamente, de
la forma c/ log t 1c/ log t, donde c es una constante y donde escribimos
s = + it) fuera de las cuales no pueden yacer ceros no triviales.
Verificaciones finitas de HGR. Es posible (usando un ordenador) probar pedazos finitos y no muy grandes de la HGR, en el sentido de verificar que todos
los ceros s no triviales de una funcin L(s, ) ( dado) con parte imaginaria
=(s) menor que alguna constante H yacen en la recta crtica <(s) = 1/2.

717

La Gaceta ? Secciones

La mayor parte de los trabajos hasta la fecha sigue la primera alternativa. Yo


eleg la segunda, y esto tuvo consecuencias para la manera en la que defin los arcos
mayores y menores: consegu resultados muy precisos en los arcos mayores, pero tuve
que definirlos de tal manera que fueran pocos y muy estrechos; si no, el mtodo no
hubiera funcionado. Esto signific que los mtodos para los arcos menores tenan que
ser particularmente potentes, ya que una parte del crculo ms grande de lo habitual
qued para ser tratada con ellos.
Vamos a ver ms detenidamente cmo se puede lidiar con los arcos mayores
usando resultados parciales de la HGR y, en particular, verificaciones finitas de
la HGR.

4.

Estimaciones en los arcos mayores

P
Recordemos que queremos calcular sumas del tipo fb() =
f (n)e(n), donde f (n) es algo como (log n)en/x para n primo y 0 para n compuesto. Vamos a
modificar esto slo un poco; de hecho calcularemos
X
S (, x) =
(n)e(n)(n/x),
donde es la funcin de Mangoldt: (n) = log p si n es de la forma pk , con k 1,
y (n) = 0 de lo contrario. (El uso de en vez de es slo una concesin a la
tradicin, como lo es el uso de la letra S, de suma. Por otra parte, el uso de (n)
en lugar de simplemente log p simplifica las cosas cuando hay que trabajar con las as
llamadas frmulas explcitas, que veremos enseguida.) Aqu (t) es alguna funcin
de decaimiento rpido; puede ser et , como en el trabajo de Hardy y Littlewood,
o (como en mi trabajo) alguna otra funcin. (Podra incluso ser el truncamiento
brutal 1[0,1] (t), igual a 1 cuando t [0, 1] y a 0 de lo contrario; esto sera bueno
para los arcos menores, pero, como veremos, resulta ser una mala idea cuando se
tratan los arcos mayores.)
Asumamos que est en un arco mayor, es decir, que podemos escribir de la
forma = a/q + /x para algn a/q (q pequeo) y algn (con || pequeo). Podemos expresar S (, x) como una combinacin lineal (esto es, una suma de mltiplos)
de trminos de la forma S, (/x, x), donde
X
S, (/x, x) =
(n)(n)e(n/x)(n/x)
n

y recorre los caracteres de Dirichlet de mdulo q.


Por qu son las sumas S, mejores que las sumas S ? El argumento se ha
convertido en /x, donde antes era . Aqu es pequeo ms pequeo que una
constante, en nuestro tratamiento. En otras palabras, e(n/x) se mover alrededor
del crculo un nmero acotado de veces a medida que n vaya de 1 hasta, digamos,
10x (para cuando (n/x) es ya muy pequeo). Esto hace que la suma S, sea mucho
ms fcil de calcular.

718

El diablo de los nmeros

Es un hecho estndar que podemos expresar S, mediante una frmula explcita


(s, la frase tiene un significado tcnico, como el Jugendtraum de Kronecker):
X
S, (/x, x) = [b
()]x
F ()x + error pequeo.

Aqu el trmino entre corchetes aparece slo para q = 1. En la suma, recorre todos
los ceros no triviales de L(s, ), y F es la transformada de Mellin de e(t)(t):
Z
dt
F (s) =
e(t)(t)ts .
t
0
P
Lograremos nuestro objetivo si llegamos a demostrar que la suma F ()x es
pequea.
La cuestin es esta: si comprobamos la HGR hasta parte imaginaria H, entonces

sabemos que todo con |=()| H satisface <() = 1/2, y por lo tanto |x | = x.
En otras palabras, x es entonces muy pequeo (comparado con x). Sin embargo,
para cualquier cuya parte imaginaria tenga valor absoluto mayor que H no sabemos
nada sobre su parte real aparte de que 0 < <() < 1. (De acuerdo, podramos usar
una regin libre de ceros, pero las regiones libres de ceros conocidas son notoriamente
dbiles para =() grande es decir, nos serviran de poco en la prctica.) Por lo
tanto, nuestra nica opcin es asegurarnos que F () sea pequea cuando |=()|
H.
Esto, claro est, tendra que ser cierto para muy pequeo (incluyendo = 0)
y para no tan pequeo ( entre 1 y una constante). Si se juega con el mtodo de
la fase estacionaria, se consigue ver que F () se comporta como M () para muy
pequeo (aqu M es la transformada de Mellin de ) y como (t/||) para no
tan pequeo (donde t = =). Por tanto, estamos en un dilema clsico, a menudo
llamado principio de incertidumbre porque es el hecho matemtico subyacente al
principio fsico del mismo nombre: no se puede tener una funcin que decrezca
muy rpidamente y cuya transformada de Fourier (o, en este caso, su transformada
de Mellin) tambin decaiga muy rpidamente.
Qu significa aqu muy rpidamente? Significa ms rpido que cualquier
exponencial eCt . Por tanto, la eleccin (t) = et de Hardy y Littlewood parecera
ser esencialmente ptima.
No tan deprisa! Lo que podemos hacer es elegir de tal manera que M decrezca
exponencialmente (con una constante C un poco peor que antes) y que decrezca
ms rpido que exponencialmente. Esto es lo crucial, ya que t/|| (y no tanto t en
s) corre el riesgo de ser bastante pequeo.
Una eleccin de que obedece a esta descripcin es la funcin gaussiana (t) =
2
et /2 . La transformada de Mellin F es entonces una funcin cilndrica parablica,
con valores imaginarios para uno de sus parmetros. Las funciones cilndricas parablicas parecen ser muy apreciadas y estudiadas en el mundo aplicado pero ms
que nada para valores reales del citado parmetro. Hay algunos desarrollos asintticos de F en la literatura para parmetros generales (notablemente por F. W.
J. Olver), pero ninguna que sea suficientemente explcita para mis propsitos. Por

La Gaceta ? Secciones

719

tanto, tena que proporcionar estimaciones totalmente explcitas yo mismo, usando


el mtodo del punto de silla. Esto me llev un buen rato, pero los resultados seguramente sern de aplicacin general hola, ingenieros y tambin es de esperar que
la funcin gaussiana se vuelva un poco ms popular en trabajos explcitos en teora
de nmeros.
A propsito, estas estimaciones de funciones cilndricas parablicas nos permiten
2
2
tomar no slo (t) = et /2 , sino tambin, ms generalmente, (t) = h(t)et /2 ,
donde h es cualquier funcin de banda limitada, lo que significa, en este contexto,
cualquier funcin h cuya transformada de Mellin restringida al eje y tenga soporte
compacto. Deseamos optimizar la eleccin de h(t) hablaremos de ello ms adelante.

5.

Los arcos menores

Cmo acotamos |S (, x)| cuando no est cerca de ningn racional a/q de


denominador pequeo? Que esto sea posible fue el gran logro de Vinogradov. El
progreso desde entonces ha sido gradual. Doy mi propio enfoque al asunto en mi
artculo Minor arcs. . . [11]. Djenme comentar algunas de las ideas detrs de los
avances all contenidos.
La demostracin de Vinogradov fue simplificada sustancialmente en los 70 (del
siglo XX) por Vaughan, quien introdujo la identidad que ahora lleva su nombre [28].
Bsicamente, la identidad de Vaughan es un gambito: otorga una gran flexibilidad,
pero a un precio aqu, un precio de dos logaritmos, en lugar de, digamos, dos
peones. El problema es que, si queremos alcanzar nuestro objetivo, no podemos
permitirnos el lujo de perder logaritmos. La nica opcin es recuperar esos logaritmos
encontrando cancelaciones en las diferentes sumas que surgen de la identidad de
Vaughan. Esto se tiene que hacer, por cierto, sin usar funciones L, puesto que ya no
podemos asumir que q sea pequeo.
He aqu otro aspecto de esta parte de la prueba. Todo tiene una aproximacin
de la forma = a/q + /x; el hecho de que est en los arcos menores nos dice que
q no es muy pequeo. Estamos buscando cotas que
p decrezcan a medida que q crece;
la cota que yo obtengo es proporcional a (log q)/ (q). Cul es el efecto de ?
Algo de lo que me di cuenta pronto fue que, si no es muy pequeo, puede de
hecho ser utilizado en nuestro beneficio. Una razn es que hay trminos de la forma
b(), y la tranformada de Fourier de funciones suaves decae conforme el argumento
crece. Hay otras razones, empero. Algo que podemos usar es lo siguiente: por un
resultado bsico de aproximacin diofntica, todo tiene muy buenas aproximaciones por racionales con denominador no demasiado grande. Si no es muy pequeo,
entonces la aproximacin = a/q + /x es buena, pero no muy buena; por lo tanto,
debe haber otra mejor aproximacin a0 /q 0 con q 0 no demasiado grande (lo que
significa considerablemente ms pequeo que x). Podemos ir y volver entre las
aproximaciones a/q y a0 /q 0 , dependiendo de cul sea ms til en cada momento.
Ello resulta ser mejor que usar una sola aproximacin a/q, por muy buena que esta
sea.
Otra manera en la que se consigue sacar provecho de un grande es esparciendo
las entradas en una gran criba. La gran criba puede ser vista como una forma apro-

720

El diablo de los nmeros

ximada de la identidad de Plancherel, reformulada como una desigualdad. Mientras


la identidad de Plancherel nos dice que la norma |fb|2 (norma `2 ) de la transformada
de Fourier fb : R/Z Z de una funcin f definida en los enteros (tambin es cierto
para los reales u otros grupos) es igual a la norma |f |2 de la misma funcin f , la gran
criba nos dice que el total de |fb(i )|2 para una muestra bien espaciada de puntos
i R/Z est acotada por (un mltiplo de) |f |2 . Ahora bien, en nuestro caso, los
puntos i son mltiplos de nuestro ngulo . Si = a/q, el espacio entre los puntos
i es 1/q, lo cual es bueno pero puede ser que tengamos que aplicar la gran criba
varias veces, ya que tenemos que aplicarla de nuevo para cada tanda de q puntos.
Sin embargo, si = a/q + /x y no es demasiado pequeo, podemos rodear el
crculo varias veces y confiar en /x en vez de en 1/q para darnos el espacio. S,
/x (e incluso q/x) es ms pequeo que 1/q, pero el efecto de esto est ms que
compensado por el hecho de que tenemos que recurrir a la gran criba muchas menos
veces (quizs solamente una vez).
Lo que es ms interesante, esta manera de esparcir los ngulos puede ser combinada con otra manera ms tradicional de esparcirlos (lema de Montgomery; ver [18,
(3.9)], o la exposicin en [15, 7.4]) con el fin de aprovechar el hecho de que estamos
tratando con sumas donde la variable recorre los primos p.

6.

Conclusin

Hemos estado hablando acerca de acotar S (, x) para dentro


de los arcos
R
menores, pero lo que queremos hacer realmente es acotar la integral m |S (, x)|3 d.
Una forma fcil y tradicional de hacer esto consiste en usar la desigualdad trivial
Z
Z
|S (, x)|3 d m
ax |S (, x)|
|S (, x)|2 d.
m

Desgraciadamente, as perderamos un factor de un logaritmo.


Como nuestras cotas para S (, x), aq, estn dadas en trminos
de q, tieR
ne sentido combinarlas con estimaciones para integrales del tipo mr |S (, x)|2 d,
donde mr es una unin de arcos alrededor de racionales con denominador ms grande que una constante pero menor que r. Cmo estimamos estas integrales? Esta
pregunta est muy relacionada con otra que entra dentro del marco de la gran criba:
qu cotas se pueden conseguir para i = a/q, q r, donde r es de tamao moderado, si es que estamos trabajando con una sucesin con soporte en los primos?
Haba una respuesta en la literatura (basada en el lema de Montgomery; el enlace
con el mtodo del crculo ya fue observado por Heath-Brown) pero era peor que la
cota ptima por un factor de al menos e (o de hecho ms); es este el resultado
utilizado en [25, 4] y la primera version de [11, 6]. Tambin haba una estimacin
ms reciente para la gran criba debida a Ramar ([22, Thm. 2.1]; ver tambin [22,
Thm. 5.2]), pero no se haba hecho totalmente explcita. Tuve que hacerla explcita,
y luego adapt el nuevo resultado sobre la gran criba a la tarea de estimar la integral
sobre mr . Como era de esperar, el factor e (o realmente un poco ms) desapareci.

721

La Gaceta ? Secciones

Queda por comparar el trmino principal con el error. Resulta que tenemos cierto
margen para elegir lo que ser el trmino principal, ya que depende de los pesos
que utilicemos. El trmino principal es proporcional a
Z Z
+ (t1 )+ (t2 ) (N/x (t1 + t2 )) dt1 dt2 ,
0

donde + y son los dos pesos con los que escogemos trabajar, N es el nmero impar
que queremos expresar como suma de tres primos y x es de nuevo un parmetro de
nuestra eleccin. En comparacin, el error es proporcional a |+ |2 | |1 . As, tenemos
un problema de optimizacin (maximizar el tamao de la doble integral dividida
por |+ |2 | |1 ). Lo mejor es elegir un peso + simtrico o cercano a ser simtrico
(+ (t) + (2 t)), asegurndonos, por otra parte, que + (t) 0 para t 2. Esto
no es demasiado difcil de conseguir aun bajo la restriccin de que + sea de la forma
2
(t) = h(t)et /2 , donde h es de banda limitada.
Qu pasa con ? La solucin del problema de optimizacin nos dice que debe
ser de soporte pequeo, o por lo menos concentrado cerca del origen. Aparte de eso,
hay, por decirlo as, un problema poltico: , a diferencia de + , se usa tanto en los
arcos mayores como en los menores; los arcos mayores quieren de verdad que sea de
2
2
la forma et /2 o tk et /2 , mientras los arcos menores preferiran algo ms simple,
como [0,1] o como 2 = (2[1/2,1] ) M (2[1/2,1] ), donde f M g es la convolucin
multiplicativa (o convolucin de Mellin):
 
Z
x dy
(f M g)(x) =
f (y)g
.
y y
0
(Aqu 2 es precisamente el peso usado en el artculo de Tao sobre los cinco primos,
o en mi propio artculo sobre los arcos menores.)
La solucin es simple: definamos (t) = (f M g)(t), donde es una constante
2
grande, f (t) = 2 (t) y g(t) = t2 et /2 . Para f y g esencialmente arbitrarias, si se
sabe cmo calcular (o estimar) Sf (, x) para algunos , y se sabe estimar Sg (, x)
para todos los otros , entonces se sabe cmo estimar Sf M g (, x) para todo . (La
prueba sale en un par de lneas; se escribe qu es Sf M g en detalle y se cambia el
orden de la suma y la integral. En el proceso tambin se aclara que ayuda si f (t) y
g(t) son pequeos para t cercano a 0.)
La moraleja de esta historia es que diferentes problemas, y diferentes partes
del mismo problema, exigen diferentes pesos . Al menos en el contexto de sumas
exponenciales, resulta haber un simple truco para combinarlas, como acabamos de
ver.

7.

Algunos comentarios finales sobre computacin

Una demostracin analtica normalmente da una prueba vlida para todo n mayor que una constante C. La razn es simple: digamos que queremos mostrar que una
cantidad es positiva. Generalmente, despus de bastante trabajo analtico, se llega

722

El diablo de los nmeros

a probar que la cantidad es de la forma 1 + error, donde el valor absoluto de este


error es menor que, digamos, C/n (para dar un ejemplo simple). Esto ciertamente
muestra que la cantidad es positiva, a condicin de que n C. La tarea, entonces, es
refinar la demostracin hasta que la constante C sea suficientemente pequea para
que todos los casos en los que n C puedan ser comprobados a mano (literalmente
a mano o con un ordenador). Esto fue, en gran parte, mi trabajo: comprobar la conjetura hasta C = 1029 (y de hecho hasta 8.8 1030 ) fue, en comparacin, una tarea
secundaria como veremos, no era siquiera el principal esfuerzo computacional.
Primero, permtanme decir algunas palabras ms en general sobre resultados
analticos. Hay resultados del tipo la proposicin es cierta para todo n mayor que
una constante C, pero esta demostracin no nos dice nada sobre C aparte de que
existe. A esto se le llama una estimacin inefectiva; muchas demostraciones de
los resultados de Vinogradov en libros de texto son de este tipo. (La razn detrs de
esto es la posible existencia de los as llamados ceros de Siegel.) Un resultado puede decir tambin la sentencia es cierta para todo n > C, y en principio se debera
poder determinar algn valor de C usando las ideas de la prueba, pero el autor preferira irse a tomar un caf. Esta es una proposicin efectiva no explcita; la versin
definitiva de Vinogradov de su propio resultado fue de este tipo (como lo son muchos
otros resultados en matemticas, incluyendo algunos de mi propio pasado). Si se da
un valor explcito de C, entonces el resultado se denomina (sorpresa!) explcito.
Queda la cuarta etapa: conseguir que C sea razonable, esto es, suficientemente pequea como para que el caso n C pueda ser comprobado a mano. Estuvo claro
desde el principio que, en el caso de la conjetura ternaria de Goldbach, razonable
significaba aproximadamente C 1030 (aunque las verificaciones existentes llegaban
a bastante menos que 1030 ).
Dije antes que D. Platt y yo comprobamos la conjetura para todos los impares
hasta 8.8 1030 . He aqu como procedimos. Ya se saba (gracias a un esfuerzo de
gran envergadura de parte de Oliveira e Silva, Herzog y Pardi [19]) que la conjetura
binaria de Goldbach es cierta hasta 4 1018 esto es, todo nmero par hasta 4 1018
es suma de dos nmeros primos. Sabiendo esto, todo lo que tenamos que hacer era
construir una escalera de primos, esto es, una lista de primos desde 2 hasta 8.8 1030
tal que la diferencia entre cualesquiera dos primos consecutivos de la lista fuera a lo
ms 4 1018 . Por tanto, si alguien le da a uno un entero impar n hasta 8.8 1030 , se
sabe que hay un primo p en la lista tal que n p es positivo y a lo ms 4 1018 . Por
hiptesis, podemos escribir n p = p1 + p2 para algunos primos p1 , p2 , y, por tanto,
n = p + p1 + p2 .
Construir esta escalera no nos llev mucho tiempo. (De hecho, conseguir una
escalera hasta 1029 es probablemente algo que el lector pueda hacer en su ordenador
personal en unas pocas semanas aunque almacenarla es otro asunto.) La tarea
se hace en aritmtica entera, y comprobamos la primalidad de los nmeros en la
escalera de manera determinista (restringindonos a primos para los cuales hay un
algoritmo rpido de comprobacin de primalidad), as que no hay que preocuparse.
El clculo computacional ms grande ha consistido en verificar que, para toda
funcin L de conductor q hasta sobre 15 000 (o dos veces esto para q par), todos
los ceros de la funcin L con parte imaginaria acotada por 108 /q yacen sobre la

La Gaceta ? Secciones

723

lnea crtica. Esto fue por completo obra de Platt [20]; mi nica contribucin fue ir
a buscar tiempo de ordenador por muchas partes (ver la seccin de agradecimientos
del artculo Major arcs. . . [12]). De hecho, Platt lleg hasta conductor 200 000 (o
dos veces esto para q par); ya haba llegado hasta el conductor 100 000 en su tesis. La
verificacin llev, en total, unas 400 000 horas de ncleo (esto es, el nmero total de
ncleos (cores) de procesador usados por el nmero de horas que corrieron es igual
a 400 000; hoy en da, un procesador de primera lnea como los de la mquina en
MesoPSL normalmente tiene ocho ncleos). Al final, como deca, us solamente
q 150 000 (o el doble de esto para q par), por lo que el nmero de horas necesarias
fue de hecho unas 160 000; como me hubiera bastado con aproximadamente q
120 000, podra decir que, en retrospectiva, se necesitaban slo unas 80 000 horas de
ncleo. Los ordenadores y yo fuimos cavando por lados opuestos de la montaa, y
nos encontramos en el centro. El hecho de que los ordenadores trabajaran ms de lo
necesario no es nada que lamentar: el clculo hecho es de uso general, y por tanto es
mucho mejor que no est hecho a la medida de mis necesidades. Por otra parte,
con demostraciones de esta longitud, lo mejor es construir como un romano, es
decir, calcular de ms por si uno (no el ordenador!) ha cometido algn pequeo
error en algn sitio. (Por qu creen que esas paredes eran tan gruesas?)
Comprobar los ceros de la funcin L computacionalmente es algo tan viejo como
Riemann (quien lo hizo a mano); es tambin una de las cosas que se intentaron en
computadoras electrnicas ya en sus primeros das (Turing tena un artculo sobre
eso). Una de las principales cuestiones con las que hay que tener cuidado surge
cuando se quieren manipular nmeros reales: hablando honestamente, un ordenador no puede almacenar ; ms an, si bien un ordenador puede manejar nmeros
racionales, realmente se siente cmodo slo cuando maneja aquellos racionales cuyos denominadores son potencias de dos. Por tanto, en realidad no se puede decir:
ordenador, dame el seno de este nmero y esperar un resultado preciso. Lo que
se debera hacer, si realmente se quiere probar algo (como en este caso!) es decir: ordenador, te estoy dando un intervalo I = [a/2k , b/2k ]; dame un intervalo
I 0 = [c/2l , d/2l ], preferiblemente muy pequeo, tal que sen(I) I 0 . Esto se llama
aritmtica de intervalos; es realmente la forma ms sencilla de hacer clculos en
coma flotante de manera rigurosa.
Ahora, los procesadores no hacen esto de forma nativa, y si se hace puramente
con software se retrasan las cosas en un factor de ms o menos 100. Afortunadamente, hay maneras de hacer esto a medias con hardware y a medias con software.
Platt tiene su propia biblioteca de rutinas, pero hay otras online (por ejemplo, PROFIL/BIAS [16]).
(Oh, a propsito, no usen la funcin seno en un procesador Intel si quieren que el
resultado sea correcto hasta el ltimo bit. En qu habrn estado pensando? Usen
la biblioteca CRlibm [4] en su lugar.)
Por ltimo, hubo varios clculos bastante menores que hice yo mismo; los encontrarn mencionados en mis artculos. Un clculo habitual fue una versin rigurosa
de una demostracin por grfica (el mximo de una funcin f es claramente menor que 4 porque gnuplot me lo dijo). El lector encontrar algoritmos para esto en
cualquier libro de texto sobre computacin validada bsicamente, es suficiente

724

El diablo de los nmeros

combinar el mtodo de la biseccin con aritmtica de intervalos.


Finalmente, djenme indicar que hay una desigualdad elemental en el artculo
Minor arcs. . . (viz., (4.24) en la demostracin del lema 4.2) que fue probada en
parte por un humano (yo) y en parte por un programa de eliminacin de cuantificadores. En otras palabras, ya existen programas de ordenador (en este caso, QEPCAD
[14]) que pueden probar cosas tiles. Ahora bien, no tengo dudas de que la misma
desigualdad puede ser probada puramente mediante el uso de seres humanos, pero
es bonito saber que nuestros amigos los ordenadores pueden (pretender) hacer algo
ms que masticar nmeros. . .
Nota. Este artculo est basado en un texto del autor publicado en su blog [13].
Se deben gracias a M. A. Morales, por una primera traduccin, y a J. Cilleruelo y
M. Helfgott, por muchos comentarios, as como a F. Chamizo, por la grfica de la
figura 4.
Nota aadida en la imprenta. R. Vaughan me indica que Descartes mencion
que todo entero es igual a [la suma de] uno, dos o tres primos en un manuscrito
publicado de manera pstuma en 1901 [6, p. 298]. Dickson alude a esto en su historia
[8, p. 421], pero de manera un tanto oscurecida por una traduccin dudosa: la palabra
latina par fue traducida como even (en castellano, par) cuando, dice Vaughan,
debi haber sido traducida como equal (igual). En resumen, Descartes plante la
conjetura de Goldbach un siglo antes de ste. Se trata, claro est, de un enunciado
emprico (no publicado) y no de algo que Descartes supiera probar; ni siquiera parece
haberlo planteado de manera explcita como un problema para ser resuelto.

Referencias
[1] J. R. Chen, On the representation of a larger even integer as the sum of a
prime and the product of at most two primes, Sci. Sinica 16 (1973), 157176.
[2] J. R. Chen y T. Z. Wang, On the Goldbach problem, Acta Math. Sinica 32
(1989), 702718.
[3] J. R. Chen y T. Z. Wang, The Goldbach problem for odd numbers, Acta
Math. Sinica (Chin. Ser.) 39 (1996), 169174.
[4] C. Daramy-Loirat, F. de Dinechin, D. Defour, M. Gallet, N. Gast
y Ch. Lauter, CRlibm Correctly Rounded mathematical library, mayo 2010,
version 1.0beta4.
[5] H. Davenport, Multiplicative number theory, Graduate Texts in Mathematics
74, Springer-Verlag, New York, tercera edicin, 2000.
[6] R. Descartes, Oeuvres (Ch. Adam y P. Tannery, eds.), vol. 10, L. Cerf, Paris,
1901.
[7] J.-M. Deshouillers, Sur la constante de nirelman, Sminaire DelangePisot-Poitou, 17e anne: (1975/76), Thorie des nombres: Fac. 2, Exp. No. G16,
Secrtariat Math., Paris, 1977.

La Gaceta ? Secciones

725

[8] L. E. Dickson, History of the theory of numbers. Vol. I: Divisibility and primality, Chelsea Publishing Co., New York, 1966.
[9] T. Estermann, On Goldbachs Problem: Proof that almost all even positive
integers are sums of two primes, Proc. London Math. Soc. Ser. 2 44 (1937),
no. 4, 307314.
[10] G. H. Hardy y J. E. Littlewood, Contributions to the theory of the Riemann zeta-function and the theory of the distribution of primes, Acta Math. 41
(1916), 119196.
[11] H. A. Helfgott, Minor arcs for Goldbachs problem. Prepublicacin, http:
//arxiv.org/abs/1205.5252.
[12] H. A. Helfgott, Major arcs for Goldbachs problem. Prepublicacin, http:
//arxiv.org/abs/1305.2897.
[13] H. A. Helfgott, The ternary Goldbach conjecture, http://valuevar.
wordpress.com/2013/07/02/the-ternary-goldbach-conjecture/, 2013.
[14] H. Hong y Ch. W. Brown, QEPCAD B Quantifier elimination by partial
cylindrical algebraic decomposition, mayo 2011, version 1.62.
[15] H. Iwaniec y E. Kowalski, Analytic number theory, American Mathematical
Society Colloquium Publications, 53, Amer. Math. Soc., Providence, RI, 2004.
[16] O. Knppel, PROFIL/BIAS, febrero 1999, versin 2.
[17] M.-Ch. Liu y T. Wang, On the Vinogradov bound in the three primes Goldbach conjecture, Acta Arith. 105 (2002), 133175.
[18] H. L. Montgomery, Topics in multiplicative number theory, Lecture Notes in
Mathematics, 227, Springer-Verlag, Berlin, 1971.
[19] T. Oliveira e Silva, S. Herzog y S. Pardi, Empirical verification of the
even Goldbach conjecture, and computation of prime gaps, up to 4 1018 , Math.
Comp., aceptado.
[20] D. Platt, Numerical computations concerning GRH. Prepublicacin.
[21] O. Ramar, On nirelmans constant, Ann. Scuola Norm. Sup. Pisa Cl. Sci.
22 (1995), 645706.
[22] O. Ramar, Arithmetical aspects of the large sieve inequality, with the collaboration of D. S. Ramana, Harish-Chandra Research Institute Lecture Notes,
vol. 1, Hindustan Book Agency, New Delhi, 2009.
[23] H. Riesel y R. C. Vaughan, On sums of primes, Ark. Mat. 2 (1983), 4674.
[24] L. Schnirelmann, ber additive Eigenschaften von Zahlen, Math. Ann. 107
(1933), 649690.
[25] T. Tao, Every odd number greater than 1 is the sum of at most five primes,
Math. Comp., aceptado.
[26] T. Tao, Heuristic limitations of the circle method, http://terrytao.
wordpress.com/2012/05/20/heuristic-limitations-of-the-circlemethod/, 2012.
[27] R. C. Vaughan, On the estimation of Schnirelmans constant, J. Reine Angew.
Math. 290 (1977), 93108.

726

El diablo de los nmeros

[28] R. C. Vaughan, Sommes trigonomtriques sur les nombres premiers, C. R.


Acad. Sci. Paris Sr. A-B 285 (1977), A981A983.
[29] I. M. Vinogradov, Representation of an odd number as a sum of three primes,
Dokl. Akad. Nauk. SSR 15 (1937), 291294.
Harald Andrs Helfgott, Ecole Normale Suprieure, Dpartement de Mathmatiques,
45 rue dUlm, F-75230 Paris, France
Correo electrnico: harald.helfgott@ens.fr
Pgina web: http://www.math.ens.fr/~helfgott/

Você também pode gostar