Un poco de historia
En su época, la demostración de la irracionalidad de \(\sqrt{2}\) ocasionó un verdadero cisma en la matemática griega, que se dividió, durante varios siglos, en geometría y aritmética: la diagonal del cuadrado unidad era un «segmento», pero no se podía describir como un «número».
Sin llegar a ese extremo, son bastantes las demostraciones sobre la naturaleza aritmética de algunas constantes que han tenido gran repercusión. Se trata de saber si un número es racional o irracional y, en caso de ser irracional, si es algebraico o trascendente. Por ejemplo, \(\sqrt{2}\) es irracional, pero es algebraico pues es raíz del polinomio con coeficientes enteros \(x^2-2\).
A principios del siglo XIX no se sabía, a ciencia cierta, si había números que no fuesen raíz de algún polinomio con coeficientes enteros; es decir, si existían o no números transcendentes. Fue Liouville el primero que encontró, en 1844, uno de tales números, la denominada constante de Liouville, que es
\[
\xi = \sum_{n=1}^\infty \frac{1}{10^{n!}}.
\]
El método usado para probar la transcendencia de \(\xi\) estaba especialmente adaptado para ese número construido aposta (u otros similares), pero no servía para ninguna de las constantes habituales de la matemática, que iban a requerir procedimientos totalmente distintos. Curiosamente, la demostración de Cantor, en 1874, de que el cardinal de los números reales no es numerable pero el de los algebraicos sí lo es, vino a mostrar que «prácticamente todos» los números reales son trascendentes. Para más detalles, tanto sobre estos resultados como sobre bastantes de los que comentamos en lo que sigue, véase [9, capítulo 6].
Un resultado muy relevante, y no exento de polémica, fue la demostración de la trascendencia de \(\pi\) efectuada por Lindemann en 1882, y que como corolario probaba la imposibilidad de la cuadratura del círculo. La demostración de Lindemann compartía muchas ideas con los argumentos que había usado Hermite para probar la trascendencia de \(e\) en 1873. Aunque el propio Hermite había comentado que la adaptación para el caso de \(\pi\) no parecía fácil, algunos matemáticos de la época menospreciaron el valor del trabajo de Lindemann, posiblemente de manera bastante injusta.
La irracionalidad de \(e\) y \(\pi\) se había demostrado un siglo antes. La demostración de la irracionalidad de \(e\) la hizo Euler en 1737 por medio de fracciones continuas, y la de \(\pi\), también con fracciones continuas, es de Lambert (alrededor de 1760). Actualmente, la demostración habitual de la irracionalidad de \(e\) usa la serie \(e = \sum_{n=1}^{\infty} 1/n!\) y se basa en una idea desarrollada por Joseph Fourier alrededor de 1815; y la prueba más sencilla de la irracionalidad de \(\pi\), que es preciosa, es de Niven [7].
Otro resultado destacado fue la respuesta al séptimo problema de Hilbert, que planteaba si, dados \(\alpha\) y \(\beta\) algebraicos con \(0 \ne\alpha\ne1\) y \(\beta \notin \mathbb{Q}\), el número \(\alpha^\beta\) siempre era transcendente. Como ejemplos, Hilbert mencionaba los casos \(2^{\sqrt{2}}\) y \(e^\pi = i^{-2i}\), y consideraba que era un problema extremadamente difícil de resolver. Tras algunos avances previos, la demostración de ese hecho se dio por concluida en 1934, y es lo que ahora se conoce como teorema de Gelfond-Schneider.
Mucho más recientemente, cabe mencionar la demostración de la irracionalidad de \(\zeta(3)\), efectuada por Apéry en 1978 (se publicó al año siguiente en [1]). Recordemos que, para \(s>1\), se define
\[
\zeta(s) = \sum_{n=1}^\infty \frac{1}{n^s},
\]
y esa función se denomina zeta de Riemann.
Alrededor de 1740, Euler había probado que \(\zeta(2k)\) (con \(k\) un entero positivo) era un múltiplo racional de \(\pi^{2k}\) (de hecho, calculó el valor de esas series utilizando los números de Bernoulli: sin seguir las ideas originales de Euler, sino con argumentos matemáticos particularmente sencillos, se puede ver cómo hacerlo en [4], [9, sección 6.9] o [6, capítulos 10 y 11]). Eso eliminaba toda incertidumbre sobre la naturaleza artimética de \(\zeta(2k)\), pero, a la vez, planteaba la cuestión de qué ocurría con \(\zeta(2k+1)\); en particular, saber si esos números eran racionales se convertía en un interesantísimo problema abierto.
Pero volvamos a la demostración original de la irracionalidad de \(\zeta(3)\), tal como nos relata Alfred van der Poorten en [8]. Nos encontramos en las Journées Arithmétiques de Marseille-Luminy en junio de 1978:
En un cambio del programa, se nos informó de que R. Apéry (Caen) hablaría el jueves, a las 14:00, «Sur l’irrationalité de \(\zeta(3)\)». Aunque ya se había rumoreado anteriormente que pretendía demostrarlo, el escepticismo era general. La conferencia tiende a reforzar esta opinión hasta la incredulidad más absoluta. Los oyentes ocasionales, o los que no eran francófonos, se limitaron a escuchar una sucesión de afirmaciones inverosímiles.
En opinión de algunos asistentes, la conferencia de Apéry fue infame. Pasaron unos meses hasta que van der Poorten, Henri Cohen y Frits Beukers (también presentes en la conferencia) se convencieron de que, completando los detalles, de la charla de Apéry se deducía una demostración rigurosa de la irracionalidad de \(\zeta(3)\). La demostración de Apéry apareció publicada en [1], y poco después Beukers publicó una versión más sencilla y elegante en [2].
Se podía sospechar que, refinando los métodos, la demostración de la irracionalidad de \(\zeta(3)\) se iba a poder adaptar a la de otros \(\zeta(2k+1)\), pero las esperanzas no fructificaron. Esencialmente, lo mejor que se sabe ahora es que al menos uno de los valores \(\zeta(5)\), \(\zeta(7)\), \(\zeta(9)\) o \(\zeta(11)\) es irracional, probado por Wadim Zudilin en 2001, véase [11]. Si tuviéramos que apostar, cualquier matemático apostaría a que son irracionales los cuatro (y no sólo eso, sino transcententes), pero una cosa es nuestro convencimiento subjetivo y otra lo que se sabe demostrar.
El resultado de Calegari, Dimitrov y Tang
En agosto de 2024, Frank Calegari, Vesselin Dimitrov y Yunqing Tang sorprendieron a la comunidad matemática al publicar, en arXiv, un artículo de más de 200 páginas con una demostración de la irracionalidad de
\[
L(2,\chi_{-3}) = \frac{1}{1^2} – \frac{1}{2^2}
+ \frac{1}{4^2} – \frac{1}{5^2}
+ \frac{1}{7^2} – \frac{1}{8^2}
+ \frac{1}{10^2} – \frac{1}{11^2}
+ \cdots.
\]
Es más, el artículo prueba que \(1\), \(\zeta(2)\) y \(L(2,\chi_{-3})\) son \(\mathbb{Q}\)-linealmente independientes, que es un resultado algo más fuerte.
Hay algunas constantes, como las que se obtienen a partir de las funciones de Dirichlet
\[
\beta(s) = \sum_{n=0}^{\infty} \frac{(-1)^n}{(2n+1)^s},
\quad
\eta(s) = \sum_{n=1}^{\infty} \frac{(-1)^{n-1}}{n^s}
\quad\text{y}\quad
\lambda(s) = \sum_{n=0}^{\infty} \frac{1}{(2n+1)^s},
\]
cuyo estudio es bastante similar al de \(\zeta(s)\) o directamente se reducen a él (véase [5]), pero \(L(2,\chi_{-3})\), que comparte con \(\zeta(2)\) el exponente \(2\) del denominador, tiene una naturaleza distinta, y ni se sabe sumar ni se sabía si era o no un número racional.
La relevancia del resultado de Calegari, Dimitrov y Tang se pone mejor de manifiesto si aclaramos qué significa la notación \(L(2,\chi_{-3})\), pues muestra que dicha constante se enmarca dentro de una categoría de números mucho más general que \(\zeta(s)\), las denominadas series \(L\) de Dirichlet, así que, quizás, la demostración abre una nueva vía para atacar nuevos problemas.
Dada una función aritmética \(\chi\) (es decir, una función definida sobre los enteros positivos), se denota
\[
L(s,\chi) = \sum_{n=1}^{\infty} \frac{\chi(n)}{n^s},
\]
siempre que la serie converja. En realidad, esto se define sobre funciones \(\chi\) que son caracteres de Dirichlet. No importa aquí demasiado lo que es esto, pero tales funciones cumplen \(\chi(nm) = \chi(n)\chi(m)\) y, además, para cierto \(k\) entero positivo satisfacen \(\chi(n+k) = \chi(n)\) y \(\chi(n) = 0\) cuando \(\operatorname{mcd}(n,k)>1\); en particular, la periodicidad implica que \(L(s,\chi)\) converge para \(s>1\).
Asimismo, y si usamos \((a \mid n)\) para referirnos al símbolo de Kronecker, tomaremos \(\chi_{a}(n) = (a \mid n)\) con \(a\) un entero fijo no nulo. La correspondiente función \(L\) es, entonces, \(L(s,\chi_a)\) (que, en ocasiones, también se suele denotar como \(L_a(s)\)).
El símbolo de Kronecker \((a \mid n)\) siempre toma valores \(0\) (cuando \(\operatorname{mcd}(a,n)>1\)), \(1\) o \(-1\), y discernir entre estos dos casos requiere cierto esfuerzo (el lector puede prescindir de hacerlo y saltarse estos detalles). Cuando \(n=p\) es un primo impar, el símbolo de Kronecker se denomina símbolo de Legendre; entonces, \((a \mid p) = 1\) si la ecuación cuadrática \(x^2 \equiv a \pmod{p}\) tiene soluciones, y \((a \mid p) = -1\) en caso contrario. Para \(n=2\), además de \((a \mid 2) = 0\) si \(a\) es par, se toma
\[
(a \mid 2) =
\begin{cases}
1 & \text{si } a \equiv \pm1 \pmod{8},\\
-1 & \text{si } a \equiv \pm3 \pmod{8}.
\end{cases}
\]
Finalmente, \((a \mid 1)=1\) y, si la descomposición en factores primos del entero \(n>1\) es \(n = p_1^{r_1} p_2^{r_2} \cdots p_k^{r_k}\), se define
\[
(a \mid n) = (a \mid p_1)^{r_1} (a \mid p_2)^{r_2} \cdots (a \mid p_k)^{r_k}.
\]
Para cada valor de \(a\), se pueden encontrar expresiones que proporcionan \((a \mid n)\) como función de \(n\) (a veces, dichas expresiones son muy sencillas).
En el caso \(a=1\) (que es el más sencillo), \(\chi_{1}(n) = 1\) para todo \(n\), con lo cual
\[
L(s,\chi_1) = \sum_{n=1}^{\infty} \frac{1}{n^s} = \zeta(s),
\]
la función zeta de Riemann. El caso que nos incumbe ahora es \(a=-3\), que da
\[
L(s, \chi_{-3}) = \sum_{n=0}^{\infty}
\left(\frac{1}{(3n+1)^s} – \frac{1}{(3n+2)^s}\right).
\]
Y otro caso muy significativo es \(a=-4\), para el cual
\[
L(s, \chi_{-4}) = \sum_{n=0}^{\infty}
\frac{(-1)^n}{(2n+1)^s} = \beta(s).
\]
El artículo prueba la irracionalidad de \(L(2, \chi_{-3})\), pero el método no puede adaptarse (o, de momento, nadie ha sabido hacerlo) para probar la irracionalidad de la constante de Catalan \(L(2, \chi_{-4})\), que es un problema abierto muy conocido.
Algunos comentarios sobre la demostración
Una gran parte de las demostraciones sobre la irracionalidad de algún número se basan en que los racionales no se pueden aproximar «bien» (con un error suficentemente pequeño en comparación con el tamaño del denominador) por otros racionales. Más en concreto, si \(\alpha = p/q \in \mathbb{Q}\) y tenemos otro racional \(a/b \ne \alpha\), se cumple
\[
\left| \alpha – \frac{a}{b} \right|
= \left| \frac{p}{q} – \frac{a}{b} \right|
= \left| \frac{pb-qa}{qb} \right|
\ge \frac{1}{qb}
\]
(para cualquier racional, el denominador siempre lo consideramos positivo). En particular, si, para \(\alpha \in \mathbb{R}\), existe una sucesión de racionales \(a_n/b_n\) (distintos del propio \(\alpha\)) tal que
\[
\left| \alpha – \frac{a_n}{b_n} \right|
= o\left( \frac{1}{b_n} \right),
\qquad n \to\infty,
\]
entonces \(\alpha \notin \mathbb{Q}\). Este resultado es muy útil y sencillo de aplicar para probar la irracionalidad de algunas constantes (por ejemplo, la de \(e\)). Además, si la velocidad de convergencia es suficientemente grande (no daremos aquí los detalles), también puede servir para probar la trascendencia (eso es lo que ocurre en el caso de la constante de Liouville, en el que las sumas parciales aproximan muy bien al número).
Pero, dada una constante \(\alpha\) cuya irracionalidad queremos probar, a menudo no es sencillo encontrar tal sucesión de racionales \(a_n/b_n\) que garantiza la irracionalidad.
Para el caso de \(\zeta(3)\), Apéry encontró la sucesión \(a_n/b_n\) que converge suficientemente rápido a \(\zeta(3)\) de manera casi «milagrosa» (pero, por ejemplo, no se ha logrado nada similar para otros \(\zeta(2k+1)\)). Comentemos a continuación algunos detalles.
En la demostración de Apéry intervienen los polinomios de Legendre, que se definen como
\[
P_n(x) = \frac{1}{n!} \left(\frac{d}{dx}\right)^n x^n(1-x)^n.
\]
Esos polinomios tienen coeficientes enteros, son muy conocidos y ya habían sido usados en muchos otros campos (en realidad, estos \(P_n(x)\) son un pequeño cambio de variable \(x \mapsto 2x-1\) sobre lo que habitualmente se denomina polinomios de Legengre). Asimismo, denotamos \(d_n = \operatorname{mcm}(1,2,\dots,n)\).
Apéry analiza en primer lugar la irracionalidad de \(\zeta(2)\), que se basa en que
\[
\int_0^1 \int_0^1 \frac{(1-t)^n P_n(s)}{1-st} \,ds \,dt
= \left(A_n+B_n \zeta(2)\right) d_n^{-2}
\]
con \(A_n, B_n \in \mathbb{Z}\). A partir de aquí se encuentra la sucesión \(a_n/b_n\) cuya rápida convergencia a \(\zeta(2)\) prueba su irracionalidad. Asimismo, la irracionalidad de \(\zeta(3)\) se basa en la expresión
\[
\int_0^1 \int_0^1 \frac{-\log(st)}{1-st} P_n(s) P_n(t) \,ds \,dt
= \left(A_n+B_n \zeta(3)\right) d_n^{-3}
\]
con \(A_n, B_n \in \mathbb{Z}\).
A grandes rasgos, en el trabajo de Calegari, Dimitrov y Tang, se da una condición más débil sobre ciertas sucesiones \(a_n/b_n\) que aproximan valores de funciones \(L\), y eso es lo que se usa para probar la irracionalidad de algunos números como \(L(2,\chi_{-3})\).
Obsérvese que, a partir de lo que hemos visto para \(\zeta(3)\) (aunque con la notación un poco cambiada, para seguir la de [3]), se puede definir una función
\[
P(x) := B(x) – \zeta(3) A(x) = \sum_{n=0}^{\infty} x^n (B_n – \zeta(3) A_n)
\]
donde los denominadores de \(A_n\) y \(B_n\) son \(d_n^3\), y las propiedades de \(P(x)\) están relacionadas con la irracionalidad de \(\zeta(3)\).
La irracionalidad de \(L(2,\chi_{-3})\) se basa en la expresión
\[
P(x) := B(x) – L(2,\chi_{-3}) A(x)
= \sum_{n=0}^{\infty} x^n \int_0^1 \int_0^1
\frac{9^n s^n t^n (1-s^3)^n (1-t^3)^n}
{(1+st+s^2t^2)^{2n+1}} \,ds \,dt,
\]
donde \(A(x)\) y \(B(x)\) son series cuyos coeficientes \(n\)-ésimos son números racionales con denominador \(d_n^2\).
La clave de la demostración en [3] es estudiar la holonomía de la función \(P(x)\), y analizar dónde está su primera singularidad. No vamos a dar ningún detalle más, pero sí mencionaremos que las funciones holonómicas son aquéllas que son soluciones de ecuaciones diferenciales cuyos coeficientes son polinomios; y, a su vez, tales funciones se expresan como series de potencias cuyos coeficientes satisfacen ciertas relaciones de recurrencia (del mismo orden que el de las ecuaciones diferenciales) con coeficientes polinómicos.
En principio, esto parece un camino bastante directo, pero la prueba completa ocupa más de 200 páginas. La razón es que el artículo requiere numerosos cálculos a medida, largos y complicados, para hacer estimaciones, y sobre el orden de las ecuaciones diferenciales involucradas en la holonomía (a este respecto, se utilizan algunas construcciones previas de Zagier [10]). Por el camino, aparecen gráficos tan atractivos como el que aquí mostramos:
Si esta entrada de la sección «Terra incognita» del blog del IMUS la hubiera escrito su responsable habitual, Juan Arias de Reyna, seguro que él podía haber explicado qué representa ese dibujo; yo me conformo con admirar su belleza.
De momento, el artículo sólo está publicado en arXiv, pero Frank Calegari ha impartido, en algunos seminarios de investigación, varias charlas que están disponibles en internet:
- The arithmetic of some Dirichlet \(L\)-values,
6 de junio de 2024, en las jornadas Visions in Arithmetic and Beyond: Celebrating Peter Sarnak’s Work and Impact (June 3-7, 2024) celebradas en la Princeton University: https://youtu.be/znBdPEyDScY - Searching for sequences: Irrationality beyond Apéry,
14 de septiembre de 2024, en el Experimental Mathematics Seminar de la Rutgers University: https://vimeo.com/1011777892
Y, aunque el manuscrito no ha sido aún completamente revisado, eminentes matemáticos expertos en el tema (no es mi caso, que no soy eminente ni experto) son muy optimistas respecto a la corrección del resultado. En particular, Wadim Zudilin, que estaba en contacto con los autores y desde hace tiempo era conocedor de sus intentos para llegar a la demostración, y a quien pregunté su opinón, amablemente me ha remitido los siguientes comentarios:
Already the method of establishing the irrationality, using “holonomicity bounds” and specific “analytic-arithmetic” optimisation for that, is a remarkable novelty in the area. There are some tough technical estimates to carefully check (and this will be of course properly done by the community and journal of submission in the nearest future), but the strategy of the proof is very convincing, not causing doubt about its validity. Notice that Apéry’s proof of the irrationality of \(\zeta(3)\) was also considered to be far from obvious and dependent on verification of certain specific technical bits: everything new undergoes similar concerns.
Agradecimentos. Agradezco a Jesús Guillera que me informara de la publicación en arXiv del artículo de Calegari, Dimitrov y Tang con la demostración de la irracionalidad de \(L(2,\chi_{-3})\), así como sus comentarios sobre las versiones preliminares de esta nota, que sin duda me han permitido mejorarla.
Referencias
[1] R. Apéry, Irrationalité de \(\zeta(2)\) et \(\zeta(3)\), Astérisque 61 (1979), 11-13.
[2] F. Beukers, A note on the irrationality of \(\zeta (2)\) and \(\zeta(3)\), Bull. London Math. Soc. 11 (1979), 268-272.
[3] F. Calegari, V. Dimitrov y Y. Tang, The linear independence of \(1\), \(\zeta(2)\), and \(L(2,\chi_{-3})\), arXiv, 2408.15403, 16 de septiembre de 2024 (la v2).
[4] Ó. Ciaurri, L. M. Navas, F. J. Ruiz y J. L. Varona, A simple computation of \(\zeta(2k)\), Amer. Math. Monthly 122 (2015), 444-451.
[5] Ó. Ciaurri, L. M. Navas, F. J. Ruiz y J. L. Varona, The computation of \(\zeta(2k)\), \(\beta(2k+1)\) and beyond by using telescoping series, Orthogonal Polynomials and Special Functions: In Memory of José Carlos Petronilho (K. Castillo y A. J. Durán, editores), Capítulo 3, Coimbra Mathematical Texts 3, Springer, 2024,
[6] P. R. Mercer, A Compact Capstone Course in Classical Calculus, Birkhäuser (Springer), Cham, 2023.
[7] I. Niven, A simple proof that \(\pi\) is irrational, Bull. Amer. Math. Soc. 53 (1947), 509.
[8] A. van der Poorten, A Proof that Euler missed…: Apéry’s proof of the irrationality of \(\zeta(3)\), an informal report, Math. Intelligencer 1 (1979), no. 4, 195-203.
[9] J. L. Varona, Recorridos por la Teoría de Números, 2.ª ed., Electolibris y Real Sociedad Matemática Española, Murcia, 2019.
[10] D. Zagier, Integral solutions of Apéry-like recurrence equations, Groups and Symmetries, 349-366, CRM Proc. Lecture Notes, vol. 47, Amer. Math. Soc., Providence, RI, 2009.
[11] W. V. Zudilin One of the numbers \(\zeta(5)\), \(\zeta(7)\), \(\zeta(9)\), \(\zeta(11)\) is irrational, Uspekhi Mat. Nauk 56 (2001), no. 4, 149-150 (en ruso); Russian Math. Surveys 56 (2001), 774-776 (en inglés).
Dejar una contestacion