インテジャーズ

INTEGERS

数、特に整数に関する記事。

メイナードのスモールギャップ論文におけるアイデアの簡単な紹介

整数論の研究者が合宿を行う『八王子数論セミナー』に参加してきました。
私が生まれた年から開催されている歴史あるセミナーで、今年のテーマは「素数の小さな間隔について」でした。

内容は、前半でセルバーグの篩の方法を学び、1つの応用として双子素数の逆数和が収束するという有名なブルンの結果を導出しました。
後半はメイナードの有名な論文 "Small gaps between primes" Ann. of Math. (2015) を読みました。

運営者や参加者の皆様のおかげで大変に勉強になったのですが、(詳細はそれなりの計算を伴うものの)メイナード論文における簡単なアイデアを(専門的にはあまり踏み込まずに)述べるだけだったら難しくないことがわかったので、ブログにしておこうと思い立ちました。

ハーディ・リトルウッドの素数k組予想

pp+2がともに素数であるような組(p,p+2)を双子素数とよびます。双子素数が無限に存在することを予想する双子素数予想は今も未解決の難問です。

双子素数があるのであれば、三つ子素数もあるのか?という疑問が浮かぶかもしれませんが、例えば素数の3つ組(p,p+2,p+6)(p,p+4,p+6)を三つ子素数とよぶ場合があります。どちらの型の三つ子素数についても無限に存在すると予想されていますが、未解決問題です。

(p,p+2,p+6)(p,p+4,p+6)は等間隔ではないので違和感があるかもしれませんし、むしろ等間隔な素数の3つ組(p,p+2,p+4)を三つ子素数とよびたくなるかもしれません。ただ、(p,p+2,p+4)が素数の3つ組であれば p, p+2, p+4の少なくとも1つは3の倍数になってしまうため、(3,5,7)しかないことが分かり、無限性を主張できる3つ組ではありません。

(p,p+2)には違和感を覚えなかったかもしれませんが、最も近いペアではないので、(p,p+1)の方が双子素数という名に相応しいという考え方もあり得ます。しかし、この場合も (p,p+1)が素数の2つ組であれば p, p+1の少なくとも1つは偶数になってしまうため、(2,3)しかないことが分かり、無限性を主張できる2つ組ではないことが分かりました。

他にも「いとこ素数」とか「セクシー素数」とか色々あるようですが、名称はともかく、3つ組をより一般の「k組」に拡張することを考えて、数学的に今興味を持っているのは次の設定です:kを正整数とし、k個の整数の組 \mathcal{H}=(h_1,\dots, h_k) をとる。このとき、素数k組、すなわち n+h_1, \dots, n+h_k が全て素数となるような整数nが無限に存在するための \mathcal{H} の条件を見つけよ。

一般の設定でもいいのですが、簡単のために、0\leq h_1 < h_2 <\cdots < h_k であると仮定しておきます。

先ほどの考察から \mathcal{H}=(0,1)\mathcal{H}=(0,2,4) は条件を満たしません。また、\mathcal{H}=(0,2)が条件を満たすだろうという予想が双子素数予想であり、同様に \mathcal{H}=(0,2,6) or =(0,4,6) の場合も条件を満たすだろうと予想されています。

(0,1)(0,2,4)はダメで、(0,2), (0,2,6), (0,4,6)は良さそうなわけですが、これらを分けているのは何でしょうか。

(0,1)には\bmod{2}で考えたときの剰余が全て現れています。また、(0,2,4)には\bmod{3}で考えたときの剰余が全て現れています:(0\bmod{3}, 2\bmod{3}, 4\bmod{3}) = (0\bmod{3}, 2\bmod{3}, 1\bmod{3}).

より一般に、ある素数 p に対して \mathcal{H}の各成分についてそれが属する \bmod{p}剰余類を考えると、全ての剰余類 0\bmod{p}, 1\bmod{p}, \dots, p-1\bmod{p}が現れる場合を考えてみましょう。この場合、どんな整数nに対しても(n+h_1,\dots, n+h_k)はどれか1つの成分がpの倍数となってしまいます。よって、(n+h_1,\dots, n+h_k)が素数k組となるようなnは高々有限個しか存在せず、条件を満たしません。

なので、もし\mathcal{H}が所望の条件を満たすのであれば、任意の素数 pに対して「\mathcal{H}の各成分についてそれが属する \bmod{p}剰余類を考えると、ある\bmod{p}剰余類はその中に現れない」を満たすことが必要であることが分かりました。これを満たす\mathcal{H}のことを専門用語で「許容k組」とよびます。

(0,2)は許容2組で、(0,2,6), (0,4,6)は許容3組です。与えられた\mathcal{H}が許容k組かをチェックするには無限に存在する素数について条件チェックをする必要があるので不可能な気が一瞬するかもしれませんが、実際は p\leq kなる素数 pに対してチェックすれば十分です。というのも、もし p>kであれば、そもそも\bmod{p}剰余類の全て( p個)を作ることはできませんので。(0\bmod{2},2\bmod{2})=(0\bmod{2},0\bmod{2})より(0,2)は許容2組。(0\bmod{2},2\bmod{2},6\bmod{2})=(0\bmod{2},0\bmod{2},0\bmod{2}), (0\bmod{3},2\bmod{3},6\bmod{3})=(0\bmod{3},2\bmod{3},0\bmod{3})より(0,2,6)は許容3組。(0\bmod{2},4\bmod{2},6\bmod{2})=(0\bmod{2},0\bmod{2},0\bmod{2}), (0\bmod{3},4\bmod{3},6\bmod{3})=(0\bmod{3},1\bmod{3},0\bmod{3})より(0,4,6)は許容3組。

それでは、この「許容」性が所望の条件であると言えるでしょうか?この質問に対する答えがYesだというのが有名な「ハーディ・リトルウッドの素数k組予想」です。

ハーディ・リトルウッドの素数k組予想 kを正整数とし、\mathcal{H}=(h_1,\dots,h_k)を許容k組とする。 このとき、n+h_1, \dots, n+h_k が全て素数となるような整数nが無限に存在する。

k\geq 2の場合にこの予想が解かれている具体的な\mathcal{H}は、現在のところ1つも知られていません。予想における無限性が特定の\mathcal{H}に対して成立することを「\mathcal{H}に対する素数k組予想が成り立つ」のように表現することにします。

メイナード論文の結果

数学の研究においては、目標となる未解決問題が解けそうにない場合、その問題をうまく弱めたり周辺の問題を考えることによって、どこまでなら現時点の人類の力で証明できるのかを見極めていきます。

ハーディ・リトルウッドの素数k組予想についても難攻不落の未解決問題であるため、これまでに様々な弱められた主張や周辺の問題が研究されてきました*1。メイナードは論文 "Small gaps between primes" において、ある種の「ハーディ・リトルウッドの素数k組予想を弱めた主張」を証明しました。では、一体どのような「弱めた主張」が示せるようになったのでしょうか。

前節で私はわざとらしくも「この予想が解かれている具体的な\mathcal{H}は、現在のところ1つも知られていません。」と、「具体的な」という形容動詞をつけていました。具体的な\mathcal{H}は得られなくとも、「予想の成立する\mathcal{H}がある程度存在することは確かである」というタイプの定理が得られれば、途中経過としては面白くないでしょうか。

簡単な話では「無理数の無理数乗は無理数とは限らない」ことの非構成的証明を彷彿とさせますし、有名な大成果ではズディリンの「\zeta(5), \zeta(7), \zeta(9), \zeta(11)のうちの少なくとも1つは無理数である」を思い出します。

メイナードが実際に示した定理は次のようなものです。

定理(メイナード) kを正整数とする。kから正整数r_kを定める(具体的に定義されているが、定め方はここでは省略)。このとき、任意の許容k\mathcal{H}=(h_1,\dots,h_k)に対して、n+h_1, \dots, n+h_k のうちの少なくともr_k個が素数となるような整数nが無限に存在する。

r_kkに比べて一般に小さくなってしまいます。本当は n+h_1, \dots, n+h_k の全てが素数となるnが無限にあることを言いたいのですが、それは諦めて、kに比べて少なくなるけれども、少なくともr_k個は素数となるようなnであれば無限に存在するということをメイナードは証明したのです。

許容k\mathcal{H}の部分列\mathcal{H}'を考えて、\mathcal{H}'m組(m < k)であるとすると、\mathcal{H}'も許容m組であることは定義から明らかです。したがって、鳩の巣原理的に考えると、メイナードの定理から「素数r_k組予想が成立するような\mathcal{H}の部分列\mathcal{H}'が必ず存在する」ことが分かります。

応用上は正整数mが勝手に与えられたときに、十分大きいkをとればm\leq r_kとできて欲しいです。これはr_kの定義に基づいて純粋に解析的な議論によって実行されており、ある絶対定数C>0によって、k=\lceil Cm^2e^{4m}\rceilとできることが示されています。

このような関係にあるm, kを考えて、kよりも十分大きい整数rをとり、r個(たくさん)の非負整数を好きに持ってきます(大きさ順に並べて列とする)。すると、その中にはある程度たくさんの許容k組が部分列としてありますが、それらの部分列の中には先ほどの鳩の巣原理的考察から素数m組予想が成立するような部分列が必ず格納されています。このような組合せ的考察を通して、次の定理が結論できます。

定理(メイナード) mを正整数とする。このとき、mのみに依存する r \in \mathbb{Z}_{>0}および d\in (0,1)が存在して、以下が成立する:整数列 0\leq a_1 < a_2 < \cdots < a_r を任意にとって、A とする。Aの項数mの部分列全体の集合をA_mとし、Aの項数mの部分列であって、それが許容m組をなし、その組に対して素数m組予想が成り立つようなもの全体をA_m^{(\mathrm{HL})}とする。このとき、
\displaystyle\frac{\#A_m^{(\mathrm{HL})}}{\#A_m}\geq d
が成り立つ。

標語的に言うと次のようになるでしょうか:大量の非負整数を用意すれば、その中のm個の非負整数を選んでm組を作ると、一定の割合以上でその組に対して素数m組予想が成立していることは確かである(が、あなたが選んだ具体的なm組が予想を満たしているかは確かめるすべがない)。

長いので、もっと標語的にすると:少なくとも正のパーセントでハーディ・リトルウッドの素数k組予想は正しい。

ちなみに、n+h_1, \dots, n+h_k のうちの少なくともm個が素数であるような整数nが無限に存在すれば、さっきのm, kの関係は実際はr_k\geq m+1を満たすように選ばれているので、p_nを小さい順に数えてn番目の素数として、

\displaystyle \liminf_{n\to\infty}(p_{n+m}-p_n)\leq h_k-h_1

が得られます。k以下の素数の個数を\pi(k)で表すとき、(p_{\pi(k)+1},\dots,p_{\pi(k)+k})は明らかに許容k組なので、素数定理から p_{\pi(k)+k}-p_{\pi(k)+1} \ll k\log k \ll m^3e^{4m} と評価できるため、次の結果となります:

定理(メイナード) mを正整数とする。このとき、
\displaystyle \liminf_{n\to\infty}(p_{n+m}-p_n)\ll m^3e^{4m}.

これらはどちらも张益唐による有名な仕事では得られていなかった成果です。ハーディ・リトルウッドによる素数k組への貢献、上記定理(有界性)がm \geq 2で未解決であったこと、篩法の新しい重みに対する計算実行などの重要性を考えると、例の"600"という数値(これはr_k\geq 2となる許容k組でh_k-h_1ができるだけ小さくなるものをコンピューターでサーチすることになり、具体的には特定の許容105組でh_1=0, h_{105}=600となるものを使う)は些細なことかなと感じました。

メイナード論文の簡単なアイデア

素数の全体集合を\mathbb{P}と表すことにし、その特性関数を \chi_{\mathbb{P}}とします。つまり、nが素数であれば、\chi_{\mathbb{P}}(n)=1であり、そうでなければ \chi_{\mathbb{P}}(n)=0です。

この記号設定の下では、素数の無限性は

\displaystyle \sum_{n=1}^{\infty}\chi_{\mathbb{P}}(n)=\infty

と表すことができます。全部足すのではなく、正整数列を適当に

\mathbb{Z}_{>0} = [a_0,a_1)\cup [a_1,a_2)\cup [a_2,a_3)\cup\cdots

と分割して、十分大きいN

\displaystyle \sum_{n\in [a_N,a_{N+1})}\chi_{\mathbb{P}}(n)>0

が言えれば、もちろん同じ結論が得られます。どのような分割でこれが実現できるかはア・プリオリには分かりませんが、実際は全ての整数N\geq 2について、

\displaystyle \sum_{n\in[N,2N)}\chi_{\mathbb{P}}(n)>0

が成り立つというのがベルトランの仮説とよばれる定理です。よって、例えばa_N=2^Nをとることができます。


k\geq 2として、\mathcal{H}=(h_1,\dots,h_k)を許容k組とします。n+h_1,\dots,n+h_kが全て素数になることは、

\displaystyle \prod_{i=1}^k\chi_{\mathbb{P}}(n+h_i)=1\tag{1}

と同値です。ですので、ハーディ・リトルウッドの素数k組予想を解きたければ、例えば、十分大きい整数Nに対して

\displaystyle \sum_{n\in[N,2N)}\prod_{i=1}^k\chi_{\mathbb{P}}(n+h_i)>0

を示すことができれば十分です。ですが、もちろんこの予想は未解決ですので、現状この和を満足に計算する手法は確立されていません。


メイナードの結果はハーディ・リトルウッドの素数k組予想そのものではなく、それを弱めたものでした。ですので、n+h_1,\dots,n+h_kの全てに素数になってもらうことは諦めており、少なくとも幾つかは素数になるという条件に緩めています。今、\rhoを正整数として、n+h_1,\dots,n+h_kの少なくとも\rho+1個が素数になって欲しいとしましょう。これは先ほどのように特性関数 \chi_{\mathbb{P}} を用いて表現できるでしょうか。

実は単純な表現が可能で、

\displaystyle \sum_{i=1}^k\chi_{\mathbb{P}}(n+h_i) > \rho\tag{2}

と表現することができます。(1)(2)を見比べると、積が和に置き換わっています!個人的にはこれが1つの大きなポイントだと感じています。

特定のnに対して(2)が確実に成立して欲しいので、メイナード型の結果を帰結したければ、十分大きい整数Nに対して

\displaystyle \sum_{n\in[N,2N)}\left(\sum_{i=1}^k\chi_{\mathbb{P}}(n+h_i)-\rho\right)>0

を示すことができれば十分です。ただ、これは実際には期待できません(n+h_i達が全然素数じゃないときにも毎回 \rhoを背負わせていては、素数は少数派なのだから和が正になるはずがない)。

しかし、このアイデアは非負値w_nn毎に用意して

\displaystyle \sum_{n\in[N,2N)}\left(\sum_{i=1}^k\chi_{\mathbb{P}}(n+h_i)-\rho\right)w_n>0\tag{3}

を示す方針にしても依然として通用します。実際、この和が正になれば、あるn\in[N,2N)(2)が成り立つことは背理法で即座に従います。よって、もし\sum_{i=1}^k\chi_{\mathbb{P}}(n+h_i)が大きそうなときには値が大きく、\sum_{i=1}^k\chi_{\mathbb{P}}(n+h_i)が小さそうなときは0に近いようなw_nを構成することができれば、メイナード型の結果が得られることになります。

このようなアイデア自体はゴールドストン・ピンツ・ユルドゥルムによる先行研究でも用いられており、彼らが採用した重みw_n

\displaystyle w_n=\left(\sum_{\substack{d\mid \prod_{i=1}^k(n+h_i) \\ d < R}}\lambda_d\right)^2,

\displaystyle \lambda_d=\mu(d)\left(\log\frac{R}{d}\right)^{k+l}

と定義されます。ここで、RはとあるNより小さい量で、篩計算で重要な効果を及ぼすパラメーターです。和が二乗の形をしているのもセルバーグの篩以来の伝統的な有効な形です。lkよりも小さい正整数で、これを付けるというピンツの発想が1つの鍵だったようです。


张益唐の仕事はこの篩に基づいていますが、メイナードはセルバーグの眠ったアイデアを目覚めさせ、ゴールドストン・ピンツ・ユルドゥルムの\lambda_dを多変数化し、より一般の形をした重みを考えて計算を遂行しました。

メイナードの計算した重みw_n

\displaystyle w_n=\left(\sum_{d_i\mid n+h_i (\forall i)}\lambda_{d_1,\dots,d_k}\right)^2,

\displaystyle \lambda_{d_1,\dots,d_k}=\left(\prod_{i=1}^k\mu(d_i)d_i\right)\sum_{\substack{(r_1,\dots,r_k)\in\mathbb{Z}_{>0}^k \\ d_i \mid r_i (\forall i)}}\frac{\mu(\sum_{i=1}^kr_i)}{\prod_{i=1}^k\varphi(r_i)}F\left(\frac{r_1}{\log R},\dots,\frac{r_k}{\log R}\right)

という形をしています*2(実際はWトリックとよばれる計算テクニックを使えるように修正します)。ここで、Fk変数のC^1級関数で、\{(x_1,\dots, x_k)\in[0,1]^k \mid x_1+\cdots +x_k \leq 1\}に台を持つようなものであり、論文の後ろの方でr_kを評価する際に最適化を試みます。

どれほどの試行錯誤が必要かは分かりませんが、適切な重みが決まってしまえば、あとは(3)を目指して計算を実行するだけです。ただ、

\displaystyle  \sum_{n\in[N,2N)}\left(\sum_{i=1}^k\chi_{\mathbb{P}}(n+h_i)-\rho\right)w_n =  \sum_{n\in[N,2N)}\sum_{i=1}^k\left(\chi_{\mathbb{P}}(n+h_i)\right)w_n-\rho\sum_{n\in[N,2N)}w_n

と分けることができるので、2つの和をそれぞれ計算すればよいです。まずは

\displaystyle \sum_{n\in[N,2N)}w_n

を計算することになります。w_nも和で定義されているため、和の順序交換から初めて計算が進んでいきます。詳細はもちろんここでは省略します*3


さて、素数k組の検出はどうやっていいのか全くわからないですが、積(1)から和(2)への移行のおかげで、和においては線形性が成り立つため、2つ目の和はk個の和に分けられます:

\displaystyle \sum_{n\in[N,2N)}\sum_{i=1}^k\left(\chi_{\mathbb{P}}(n+h_i)\right)w_n=\sum_{i=1}^k\sum_{n\in[N,2N)}\left(\chi_{\mathbb{P}}(n+h_i)\right)w_n,

つまり、

\displaystyle \sum_{n\in[N,2N)}\left(\chi_{\mathbb{P}}(n+h_i)\right)w_n

を1つ目の和と同じように計算できればOKとなります。この段階に至ると、特性関数の部分は1つ(\chi_{\mathbb{P}}(n+h_i))しか相手にしなくてよいのです。もちろん、何もなかった1つ目の和に比べれば特性関数の部分が1つあるので、何かしらの素数分布の情報が必要となります。でも、1つならなんとかなりそうです。実際にはh_iの素性に依らずに処理できるようにある程度強い結果が必要になりますが、ボンビエリ・ヴィノグラードフの定理を使います(実は素数のlevel of distributionsが1/2よりずっと小さくても問題ないという点がメイナードの1つの驚きポイントではある)。

これぐらいの説明をもって「簡単な紹介」と考えています。

*1:1つだけ例をあげるなら、(p,p+2)が双子素数であるという条件を弱めて、pは素数なんだけれども、p+2は素数または「2つの素数の積」であるというペアを考えることにしましょう。すると、このようなペアが無限に存在するというのが、有名な「陳の定理」です。

*2:\lambda_{d_1,\dots,d_k}の形が複雑に見えますが、篩の計算を追うと自然にこの形が出てくることが一応分かります。

*3:ちなみにここの計算が私の発表担当でした。