2016-03-16

Oliver-Soundararajanのプレプリントについて

定理解説

3/11にarXivに投稿されたプレプリント

R. J. L. Oliver, K. Soundararajan, Unexpected biases in the distribution of consecutive primes, preprint.

がFields賞受賞者であるTerence Taoのブログで取り上げられたり("very nice"と書いてある！)、natureで記事が書かれたりするなどして注目を浴びまくっています。

私自身は題名だけ見て中身は見ていなかったのですが、先ほど*1twitterで情報が流れてくるのを見て気になったので話題のプレプリントを少し眺めてみました。

しっかり計算は追えていませんし、理解できていない部分も多いですが、現段階における理解をまとめてみたいと思います(まだ、専門家による査読を受けていないプレプリントのため、内容を全面的に信用することはできません)。

追記) その後、PNASに査読付きで掲載されています。

前提知識の復習

素数定理

今回の話題は素数の分布に関するものです。素数の分布については素数定理と呼ばれる定理が知られています。 $\pi (x)$ で $x$ 以下の素数の個数を表し、対数積分 $\mathrm{Li}(x)$ を $\displaystyle \int_2^x\frac{dy}{\log y}$ で定義すると素数定理は以下のように表すことができます：

素数定理 $\ \ \ \displaystyle \pi (x) \sim \mathrm{Li}(x), \ \ \ (x \to \infty)$

ここで、 $\sim$ は２つの関数の比の極限が $1$ となることを表す記号です。以下、漸近挙動は全て $x \to \infty$ で考えます。

素数定理については素数定理 - INTEGERS

素数定理の証明については素数定理の証明 - INTEGERSを参照してください。

標語的に言えば「 $\pi(x)$ は $\mathrm{Li}(x)$ に近づく。」とか「 $x$ が十分大きければ $\pi (x)$ と $\mathrm{Li}(x)$ は殆ど等しい。」などと表現できるかもしれません。しかし、今回重要となる視点は、素数定理は「比をとれば近づく」としか言っていないということです。

比で見ると近づく場合に差を考えても近づくとは限りません。例えば、隣合う素数の比の極限は $1$ になりますが、差の上極限は発散します。

Dirichletの算術級数定理

素数定理が証明されたことによって、とりあえず素数の分布に関する大きな情報が得られました。勿論、もっと精密な分布を知りたいと思うのは自然であり、様々な研究がなされています(Riemann予想も関係する)。一方、特別な種類の素数に限定してその素数の分布を調べるという研究の方向性もあります。そのような方向の最初の大きな成果が(素数定理より前の結果ですが)Dirichletの算術級数定理です。

簡単な例で考えてみましょう。全ての自然数は $3$ で割った余りが $0$ か $1$ か $2$ かの３通りに分類することが出来ます。 $3$ の倍数であるような素数は $3$ のみなので、 $3$ 以外の素数は $3$ で割った余りが $1$ か $2$ の２通りに分類されることが分かります。

このとき、 $3$ で割った余りが $1$ であるような素数と $3$ で割った余りが $2$ であるような素数はそれぞれどのように分布しているのだろうか？という疑問が生じます。一番最初に気になるのは「無数に存在するのだろうか？」ということですが、無数に存在するというのがDirichletの算術級数定理です。一般の形で述べてみましょう：

Dirichletの算術級数定理
$q$ を自然数、 $a$ を $q-1$ 以下の非負整数とし、 $q, a$ は互いに素であると仮定する。このとき、 $q$ で割った余りが $a$ となるような素数は無数に存在する。

tsujimotter氏による記事
tsujimotter.hatenablog.com
が参考になります*2。

算術級数の素数定理

無数に存在することが分かったので、更に精密な分布を知りたくなります。例えば、素数定理レベルの漸近挙動が分かれば嬉しいですがそれは既に証明されています。
$\pi (x; 3, 1)$ を $x$ 以下の $3$ で割った余りが $1$ であるような素数の個数、 $\pi (x; 3, 2)$ を $x$ 以下の $3$ で割った余りが $2$ であるような素数の個数とすると

$\displaystyle \pi(x; 3, 1) \sim \pi (x; 3, 2) \sim \frac{1}{2}\mathrm{Li}(x)$

が成り立ちます。素数定理と合わせることによって、「 $3$ で割った余りが $1$ であるような素数と余りが $2$ であるような素数は同じ割合で分布する」ことが分かりました。

一般の場合には次の定理が成り立ちます：

算術級数の素数定理 $q, a$ は算術級数定理と同じものとする。 $\pi (x; q, a)$ を $x$ 以下の $q$ で割った余りが $a$ であるような素数の個数とする。このとき、

$\displaystyle \pi (x; q, a) \sim \frac{1}{\varphi (q)}\mathrm{Li}(x)$

が成り立つ。

やはり、漸近挙動は $q$ で割った余りである $a$ には依っていないことに注意します。なお、 $\varphi(n)$ はEulerのトーシェント関数です。

追記) 算術級数の素数定理の証明を書きました：
integers.hatenablog.com

Chebyshevの偏り

さて、算術級数の素数定理によって「 $3$ で割った余りが $1$ であるような素数と余りが $2$ であるような素数は同じ割合で分布する」ことが分かりましたが、それはあくまで比をとってのことです。深く考えなければ $3$ で割った余りが $1$ であることと余りが $2$ であることの間には大差がないような気がしますので、 $3$ で割った余りが $1$ であるような素数と $2$ であるような素数の個数の間に偏りがなくても直観には反さない気がします。しかしながら、実際に数値を見てみると偏りがあることが分かります。例えば、殆どの $x$ に対して

$\displaystyle \pi(x; 3, 2) > \pi(x; 3, 1)$

が成り立つのです！！このような現象はChebyshevが最初に観察したため、Chebyshevの偏りと呼ばれています。数値例として最初に挙げたプレプリントを参照すると

$\displaystyle \pi (x_0; 3, 1) = 499829, \ \pi(x_0; 3, 2)=500170$

と最初の $100$ 万個の素数では(すなわち、 $\pi(x_0)=10^6$ )確かに余りが $2$ であるような素数の方が多いことがわかります。

とは言っても整数の世界は深遠なのであって、高々 $100$ 万個の素数を調べたぐらいで一般の法則を予想してしまうことが余りに危険であることは歴史が証明しています。

幸い、多くの数学者の努力を経て、RubinsteinとSarnakによって $\pi (x; 3, 2) > \pi(x; 3, 1)$ が99.9%の $x$ に対して成り立つことが1994年に証明されています。100%でないことは真に驚くべきことであって、不等号の向きが逆転するような整数 $x$ が無数に存在することまで示されているのです！！！

なお、 $q=10$ の場合で考えると「一桁目」を固定した素数の分布を考察することになりますが、この場合のChebyshevの偏りは

「一桁目が $3, 7$ である素数は一桁目が $1,9$ である素数より多く現れる」

となります。「何故、 $3, 7$ なのか？」という疑問がわくと思いますが、ちゃんと理由があります。一般に $\pi(x;q, a)$ で考えた場合、 $a$ が法 $q$ で平方非剰余になる場合が平方剰余になる場合より多く現れる偏りがあることが分かっています。平方剰余については平方剰余の相互法則 - INTEGERSを参照してください。

彼らは何を発見したか

以上が前提知識です。それでは、OliverとSoundararajanはどのような新発見をしたのでしょうか？

彼らはChebyshevの偏りからもう一歩踏み込んで、「連続する素数の剰余を指定したときどのように分布するだろうか？」ということを考察しました。

例えば、 $(p_1, p_2)$ を $(151, 157)$ のような連続した素数としましょう( $3$ は除外)。このとき、 $p_1$ や $p_2$ それぞれに関しては $3$ で割った余りは $1$ か $2$ の２通りですが、ペアとしては

$\displaystyle (p_1, p_2) \equiv (1, 1), \ (1, 2), \ (2, 1), \ (2, 2) \pmod{3}$

の４通りがあることが分かります。例えば、 $(151, 157)$ は $3$ で割ると $(1, 1)$ です。

素数のペアをこのように４通りに分類して、（小さい方の素数が） $x$ 以下の個数をそれぞれ

$\pi (x; 3, (1, 1)), \ \pi(x; 3, (1, 2)), \ \pi(x; 3, (2, 1)), \ \pi(x; 3, (2, 2))$

と表すと、この場合の素数定理は

$\pi (x; 3, (1, 1)) \sim \pi(x; 3, (1, 2)) \sim \pi(x; 3, (2, 1)) \sim \pi(x; 3, (2, 2)) \sim \frac{1}{4}\mathrm{Li}(x)$

となります。従って、この４つが偏りなく分布していても驚くには値しないと思いますが、彼らの行った数値実験はア・プリオリには予想できそうもないデータを与えました。先ほどと同じく最初の $100$ 万個の素数におけるデータです：

$\begin{equation}\begin{split} &\color{red}{\pi(x_0; 3, (1, 1)) = 215873} \\ &\pi(x_0; 3, (1, 2)) = 283957 \\ &\pi(x_0; 3, (2, 1))=283957 \\ &\color{red}{\pi(x_0; 3, (2, 2)) = 216213}\end{split}\end{equation}$

彼らが何を発見したかを明言する前に、 $q=10$ の場合にも同様のデータを眺めてみましょう。こちらは最初の $1$ 億個の素数をサーチしたようです（ $\pi (x_0)=10^8$ ）：

$\begin{equation}\begin{split} &\color{red}{\pi(x_0; 10, (1, 1))=4623042} \\ &\pi(x_0; 10, (1, 3))=7429438 \\ &\pi(x_0; 10, (1, 7))=7504612 \\ &\pi(x_0; 10, (1, 9))=5442345 \\ &\pi(x_0; 10, (3, 1))=6010982 \\ &\color{red}{\pi(x_0; 10, (3, 3))=4442562} \\ &\pi(x_0; 10, (3, 7))=7043695 \\ &\pi(x_0; 10, (3, 9))=7502896 \\ &\pi(x_0; 10, (7, 1))=6373981 \\ &\pi(x_0; 10, (7, 3))=6755195 \\ &\color{red}{\pi(x_0; 10, (7, 7))=4439355} \\ &\pi(x_0; 10, (7, 9))=7431870 \\ &\pi(x_0; 10, (9, 1))=7991431 \\ &\pi(x_0; 10, (9, 3))=6372941 \\ &\pi(x_0; 10, (9, 7))=6012739 \\ &\color{red}{\pi(x_0; 10, (9, 9))=4622916}\end{split}\end{equation}$

読み取れることはいくつかあるかと思いますが、最大の特徴は

連続する素数の剰余が等しい場合の方が等しくない場合に比べて出現する頻度が少ない

ということです。

これが、今まで他の数学者によっては指摘されていなかった新しい発見です。

Oliver-Soundararajanの予想

とは言っても、最初の $1$ 億個の素数というのは無数に存在する素数全体から見れば"とても小さい素数"です。数値データからだけでこのような偏りが一般的に存在すると予想することは普通しません(数学者のいう"予想"は強い根拠がある場合のみに用いられる傾向があります)。根拠については後で述べることにして、彼らはもっと精密な予想を立てています(数値データを与えただけの論文ではありません！！)：

予想（Oliver-Soundararajan (Conjecture 1.1の非常に特別な場合)） $q$ を $3$ 以上の整数とし、 $a, b$ を $\bmod{q}$ における $q$ と互いに素な剰余とする。このとき、

$\displaystyle {\small \pi(x; q, (a, b)) = \frac{\mathrm{Li}(x)}{\varphi (q)^2}\left( 1+\frac{\varphi (q)}{2}\left( \frac{1}{\varphi (q)}-\delta_{a b}\right) \frac{\log \log x}{\log x} + O\left( (\log x)^{-\frac{7}{4}}\right) \right)}$

が成り立つ。ここで、 $\delta_{ab}$ はKroneckerのデルタ。

この予想は $\pi(x; q, (a, b))$ に関する素数定理よりも精密な漸近公式を与えるものです。主要項のみをみても $a=b$ の場合とそうでない場合で差がありませんでしたが、第二項まで考慮するとKroneckerのデルタの部分から差が生じることが分かります。すなわち、この予想は先ほどの数値データから読み取った偏りのより正確な表現を与えることがわかります。

実際、先ほど赤字で主張したような漠然としたものよりも強いことを言っていて、主要項が一定であることから「データの桁数が異なる程の偏りはない」とか、第二項の形から「 $a=b$ のもの同士を比較すればどれも大体同じぐらいで、 $a\neq b$ のもの同士を比較しても大体同じぐらい」といったことまで分かります。「いや、同じではない」という場合は第三項目以降の寄与と考えることが出来るでしょう。

この記事では導出までは解説しませんが、第三項は

$\displaystyle \frac{\mathrm{Li}(x)}{\varphi (q)^2}c_2(q; (a, b))\frac{1}{\log x}$

で与えられ、 $a=b$ のときは

$\displaystyle c_2(q; (a, a)) = \frac{\varphi (q)\log (q/2\pi)+\log 2\pi}{2}-\frac{\varphi (q)}{2}\sum_{p \mid q}\frac{\log p}{p-1}$

です。これは $a$ に依らない量のため、例えば先ほどの $q=10$ の場合のデータで

$\displaystyle \pi(x_0; 10, (1, 1)) ≒ \cdots ≒ \pi(x_0; 10, (9, 9)) ≒ 4.5\times 10^6$

と大体近い値であることが納得できます。一方で、

$\displaystyle \pi(x_0; 10, (1, 3)) = 7429438, \ \pi(x_0; 10, (1, 9))=5442345$

は同じ $a \neq b$ の場合であるにも関わらず偏りがあります。これは $a \neq b$ のときの第三項が $a, b$ に依っており、第二項に出てくる $\log \log x$ の成長スピードが非常に遅くて $1$ 億個の素数レベルでは第三項の寄与を無視できないということなのでしょう。はるかに大きいデータを見れば漸近していくはずです(予想が正しければ)。

また、 $c_2(q; (a, b))=c_2(q; (-b, -a))$ が成り立つことを示せるため、

$\displaystyle \pi(x_0; 10, (1, 3)) = 7429438, \ \pi(x_0; 10, (7, 9))=7431870$

はかなり近い数値になっているのが納得いくのです。

要は、彼らの主張する厳密な意味での予想はConjecture 1.1の漸近公式なのであって、或る意味ではそれ以上でもそれ以下でもない*3ということです。

さて、予想の根拠ですが、次のような２つの手法がよく用いられます：

既に成り立つと信じられている他の予想から導く
Heuristicな議論

今回はこの両方ともを用いて予想を導出しています(別の予想を仮定して厳密に証明しているわけではない)。これらの手法では予想が正しいことの証明にはならないのですが、一定の根拠を与えるだけでなく、上記予想のような何で思いついたか一見分からないような精密な係数を導くことが出来ることがあります*4。

細かい計算はプレプリントに書いてあるので、この記事では

「何故 $\delta_{ab}$ の項が現れるのか」

という最も気になる部分に焦点を充てて解説を試みます。

Hardy-Littlewood予想

素数分布に関するHardy-Littlewood予想と呼ばれるものがたくさん存在するのですが、特に「素数 $k$ 組予想」と呼ばれるものを扱います(以下のステイトメントにおける $\#\mathcal{H}$ が $k$ です)：

Hardy-Littlewoodの素数 $k$ 組予想
$\mathcal{H}$ を整数からなる有限集合とし、 $\mathbf{1}_{\mathcal{P}}$ を素数で $1$ を返し、そうでなければ $0$ を取るような特性関数とする。このとき、

$\displaystyle \sum_{n \leq x}\prod_{h \in \mathcal{H}}\mathbf{1}_{\mathcal{P}}(n+h)=\mathfrak{S}(\mathcal{H})\int_2^x\frac{dy}{(\log y)^{\#\mathcal{H}}}+O(x^{\frac{1}{2}+\varepsilon})$

が成り立つ。ただし、 $\mathfrak{S}(\mathcal{H})$ は

$\displaystyle \mathfrak{S}(\mathcal{H}) := \prod_p \left( 1-\frac{\#(\mathcal{H} \bmod{p})}{p}\right) \left( 1-\frac{1}{p} \right)^{-\#\mathcal{H}}$

で定義される。 $p$ は素数であり、 $\#(\mathcal{H} \bmod{p})$ は $\mathcal{H}$ の元の法 $p$ における剰余類の個数

$\mathcal{H}=\{0, 2\}$ の場合を考えると双子素数予想よりも強い「双子素数に関する素数定理」となります。双子素数については双子素数予想 - INTEGERSを参照してください。

上記予想がプロトタイプですが、実際に今回関係するのは次の算術級数に対する修正されたHardy-Littlewoodの素数 $k$ 組予想(MHL予想)です：

MHL予想　任意の $h \in \mathcal{H}$ に対して $(h+a, q)=1$ なる条件を満たす $a$ を考える*5。このとき、

$\displaystyle {\small \sum_{\substack{n \leq x \\ n \equiv a \pmod{q}}}\prod_{h \in \mathcal{H}}\left( \mathbf{1}_{\mathcal{P}}(n+h) -\frac{q}{\varphi (q)\log n} \right) \sim \mathfrak{S}_{q, 0}(\mathcal{H})\left( \frac{q}{\varphi (q)}\right)^{\#\mathcal{H}}\frac{1}{q}\int_2^x\frac{dy}{(\log y)^{\#\mathcal{H}}}}$

が成り立つ。ここで、 $\mathfrak{S}_{q, 0}(\mathcal{H})$ は

$\displaystyle \mathfrak{S}_{q, 0}(\mathcal{H}) := \sum_{\mathcal{T} \subset \mathcal{H}}(-1)^{\#(\mathcal{H}\setminus \mathcal{T})}\mathfrak{S}_q(\mathcal{T})$

および

$\displaystyle \mathfrak{S}_q(\mathcal{H}) := \prod_{p \nmid q} \left( 1-\frac{\#(\mathcal{H} \bmod{p})}{p}\right) \left( 1-\frac{1}{p} \right)^{-\#\mathcal{H}}$

によって定義される。

Heuristicな議論

それではMHL予想を用いたheuristicな議論によるOliver-Soundararajanの予想の導出の大まかな流れを追ってみましょう。

まず、連続する２つの素数のギャップ $h$ を固定して考えます。例えば、 $151, 157$ の場合は $h=6$ です。今の設定としては剰余となる $a$ , $b$ を固定しているので、 $h \equiv b-a \pmod{q}$ を満たします。

そうすると、(小さい方の素数が) $x$ 以下の差が $h$ であるような連続する素数のペア $(p_1, p_2)$ であって、 $(p_1, p_2) \equiv (a, b) \pmod{q}$ となるようなものの個数は

$\displaystyle \sum_{\substack{n \leq x \\ n \equiv a \pmod{q}}}\mathbf{1}_{\mathcal{P}}(n)\mathbf{1}_{\mathcal{P}}(n+h)\prod_{\substack{0 < t < h \\ (t+a, q)=1}}\left( 1-\mathbf{1}_{\mathcal{P}}(n+t) \right)$

と表すことができることがわかります( $0$ でない項が現れたとき、左側の部分から $(n, n+h)$ が素数のペアであることがわかり、右側の積の部分から $n$ と $n+h$ の間に $q$ と互いに素な素数がないことが保証されます)。

ここで、素数であるかどうかの確率を付加した特性関数

$\displaystyle \widetilde{\mathbf{1}}_{\mathcal{P}}(n):=\mathbf{1}_{\mathcal{P}}(n)-\frac{q}{\varphi (q)\log n}$

を導入します。これを用いて上の式を書き直すと

$\begin{equation}\begin{split}&\sum_{\substack{n \leq x \\ n \equiv a \pmod{q}}}\left(\frac{q}{\varphi (q)\log n}+ \widetilde{\mathbf{1}}_{\mathcal{P}}(n) \right) \left( \frac{q}{\varphi (q)\log (n+h)}+\widetilde{\mathbf{1}}_{\mathcal{P}}(n+h) \right) \\ &\times \prod_{\substack{0 < t < h \\ (t+a, q)=1}}\left( 1-\frac{q}{\varphi (q)\log (n+t)}-\widetilde{\mathbf{1}}_{\mathcal{P}}(n+t) \right)\end{split}\end{equation}$

となります。これを展開すれば、 $\log n$ と $\log (n+h)$ と $\log (n+t)$ の差を無視することによって

$\begin{equation}\begin{split} &\sum_{\mathcal{A} \subset \{0, h\}}\sum_{\substack{\mathcal{T} \subset [1, h-1] \\ (t+a, q)=1 \forall t \in \mathcal{T}}}(-1)^{\#\mathcal{T}}\sum_{\substack{n \leq x \\ n \equiv a\pmod{q}}}\left( \frac{q}{\varphi (q)\log n}\right)^{2-\#\mathcal{A}} \\ &\times \prod_{\substack{t \in [1, h-1] \\ (t+1, q)=1 \\ t \not \in \mathcal{T}}}\left( 1-\frac{q}{\varphi (q)\log n}\right) \prod_{t \in \mathcal{A} \cup \mathcal{T}}\widetilde{\mathbf{1}}_{\mathcal{P}}(n+t) \end{split}\end{equation}$

となります。ここで、

$\displaystyle \#\{ 0 < t < h \mid (t+a, q)=1\} = \frac{\varphi (q)}{q}h+\varepsilon_q (a, b)$

と表示できることに注意しましょう( $\varepsilon_q(a, b)$ は剰余項。これが $h$ に依らないことは、 $q$ の約数 $d$ に対して $\displaystyle \left\{ \frac{h+a}{d} \right\}$ が $h$ に依らないことから分かります。詳しい導出は90：Moserの定理 - INTEGERSを読めば分かります。なお、 $\{ \ \}$ は少数部分を表す記号です)。

また、 $\displaystyle \alpha (y) := 1-\frac{q}{\varphi (q)\log y}$ とおきます。すると、いくつかの離散的な部分を連続的に変形させることによって、MHL予想の観点から、先ほど展開して得た式は

$\displaystyle {\small \sum_{\mathcal{A} \subset \{0, h\}}\sum_{\substack{\mathcal{T} \subset [1, h-1] \\ (t+a, q)=1\forall t \in \mathcal{T}}}(-1)^{\#\mathcal{T}}\mathfrak{S}_{q, 0}(\mathcal{A} \cup \mathcal{T}) \times \frac{1}{q}\int_2^x \left( \frac{q}{\varphi (q)\log y}\right)^{2+\#\mathcal{T}}\alpha (y)^{\frac{\varphi(q)}{q}h+\varepsilon_q(a, b)-\#\mathcal{T}}dy}$

に漸近すると考えることは妥当です。

ここまでは $h$ を固定していたので、 $h \equiv b-a \pmod{q}$ を満たすように動かすことによって、

$\displaystyle \pi(x; q, (a, b)) \sim \frac{1}{q}\int_2^x\alpha (y)^{\varepsilon_q(a, b)}\left( \frac{q}{\varphi (q)\log y}\right)^2\mathcal{D}(a, b; y)dy$

と期待されます。ここで、

$\begin{equation}\begin{split} &\mathcal{D}(a, b; y) := \\ &\sum_{\substack{h > 0 \\ h \equiv b-a\pmod{q}}}\sum_{\mathcal{A} \subset \{0, h\}}\sum_{\substack{\mathcal{T} \subset [1, h-1] \\ (t+a, q)=1\forall t \in \mathcal{T}}}(-1)^{\#\mathcal{T}}\mathfrak{S}_{q, 0}(\mathcal{A}\cup \mathcal{T})\left(\frac{q}{\varphi (q)\alpha (y)\log y}\right)^{\#\mathcal{T}}\alpha (t)^{\frac{\varphi (q)}{q}h}\end{split}\end{equation}$

とおいています。

たくさん足していますが、彼らは $\mathcal{A}=\mathcal{T}=\emptyset$ または $\#\mathcal{A}+\#\mathcal{T}=2$ 以外の項は誤差項になると予想しています。これはMontgomeryとSoundararajanによるsingular seriesの平均的振る舞いに関する先行研究や隣り合う素数のギャップの平均が大体 $\log x$ であることを用いてheuristicに導いているようです。

よって、主要項(および第二項)を知るためには $\mathcal{D}(a, b; y)$ の部分を

$\displaystyle \mathcal{D}_0(a, b; y)+\mathcal{D}_1(a, b; y)+\mathcal{D}_2(a, b; y)$

と分けて計算すれば十分です。ここで、

$\mathcal{D}_0(a, b; y)$ … $\mathcal{A}=\mathcal{T}=\emptyset$ または $\mathcal{A}=\{0, h\}$ の部分
$\mathcal{D}_1(a, b; y)$ … $\#\mathcal{A}=1$ または $\#\mathcal{T}=1$ の部分
$\mathcal{D}_2(a, b; y)$ … $\#\mathcal{T}=2$ の部分

です。さて、後はどこが難しいかというとsingular series $\mathfrak{S}_{q, 0}$ の部分です。これは定義がそもそも素数に関する積で与えられているため、その挙動を知るには解析的整数論的な考察が必須であることは明らかです。さて、 $e$ の定義から

$\displaystyle \alpha (y) ≒ e^{-\frac{h}{\log y}}$

とみなすことにして、少なくとも $\mathcal{D}_0$ については次の量の情報を得ることが重要です：

$\displaystyle S_0(q, v; H):=\sum_{\substack{h > 0 \\ h \equiv v \pmod{q}}}\mathfrak{S}_{q, 0}(\{0, h\})e^{-\frac{h}{H}}$

$H$ は正の実数( $\displaystyle H:= -\frac{q}{\varphi (q)}\frac{1}{\log \alpha (y)}$ として適用)で、 $v$ は法 $q$ の剰余。

このとき、

$\displaystyle \mathcal{D}_0(a, b; y) = \frac{\log y}{q}+S_0(q, b-a; H)+\left( \frac{1}{2}-\frac{b-a}{q}\right) - \frac{1}{2\varphi (q)}+O\left( \frac{1}{\log y}\right).$

そうして、実際に $S_0(q, v; H)$ の漸近挙動を与えるのがProposition 2.1なのです(式が少々複雑なのでプレプリントを参照のこと)。この命題に関しては厳密な証明が与えられています。

更に、この命題があれば十分でもあります。というのも、 $\{t, h\}$ に対して $r=h-t$ とおいて $\{0, r\}$ と考えれば $\mathcal{D}_1$ の場合も命題を使って評価でき、同じように工夫することによって $\mathcal{D}_2$ の評価も得られます。

ところが！ $\mathcal{D}_1$ および $\mathcal{D}_2$ の主要項には $a=b$ か $a\neq b$ かが影響する部分が現れません。

というわけで、 $a=b$ か否かが影響を受ける部分は $\mathcal{D}_0$ に現れる $S_0(q, b-a; y)$ の部分のみであることが判明しました。

そして、命題が主張するに、 $S_0(q, v; y)$ の $v$ が $0$ のときは $\displaystyle -\frac{\varphi (q)}{2q}\log H$ なる項が現れるが、そうでなければ現れないというのです。

後はこのメカニズムさえ理解すれば、一番知りたいことに関しては納得がいきます。

Principal Dirichlet Character

命題の証明はプレプリントを見れば書いてあるわけですが、超大雑把にキーポイントだけを押さえたいと思います。

$S_0(q, v; H)$ は $v$ という法 $q$ における剰余を固定して $h \equiv v\pmod{q}$ なる $h$ を走らせた和を考えています。このような和を取り出すにはDirichletの算術級数定理の証明を真似て、Dirichlet指標 $\chi$ に関する和を考察した後に直交関係式を使えばよいです。しかしながら、 $v$ に $q$ と互いに素であるという制約は課していません。というわけで、 $(v, q)=d$ , $q/d=:m$ に対して法 $m$ のDirichlet指標を考えることになります。

さて、singular seriesはその定義が素数に関する積で与えられていることからも察することが出来るように、指標で捻った場合を考えるとDirichlet $L$ 関数が現れます。簡単に言えば、この結びつきから $L$ 関数の解析的性質によって命題が証明されるというわけです。

具体的には $L(s, \chi)L(s+1, \chi)$ という積の形が現れ、極の候補は $s=0, 1$ のみという状況になります。

$v=0$ か否かというのは $m=1$ か $m > 1$ かと言い換えられますが、法 $m$ が $1$ か否かによってprincipal指標に対するDirichlet $L$ 関数の挙動が異なるということがOliver-Soundararajanのデータが示唆した現象の根源的理由と思えます*6：

$\chi$ はprincipalとする。このとき、 $\displaystyle L(s+1, \chi)=\frac{\varphi (m)}{m}\frac{1}{s}+O(1), (s \to 0)$ であり、

$m > 1$ ならば $L(s, \chi) = s\Lambda (m) + O(s^2), (s \to 0)$ なので、 $s=0$ は全体では極にならない。
$m=1$ ならば $L(s, \chi)=\zeta (s)$ であり、 $\displaystyle \zeta (0)=-\frac{1}{2}$ なので、 $s=0$ は全体で極である。

ここで、 $\Lambda (m)$ はvon-Mangoldt関数であり、 $\zeta (s)$ はRiemannのゼータ関数です。von-Mangoldt関数についてはメルテンスの第一定理 - INTEGERSを参照してください。

論文にどのようなことが書いてあるか

実際には上記論法によって $\pi(x; q, (a, b))$ の第三項まで予想されています。更に、 $r$ 個の $q$ と互いに素な法 $q$ における剰余の組 $\mathbf{a}:=(a_1, \dots, a_r)$ に対して定義される

$\displaystyle \pi(x; q, \mathbf{a}) := \#\{p_n \leq x \mid p_{n+i-1} \equiv a_i \pmod{q} \ (1 \leq {}^{\forall}i\leq r)\}$

についても同様の漸近公式を予想しています(Conjecture 1.1)。ただし、 $p_n$ は $n$ 番目の素数。たくさんの組で考えた場合は等しい剰余が多ければ多い程出現頻度が下がるということが示唆されます。

また、関連する予想も立てています(Conjecture 1.2 ~ 1.4)。

最後には予想を支持する数値データが与えられています。

論文へのリンク

[1603.03720] Unexpected biases in the distribution of consecutive primes

感想

連続する素数のペアの剰余を指定した素数分布を考えた場合、主要項だけを見ると指定した剰余に依らないにも関わらず、第二項が指定した二つの剰余が等しいか否かで変わるという現象は知らなかったので面白いと感じました。更に、それの理由をゼータ関数( $L$ 関数)の漸近挙動に求めることが出来る点が「整数論いたるところゼータ関数あり」というか、ゼータによってかような素数分布のバイアスが生じると想像することは感動的ですらあります。しかし、予想であって解決はされていません。連続する素数の情報を扱う必要があり、(Hardy-Littlewood予想と関係していることからもわかるように)双子素数予想以上の困難が伴うものと考えられます。

*1:3/15 23時頃。

*2:証明を書きました： integers.hatenablog.com

*3:よく使う日本語の意味。

*4:そこまで複雑な係数でもないですが、第三項はかなり複雑です。

*5: $(a, b)=1$ で $a$ と $b$ が互いに素であることを意味する。