3/11にarXivに投稿されたプレプリント
R. J. L. Oliver, K. Soundararajan, Unexpected biases in the distribution of consecutive primes, preprint.
がFields賞受賞者であるTerence Taoのブログで取り上げられたり("very nice"と書いてある!)、natureで記事が書かれたりするなどして注目を浴びまくっています。
私自身は題名だけ見て中身は見ていなかったのですが、先ほど*1twitterで情報が流れてくるのを見て気になったので話題のプレプリントを少し眺めてみました。
しっかり計算は追えていませんし、理解できていない部分も多いですが、現段階における理解をまとめてみたいと思います(まだ、専門家による査読を受けていないプレプリントのため、内容を全面的に信用することはできません)。
追記) その後、PNASに査読付きで掲載されています。
前提知識の復習
素数定理
今回の話題は素数の分布に関するものです。素数の分布については素数定理と呼ばれる定理が知られています。で以下の素数の個数を表し、対数積分をで定義すると素数定理は以下のように表すことができます:
ここで、は2つの関数の比の極限がとなることを表す記号です。以下、漸近挙動は全てで考えます。
素数定理については素数定理 - INTEGERS
素数定理の証明については素数定理の証明 - INTEGERSを参照してください。
標語的に言えば「はに近づく。」とか「が十分大きければとは殆ど等しい。」などと表現できるかもしれません。しかし、今回重要となる視点は、素数定理は「比をとれば近づく」としか言っていないということです。
比で見ると近づく場合に差を考えても近づくとは限りません。例えば、隣合う素数の比の極限はになりますが、差の上極限は発散します。
Dirichletの算術級数定理
素数定理が証明されたことによって、とりあえず素数の分布に関する大きな情報が得られました。勿論、もっと精密な分布を知りたいと思うのは自然であり、様々な研究がなされています(Riemann予想も関係する)。一方、特別な種類の素数に限定してその素数の分布を調べるという研究の方向性もあります。そのような方向の最初の大きな成果が(素数定理より前の結果ですが)Dirichletの算術級数定理です。
簡単な例で考えてみましょう。全ての自然数はで割った余りがかかかの3通りに分類することが出来ます。の倍数であるような素数はのみなので、以外の素数はで割った余りがかの2通りに分類されることが分かります。
このとき、で割った余りがであるような素数とで割った余りがであるような素数はそれぞれどのように分布しているのだろうか?という疑問が生じます。一番最初に気になるのは「無数に存在するのだろうか?」ということですが、無数に存在するというのがDirichletの算術級数定理です。一般の形で述べてみましょう:
を自然数、を以下の非負整数とし、は互いに素であると仮定する。このとき、で割った余りがとなるような素数は無数に存在する。
tsujimotter氏による記事
tsujimotter.hatenablog.com
が参考になります*2。
算術級数の素数定理
無数に存在することが分かったので、更に精密な分布を知りたくなります。例えば、素数定理レベルの漸近挙動が分かれば嬉しいですがそれは既に証明されています。
を以下ので割った余りがであるような素数の個数、を以下ので割った余りがであるような素数の個数とすると
が成り立ちます。素数定理と合わせることによって、「で割った余りがであるような素数と余りがであるような素数は同じ割合で分布する」ことが分かりました。
一般の場合には次の定理が成り立ちます:
やはり、漸近挙動はで割った余りであるには依っていないことに注意します。なお、はEulerのトーシェント関数です。
追記) 算術級数の素数定理の証明を書きました:
integers.hatenablog.com
Chebyshevの偏り
さて、算術級数の素数定理によって「で割った余りがであるような素数と余りがであるような素数は同じ割合で分布する」ことが分かりましたが、それはあくまで比をとってのことです。深く考えなければで割った余りがであることと余りがであることの間には大差がないような気がしますので、で割った余りがであるような素数とであるような素数の個数の間に偏りがなくても直観には反さない気がします。しかしながら、実際に数値を見てみると偏りがあることが分かります。例えば、殆どのに対して
が成り立つのです!!このような現象はChebyshevが最初に観察したため、Chebyshevの偏りと呼ばれています。数値例として最初に挙げたプレプリントを参照すると
と最初の万個の素数では(すなわち、)確かに余りがであるような素数の方が多いことがわかります。
とは言っても整数の世界は深遠なのであって、高々万個の素数を調べたぐらいで一般の法則を予想してしまうことが余りに危険であることは歴史が証明しています。
幸い、多くの数学者の努力を経て、RubinsteinとSarnakによってが99.9%のに対して成り立つことが1994年に証明されています。100%でないことは真に驚くべきことであって、不等号の向きが逆転するような整数が無数に存在することまで示されているのです!!!
なお、の場合で考えると「一桁目」を固定した素数の分布を考察することになりますが、この場合のChebyshevの偏りは
「一桁目がである素数は一桁目がである素数より多く現れる」
となります。「何故、なのか?」という疑問がわくと思いますが、ちゃんと理由があります。一般にで考えた場合、が法で平方非剰余になる場合が平方剰余になる場合より多く現れる偏りがあることが分かっています。平方剰余については平方剰余の相互法則 - INTEGERSを参照してください。
彼らは何を発見したか
以上が前提知識です。それでは、OliverとSoundararajanはどのような新発見をしたのでしょうか?
彼らはChebyshevの偏りからもう一歩踏み込んで、「連続する素数の剰余を指定したときどのように分布するだろうか?」ということを考察しました。
例えば、をのような連続した素数としましょう(は除外)。このとき、やそれぞれに関してはで割った余りはかの2通りですが、ペアとしては
の4通りがあることが分かります。例えば、はで割るとです。
素数のペアをこのように4通りに分類して、(小さい方の素数が)以下の個数をそれぞれ
と表すと、この場合の素数定理は
となります。従って、この4つが偏りなく分布していても驚くには値しないと思いますが、彼らの行った数値実験はア・プリオリには予想できそうもないデータを与えました。 先ほどと同じく最初の万個の素数におけるデータです:
彼らが何を発見したかを明言する前に、の場合にも同様のデータを眺めてみましょう。こちらは最初の億個の素数をサーチしたようです():
読み取れることはいくつかあるかと思いますが、最大の特徴は
ということです。
これが、今まで他の数学者によっては指摘されていなかった新しい発見です。
Oliver-Soundararajanの予想
とは言っても、最初の億個の素数というのは無数に存在する素数全体から見れば"とても小さい素数"です。数値データからだけでこのような偏りが一般的に存在すると予想することは普通しません(数学者のいう"予想"は強い根拠がある場合のみに用いられる傾向があります)。根拠については後で述べることにして、彼らはもっと精密な予想を立てています(数値データを与えただけの論文ではありません!!):
が成り立つ。ここで、はKroneckerのデルタ。
この予想はに関する素数定理よりも精密な漸近公式を与えるものです。主要項のみをみてもの場合とそうでない場合で差がありませんでしたが、第二項まで考慮するとKroneckerのデルタの部分から差が生じることが分かります。すなわち、この予想は先ほどの数値データから読み取った偏りのより正確な表現を与えることがわかります。
実際、先ほど赤字で主張したような漠然としたものよりも強いことを言っていて、主要項が一定であることから「データの桁数が異なる程の偏りはない」とか、第二項の形から「のもの同士を比較すればどれも大体同じぐらいで、のもの同士を比較しても大体同じぐらい」といったことまで分かります。「いや、同じではない」という場合は第三項目以降の寄与と考えることが出来るでしょう。
この記事では導出までは解説しませんが、第三項は
で与えられ、のときは
です。これはに依らない量のため、例えば先ほどのの場合のデータで
と大体近い値であることが納得できます。一方で、
は同じの場合であるにも関わらず偏りがあります。これはのときの第三項がに依っており、第二項に出てくるの成長スピードが非常に遅くて億個の素数レベルでは第三項の寄与を無視できないということなのでしょう。はるかに大きいデータを見れば漸近していくはずです(予想が正しければ)。
また、が成り立つことを示せるため、
はかなり近い数値になっているのが納得いくのです。
要は、彼らの主張する厳密な意味での予想はConjecture 1.1の漸近公式なのであって、或る意味ではそれ以上でもそれ以下でもない*3ということです。
さて、予想の根拠ですが、次のような2つの手法がよく用いられます:
- 既に成り立つと信じられている他の予想から導く
- Heuristicな議論
今回はこの両方ともを用いて予想を導出しています(別の予想を仮定して厳密に証明しているわけではない)。これらの手法では予想が正しいことの証明にはならないのですが、一定の根拠を与えるだけでなく、上記予想のような何で思いついたか一見分からないような精密な係数を導くことが出来ることがあります*4。
細かい計算はプレプリントに書いてあるので、この記事では
という最も気になる部分に焦点を充てて解説を試みます。
Hardy-Littlewood予想
素数分布に関するHardy-Littlewood予想と呼ばれるものがたくさん存在するのですが、特に「素数組予想」と呼ばれるものを扱います(以下のステイトメントにおけるがです):
を整数からなる有限集合とし、を素数でを返し、そうでなければを取るような特性関数とする。このとき、
が成り立つ。ただし、は
で定義される。は素数であり、はの元の法における剰余類の個数
の場合を考えると双子素数予想よりも強い「双子素数に関する素数定理」となります。双子素数については双子素数予想 - INTEGERSを参照してください。
上記予想がプロトタイプですが、実際に今回関係するのは次の算術級数に対する修正されたHardy-Littlewoodの素数組予想(MHL予想)です:
Heuristicな議論
それではMHL予想を用いたheuristicな議論によるOliver-Soundararajanの予想の導出の大まかな流れを追ってみましょう。
まず、連続する2つの素数のギャップを固定して考えます。例えば、の場合はです。今の設定としては剰余となる, を固定しているので、を満たします。
そうすると、(小さい方の素数が)以下の差がであるような連続する素数のペアであって、となるようなものの個数は
と表すことができることがわかります(でない項が現れたとき、左側の部分からが素数のペアであることがわかり、右側の積の部分からとの間にと互いに素な素数がないことが保証されます)。
ここで、素数であるかどうかの確率を付加した特性関数
を導入します。これを用いて上の式を書き直すと
となります。これを展開すれば、ととの差を無視することによって
となります。ここで、
と表示できることに注意しましょう(は剰余項。これがに依らないことは、の約数に対してがに依らないことから分かります。詳しい導出は90:Moserの定理 - INTEGERSを読めば分かります。なお、は少数部分を表す記号です)。
また、とおきます。すると、いくつかの離散的な部分を連続的に変形させることによって、MHL予想の観点から、先ほど展開して得た式は
に漸近すると考えることは妥当です。
ここまではを固定していたので、を満たすように動かすことによって、
と期待されます。ここで、
とおいています。
たくさん足していますが、彼らはまたは以外の項は誤差項になると予想しています。これはMontgomeryとSoundararajanによるsingular seriesの平均的振る舞いに関する先行研究や隣り合う素数のギャップの平均が大体であることを用いてheuristicに導いているようです。
よって、主要項(および第二項)を知るためにはの部分を
と分けて計算すれば十分です。ここで、
- … またはの部分
- … またはの部分
- … の部分
です。さて、後はどこが難しいかというとsingular series の部分です。これは定義がそもそも素数に関する積で与えられているため、その挙動を知るには解析的整数論的な考察が必須であることは明らかです。さて、の定義から
とみなすことにして、少なくともについては次の量の情報を得ることが重要です:
は正の実数(として適用)で、は法の剰余。
このとき、
そうして、実際にの漸近挙動を与えるのがProposition 2.1なのです(式が少々複雑なのでプレプリントを参照のこと)。この命題に関しては厳密な証明が与えられています。
更に、この命題があれば十分でもあります。というのも、に対してとおいてと考えればの場合も命題を使って評価でき、同じように工夫することによっての評価も得られます。
ところが!およびの主要項にはかかが影響する部分が現れません。
というわけで、か否かが影響を受ける部分はに現れるの部分のみであることが判明しました。
そして、命題が主張するに、のがのときはなる項が現れるが、そうでなければ現れないというのです。
後はこのメカニズムさえ理解すれば、一番知りたいことに関しては納得がいきます。
Principal Dirichlet Character
命題の証明はプレプリントを見れば書いてあるわけですが、超大雑把にキーポイントだけを押さえたいと思います。
はという法における剰余を固定してなるを走らせた和を考えています。このような和を取り出すにはDirichletの算術級数定理の証明を真似て、Dirichlet指標に関する和を考察した後に直交関係式を使えばよいです。しかしながら、にと互いに素であるという制約は課していません。というわけで、, に対して法のDirichlet指標を考えることになります。
さて、singular seriesはその定義が素数に関する積で与えられていることからも察することが出来るように、指標で捻った場合を考えるとDirichlet関数が現れます。簡単に言えば、この結びつきから関数の解析的性質によって命題が証明されるというわけです。
具体的にはという積の形が現れ、極の候補はのみという状況になります。
か否かというのはかかと言い換えられますが、法がか否かによってprincipal指標に対するDirichlet関数の挙動が異なるということがOliver-Soundararajanのデータが示唆した現象の根源的理由と思えます*6:
はprincipalとする。このとき、であり、
- ならば なので、は全体では極にならない。
- ならば であり、なので、は全体で極である。
ここで、はvon-Mangoldt関数であり、はRiemannのゼータ関数です。von-Mangoldt関数についてはメルテンスの第一定理 - INTEGERSを参照してください。
論文にどのようなことが書いてあるか
実際には上記論法によっての第三項まで予想されています。更に、個のと互いに素な法における剰余の組に対して定義される
についても同様の漸近公式を予想しています(Conjecture 1.1)。ただし、は番目の素数。たくさんの組で考えた場合は等しい剰余が多ければ多い程出現頻度が下がるということが示唆されます。
また、関連する予想も立てています(Conjecture 1.2 ~ 1.4)。
最後には予想を支持する数値データが与えられています。
感想
連続する素数のペアの剰余を指定した素数分布を考えた場合、主要項だけを見ると指定した剰余に依らないにも関わらず、第二項が指定した二つの剰余が等しいか否かで変わるという現象は知らなかったので面白いと感じました。更に、それの理由をゼータ関数(関数)の漸近挙動に求めることが出来る点が「整数論いたるところゼータ関数あり」というか、ゼータによってかような素数分布のバイアスが生じると想像することは感動的ですらあります。しかし、予想であって解決はされていません。連続する素数の情報を扱う必要があり、(Hardy-Littlewood予想と関係していることからもわかるように)双子素数予想以上の困難が伴うものと考えられます。