インテジャーズ

INTEGERS

数、特に整数に関する記事。

STICKERBRUSH SYMPHONIES

David Wise作曲のStickerbrush Symphony (= Bramble Blast = Brambles)のYouTube動画を自分用にまとめます。この曲がなければ私は論文を書けません。

原曲(原点にして頂点)

www.youtube.com

作曲者

www.youtube.com

オフィシャルな編曲

www.youtube.com

www.youtube.com


www.youtube.com

数体の世界(1920年編)

これは Math Advent Calendar 2020 の24日目の記事です。Happy Christmas!

有理数\mathbb{Q}の拡大体kであって、\mathbb{Q}上のベクトル空間とみなしたときに有限次元となっているものを数体または代数体と呼びます。

整数全体の集合は有理数\mathbb{Q}の部分環\mathbb{Z}をなし、整除関係によって豊かな現象を私達に見せてくれます。それを論じるのが初等整数論です。

\mathbb{Q}\mathbb{Z}の関係と並行に、数体kにもその部分環であるkの整数環\mathcal{O}_kが定義されます。\mathcal{O}_kの元は高次元の世界における整数の拡張概念です。

数体やその整数環を考える一つの動機は高次元の世界から一次元の世界\mathbb{Z}を見つめ直すことによって初等整数論の難問を攻略しようというものです。歴史的には円分体と呼ばれる特殊な数体を考察することで、名高いフェルマーの最終定理を解決しようという試みがなされていました。

そのためには\mathcal{O}_kのことをよく知らなければなりません。\mathcal{O}_k\mathbb{Z}と同様に豊かな現象を内包する世界なのですが、一般には\mathbb{Z}の場合とは全く異なる現象が生じ、k毎にある種の個性があることがわかります。

\mathbb{Z}と同じだろうと思い込んでフェルマーの最終定理が解けたと何人かの数学者が勘違いしたことは苦い経験であったと思われますが、その未知の現象が生じている\mathcal{O}_kという世界の存在を知った人類は新しい探求の地を見出したのです。

こうして、\mathcal{O}_kの世界そのものを理解しようという代数的整数論が生まれました。

代数的整数論の基礎中の基礎はデデキントを中心に構築されました。そして、代数的整数論における未解明の謎はいくらでもあると言っても過言ではないと思いますが、現代に至るまでその研究が続けられています。

代数的整数論の研究の中で1900年代前半までに相当に整理・完成された理論として、類体論があります。これは数体kの上の有限次アーベル拡大体をkの内部で群論的に統制する理論であり、理論の根幹をなす多くの定理は日本初の国際的数学者である高木貞治先生によって証明され、高木類体論と呼ばれることも多いです。類体論自体にとっては高木先生の後にアルティンによって発見・証明されたアルティン相互法則が極めて重要ですが、むしろそれなしに基本法則を打ち立てたところに個人的には高木先生の凄さを感じるところでもあります。

高木類体論の詳細は基本的には以下の論文で発表されました:


[T] T. Takagi, Ueber eine Theorie des relative Abel'schen Zahlkörpers, J. College of Science, Imperial Univ. of Tokyo 41 (1920), 1-133.


この歴史的大論文から今年は100周年を迎えています。この記事では上記大論文の中から幾つかの定理を抜粋して鑑賞したいと思います。

なお、類体論に関する書籍は大型書店に行けば幾つも目に入ってくると思いますが、やはり高木貞治先生本人による『代数的整数論』(岩波書店)は格調高い本であり、今でも一読をお勧めします。

また、別のカテゴリーのAdvent Calendarにはなりますが、今月tsujimotterさんによって執筆された以下の類体論入門記事もお勧めです。こちらで類体論とは一体どのような理論なのかを頭に入れてから高木先生の実際の記述を眺めると、感慨もひとしおでしょう。
tsujimotter.hatenablog.com

高木論文

論文[T]の章立ては以下のようになっています:

Capitel I. Der allgemeine Classenkörper.
§1. Verallgemeinerung des Classenbegriffs.
§2. Congruenz-classengruppen.
§3. Ein Fundamentalsatz über die relativ normalen Körper.
§4. Der Classenkörper.
§5. Eindeutigkeit des Classenkörpers.
Capitel II. Die Geschlechter im relativ cyclischen Körper vom Primzahlgrade.
§6. Einige allgemeine Sätze über die relativ Abel'schen Zahlkörper.
§7. Über die Normenreste des relativ cyclischen Körpers vom Primzahlgrade.
§8. Einheiten im relativ cyclischen Körper.
§9. Formulirung eines Fundamentalsatzes.
§10. Die Anzahl der ambigen Classen im relativ cyclischen Körper eines ungeraden Primzahlgrades.
§11. Die Anzahl der ambigen Classen im relativ quadratischen Körper.
§12. Die Geschlechter im relativ cyclischen Körper eines ungeraden Primzahlgrades.
§13. Die Geschlechter im relativ quadratischen Körper.
§14. Eine Verallgemeinerung des Geschlechterbegriffs.
Capitel III. Existenzbeweis für den allgemeinen Classenkörper.
§15. Formulirung des Existenzsatzes.
§16. Rang der Gruppe der Zahlclassen.
§17. Rang der Classengruppe.
§18. Existenzbeweis des Classenkörpers vom ungeraden Primzahlgrade.
§19. Fortsetzung des vorhergehenden Artikels.
§20. Relativ quadratische Classenkörper.
§21. Relativ cyclische Classenkörper vom Primzahlpotenzgrade.
§22. Existenzbeweis im allgemeinen Falle.
Capitel IV. Weitere allgemeine Sätze.
§23. Der Vollständigkeitssatz.
§24. Ueber die Geschlechter im relativ cyclischen Körper eines Primzahlpotenzgrades.
§25. Der Zerlegungssatz.
§26. Ein Criterium für den relativ Abel'schen Zahlkörper.
Capitel V. Anwendung auf die Theorie der komplexen Multiplication der elliptischen Funktionen.
§27. Absolut Abel'scher Zahlkörper.
§28. Relativ Abel'sche Oberkörper eines imaginären quadratischen Körpers.
§29. Der durch den singulären Wert der elliptischen Modulfunktion erzeugte Ordnungskörper.
§30. Gleichzeitige Adjunction der singulären Moduln und der Einheitswurzeln.
§31. Ueber die complexe Multiplication der Jacobi'schen Function.
§32. Ueber die arithmetische Natur des Teilungskörpers.


それでは幾つかの定理等を抜粋して鑑賞しましょう。


§4において

Wenn der Relativgrad des relativ normalen Körpers K und der Index der zugeordneten Classengruppe H von k einander gleich sind, dann soll K der Classenkörper für die Classengruppe H genannt werden. ([T]より引用)

と類体が定義された後(Weberによる定義とは異なりますが、同値であることが類体論を通して証明されます)、

Satz 4. Der Relativgrad des relativ normalen Köpers ist niemals klenier*1 als der Index der zugeordneten Classengruppe des Grundkörpers. ([T]より引用)

第二基本不等式が述べられます。これは解析的手法で証明されるSatz 1とSatz 2を用いて示されます。

Satz 6で類体の一意性が証明され、第一章は終わります。


第二章に入って、§9で素数次巡回拡大に対する類体論の基本定理が述べられます:

Satz 13. Die Relativdiscriminante des relativ cyclischen Körpers K/k vom ungeraden Primzahlgrade l sei \mathfrak{d}=\mathfrak{f}^{l-1}, wo

\mathfrak{f}=\Pi\mathfrak{p}. \Pi \mathfrak{l}^{v+1},
wo \mathfrak{p} ein zu l primes, und \mathfrak{l} ein in l aufgehendes Primideal von k bedeutet. Die Idealclassen von k seien nach einer Zahlengruppe O definirt, welche aus den Zahlen \alpha besteht, die der Congruenz:
\alpha\equiv 1, (\mathfrak{m})
genügen, wo der Modul \mathfrak{m} ein beliebiges durch \mathfrak{f} teilbares Ideal von k ist. Dann sind die Relativnormen aller zu \mathfrak{m} primen Ideale von K in einer Classengruppe vom Index l in k enthalten.
  Dasselbe gilt auch für den relativ quadratischen Körper K=k(\sqrt{\mu}), wenn an Stelle von O eine Zahlengruppe \overline{O} mit gewisser Vorzeichenbedingung angenommen wird. Es soll nämlich nur diejenigen Zahlen von O in \overline{O} aufgenommen werden, welche wenigstens in allen denjenigen mit k conjugirten reellen Körpern, worin \mu negativ ausfällt, positiv sind. ([T]より引用)


長めの文章ですが、一つ目のパラグラフでは次数が奇素数である場合の設定がしばらく述べられた後、"Dann"以降が主張です。 二つ目のパラグラフは二次拡大の場合が書かれています。そして、第一章の内容を用いることによって言い換えられた要約が直後に述べられます:

Jeder relativ Abel'sche Körper vom Primzahlgrade l mit der Relativdiscriminante \mathfrak{f}^{l-1} ist der Classenkörper für eine Classengruppe nach dem Modul \mathfrak{f}. ([T]より引用)


第二章の残りの内容は基本的にはこの定理の証明です(Satz 22も示されます)。


基本定理は一旦横へ置いておいて、第三章は存在定理です。まずは§15で目標定理が掲げられます:

Satz 23. In einem algebraischen Körper k sei eine Classengruppe H nach dem Modul m mit oder ohne Vorzeichenbedingung vorgelegt. Dann existirt stets ein Classenkörper K für diese Classengruppe H, welcher die folgenden Eigenschaften besitzt:
1) K ist relativ Abel'sch in Bezug auf k.
2) Die Galois'sche Gruppe des Relativkörper K/k ist holoedrisch isomorph mit der komplementären Gruppe G/H, wo G die Gruppe der sämtlichen Classen von k bedeutet.
3) Die Rlativdiscriminante von K/k enthält kein Primideal als Factor, welches nicht in den Modul \mathfrak{m} aufgeht. ([T]より引用)


特に、2)を要請していることから、類体の一意性と基本定理を合わせると所謂同型定理が得られます。以下、§22までかけてSatz 23が証明されます。絶対類体の場合はHilbertがこれを予想しており(特殊な場合のみ証明)、Furtwänglerが証明しました。高木先生はHilbertの手法を拡張することによってSatz 23を証明しましたが、Satz 13を取り入れることで単純化にも成功しているとのことです。


さて、Satz 13で素数次巡回拡大の場合には基本定理が証明されていましたが、『代数的整数論』とは順番が違って基本定理の前に存在定理の証明が第三章で完了しました。そして、第四章の最初の§24において次の疑問が提唱されます。

Eine wichtige Frage ist nun, ob auch umgekehrt jeder relativ Abel'schen Köper in Bezug auf k als Classenköper einer Classengruppe nach einem geeignet gewählten Modul \mathfrak{m} in k zugeordnet ist? ([T]より引用)


存在定理はHilbertの予想の一般化なので、もちろん一般のモジュラス版に拡張するというのは類体の定義を与えたWeberおよび証明した高木先生による著しい貢献ですが、ある意味では自然な方向性に見える一方で、基本定理は「当時誰も予想すらできなかった」とよく表現されることを思い出しておきましょう。

この疑問の直後に次の極めてかっこいい言明がなされます!

Diese Frage ist im bejahenden Sinne zu beantworten:
Satz 28. Alle relativ Abel'schen Körper in Bezug auf einen beliebigen algebraischen Körper werden durch die Classenkörper nach den Idealmoduln in demselben erschöpft. ([T]より引用)


「要するにアーベル体は類体なりということにぶつかった」(高木貞治


類体論の基本定理 = Satz 28は素数冪巡回拡大の場合に帰着され、それは§24においてSatz 29として実行されます。

その後、§25において分解定理フェルマーの二平方和の定理の大規模な一般化!)が証明されます。

Satz 30. (Der Zerlegungssatz). Jedes in einer Classengruppe eines beliebigen Körpers enthaltene Primideal zerfällt in die von einander verschiedenen Primideale des ersten Relativgrades in dem Classenkörper für diese Classengruppe. ([T]より引用)

より一般に、

Satz 31. Ist K der Classsenkörper für die Classengruppe H von k, dann werden die Primideale von k, welch einem und demselben Classencomplex HC angehören, in K auf derselben Weise zerlegt, d. h. sie erfahren in K eine Zerlegung in dieselbe Anzahl von Primidealen derselben Relativgrade. ([T]より引用)


アルティンの相互法則がないので、どちらもそれなりに議論して証明されています。§26において類体論終結定理に対応するものが述べられ、第四章が完結します。当時まだチェボタリョフの密度定理は証明されていないことに注意しましょう。


類体論は以上で一旦完成していますが、第五章で類体論の応用が示されます。この章は決して短くないですが、全ては最後の定理のためにあります。まずは『代数的整数論』の補遺から引用してみましょう:

さて, 逆に虚二次体k上の「アアベル」体が, すべてこれら特異値乃至等分値によって尽くされて, 有理数体上の「アアベル」体と指数函数の等分値e^{2\pi i/n}即ち1の巾根との間の関係が, 虚二次体の上に見事に拡張されるというような奇蹟が実現されないであろうか. この謎を解こうというのがKroneckerの「青春の夢」(Jugendtraum)であった. 実際この問題はそれ自身興味深いものであるが, 当時にあっては, 整数論代数学及び函数論の最高部門の交錯する数学のEl Doradoである所に, 特に魅力があったのであろう. (『代数的整数論』より引用)


一生に一度でいいのでこんな格調高い文章を書いてみたいものです。El Doradoとまで表現した直後に高木先生は

この問題は, 類体論の完成と共に, 容易に肯定的に解決されたのであるが*,  (『代数的整数論』より引用)

と言ってのけます!しかも、最後の脚注が自身の論文[T, 第V章]であるところがカッコよすぎる。


それでは、原論文における記述を眺めましょう:

Mit Rücksicht auf Satz 36 erhalten wir daher in Bestätigung der Kronecker'schen Vermutung
Satz 37. Alle relativ Abel'sche Oberköper eines imaginären quadratischen Körpers werden durch die Einheitswurzeln, die singulären Moduln und die Teilwerte der Jacobi'schen Function erzeugt. ([T]より引用)


この定理の宣言をもって、他には一字も追加することなく論文が完結しています。高木先生は一つの理論を構築しただけではなく、それを道具として使ってその時代の大難問を解決したのです。理論創造型研究に基づくプロブレムソルバーと言えます。


まごうことなき歴史的大論文!

*1:原文ママkleinerの誤植?

素数定理のRichterによる新しい初等的証明の調査

N以下の素数の個数を \pi(N) と表すとき,

\displaystyle \lim_{N\to \infty}\frac{\pi(N)}{N/\log N}=1 \tag{1}

が成り立つ.


1.1 この記事では2020年2月9日にarXivに投稿されたFlorian K. Richterの論文


A new elementary proof of the Prime Number Theorem, arXiv:2002.03255.


で提示された(1)式の新しい証明の解説を試みる.


1.2 Richterはノースウェスタン大学の若い数学者で, 近年の数学上の大成果である "Erdős sumset conjecture" を解決した3人の数学者のうちの1人である:

J. Moreira, F. K. Richter, D. Robertson, A proof of the Erdős sumset conjecture, Annals of Mathematics, Volume 189 (2019), Issue 2, pp. 605-652.


Erdős sumset conjectureは次のような主張である:

定理 上漸近密度が正であるような自然数からなる無限集合Aに対し, 必ずある自然数からなる無限集合B, Cが存在して, A\supset B+C が成り立つ. ここで, B+C:=\{b+c \mid b\in B, c\in C\}である.


1.3 Richterによる素数定理の新証明の流れを数学的厳密性を犠牲にしてここにラフに記述する.

Mertens関数の商M=M(N)/N0に漸近することを示したい(これが示されると素数定理が従う\to2.1).

証明全体においてキーとなるのは, よい条件を満たす, 自然数からなる2つの有限集合B_1, B_2の存在である(Richterの集合などと呼んでもよいかもしれない\to3.2).

B_1, B_2はともに「その集合からランダムに2元を選んだとき, それらが互いに素である確率が非常に高い」という条件を満たし, B_1B_2とではある種のパリティが異なるが, その個数分布は\rho進的に連動している. ここで, \rho1より少しだけ大きい数であり, 「個数分布が\rho進的に連動する」とは, 任意の j\geq 0に対して \#(B_1\cap (\rho^j, \rho^{j+1}])=\#(B_2\cap (\rho^j, \rho^{j+1}])が成り立つことをいう.

B_1に対応する量E_1およびB_2に対応する量E_2を定義することができるが, 「その集合からランダムに2元を選んだとき, それらが互いに素である確率が非常に高い」という条件から, 簡単な計算により

M-E_1 \approx 0

を導出できる. 「 B_1B_2とではある種のパリティが異なる」ということから, B_2に対する同様の計算結果は

M+E_2 \approx 0

となる(\to3.1, 3.6). 一方, 「B_1B_2の個数分布が\rho進的に連動する」ことからは

E_1 \approx E_2

が言える(\to3.7). 以上を組み合わせると

\displaystyle M \approx 0

素数定理が導かれる(\to3.11).

1.4 上記議論は素数定理の証明における新しい議論であり, Richterの集合の存在が確定した後の議論は初等的な不等式評価のみで実行される. Richterの集合の存在性には素数分布の情報が必要となるが, それはいわゆるChebyshevの定理で本質的に事足りる. 参考文献の[note]の言葉遣いでいけば第二世代のビッグ・オー不等式に対応し, 第三世代のビッグ・オー不等式であるSelbergの漸近公式([note]の定理7.2)は一切使わない真に新しい証明である. もちろんRiemannのゼータ関数および複素関数論も用いていない.

なお, Selbergの漸近公式に依らない初等的な素数定理の新証明は1984年にDaboussiによっても与えられているが, そのことも含めてRichterの論文の一ページ目に小気味好く解説されている.

松本先生の教科書『リーマンのゼータ関数』(朝倉書店)では

ただし, 初等的方法の効力は今のところ解析的方法には及ばないのであって, 初等的方法で得られる誤差項評価は現在最良のものでも定理3.1の古典的な誤差高評価O(x\exp(-c_1\sqrt{\log x})にすら届かない.

という文があり, Selberg-Erdősの初等的証明の発見はそれなりの驚きと意義があったであろうけれども, 導出できる定理の強さの観点ではRiemannゼータ関数を用いる証明には劣っていると言えなくない. すると, 初等的証明を新たに発見することは単なる趣味のようなもので, 数学的意義が殆どないようにも思われるかもしれない.

しかしながら, 新しい証明にはそれまでの証明にはなかったポテンシャルが秘められている可能性があるのでその探求には常に意義があると私は思うし, Richterの証明の場合には既に応用が発見されている.

今回のRichterによる証明はSarnak予想とChowla予想に関連する近年の研究の発展にインスパイアされたものとのことで, 既に別の論文

V. Bergelson, F. K. Richter, Dynamical generalizations of the Prime Number Theorem and disjointness of additive and multiplicative semigroup actions, arXiv:2002.03498.

において同様の手法を用いて素数定理力学系的, エルゴード理論的な一般化が与えられている. この意味でもRichterの素数定理の証明法を学んでおくことは今後この分野の研究の進展を追うためにも必須となるかもしれない.


Notation:
集合Sの元の個数を\#Sで表す.
\mathbb{N}: 自然数全体の集合. ただし, この記事では便宜上, 自然数1以上とする.
\mathcal{P}: 素数全体の集合.
\mathcal{P}_k: 相異なるk個の素数の積として表されるような自然数全体のなす集合.
N\in \mathbb{N}に対し, [N]:=\{1,2,\dots,N\}を表す.
集合S\subset \mathbb{N}の空でない有限部分集合A\subset Sおよび関数 f\colon S\to \mathbb{C}に対して,

\begin{align}
&\mathbb{E}_{n\in A}\bigl(f(n)\bigr):=\frac{1}{\#A}\sum_{n\in A}f(n),\\
&\mathbb{E}_{n\in A}^{\log}\bigl(f(n)\bigr):=\frac{\sum_{n\in A}f(n)/n}{\sum_{n\in A}1/n}.
\end{align}

\mu\colon \mathbb{N}\to \{0,\pm1\}: Möbius関数.
\lfloor x\rfloor: xを超えない最大の整数.
oおよび特定の近傍でOを考える場合, "as x\to \infty" のような条件を添え字で明記する. Oに添え字が付いていない場合は考えている範囲全体で不等式が成立するものとする.
\mathbf{1}_Aは集合Aの指示関数(特性関数).
\mathbf{1}_{m\mid n}m\mid nのとき1, m\nmid nのときに0を意味する.
\mathrm{gcd}(m,n): mnの最大公約数.
A,B\subset \mathbb{N}に対して、A+B:=\{a+b \mid a\in A, b \in B\}, A\cdot B:=\{ab \mid a\in A, b \in B\}.


References
[note] 次のページからダウンロードできるPDFファイルにおいてSelbergによる素数定理の初等的証明がまとめられているが, そこから幾つかの事実を引用することにする:
note.com

[A] T. M. Apostol, Introduction to Analytic Number Theory, Undergraduate Texts in Mathematics, Corrected fifth printing, Springer, 1998.


2.1 素数定理には多数の同値な主張があり, 通常(1)そのものではなく, いずれかの同値な主張を選択してそれを証明することになる. Richterが選んだのは少なくともLandauに遡ることができる


\displaystyle \lim_{N\to \infty}\mathbb{E}_{n\in[N]}\bigl(\mu(n)\bigr) = 0 \tag{2}


だ. 読者の利便性を考えて(2) \Longrightarrow (1)の証明を[A]から引っ張ってきてここに記しておこう.


2.2 x\geq 1に対して

\displaystyle \psi(x)=x-\sum_{\substack{m,n\in \mathbb{N} \\ mn\leq x}}\mu(m)\bigl(d(n)-\log n-2\gamma\bigr)+O(1)

が成立する.

ここで, \psi(x)は第二Chebyshev関数([note]の定義6.13), d(n)nの正の約数の総和, \gammaはEulerの定数([note]の命題5.4).

証明. 和におけるm,n\mathbb{N}の元をはしるものとする. まず,

\displaystyle \lfloor x\rfloor=\sum_{n\leq x}1,\quad \psi(x)=\sum_{n\leq x}\Lambda(n),\quad 1=\sum_{n\leq x}\left\lfloor \frac{1}{n}\right\rfloor

が成り立つことに注意する. ここで, \Lambdaはvon Mangoldt関数([note]の定義6.9)で真ん中の等式は第二Chebyshev関数の定義に他ならない.

次に, 必要なら[note]の補題6.10を参照して

\displaystyle d(n)=\sum_{m\mid n}1,\quad \log n=\sum_{m\mid n}\Lambda(m),\quad 1=\sum_{m\mid n}\left\lfloor\frac{1}{m}\right\rfloor

が成り立つが, それぞれにMöbiusの反転公式([note]の命題6.8)を適用することにより

\displaystyle 1=\sum_{m\mid n}\mu(m)d\left(\frac{n}{m}\right),\quad \Lambda(n)=\sum_{m\mid n}\mu(m)\log\frac{n}{m},\quad \left\lfloor\frac{1}{n}\right\rfloor=\sum_{m\mid n}\mu(m)

を得る. 以上を組み合わせると

\begin{align}
\lfloor x\rfloor-\psi(x)-2\gamma&=\sum_{n\leq x}\left(1-\Lambda(n)-2\gamma\left\lfloor\frac{1}{n}\right\rfloor\right)\\
&=\sum_{n\leq x}\sum_{m\mid n}\mu(m)\left(d\left(\frac{n}{m}\right)-\log\frac{n}{m}-2\gamma\right)\\
&=\sum_{mn\leq x}\mu(m)\bigl(d(n)-\log n-2\gamma\bigr)
\end{align}

と計算でき, これから直ちに所望の等式に到達する. Q.E.D.

ここまで再チェック完了.

2.3 [note]の補題6.15より(1)

\psi(x)=(1+o_{x\to\infty}(1) )x

と同値である. 従って, 2.2より, (2) \Longrightarrow (1)を示すためには(2)の仮定のもと

\displaystyle \sum_{mn\leq x}\mu(m)\bigl(d(n)-\log n-2\gamma\bigr)=o_{x\to\infty}(x)

を示せばよいことがわかる.

2.4 x\geq 1に対して

\displaystyle \sum_{n\leq x}d(n)=x\log x+O(x)

が成り立つ.

証明. n/m\mapsto nと変数変換して二重和の変形を行うことにより

\begin{align}
\sum_{n\leq x}d(n)&=\sum_{n\leq x}\sum_{m\mid n}1=\sum_{mn\leq x}1\\
&=\sum_{m\leq x}\sum_{n\leq \frac{x}{m}}1=\sum_{m\leq x}\left(\frac{x}{m}+O(1)\right)\\
&=x\sum_{m\leq x}\frac{1}{m}+O(x)
\end{align}

を得る. [note]の命題5.4より

\displaystyle \sum_{m\leq x}\frac{1}{m}=\log x+\gamma+O\left(\frac{1}{x}\right)

が成り立つので, 代入すればよい. Q.E.D.


2.5 (Dirichlet.) x\geq 1に対して

\displaystyle \sum_{n\leq x}d(n)=x\log x+(2\gamma-1)x+O(\sqrt{x})

が成り立つ.

証明. まず,

\displaystyle \sum_{n\leq x}d(n)=\sum_{mn\leq x}1=2\sum_{\substack{mn\leq x \\ m=n}}1+\sum_{\substack{mn\leq x \\ m=n}}1

と分割する.

\displaystyle \sum_{\substack{mn\leq x \\ m=n}}1=\sum_{n\leq x}\sum_{n < m \leq \frac{x}{n}}1=\sum_{n\leq \sqrt{x}}\left(\left\lfloor\frac{x}{n}\right\rfloor-n\right)

なので,

\begin{align}
\sum_{n\leq x}d(n)&=2\sum_{n\leq \sqrt{x}}\left(\frac{x}{n}-n+O(1)\right)+O(\sqrt{x})\\
&=2x\sum_{n\leq \sqrt{x}}\frac{1}{n}-2\sum_{n\leq \sqrt{x}}n+O(\sqrt{x})
\end{align}

を得る. 1つ目の和には[note]の命題5.4を, 2つ目には普通の和の公式を適用することにより

\begin{align}
\sum_{n\leq x}d(n)&=2x\left(\log\sqrt{x}+\gamma+O\left(\frac{1}{\sqrt{x}}\right)\right)-2\left(\frac{x}{2}+O(\sqrt{x})\right)+O(\sqrt{x})\\
&=x\log x+(2\gamma-1)x+O(\sqrt{x})
\end{align}

が示された. Q.E.D.

2.6 x,a,b\geq 1, x=abとし, 関数 f, g, F, G

\displaystyle F(x)=\sum_{n\leq x}f(n),\quad G(x)=\sum_{n\leq x}g(n)

なる関係にあるとする. このとき,

\displaystyle \sum_{mn\leq x}f(m)g(n)=\sum_{m\leq a}f(m)G\left(\frac{x}{m}\right)+\sum_{n\leq b}g(n)F\left(\frac{x}{n}\right)-F(a)G(b)

が成り立つ. やはり, m,n\mathbb{N}の元を動いている.

証明. これは左辺を計算するために

\displaystyle \sum_{m\leq a}\sum_{n\leq \frac{x}{m}}f(m)g(n)=\sum_{m\leq a}f(m)G\left(\frac{x}{m}\right)

および

\displaystyle \sum_{n\leq b}\sum_{m\leq \frac{x}{n}}g(n)f(m)=\sum_{n\leq b}g(n)F\left(\frac{x}{n}\right)

を足し合わせると

\displaystyle \sum_{m\leq a}\sum_{n\leq b}f(m)g(n)=F(a)G(b)

が重複して足されるという話である. Q.E.D.

2.7 f(n)=d(n)-\log n-2\gamma, g(n)=\mu(n)として, 2.6を適用することを考える. まず,

\displaystyle F(x)=\sum_{n\leq x}f(n)=O(\sqrt{x})

が確認できる. ただし, \log xを経由するので例えばx\geq 2としておく.

証明. 2.6および[note]の命題5.3より

\begin{align}
F(x)&=\sum_{n\leq x}d(n)-\sum_{\log n}-2\gamma\sum_{n\leq x}1\\
&=x\log x+(2\gamma-1)x+O(\sqrt{x})-(x\log x-x+O(\log x) )-2\gamma x+O(1)\\
&=O(\sqrt{x})+O(\log x)+O(1)=O(\sqrt{x})
\end{align}

と計算できる. Q.E.D.

2.8 ab=xを満たすような実数a \geq 2, b, xを考える. 2.7および[note]の命題5.5より

\displaystyle \sum_{n\leq b}\mu(n)F\left(\frac{x}{n}\right)=O\left(\sum_{n\leq b}\sqrt{\frac{x}{n}}\right)=O(\sqrt{xb})=O\left(\frac{x}{\sqrt{a}}\right) \tag{3}

が成り立つ. 以下, \varepsilon > 0を任意にとり, a

\displaystyle \left|\sum_{n\leq b}\mu(n)F\left(\frac{x}{n}\right)\right| < \varepsilon x\tag{4}

が成り立つようにとる. a\varepsilonのみに依存し, xには依存しないことに注意.

\varepsilonのみに依存する正の定数K=K(\varepsilon) > 0

\displaystyle K:=\sum_{n\leq a}\frac{|f(n)|}{n}

で定める. また, Mertens関数M(x):=\sum_{n\leq x}\mu(n)で定め, 以下(2)を仮定することにより

M(x)=o_{x\to\infty}(x)

である. このとき, あるx_0=x_0(\varepsilon)が存在して, x\geq x_0ならば

\displaystyle \frac{|M(x)|}{x} < \min\left\{1,\frac{\varepsilon}{K}\right\}

が成り立つ. 以下, x \geq ax_0を仮定する. すると x/n\geq x_0なので,

\displaystyle \left|\sum_{n \leq a}f(n)M\left(\frac{x}{n}\right)\right| < \sum_{n\leq a}|f(n)|\cdot \frac{\varepsilon}{K}\cdot\frac{x}{n}=\varepsilon x\tag{5}

と評価できる.

最後に, F(a)M(b)=O(\sqrt{a}b)であるが(b\geq x_0に注意), このビッグ・オー係数は(3)のものより小さいことから,

\displaystyle \left|F(a)M(b)\right| < (\varepsilon\sqrt{a})\sqrt{a}b = \varepsilon x

を得る. これと, 2.6, (4), (5)を合わせることにより,

\displaystyle \left|\sum_{mn\leq x}f(n)\mu(m)\right| < 3\varepsilon x

なる評価に到達した.

\varepsilon > 0は任意であったから, 2.3の観点から(2)\Longrightarrow (1)の証明が完了となる.

2.9 (2)\Longrightarrow (1)の証明は若干長く感じられるかもしれない. ただし, この部分は古典的であり, Richterの論文で新しい視点で議論されているのは(2)の証明の部分のみであることに注意. また, [note]の言葉で考えると, Selbergによる素数定理の証明が「第三世代のビッグ・オー不等式」まで必要となるのに対して, (2)\Longrightarrow (1)の証明は「第一世代のビッグ・オー不等式」しか用いないローテクなものである.


それではRichterの論文での議論に移ろう.


3.1 B\subset\mathbb{N}を空でない有限集合とする. このとき, 不等式

\displaystyle 
\limsup_{N\to\infty}\mathbb{E}_{n\in[N]}\left(\left|\mathbb{E}_{m\in B}^{\log}\bigl(1-m\mathbf{1}_{m\mid n}\bigr)\right|\right)
\leq \sqrt{\mathbb{E}_{m\in B}^{\log}\mathbb{E}_{n\in B}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)}

が成り立つ*1.

証明. Cauchy-Schwarzの不等式*2より

\displaystyle \mathbb{E}_{n\in[N]}\left(\left|\mathbb{E}_{m\in B}^{\log}\bigl(1-m\mathbf{1}_{m\mid n}\bigr)\right|\right)^2\leq \mathbb{E}_{n\in[N]}\left(\left(\mathbb{E}_{m\in B}^{\log}\bigl(1-m\mathbf{1}_{m\mid n}\bigr)\right)^2\right)\tag{6}

と評価できる. 2乗を展開すれば

\displaystyle \mathbb{E}_{n\in[N]}\left(\left(\mathbb{E}_{m\in B}^{\log}\bigl(1-m\mathbf{1}_{m\mid n}\bigr)\right)^2\right)=S_1-2S_2+1,

\begin{align}
S_1&=\mathbb{E}_{n\in[N]}\mathbb{E}_{m\in B}^{\log}\mathbb{E}_{l\in B}^{\log}\bigl(m\mathbf{1}_{m\mid n}\cdot l\mathbf{1}_{l\mid n}\bigr),\\
S_2&=\mathbb{E}_{n\in[N]}\mathbb{E}_{m\in B}^{\log}\bigl(m\mathbf{1}_{m\mid n}\bigr)
\end{align}

と分解することができる*3.

\mathbb{E}_{n\in [N]}\bigl(m\mathbf{1}_{m\mid n}\bigr)=1+O(1/N)なので*4, 和の順序を入れ替えることにより

\displaystyle S_1=1+O\left(\frac{1}{N}\right)

がわかる*5.

同様に考えると, \mathbb{E}_{n\in [N]}\bigl(m\mathbf{1}_{m\mid n}\cdot l\mathbf{1}{l \mid n}\bigr)=\mathrm{gcd}(m,l)\bigl(1+O(1/N)\bigr)なので*6, Bに依存する自然数g_B

\displaystyle g_B:=\max_{(m,l)\in B\times B}\mathrm{gcd}(m,l)

とおけば

\displaystyle S_2=1+\mathbb{E}_{m\in B}^{\log}\mathbb{E}_{l\in B}^{\log}\bigl(\mathrm{gcd}(m,l)-1\bigr)+O\left(\frac{g_B}{N}\right)

を得る. 不等式(6)の両辺の平方根をとり, 右辺をS_1, S_2の得られた表示で整理し, 両辺の\displaystyle \limsup_{N\to\infty}をとれば所望の不等式となる. Q.E.D.


次の命題が証明全体におけるキーであり, 良い性質を持つ2つの集合B_1, B_2の存在を主張する.

3.2 0 < \eta < 1に対して, \rho=\rho(\eta)\in (1,1+\eta]およびk_0=k_0(\eta)\in\mathbb{N}が存在し, 以下が成り立つ: 任意の整数k\geq k_0および任意のl\in \mathbb{N}に対して空でない有限集合B_1=B_1(\eta,k,l)\subset\mathbb{N}, B_2=B_2(\eta,k,l)\subset\mathbb{N}が存在して, 以下の性質が成り立つ:

(a) B_1\subset \mathcal{P}\setminus [l],\quad B_2\subset \mathcal{P}_k\setminus [l].
(b) 任意のj\in \mathbb{N}\cup\{0\}に対して, \#(B_1\cap (\rho^j, \rho^{j+1}]) = \#(B_2\cap (\rho^j, \rho^{j+1}])が成り立つ.
(c) i=1,2に対して\mathbb{E}_{m\in B_i}^{\log}\mathbb{E}_{n\in B_i}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr) < \etaが成り立つ.


3.3 論文と同じく, 3.2が証明できたと仮定して(2)が導かれることを先にみておく.

\eta > 0を任意に取り, 3.2によって存在する\rho\in (1,1+\eta]およびk_0\in\mathbb{N}をとる. 更に, k_0以上の偶数kおよび自然数l\in\mathbb{N}をとる. そうして, 3.2によって存在する集合B_1, B_2をとる. B_1\cup B_2の最大限をh_Bと表す.

i=1,2とする. m\in B_i\cap[N]を固定し, [\lfloor N/m\rfloor]=[N/m]と略記するとき,

\begin{align}
\mathbb{E}_{n\in[N/m]}\bigl(\mu(mn)\bigr)&=\frac{1}{\lfloor N/m\rfloor}\sum_{n\leq \frac{N}{m}}\mu(mn)=\left(1+O\left(\frac{h_B}{N}\right)\right)\frac{m}{N}\sum_{n\leq N}\mathbf{1}_{m\mid n}\mu(n)\\
&=\mathbb{E}_{n\in[N]}\bigl(m\mathbf{1}_{m\mid n}\mu(n)\bigr)+O\left(\frac{h_B}{N}\right)
\end{align}

なので,

\begin{align}
&\left|\mathbb{E}_{n\in [N]}\bigl(\mu(n)\bigr)-\mathbb{E}_{m\in B_i}^{\log}\mathbb{E}_{n\in[N/m]}\bigl(\mu(mn)\bigr)\right|\\
&=\left|\mathbb{E}_{n\in [N]}\bigl(\mu(n)\bigr)-\mathbb{E}_{m\in B_i}^{\log}\mathbb{E}_{n\in[N]}\bigl(m\mathbf{1}_{m\mid n}\mu(n)\bigr)\right|+O\left(\frac{h_B}{N}\right)\\
&\leq\mathbb{E}_{n\in[N]}\left(\left|\mathbb{E}_{m\in B_i}^{\log}\bigl(1-m\mathbf{1}_{m\mid n}\bigr)\right|\right)+O\left(\frac{h_B}{N}\right)
\end{align}

と評価できる. 両辺のNに関する上極限をとって3.1および3.2の(c)を用いると

\displaystyle \limsup_{N\to\infty}\left|\mathbb{E}_{n\in [N]}\bigl(\mu(n)\bigr)-\mathbb{E}_{m\in B_i}^{\log}\mathbb{E}_{n\in[N/m]}\bigl(\mu(mn)\bigr)\right|\leq \sqrt{\eta}

を得る.

3.4 ここで少し上漸近密度を取り扱う. 集合A\subset\mathbb{N}の上漸近密度\overline{d}(A)

\displaystyle \overline{d}(A):=\limsup_{N\to\infty}\frac{\#(A\cap[N])}{N}

と定義される. 一般に\overline{d}(A\cup B)\leq \overline{d}(A)+\overline{d}(B).

m=p_1\cdots p_kを相異なるk個のl以上であるような素数の積とし, \mathbb{N}_mmと互いに素な自然数全体のなす集合とし, p_i\mathbb{N}p_iの倍数全体のなす集合とするとき,

\displaystyle \frac{\lfloor N/p_i\rfloor}{N}=\frac{N/p_i+O(1)}{N}=\frac{1}{p_i}+O\left(\frac{1}{N}\right)\to\frac{1}{p_i}\leq \frac{1}{l}

という計算から

\displaystyle \overline{d}(\mathbb{N}\setminus\mathbb{N}_m)\leq \sum_{i=1}^k\overline{d}(p_i\mathbb{N})\leq \frac{k}{l}

と評価できることがわかる.

3.5 ここで, 3.3の設定に戻る. m\in B_iに対して, Möbius関数の乗法性*7から

\begin{align}
\mathbb{E}_{n\in[N/m]}\bigl(\mu(mn)\bigr)&=\frac{1}{\lfloor N/m\rfloor}\left(\sum_{\substack{n\leq N/m \\ n\in \mathbb{N}_m}}\mu(mn)+\sum_{\substack{n\leq N/m \\ n\not\in \mathbb{N}_m}}\mu(mn)\right)\\
&=\frac{1}{\lfloor N/m\rfloor}\left(\sum_{n\leq N/m}\mu(m)\mu(n)-\sum_{\substack{n\leq N/m \\ n\not\in \mathbb{N}_m}}\mu(m)\mu(n)+\sum_{\substack{n\leq N/m \\ n\not\in \mathbb{N}_m}}\mu(mn)\right)
\end{align}

と変形でき, 3.4を使うことにより

\displaystyle \mathbb{E}_{n\in[N/m]}\bigl(\mu(mn)\bigr)=\mathbb{E}_{n\in[N/m]}\bigl(\mu(m)\mu(n)\bigr)+O_{N\to\infty}\left(\frac{k}{l}\right)

が成り立つことがわかる(i=1のときは, それで十分だからという理由で, 1/l\leq k/lと上から評価しておく).

3.6 さて, 3.2の(a)からB_1の元は素数であり, B_2の元は相異なるk個の素数の積である. 更にkを偶数として選んでいることから, m\in B_1のときは \mu(m)=1, m\in B_2のときは \mu(m)=-1である. このことと, 3.3, 3.5の結論より

\begin{align}
\limsup_{N\to\infty}\left|\mathbb{E}_{n\in [N]}\bigl(\mu(n)\bigr)-\mathbb{E}_{m\in B_1}^{\log}\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\right|\leq \sqrt{\eta}+O\left(\frac{k}{l}\right)\\
\limsup_{N\to\infty}\left|\mathbb{E}_{n\in [N]}\bigl(\mu(n)\bigr)+\mathbb{E}_{m\in B_2}^{\log}\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\right|\leq \sqrt{\eta}+O\left(\frac{k}{l}\right)
\end{align}

が得られる.

3.7 実は3.2の(b)から

\displaystyle \mathbb{E}_{m\in B_1}^{\log}\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)=\mathbb{E}_{m\in B_2}^{\log}\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)+O_{N\to\infty}(\eta)+o_{N\to\infty}(1)

が成り立つことを証明できる(初見で「そんなこと証明できるはずがない」と思ってしまったのは内緒). まず, (\rho^j,\rho^{j+1}]毎に区切って三角不等式を用いることにより

\begin{align}
&\left|\mathbb{E}_{m\in B_1}^{\log}\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)-\mathbb{E}_{m\in B_2}^{\log}\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\right|\\
&=\left|\sum_{j=0}^{\infty}\left(\mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\bigr)-\mathbb{E}_{m\in B_2}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\bigr)\right)\right|\\
&\leq\sum_{j=0}^{\infty}\left|\mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\bigr)-\mathbb{E}_{m\in B_2}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\bigr)\right|
\end{align}

と評価できる. 和の中身を評価していこう. B_1, B_2は有限集合なので, jは有限の範囲を考えれば十分であり, 以下の評価では実際にそう仮定する.

3.8 m\in B_i, m\in(\rho^j,\rho^{j+1}]とする(i=1,2). このとき,

\displaystyle \mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)=\mathbb{E}_{n\in[N/\rho^j]}\bigl(\mu(n)\bigr)+O_{N\to\infty}(\eta)+o_{N\to\infty}(1)

が成り立つ.

証明. N/\rho^{j+1}\leq N/m < N/\rho^jに注意する.

\displaystyle \frac{1}{\lfloor N/m\rfloor}=\frac{\rho^{j+1}}{N}\left(1+O_{N\to\infty}(\eta)\right),\quad \frac{1}{\lfloor N/\rho^j\rfloor}=\frac{\rho^{j+1}}{N}\left(1+O_{N\to\infty}(\eta)\right)

が成り立っている*8.

\displaystyle \left|\frac{\rho^{j+1}}{N}\sum_{\frac{N}{m} < n\leq \frac{N}{\rho^j}}\mu(n)\right|\leq \frac{\rho^{j+1}}{N}\left(\frac{N(\rho-1)}{\rho^{j+1}}+1\right)\leq \eta+o_{N\to\infty}(1)

と評価できることから,

\displaystyle \frac{\rho^{j+1}}{N}\cdot O_{N\to\infty}(\eta)\left(\left|\sum_{n\leq N/m}\mu(n)\right|+\left|\sum_{n\leq \frac{N}{\rho^j}}\mu(n)\right|\right)=O_{N\to\infty}(\eta)

と合わせて所望の評価を得る. Q.E.D.

3.9 \#(B_i\cap (\rho^j,\rho^{j+1}])=t_jとおく. 3.2の(b)よりt_jこれはi=1,2によらず, j > Jでは t_j=0の状態にあるとする.

\displaystyle E_j:=\frac{t/\rho^j}{\sum_{j=1}^Jt_j/\rho^j}

とおけば, 1\not\in B_1, B_2に注意して,

\displaystyle \frac{1}{\rho}E_j\leq \mathbb{E}_{m\in B_i}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\bigr) \leq \rho E_j

と評価することができる. 従って,

\displaystyle \frac{1}{\rho^2}\mathbb{E}_{m\in B_2}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\bigr) \leq \mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\bigr) \leq \rho^2\mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\bigr)

とはさむことができ,

\displaystyle \frac{\mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\bigr)}{\mathbb{E}_{m\in B_2}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\bigr)}=1+O(\eta)

がわかる*9.

3.10 上の2つの評価3.8, 3.9を用いると

\begin{align}
&\mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\bigr)-\mathbb{E}_{m\in B_2}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\bigr)\\
&=\mathbb{E}_{n\in N/\rho^j}\bigl(\mu(n)\bigr)\left(\mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\bigr)-\mathbb{E}_{m\in B_2}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\bigr)\right)\\
&\quad +\left(O_{N\to\infty}(\eta)+o_{N\to\infty}(1)\right)\mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\bigr)\\
&=\left(O_{N\to\infty}(\eta)+o_{N\to\infty}(1)\right)\mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\bigr)
\end{align}

を得る. \mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\bigr)が非負である事に注意すれば

\begin{align}
&\sum_{j=0}^{\infty}\left|\mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\bigr)-\mathbb{E}_{m\in B_2}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\bigr)\right|\\
&\leq  \left(O_{N\to\infty}(\eta)+o_{N\to\infty}(1)\right)\sum_{j=1}^{\infty}\mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\bigr)
\end{align}

と評価することができ,

\displaystyle \sum_{j=1}^{\infty}\mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{(\rho^j,\rho^{j+1}]}(m)\bigr)=\mathbb{E}_{m\in B_1}^{\log}\bigl(\mathbf{1}_{B_1}\bigr)=1

である事から3.7は真実である.

3.11 今示された3.7を用いることにより,

\begin{align}
2\mathbb{E}_{n\in[N]}\bigl(\mu(n)\bigr)&=
\mathbb{E}_{n\in [N]}\bigl(\mu(n)\bigr)-\mathbb{E}_{m\in B_1}^{\log}\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\\
&\quad +\mathbb{E}_{n\in [N]}\bigl(\mu(n)\bigr)+\mathbb{E}_{m\in B_1}^{\log}\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\\
&=\mathbb{E}_{n\in [N]}\bigl(\mu(n)\bigr)-\mathbb{E}_{m\in B_1}^{\log}\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\\
&\quad +\mathbb{E}_{n\in [N]}\bigl(\mu(n)\bigr)+\mathbb{E}_{m\in B_2}^{\log}\mathbb{E}_{n\in[N/m]}\bigl(\mu(n)\bigr)\\
&\quad +O_{N\to\infty}(\eta)+o_{N\to\infty}(1)
\end{align}

と変形することができる. これに三角不等式を適用してから上極限\displaystyle\limsup_{N\to\infty}をとり, 3.6を用いることにより

\displaystyle \limsup_{N\to\infty}\left|\mathbb{E}_{n\in[N]}\bigl(\mu(n)\bigr)\right|\leq O(\eta)+O\left(\frac{k}{l}\right)

を得る. 任意に\varepsilon > 0をとり, O(\eta) < \varepsilon/2が成り立つように\etaをとる. \etaに依存してkをとったあとに, O(k/l) < \varepsilon/2が成り立つだけ大きなlをとる. このようにすれば

\displaystyle \limsup_{N\to\infty}\left|\mathbb{E}_{n\in[N]}\bigl(\mu(n)\bigr)\right|\leq \varepsilon

が得られるので,

\displaystyle \lim_{N\to\infty}\mathbb{E}_{n\in[N]}\bigl(\mu(n)\bigr)=0

が従う. これは(2)であり, 2節の議論から素数定理(1)が証明されたことになる.


後は3.2B_1, B_2の存在性を示せばよい. そのために, Chebyshev型定理の評価を用いる. 古典的な結果であるが証明しておこう. まずは下からの評価を与える.

4.1 xe以上の実数とする. このとき,

\displaystyle \pi(x) \geq (\log 2)\cdot \frac{x}{\log x}+O(1)

が成り立つ.

証明. xが偶数x=2nである場合に証明すれば十分である*10. Legendreの公式より

\displaystyle \mathrm{ord}_p\binom{2n}{n}=\sum_{i=1}^{\lfloor\log_p(2n)\rfloor}\left(\left\lfloor\frac{2n}{p^i}\right\rfloor-2\left\lfloor\frac{n}{p^i}\right\rfloor\right)\leq\log_p(2n)

である*11. よって

\displaystyle \binom{2n}{n}=\prod_{p\in\mathcal{P}\cap[2n]}p^{\mathrm{ord}_p\binom{2n}{n}}\leq (2n)^{\#(\mathcal{P}\cap [2n]})

と評価でき, 自然対数をとると

\displaystyle \log\binom{2n}{n}\leq \#(\mathcal{P}\cap[2n])\log 2n \tag{7}

を得る. [note]の命題5.3より

\log(n!)=n\log n-n+O(\log n)

なので,

\displaystyle \log \binom{2n}{n}=(2\log 2)n+O(\log n)\tag{8}

を得る. (7)(8)を合わせれば証明が完了する. Q.E.D.

上からの評価には次の補題を用いる.

4.2 x\geq e, 1 < \sigma \leq 16とする*12. このとき,

\displaystyle \#(\mathcal{P}\cap (x,\sigma x])\leq \frac{\beta(\sigma)x}{\log x}+O\left(\frac{x}{\log^2x}\right)

が成り立つ. ここで, \beta(\sigma):=\sigma \log \sigma-(\sigma-1)\log (\sigma-1)とおいている.

証明. \binom{\sigma x}{x}\binom{\lfloor \sigma x\rfloor}{\lfloor x\rfloor}を意味するものとする. \mathcal{P}\cap (x,\sigma x]の元は\binom{\sigma x}{x}を割り切るので,

\displaystyle \binom{\sigma x}{x}\geq \prod_{p\in\mathcal{P}\cap (x,\sigma x]}p\geq x^{\#(\mathcal{P}\cap (x,\sigma x])}

と評価でき, 自然対数をとると

\displaystyle \log\binom{\sigma x}{x}\geq \#(\mathcal{P}\cap (x,\sigma x])\log x\tag{9}

を得る. [note]の命題5.3より

\begin{align}
\log\binom{\sigma x}{x} &= \log\frac{\lfloor \sigma x\rfloor!}{\lfloor x\rfloor!(\lfloor \sigma x\rfloor-\lfloor x\rfloor)!}\\
&=\lfloor \sigma x\rfloor \log \lfloor \sigma x\rfloor -\lfloor \sigma x\rfloor+O(\log\lfloor \sigma x\rfloor)\\
&\quad -\bigl(\lfloor x\rfloor\log\lfloor x\rfloor-\lfloor x\rfloor + O(\log\lfloor x\rfloor)\bigr)\\
&\quad -\bigl( (\lfloor \sigma x\rfloor-\lfloor x\rfloor)\log(\lfloor \sigma x\rfloor - \lfloor x\rfloor)-(\lfloor \sigma x\rfloor - \lfloor x\rfloor) + O(\log(\lfloor \sigma x\rfloor - \lfloor x\rfloor) )\\
&=\lfloor \sigma x\rfloor \log \lfloor \sigma x\rfloor-\lfloor x\rfloor\log\lfloor x\rfloor-(\lfloor \sigma x\rfloor-\lfloor x\rfloor)\log(\lfloor \sigma x\rfloor - \lfloor x\rfloor)+O(\log x)\\
&=\sigma x \log (\sigma x)-x\log x-(\sigma-1)x\log( (\sigma-1)x)+O\left(\frac{x}{\log x}\right)\\
&=\sigma x\log \sigma-(\sigma-1)x\log (\sigma-1)+O\left(\frac{x}{\log x}\right)\\
&=(\sigma\log \sigma-(\sigma-1)\log(\sigma-1) )x+O\left(\frac{x}{\log x}\right)
 \end{align}

と計算できる*13. (9)と合わせて両辺を\log xで割ればよい. Q.E.D.

Richterの証明において必要となる数論的情報は, Chebyshev型定理として証明した上記2つの補題から示される, 短区間における素数の個数に関する次の命題に集約される*14.

4.3 実数x_0\geq 1, \varepsilon_0 > 0が存在して, 以下が成立する:

\begin{align}
\#(\mathcal{P}\cap (8^x,8^{x+1}]) &\geq \frac{8^x}{x}\qquad \quad (x\geq x_0),\\
\#(\mathcal{P}\cap (8^x, 8^{x+\varepsilon}])&\leq \frac{\sqrt{\varepsilon}8^x}{x}\qquad (\varepsilon \in (0,\varepsilon_0], x\geq x_1(\varepsilon) ).
\end{align}

ただし, x_1(\varepsilon) \geq 1\varepsilonに依存して存在する実数.

証明. 4.2において\sigma=8^{\varepsilon}とおくことにより、

\displaystyle \#(\mathcal{P}\cap (8^x, 8^{x+\varepsilon}])\leq \frac{\beta(8^{\varepsilon})}{\log 8}\cdot\frac{8^x}{x}+O\left(\frac{8^x}{x^2}\right)

が成り立つ。\varepsilonが例えば0.16以下であれば \frac{\beta(8^{\varepsilon})}{\log 8} < \sqrt{\varepsilon}が成り立つので、xが十分大きければ

\displaystyle \#(\mathcal{P}\cap (8^x, 8^{x+\varepsilon}])\leq \frac{\sqrt{\varepsilon}8^x}{x}

が成り立つことがわかる。
1つ目の不等式の証明について, 4.2を用いたRichterの議論は細かい点が個人的に気になるが, ここでは代わりに4.1の逆向きの不等式として以下の4.4を用いることにする*15. 4.14.4を組み合わせると,

\displaystyle \#(\mathcal{P}\cap (8^x,8^{x+1}])\geq \frac{8^{x+1}}{3(x+1)}-\frac{2\cdot 8^x}{3\log 2\cdot x}+O(1)

と評価できる. 例えば 1/(x+1) > 3/(4x) と評価すれば, これは8^x/xで下から押さえることができる. Q.E.D.

4.4 xe以上の実数とする. このとき,

\displaystyle \pi(x) \leq 2\cdot \frac{x}{\log x}

が成り立つ.

証明. 4.1のときと同様に考えて, x3以上の整数nのときに成立することを証明すればよく, nが小さいときは直接成立を確認できるので, n > 105と仮定してよい. このときに, 3以上n未満の整数では成立すると仮定して数学的帰納法で証明する. その際, nは奇数であると仮定してよく, n=2k+1とおく. まず,

\displaystyle \binom{2k+1}{k}\geq \prod_{k+2\leq p\leq 2k+1}p\geq (k+2)^{\pi(2k+1)-\pi(k+1)}

と評価でき, 一方

\displaystyle \binom{2k+1}{k}=\frac{1}{2}\left\{\binom{2k+1}{k}+\binom{2k+1}{k+1}\right\}\leq \frac{1}{2}\sum_{j=0}^{2k+1}\binom{2k+1}{j}=2^{2k}

と評価できるので, 合わせると

\displaystyle (k+2)^{\pi(2k+1)-\pi(k+1)}\leq 2^{2k}

を得る. 対数を取れば

\displaystyle \pi(2k+1)-\pi(k+1)\leq \frac{2k\log 2}{\log (k+2)}

となるが, 帰納法の仮定および条件n > 105を用いることにより

\displaystyle \pi(n)=\pi(2k+1)\leq \frac{2k\log 2}{\log (k+2)}+\frac{2(k+1)}{\log (k+1)} < \frac{(\log 2+1)n+1}{\log \left(\frac{n}{2}\right)} < \frac{2n}{\log n}

を得る. Q.E.D.

4.5 ある\varepsilon_0 \in (0,1)が存在して以下が成立する: 任意の\varepsilon \in (0,\varepsilon_0]と任意の\delta \in (0,1)をとるとき、\varepsilonのみに依存するx_0=x_0(\varepsilon) > 0\varepsilon, \deltaのみに依存するD=D(\varepsilon, \delta)\in (0,1)が存在して以下が成立する: x_0以上の整数nに対して、あるx,y\in [n,n+1)が存在し、\varepsilon^4 < y-x < \varepsilonかつ

\displaystyle \#(\mathcal{P}\cap(8^x,8^{x+\delta}])\geq D\cdot\frac{8^x}{x},\qquad \#(\mathcal{P}\cap(8^y,8^{y+\delta}])\geq D\cdot\frac{8^y}{y}

が成り立つ。

証明. x_04.3のもの以上とするとき、4.3の一つ目の不等式から区間 (8^n,8^{n+1}]内に少なくとも8^n/n個の素数が存在することがわかる。K_0:=\lceil \varepsilon^{-1}\rceilとおくとき、分割による被覆

\displaystyle (8^n, 8^{n+1}]\subset (8^n, 8^{n+\varepsilon}]\cup(8^{n+\varepsilon},8^{n+2\varepsilon}]\cup\cdots\cup(8^{n+(K_0-1)\varepsilon},8^{n+K_0\varepsilon}]

があるので、鳩の巣原理により或るt\in [n,n+1)が存在して区間(8^t,8^{t+\varepsilon}]に少なくとも

\displaystyle \frac{\varepsilon 8^n}{2n}

個の素数が存在することがわかる。実際、上のK_0個の区間の全てがそれぞれ\varepsilon 8^n/2n個未満の素数しか含まなければ、区間(8^n, 8^{n+1}]の含む素数の個数が高々

\displaystyle K_0\times\frac{\varepsilon 8^n}{2n}\leq \left(\frac{1}{\varepsilon}+1\right)\cdot\frac{\varepsilon 8^n}{2n} < \frac{\varepsilon 8^n}{2}

で矛盾する。次に、K_1:=\lceil\varepsilon^{-3}\rceilとおく。分割による被覆

\displaystyle (8^t,8^{t+\varepsilon}]\subset (8^t,8^{t+\varepsilon^4}]\cup(8^{t+\varepsilon^4},8^{t+2\varepsilon^4}]\cup\cdots\cup(8^{t+(K_1-1)\varepsilon^4},8^{t+K_1\varepsilon^4}]

を考える。このとき、各1\leq j\leq K_1-1に対して小区間(8^{t+j\varepsilon^4},8^{t+(j+1)\varepsilon^4}]は高々

\displaystyle \frac{64\varepsilon^28^n}{n}

個の素数しか含まない。実際、\varepsilon_04.3\varepsilon_0の4乗根以下とし、x_04.3x_1(\varepsilon^4)以上とすると、4.3の2つ目の不等式より

\displaystyle \#(\mathcal{P}\cap(8^{t+j\varepsilon^4},8^{t+(j+1)\varepsilon^4}])\leq \frac{\varepsilon^28^{t+j\varepsilon^4}}{t+j\varepsilon^4}

が成り立つ。あとはn\leq t+j\varepsilon^4\leq t+\varepsilon\leq n+2に注意すればよい。

このことから、\varepsilon_0が十分小さければ、ある連続しない2つの整数a,b\in \{0,1,\dots,K_1-1\}が存在して(a < bとする)、

\begin{align}
&\#(\mathcal{P}\cap(8^{t+a\varepsilon^4},8^{t+(a+1)\varepsilon^4}])\geq \frac{\varepsilon^48^n}{4n},\\
&\#(\mathcal{P}\cap(8^{t+b\varepsilon^4},8^{t+(b+1)\varepsilon^4}])\geq \frac{\varepsilon^48^n}{4n}
\end{align}

が成り立つことがわかる。実際、今考えているK_1個の小区間のうち、少なくも3つの区間素数を少なくとも\varepsilon^48^n/(4n)個含むことを示せばよい。背理法で証明するために、K_1-2個の小区間素数をそれぞれ\varepsilon^48^n/(4n)個未満しか含まなかったと仮定する。残り2個の区間に含まれる素数の総計は先ほど示したことから高々

\displaystyle \frac{128\varepsilon^28^n}{n}

個しか含まないので、\varepsilon_0が(従って\varepsilonが)十分小さければ

\displaystyle \#(\mathcal{P}\cap (8^t,8^{t+\varepsilon}])\leq (K_1-2)\frac{\varepsilon^48^n}{4n}+\frac{128\varepsilon^28^n}{n} < \frac{\varepsilon8^n}{2n}

なる評価に到達して、tの取り方に矛盾する。

さて、任意の\delta\in (0,1)に対して

\displaystyle x\in [t+a\varepsilon^4,t+(a+1)\varepsilon^4),\quad y\in [t+b\varepsilon^4,t+(b+1)\varepsilon^4)

であって

\begin{align}
&\#(\mathcal{P}\cap (8^x,8^{x+\delta}])\geq \frac{\delta\varepsilon^48^n}{8n},\\
&\#(\mathcal{P}\cap (8^y,8^{y+\delta}])\geq \frac{\delta\varepsilon^48^n}{8n}\end{align}

が成り立つようなものが存在する。これはK_2:=\lceil\delta^{-1}\rceilとおいて分割による被覆

\displaystyle (8^{t+a\varepsilon^4},8^{t+(a+1)\varepsilon^4}]\subset (8^{t+a\varepsilon^4},8^{t+a\varepsilon^4+\delta}]\cup\cdots\cup(8^{t+a\varepsilon^4+(K_2-1)\delta},8^{t+a\varepsilon^4+K_2\delta}]

を考えて鳩の巣原理を適用すればよい(bについても同様)。このとき、a,bが隣合わないことからy-x > \varepsilon^4が成り立っており、x,y\in [t,t+\varepsilon)なのでy-x < \varepsilonである。すなわち、n < x, y < n+2に注意して、D(\varepsilon, \delta)=\varepsilon^4\delta/8^3ととれる。 Q.E.D.

4.6 ある\varepsilon_0 \in (0,1)が存在して以下が成立する: 任意の\varepsilon \in (0,\varepsilon_0]に対してx_0=x_0(\varepsilon) > 0が存在して以下が成立する: 任意に整数k\geq \lceil 3\varepsilon^{-4}\rceilをとり、\delta:=\varepsilon/kとしてD=D(\varepsilon,\delta)4.5のものとする。x_0(\varepsilon)以上のk個の整数n_1,\dots,n_kおよび実数x\geq x_0(\varepsilon)であってn_1+\cdots+n_k=\lfloor x\rfloorを満たすようなものを任意にとる。このとき、実数x_1,\dots, x_kであって、

\begin{align}
\bullet \ &\#(\mathcal{P}\cap(8^{x_i},8^{x_i+\delta}]\geq D\cdot\frac{8^{x_i}}{x_i} \quad (1\leq i \leq k),\\
\bullet \ &|x_i-n_i|\leq 1 \quad (1\leq i \leq k), \\
\bullet \ &x_1+\cdots + x_k \in [x, x+\varepsilon)
\end{align}

を満たすようのものが存在する。

証明. \varepsilon_04.5と同じもの、x_0(\varepsilon)4.5のもの+1とする。4.5より、各i\in [k]に対して x_{i,1},y_{i,1}\in[n_i-1,n_i), x_{i,2}, y_{i,2}\in [n_i, n_i+1)であって

\varepsilon^4 < y_{i,j}-x_{i,j} < \varepsilon

および

\displaystyle \#(\mathcal{P}\cap (8^{x_{i,j}},8^{x_{i,j}+\delta}])\geq D\cdot \frac{8^{x_{i,j}}}{x_{i,j}}

j=1,2に対して成り立つようなものが存在する。よって、x_i \in \{x_{i,1},y_{i,1},x_{i,2},y_{i,2}\}であるようにx_iを選べば所望の性質のうち最初の二つは満たされる。

まずはx_1:=x_{1,1}および

\displaystyle x_{i+1}:=\begin{cases} x_{i+1,2} & (x_1+\cdots +x_i \leq n_1+\cdots +n_i-1) \\ x_{i+1,1} & (x_1+\cdots +x_i > n_1+\cdots +n_i-1)\end{cases}

によってx_1,\dots, x_kを定める。すると、帰納法によって

n_1+n_2+\cdots + n_i-2 \leq x_1+\cdots +x_i < n_1+\cdots +n_i

が満たされる。特に、

\lfloor x\rfloor -2 \leq x_1+\cdots +x_k < \lfloor x\rfloor

が成り立つ。その後、x_1から順次必要に応じてx_iの値x_{i,j}y_{i,j}に取り替えていく。一回取り替える毎にx_1+\cdots +x_kの増える量は\varepsilon未満なので、x未満の値から一回取り替えていきなりx+\varepsilon以上になることはない。一方、x_1+\cdots +x_kの増える量は\varepsilon^4以上なのでk回取り替えを行うと3は増加して必ずxを超えることになる。つまり、どこかのタイミングでx_1+\cdots +x_k[x,x+\varepsilon)に入る。 Q.E.D.



以上の準備のもとに3.2を証明する。

4.7 (パラメーターの選択)
\eta \in (0,1)を任意に選ぶ。
K=K(\eta) > 08^{1/K} < 1+\etaを満たすようにとる。
\rho:=8^{1/K}とおく。
\varepsilon_04.6のものとする。
\varepsilon:=\min\{\varepsilon_0,1/(2K)\}とする。
x_04.6x_0(\varepsilon)以上の\etaのみに依存する十分大きい数とする。
k_0:=\lceil 3\varepsilon^{-4}\rceilとする。

整数k\geq k_0およびl \geq 1を任意にとる。
Chebyshev型の不等式である4.3の1つ目の不等式と4.4から、絶対定数C\geq 1があって

\displaystyle \frac{8^n}{n}\leq \#(\mathcal{P}\cap (8^{n-1},8^{n+2}])\leq C\cdot \frac{8^n}{n} \quad (n\geq x_0)

が成り立つ。

\delta:=\varepsilon/kとおき、D=D(\varepsilon,\delta)4.6のものとし、整数N

\displaystyle N\geq \left(\frac{ECK}{D}\right)^{2k}\cdot \frac{1}{\eta}

を満たすようにとる(Eは絶対定数)。最後に整数s_1

s_1 =\max\left\{x_0,\frac{\log l}{\log 8}+1\right\}

と選んでおく。

4.8 (A_1,\dots, A_kの構成)
有限集合A_1\subset s_1\mathbb{N}(s_1の倍数からなる)を

\displaystyle \sum_{n\in A_1}\frac{1}{n}\geq N

を満たすように選ぶ(調和級数が発散することから選べる)。以下、帰納的にA_iまで決まっているときに、s_{i+1}を集合A_1+\cdots + A_iの最大元+1と定める。そうして、有限集合A_{i+1}\subset s_{i+1}\mathbb{N}

\displaystyle \sum_{n\in A_{i+1}}\frac{1}{n}\geq N

を満たすように選ぶ。こうして、A_1, \dots, A_kを定義する。

このとき、A_1+\cdots + A_kの元は一意的な表示を持つ。∵ A_1+\cdots +A_iでそうであると仮定して、A_1+\cdots +A_i+A_{i+1}もそうだということを示せばよい。n_1+\cdots +n_{i+1}=n_1'+\cdots +n_{i+1}'と2通りの表示があったとすると

n_{i+1}-n_{i+1}'=(n_1'+\cdots +n_i')-(n_1+\cdots +n_i)

が成り立つが、右辺は-s_{i+1}より真に大きくs_{i+1}未満であり、左辺はs_{i+1}の倍数である。このことからn_{i+1}=n_{i+1}'であり、残りは帰納法の仮定からn_1=n_1',\dots, n_i=n_i'が従う。こうして一意的な表示を持つことが示された。

n\in A_1+\cdots +A_kをとる。4.3の1つ目の不等式から\#(\mathcal{P}\cap (8^{n-1},8^{n+2}])\geq 8^n/nであり、

\displaystyle (8^n,8^{n+1}]=(\rho^{Kn},\rho^{Kn+1}]\cup\cdots\cup(\rho^{Kn+K-1},\rho^{Kn+K}]

から、鳩の巣原理により或るi_n\in\{Kn,\dots, Kn+K-1\}が存在して小区間(\rho^{i_n},\rho^{i_n+1}]\subset (8^n,8^{n+1}]は少なくとも8^n/(Kn)個の素数を含む。

\displaystyle \left\lfloor \frac{i_n}{K}\right\rfloor = n = n_1+\cdots +n_k

と一意的に表示できるが(n_1\in A_1, \dots, n_k\in A_k)、4.6においてx=i_n/Kとしたときのx_1,\dots, x_kをとる。これらはnに依存することに注意(本当はnを明示すべきだが記号がうるさくなるので省略する)。x_{i+1}\geq n_{i+1}-1 > n_i+1 \geq x_iである。

4.9 (B_{n,2}の構成)
i\in [k]について、4.6の1つ目の式から、\mathcal{P}\cap(8^{x_i},8^{x_i+\delta}]の部分集合P_{n_i}であって、

\displaystyle \#P_{n_i}=\left\lfloor\frac{D8^{x_i}}{Kx_i}\right\rfloor

が成り立つようなものをとることができる。P_{n_i}達はどの2つをとっても互いに素な集合*16である。このとき、

\displaystyle B_{n,2}:=P_{n_1}\cdot \cdots \cdot P_{n_k}

とおく。4.6の3つ目の式とk\delta=\varepsilon, 2\varepsilon \leq 1/Kであることから

B_{n,2}\subset (8^{x_1+\cdots +x_k},8^{x_1+\cdots +x_k+k\delta}]\subset (8^{i_n/K}, 8^{i_n/K+2\varepsilon}]\subset (\rho^{i_n},\rho^{i_n+1}]

が成り立つ。

4.10 (B_{n,1}の構成)
B_{n,1}\subset \mathcal{P}\cap (\rho^{i_n}, \rho^{i_n+1}]\#B_{n,1}=\#B_{n,2}が成り立つように選ぶ。選べる理由であるが、

\displaystyle \#B_{n,2}\leq \prod_{i=1}^k\frac{D8^{x_i}}{Kx_i} < \frac{8^n}{Kn}

と評価できることとi_nの取り方からわかる。最後の不等号はx_1+\cdots +x_k < i_n/K+\varepsilon < n+1, 8D < 1,

x_1\cdots x_k \geq (n_1-1)\cdots (n_k-1) \geq n_1+\cdots +n_k=n

などから余裕で評価できる。

4.11 (Richterの集合の構成)
集合B_1, B_2

\displaystyle B_1:=\bigcup_{n\in A_1+\cdots +A_k}B_{n,1},\quad B_2:=\bigcup_{n\in A_1+\cdots +A_k}B_{n,2}

と定める。B_{n,1}\subset (8^n, 8^{n+1}]であり、P_{n_i}\subset (8^{x_i},8^{x_i+\delta}]であるが、8^{x_i}\geq 8^{x_1}\geq 8^{n_1-1}\geq 8^{s_1-1}\geq lなどより3.2の(a)が満たされるように構成されていることがわかる。また、B_1B_2(\rho^j,\rho^{j+1}]への制限は空集合であるかB_{n,1}B_{n,2}であるため、3.2の(b)も成立することがわかる*17。従って、あとは3.2の(c)が成り立っていることを確認すればよい。

4.12i\in [k]n_i \in A_iに対し、Q_{n_i}:=\mathcal{P}\cap (8^{n_i-1},8^{n_i+2}]とし、

\displaystyle Q_i:=\bigcup_{n_i \in A_i}Q_i

とおく(これは非交和になっている)。\#Q_{n_i}\leq C8^{n_i}/n_iなので、

\displaystyle 
\sum_{m\in Q_1\cdot\cdots \cdot Q_k}\frac{1}{m}=\prod_{i=1}^k\left(\sum_{m\in Q_i}\frac{1}{m}\right)
\leq \prod_{i=1}^k\left(\sum_{n_i\in A_i}\frac{\#Q_{n_i}}{8^{n_i-1}}\right)\leq 8^kC^k\prod_{i=1}^k\left(\sum_{n_i\in A_i}\frac{1}{n_i}\right)
\tag{10}

と評価できる。一方、x_iが十分大きいことから

\displaystyle \#P_{n_i}=\left\lfloor\frac{D8^{x_i}}{Kx_i}\right\rfloor\geq \frac{D8^{x_i}}{Kx_i}-1\geq \frac{D8^{x_i}}{2Kx_i}\geq \frac{D8^{n_i-1}}{2K(n_i+1)}\geq \frac{D8^{n_i}}{32Kn_i}

が成り立ち、

\begin{align}
\sum_{m\in B_2}\frac{1}{m}&=\sum_{n_1\in A_1,\dots, n_k\in A_k}\left(\sum_{p_1\in P_{n_1},\dots, p_k\in P_{n_k}}\frac{1}{p_1\cdots p_k}\right)\geq \sum_{n_1\in A_1,\dots,n_k\in A_k}\prod_{i=1}^k\frac{\#P_{n_i}}{8^{n_i+2}}\\
&\geq \frac{D^k}{2048^kK^k}\prod_{i=1}^k\left(\sum_{n_i\in A_i}\frac{1}{n_i}\right)\tag{11}
\end{align}

と評価できる*18(10), (11)を合わせると

\displaystyle \sum_{m \in B_2}\frac{1}{m}\geq \frac{D^k}{16384^kC^kK^k}\sum_{m\in Q_1\cdot\cdots\cdot Q_k}\frac{1}{m}\tag{12}

を得る。

4.13 (B_1に関する期待値評価)
B_1の元は素数なので、

\displaystyle 
\mathbb{E}^{\log}_{m\in B_1}\mathbb{E}^{\log}_{n\in B_1}\bigl(\mathrm{gcd}(m,n)-1\bigr)= \mathbb{E}^{\log}_{m\in B_1}\left(\frac{\sum_{n\in B_1}\frac{\mathrm{gcd}(m,n)-1}{n}}{\sum_{n\in B_1}\frac{1}{n}}\right)
=\frac{\mathbb{E}^{\log}_{m\in B_1}\left(\frac{m-1}{m}\right)}{\sum_{n\in B_1}\frac{1}{n}}
\leq \frac{1}{\sum_{n\in B_1}\frac{1}{n}}

が成り立つ。また、3.2の(b)より各jに対して\#(B_1\cap(\rho^j,\rho^{j+1}])=\#(B_2\cap(\rho^j,\rho^{j+1}])=t_jとおくと、

\begin{align}
\sum_{m\in B_1}\frac{1}{m}&=\sum_j\sum_{m\in B_1\cap(\rho^j,\rho^{j+1}]}\frac{1}{m}\geq \sum_j\frac{t_j}{\rho^{j+1}}\\
&=\frac{1}{\rho}\sum_j\frac{t_j}{\rho^{j+1}}\geq \frac{1}{\rho}\sum_j\sum_{m\in B_2\cap(\rho^j,\rho^{j+1}]}\frac{1}{m}=\frac{1}{\rho}\sum_{m\in B_2}\frac{1}{m}
\end{align}

と評価できるので、(11), A_iの取り方, \rho < 2, Nの取り方より

\displaystyle 
\mathbb{E}^{\log}_{m\in B_1}\mathbb{E}^{\log}_{n\in B_1}\bigl(\mathrm{gcd}(m,n)-1\bigr)\leq \frac{\rho}{\sum_{m\in B_2}\frac{1}{m}}\leq \frac{2048^kK^k\rho}{D^k\prod_{i=1}^k\left(\sum_{n_i\in A_i}\frac{1}{n_i}\right)}\leq \frac{2048^kK^k\rho}{D^kN} < \eta

を示すことができた。これで3.2の(c)をB_1に対して証明できたことになる。

4.14 U, V自然数からなる互いに素な集合とする。このとき、等式

\begin{align}
&\mathbb{E}_{m\in UV}^{\log}\mathbb{E}_{n\in UV}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)\\
&=\left(\mathbb{E}_{m\in U}^{\log}\mathbb{E}_{n\in U}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)\right)\cdot\left(\mathbb{E}_{m\in V}^{\log}\mathbb{E}_{n\in V}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)\right)\\
&\qquad +\mathbb{E}_{m\in U}^{\log}\mathbb{E}_{n\in U}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)+\mathbb{E}_{m\in V}^{\log}\mathbb{E}_{n\in V}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)
\end{align}

が成り立つ。

証明. これは

\displaystyle \sum_{m\in UV}\frac{1}{m}=\left(\sum_{m\in U}\frac{1}{m}\right)\left(\sum_{m \in V}\frac{1}{m}\right)

であることと、m_1,n_1\in U, m_2, n_2\in Vに対して

\begin{align}
&\mathrm{gcd}(m_1m_2,n_1n_2)-1\\
&=(\mathrm{gcd}(m_1,n_1)-1)(\mathrm{gcd}(m_2,n_2)-1)+(\mathrm{gcd}(m_1,n_1)-1)+(\mathrm{gcd}(m_2,n_2)-1)
\end{align}

が成り立つことからわかる。 Q.E.D.

よって、特に\mathbb{E}_{m\in U}^{\log}\mathbb{E}_{n\in U}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)\mathbb{E}_{m\in V}^{\log}\mathbb{E}_{n\in V}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)1以下であれば

\begin{align}
&\mathbb{E}_{m\in UV}^{\log}\mathbb{E}_{n\in UV}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)\\
&\leq 3\max\left\{\mathbb{E}_{m\in U}^{\log}\mathbb{E}_{n\in U}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr), \mathbb{E}_{m\in V}^{\log}\mathbb{E}_{n\in V}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)\right\}\end{align}

が成り立つ。

4.15 (B_2に関する期待値評価)
i \in [k]についてP_{n_i}\subset Q_{n_i}であるため、B_2\subset Q_1\cdot \cdots \cdot Q_kが成り立つ。このことと、(12)から

\displaystyle \mathbb{E}_{m\in B_2}^{\log}\mathbb{E}_{n\in B_2}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)\leq \left(\frac{16384CK}{D}\right)^{2k}\mathbb{E}_{m\in Q_1\cdot \cdots \cdot Q_k}^{\log}\mathbb{E}_{n\in Q_1\cdot \cdots \cdot Q_k}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)

と評価できる。Q_i素数の集合なので

\displaystyle\mathbb{E}_{m\in Q_i}^{\log}\mathbb{E}_{n\in Q_i}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)\leq \frac{1}{\sum_{m\in Q_1}\frac{1}{m}}

が成り立ち、Q_{n_i}\subset (8^{n_i-1}, 8^{n_i+2}], \#Q_{n_i}\geq 8^{n_i}/n_i, A_iの取り方より

\displaystyle \sum_{m \in Q_i}\frac{1}{m}\geq \frac{1}{64}\sum_{n_i\in A_i}\frac{1}{n_i}\geq \frac{N}{64} \ ( > 1)

であることに注意すると、4.14を用いた数学的帰納法により

\displaystyle \mathbb{E}_{m\in Q_1\cdot \cdots \cdot Q_k}^{\log}\mathbb{E}_{n\in Q_1\cdot \cdots \cdot Q_k}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)\leq 3^k\max\left\{\frac{1}{\sum_{m\in Q_1}\frac{1}{m}}, \dots, \frac{1}{\sum_{m\in Q_k}\frac{1}{m}}\right\}

と評価でき、

\displaystyle \mathbb{E}_{m\in B_2}^{\log}\mathbb{E}_{n\in B_2}^{\log}\bigl(\mathrm{gcd}(m,n)-1\bigr)\leq \frac{64\cdot 3^k}{N}\cdot\left(\frac{16384CK}{D}\right)^{2k}

に到達する。Nの取り方からこれは\etaで上から押さえることができ、3.2の(c)がB_2に対しても成立することが示された。

4.16 証明すべきことが全てなされたので、素数定理の証明も以上をもって完結する。

*1:期待値記号\mathbb{E}\mathbb{E}^{\log}を二重に用いる場合はここのように適宜括弧を省略する. 有限和なので当然問題は生じない.

*2:\left(\mathbb{E}_{n\in A}\bigl(f(n)\bigr)\right)^2\leq \mathbb{E}_{n\in A}\bigl(\bigl(f(n)\bigr)^2\bigr)という型で用いる.

*3:次のように計算すればよい: \begin{align}
\left(\mathbb{E}_{m\in B}^{\log}\bigl(1-m\mathbf{1}_{m\mid n}\bigr)\right)^2&=\frac{\left(\sum_{m\in B}(1-m\mathbf{1}_{m\mid n})/m\right)^2}{\left(\sum_{m\in B}1/m\right)^2}=\frac{\sum_{m\in B}\sum_{l\in B}(1-m\mathbf{1}_{m\mid n}-l\mathbf{1}_{l\mid n}+m\mathbf{1}_{m\mid n}l\mathbf{1}_{l\mid n})/(ml)}{\left(\sum_{m\in B}1/m\right)\left(\sum_{l\in B}1/l\right)}\\
&=1-2\frac{\sum_{m\in B}m\mathbf{1}_{m\mid n}/m}{\sum_{m\in B}1/m}+\frac{\sum_{m\in B}\sum_{l\in B}(m\mathbf{1}_{m\mid n}l\mathbf{1}_{l\mid n})/(ml)}{\left(\sum_{m\in B}1/m\right)\left(\sum_{l\in B}1/l\right)}.
\end{align}

*4:N=mq+rNmで割った表示とすると, \displaystyle \mathbb{E}_{n\in N}\bigl(m\mathbf{1}_{m\mid n}\bigr)=\frac{\overbrace{m+m+\cdots+m}^{q}}{N}=\frac{N-r}{N}=1+O(1/N).

*5:\displaystyle \mathbb{E}_{m\in B}^{\log}\bigl(1+O(1/N)\bigr)=\frac{\sum_{m\in B}1/m+O\left(\sum_{m\in B}1/(Nm)\right)}{\sum_{m\in B}1/m}=1+O(1/N).

*6:mlの最小公倍数の倍数であってN以下であるようなnについてmlをピックアップしていくので, N=\mathrm{lcm}(m,l)q+rと割り算をするとき, \displaystyle \mathbb{E}_{n\in N}\bigl(m\mathbf{1}_{m\mid n}\cdot l\mathbf{1}_{l\mid n}\bigr)=\frac{\overbrace{ml+ml+\cdots+ml}^{q}}{N}=\frac{mlq}{N} を得る. よく知られているように ml=\mathrm{gcd}(m,l)\mathrm{lcm}(m,l)であることから, \displaystyle \frac{mlq}{N}=\frac{\mathrm{gcd}(m,l)(N-r)}{N}=\mathrm{gcd}(m,l)\bigl(1+O(1/N)\bigr) と計算できる.

*7:a,bが互いに素な自然数であるとき, \mu(ab)=\mu(a)\mu(b)が成り立つ. これは定義から明らか.

*8:\displaystyle \frac{1}{\lfloor N/m\rfloor}=\frac{\rho^{j+1}}{N}\left(1+\frac{N/\rho^{j+1}-\lfloor N/m\rfloor}{\lfloor N/m\rfloor}\right)であるが, \displaystyle \left|N/\rho^{j+1}-\lfloor N/m\rfloor\right|\leq N/m-N/\rho^{j+1} < \frac{N(\rho-1)}{\rho^{j+1}}\leq \frac{N\eta}{\rho^{j+1}}, \displaystyle \frac{1}{\lfloor N/m\rfloor} < \frac{1}{N/m-1} < \frac{1}{N/\rho^{j+1}} < \frac{2\rho^{j+1}-1}{N} と評価できる. 最後の不等式はNが(B_1, B_2に依存して)十分大きければ実現される. \frac{1}{\lfloor N/\rho^j\rfloor}についても同様.

*9:\rho^2 < 1+3\eta, \rho^2 > 1-3\eta.

*10:x以上の最小の偶数を2nとすれば, \pi(x)=\pi(2n) or \pi(2n)-1であり, \frac{2n}{\log(2n)}\geq \frac{x}{\log x}である. メモ: y=x/\log xx\geq eで単調増加.

*11:一般に実数yに対して \lfloor 2y\rfloor-2\lfloor y\rfloor =0, 1.

*12:eとか16という数はそれでないといけないというわけではない.

*13:4つ目の等号が得られる理由は, \lfloor \sigma x\rfloor \log \lfloor \sigma x\rfloor=\sigma x\log (\sigma x)+O(\beta(\sigma x) ), \lfloor x\rfloor\log\lfloor x\rfloor=x\log x+O(\beta(x) ), (\lfloor \sigma x\rfloor-\lfloor x\rfloor)\log(\lfloor \sigma x\rfloor - \lfloor x\rfloor)=(\sigma-1)x\log( (\sigma-1)x)+O(\beta( (\sigma-1)x)+\beta( (\sigma-1)x+1) )および\beta(x)=O\left(\frac{x}{\log x}\right).

*14:Richterの論文で実際に素数の性質を使う部分は4.1, 4.2のそれぞれの冒頭の議論のみである. 実際には, 2.1の証明において[note]の補題6.7, 補題6.10の証明に素因数分解の情報が使われている.

*15:ただし, 本質的な考え方は全く同じであり, 違いは非常に細かい部分にある.

*16:ABが互いに素な集合とは、Aの元とBの元の任意の組が互いに素なときにいう。

*17:(\rho^{i_n},\rho^{i_n+1}]\subset (8^n,8^{n+1}]なので、n\mapsto i_n単射である。

*18:P_{n_i}\subset \mathcal{P}\cap (8^{x_i},8^{x_i+\delta}]であるが、x_i+\delta \leq n_i+2と大雑把に評価している。