インテジャーズ

INTEGERS

数、特に整数に関する記事。

グリーン・タオ論文の§9を読む(その一)

§9 A pseudorandom measure which majorisies the primes を読みます。

(無限版)Szemerédiの定理は整数からなる集合が任意の長さの等差数列を含むための(上漸近密度が正であればよいという)十分条件を与える定理でした。従って、実際に個々のケースで等差数列の存在定理を証明するには上漸近密度を計算する必要があります。

例えば(失敗例ですが)、素数全体のなす集合にSzemerédiの定理を適用するには\displaystyle \limsup_{n \to \infty}\frac{\pi(n)}{n}を計算する必要があって(答えは0)、簡単とはいえ、それは素数分布の問題です。

前節までに証明した擬ランダム測度に対するSzemerédiの定理 (Thm 3.5)も同様で、等差数列の存在証明の擬ランダム測度の構成+関数の期待値計算への帰着が示されただけなので、最終的帰結を得るためにはまだやることがあります。

実際、Green-Taoの定理およびその拡張である素数版Szemerédiの定理を証明するために必要となる擬ランダム測度(=Green-Tao測度)の構成は簡単ではありません(素数分布論。W-トリックを使っています)。一方、関数の期待値計算には素数定理で十分です。


W-トリックのため、w=w(N)を(以降の議論が全て成り立つだけ)十分増加速度の遅い1/w(N)=o(1)を満たすような実数値関数とし、

\displaystyle W=W(N):=\prod_{p \leq w(N)}p

とします(pは素数)。

定義1(修正von Mangoldt関数) Wと互いに素な整数b=b(N)をとる(1 \leq b < W)。このとき、修正von Mangoldt関数\widetilde{\Lambda}_b \colon \mathbb{Z}^+ \to \mathbb{R}^+
\displaystyle \widetilde{\Lambda}_b(n)=\widetilde{\Lambda}_{b, N}(n):=\begin{cases} \frac{\varphi(W)}{W}\log (Wn+b) & (Wn+b\colon \text{素数}) \\ 0 & (\text{otherwise}) \end{cases}
と定義する。

次がGreen-Tao論文の後半の主結果です:

定理 (Green-Tao測度, Proposition 9.1) \varepsilon_k:=\frac{1}{2^k(k+4)!}とし、Nを十分大きい素数とする。写像\iota_Nを標準射影を制限して得られる単射

\left. \iota_N=\mathrm{pr}_N\right|_{[\varepsilon_kN, 2\varepsilon_kN]}\colon [\varepsilon_kN, 2\varepsilon_kN] \cap \mathbb{Z} \hookrightarrow \mathbb{Z}_N

と定義する。また、Wと互いに素な整数b=b(N)をとる(1 \leq b < W)。
このとき、k-擬ランダム測度\nu_{\text{GT}, b}\colon \mathbb{Z}_N \to \mathbb{R}^+であって、任意のx \in \mathrm{Im}(\iota_N)に対して

\displaystyle \nu_{\text{GT}, b}(x) \geq \frac{1}{k2^{k+5}}\widetilde{\Lambda}_b(\iota_N^{-1}(x) )
が成り立つようなものが存在する。

これを示せば最終結論

素数版Szemerédiの定理 (Theorem 1.2) Aを素数のみからなる集合とする。Aの相対上漸近密度\overline{d}_{\pi}(A)が正であれば、Aは任意の長さの等差数列を含む。

が従うことを確認しましょう。

定理 \Longrightarrow 素数版Szemerédiの定理の証明

\overline{d}_{\pi}(A) = c > 0とし、x以下のAに属するような素数の個数を\pi_{A}(x)とすると、


ここに書いていた議論が一部間違っていたため一旦非公開にします。議論の修正案はあり、書く余裕が出来たら修正版を載せます。

なので、十分大きいjに対して、Wと互いに素な或る整数1 \leq b_j < Wが存在して

\displaystyle \frac{1}{N_j}\sum_{\varepsilon_kN_j \leq n \leq 2\varepsilon_kN_j}\mathbf{1}_A(Wn+b_j)\widetilde{\Lambda}_{b_j}(n) \geq \frac{\varepsilon_kc}{7}

が成り立つ(鳩ノ巣原理)。

十分大きいjに対してb(N_j)=b_jが成り立つようなbを一つ固定して、それに対するGreen-Tao測度\nu_{\text{GT}, b}をとる。十分大きいjを固定して、N=N_j, \ b=b_jと略記する。f \in L^1(\mathbb{Z}_N)

\displaystyle f(x) := \begin{cases} \displaystyle \frac{1}{k2^{k+5}}\mathbf{1}_A(W\iota_N^{-1}(x)+b)\widetilde{\Lambda}_b(\iota_N^{-1}(x) ) & (x \in \mathrm{Im}(\iota_N) ) \\ 0 & (\text{otherwise})\end{cases}

と定義する。すると、

\displaystyle \mathbb{E}(f) = \frac{1}{k2^{k+5}N}\sum_{\varepsilon_kN \leq n \leq 2\varepsilon_kN}\mathbf{1}_A(Wn+b)\widetilde{\Lambda}_b(n) \geq \frac{\varepsilon_kc}{7k2^{k+5}}

と評価でき、定理から

0 \leq f(x) \leq \nu_{\text{GT}, b}(x),\quad {}^{\forall}x \in \mathbb{Z}_N

が成り立つので、擬ランダム測度に対するSzemerédiの定理(Thm 3.5)によってc_{\text{GT}}(k, \cdot) > 0が存在して、

\displaystyle \mathbb{E}(f(x)f(x+r)\cdots f(x+(k-1)r) \mid x, r \in \mathbb{Z}_N) \geq c_{\text{GT}}(k, k^{-1}2^{-k-5}\varepsilon_kc/7)-o(1)

が得られる。期待値におけるr=0の寄与は

\displaystyle \frac{1}{N^2}\sum_{x \in \mathbb{Z}_N}f(x)^k \leq O\left(\frac{N\log (2W\varepsilon_kN+1)^k}{N^2}\right) = O\left(\frac{\log^kN}{N}\right) = o(1)

なので、jが十分大きければ、x \in \mathbb{Z}_N, \ r \in \mathbb{Z}_N\setminus\{0\}が存在して

f(x)f(x+r)\cdots f(x+(k-1)r) > 0

が成り立つ。このとき、fの定義より

x, x+r, \dots, x+(k-1)r \in \mathrm{Im}(\iota_N)

かつ

W\iota_N^{-1}(x+ir)+b \in A,\quad i=0, 1, \dots, k-1

である。a:=\iota_N^{-1}(x), \ d:=\iota_N^{-1}(x+r)-a \in \mathbb{Z}とする。\varepsilon_kN \leq a+d \leq 2\varepsilon_kNなので、-\varepsilon_kN \leq d \leq \varepsilon_kNである。d=0とするとa=\iota_N^{-1}(x+r)からr=0となって矛盾するのでd \neq 00 \leq i \leq k-1に対して

-(k-2)\varepsilon_kN \leq a+id \leq (k+1)\varepsilon_kN

および

\mathrm{pr}_N(a+id)=x+ir

が成り立つ。c_i:=\iota_N^{-1}(x+ir)とおく。\varepsilon_kN \leq c_i \leq 2\varepsilon_kN, \ \frac{1}{2^k(k+4)!} < \frac{1}{k}より

-N < -k\varepsilon_kN \leq a+id-c_i \leq k\varepsilon_kN < N

なので*1

a+id = c_i=\iota_N^{-1}(x+ir),\quad i=0, 1, \dots, k-1

が確定する。すなわち、

W(a+id)+b=Wa+b+(Wd)i \in A, \quad i=0, 1, \dots, k-1

Aの元のみから構成される長さkの等差数列である。 Q.E.D.


よって、後はGreen-Tao測度を構成するだけとなりました。\log_+x :=\max\{\log x, 0\}とします。

定義2(Goldston-Yıldırımの切断約数和, Definition 9.2) Rを正実数パラメータするとき、関数\Lambda_R\colon \mathbb{Z} \to \mathbb{R}
\displaystyle \Lambda_R(n) := \sum_{d \mid n, \ d \leq R}\mu(d)\log\frac{R}{d} = \sum_{d \mid n}\mu(d)\log_+\frac{R}{d}
により定義する。ただし、dは正の約数をわたり、\Lambda_{R}(0)=0\muMöbius関数

切断約数和を用いて\nu_{\text{GT}, b}を構成します。

定義3 (Definition 9.3) R:=N^{\frac{1}{k2^{k+4}}}とし*2\varepsilon_k:=\frac{1}{2^k(k+4)!}とする。Wと互いに素な整数1 \leq b < Wをとる。このとき、関数\nu_{\text{GT}, b} \colon \mathbb{Z}_N \to \mathbb{R}^+
\displaystyle \nu_{\text{GT}, b}(x) := \begin{cases} \frac{\varphi(W)}{W}\frac{\Lambda_R(W\iota_N^{-1}(x)+b)^2}{\log R} & (x \in \mathrm{Im}(\iota_N) ) \\ 1 & (x \not \in \mathrm{Im}(\iota_N) )\end{cases}
によって、定義する。

これが所望の性質を満たすことを示していきます。まずは、満たすべき不等式を証明しましょう。代表元をとる関数をr_N\colon \mathbb{Z}_N \to \{0, 1, \dots, N-1\}と表します。

補題1 (Lemma 9.4) 任意のx \in \mathbb{Z}_Nに対して\nu_{\text{GT}, b}(x) \geq 0であり、
Nが十分大きければ、x \in \mathrm{Im}(\iota_N)に対して
\displaystyle \nu_{\text{GT}, b}(x) \geq \frac{1}{k2^{k+5}}\widetilde{\Lambda}_b(\iota_N^{-1}(x) )
が成り立つ。

証明. 最初の主張は定義より自明。\varepsilon_kN \leq n:=r_N(x) \leq 2\varepsilon_kNとして二つ目の主張を示す。Wn+bが素数でない場合は0で下から押さえるだけなので同じく自明。kに対してNが十分大きければ

\displaystyle Wn+b > \frac{WN}{2^k(k+4)!} > N^{\frac{1}{k2^{k+4}}},

すなわち、Wn+b > Rが成り立つ。よって、Wn+bが素数であれば、\Lambda_R(Wn+b)の和はd=1の項のみとなり、

\Lambda_R(Wn+b) = \log R

となる。従って、確認すべきことは

\displaystyle \nu_{\text{GT}, b}(x) = \frac{\varphi(W)}{W}\log R = \frac{\varphi(W)}{W}\frac{1}{k2^{k+4}}\log N \geq \frac{1}{k2^{k+5}}\widetilde{\Lambda}_b(n),

すなわち、

2\log N \geq \log (Wn+b) \  or \ N^2 \geq W(2\varepsilon_kN+1)

の成立である。これは、w(N)が十分遅く増加する関数であれば実際に成立する。 Q.E.D.

後は、①測度になっていること、②(k2^{k-1}, 3k-4, k)-線形形式条件を満たすこと、③2^{k-1}-相関条件を満たすことを示す必要がありますが、これらは次の二つの定理から導出されます(切断約数和に関する解析的整数論の結果。本質的にはGoldston-Yıldırımの貢献):

Goldston-Yıldırım型定理A (Proposition, 9.5) m, tを正整数とし、1 \leq i \leq m, 1 \leq j \leq tに対して整数L_{ij}m個のベクトル(L_{ij})_{j=1}^tがどの二つを取っても\mathbb{Q}上一次独立であるようにとる。\left|L_{ij}\right| \leq \frac{\sqrt{w(N)}}{2}が成り立つような十分大きいNに対して整数b_i \ (1 \leq i \leq m)を任意にとって、1 \leq i \leq mに対して線形形式 \psi_i\colon \mathbb{Z}^t \to \mathbb{Z}
\displaystyle \psi_i(\boldsymbol{x}) := \sum_{j=1}^tL_{ij}x_j+b_i,\quad \boldsymbol{x}=(x_1, \dots, x_t) \in \mathbb{Z}^t
と定める。Wと互いに素な整数1 \leq b < Wをとって、\theta_i(\boldsymbol{x}):=W\psi_i(\boldsymbol{x})+bとする。1 \leq i \leq tに対してI_i \subset \mathbb{R}を長さがR^{10m}以上の区間とし、B
\displaystyle B:=\Biggl(\prod_{i=1}^tI_i \Biggr)\cap \mathbb{Z}^t
とする(b_i, \psi_i, \theta_i, W, b, R, I_i, BN依存であることに注意)。このとき、
\displaystyle \mathbb{E}\left(\left. \Lambda_R(\theta_1(\boldsymbol{x}) )^2\cdots \Lambda_R(\theta_m(\boldsymbol{x}) )^2 \right| \boldsymbol{x} \in B\right) = \left(1+o_{m, t}(1)\right) \left(\frac{W\log R}{\varphi(W)}\right)^m
が成り立つ。

Goldston-Yıldırım型定理B (Proposition, 9.6) mを正整数とし、h_1, \dots, h_m\left|h_i\right| \leq N^2 \ (1 \leq i \leq m)を満たすような相異なる整数とし、
\displaystyle \Delta := \prod_{1 \leq i < j \leq m}\left|h_i-h_j\right|
とおく。Bを長さがR^{10m}以上であるような\mathbb{R}内の区間と\mathbb{Z}の共通部分として、Wと互いに素な整数1 \leq b < Wをとる(以上、m以外全てN依存)。このとき、
\begin{align}&\left.\mathbb{E}\left(\Lambda_R(W(x+h_1)+b)^2\cdots \Lambda_R(W(x+h_m)+b)^2\right| x \in B\right) \\ &\leq \left(1+o_m(1)\right)\left(\frac{W\log R}{\varphi(W)}\right)^m\prod_{p \mid \Delta}\left(1+O_m(p^{-\frac{1}{2}})\right)\end{align}
が成り立つ。

pは素数を表します(以下ずっと)。これら重要定理の証明は後にまわして、①、②、③が導出されることを確認します。

補題2 \nu_{\text{GT}, b}は測度である。すなわち、\mathbb{E}(\nu_{\text{GT}, b}) = 1+o(1)が成り立つ。

証明. Goldston-Yıldırım型定理Aを次の状況で適用する: m=t=1, \ \psi_1(x_1)=x_1*3, I_1=[\varepsilon_kN, 2\varepsilon_kN], \ B=I_1 \cap \mathbb{Z},  \ R=N^{\frac{1}{k2^{k+4}}}*4とする。このとき、定理Aからの帰結は

\displaystyle \mathbb{E}(\Lambda_R(Wn+b)^2 \mid n \in B) = (1+o(1) )\left(\frac{W\log R}{\varphi(W)}\right)

であり、

\displaystyle \mathbb{E}(\nu_{\text{GT}, b}(x) \mid x \in \mathrm{pr}_N(B) ) = 1+o(1)

と書き直せる。また、定義よりx \in \mathbb{Z}_N \setminus \mathrm{pr}_N(B)に対しては\nu_{\text{GT}, b}(x) = 1なので、

\mathbb{E}(\nu_{\text{GT}, b}(x) \mid x \in \mathbb{Z}_N \setminus \mathrm{pr}_N(B) ) = 1

である。よって、

\displaystyle \mathbb{E}(\nu_{\text{GT}, b}) = \frac{1}{N}\left(\#B(1+o(1) )+(N-\#B)\right) = 1+\frac{\#B}{N}o(1) = 1+o(1)

を得る*5Q.E.D.

②、③については以降の記事で確認します。

*1:\varepsilon_kに限らず、Tao, Green-Tao論文で全体的に言えることですが、\varepsilon_kが具体的に1/2^k(k+4)!でなければならない必然性はないように感じました。

*2:以下、付録の節を除いて、Rはここで取ったものとする。

*3:係数の条件 1 \leq \frac{\sqrt{w(N)}}{2}Nが十分大きければ成立する。

*4:I_1の長さ\varepsilon_kNNが十分大きければR^{10m}を超える。

*5:\#\mathrm{pr}_N(B) = \#B.