インテジャーズ

INTEGERS

数、特に整数に関する記事。

高木関数

今、目の前に高木貞治博士の論文集があります。高木貞治博士が28歳ぐらいのときに出版された論文

T. Takagi, A simple example of a continuous function without derivative, Proc. Phys. Math. Japan, (1903) Vol. 1, pp. 176-177.

は一ページ半に満たないものですが(Proceeding)、最初にそのような当時の感覚では病的な関数を発見したWeierstrassの例(1872年)に比べて、至る所微分不可能な連続関数の簡単な例を与えた有名な論文です。この高木関数とか高木曲線として有名な関数を、できるだけ博士が論文中で使用している記号のまま紹介したいと思います。

f:id:integers:20170103004248p:plain:w400

Dirichlet関数(高数美物語アジマティクスインテジャーズ)は至る所不連続な関数で有名な関数であり、それは当然至る所微分不可能ですが、Weierstrassの例や高木博士の例はある意味一段階レベルアップした病的な関数です。超有名ではありますが、Dirichlet関数のように大学の授業で必ず習うというわけではないです。あと、フラクタルになっています。

論文に沿った紹介

[0, 1]区間の実数t

\displaystyle t=\sum^n\frac{c_n}{2^n}

2進展開する(ただし、c_n0または1)。各正整数nに対して\tau_n\tau'_n

\begin{align} \tau_n &= \frac{c_n}{2^n}+\frac{c_{n+1}}{2^{n+1}}+\frac{c_{n+2}}{2^{n+2}}+\cdots \\ \tau'_n &= \frac{1}{2^{n-1}}-\tau_n\end{align}

と定める(これはtに依存して定まるが、t2進展開が二通りある場合であってもその展開の仕方には依らない)。そうして、\gamma_n

\displaystyle \gamma_n = \begin{cases}\tau_n & (c_n=0)\\ \tau'_n & (c_n=1)\end{cases}

によって定める(これもtのみに依存する)。このとき、[0, 1]区間上の関数 f(t)

\displaystyle f(t) = \sum_{1, \infty}^n\gamma_n

によって定義する*1(これが高木関数と呼ばれているもの)。

\pi_nおよび\nu_nをそれぞれc_1, c_2, \dots, c_nにおける0の個数および1の個数とし(\pi_n+\nu_n=n)、a_n

\displaystyle a_n = \begin{cases}\nu_n & (c_n=0)\\ \pi_n & (c_n=1)\end{cases}

と定めると、

\displaystyle f(t) = \sum\frac{a_n}{2^n}

と書けることが容易にわかる()。f(t)[0, 1]上定義される連続関数である()。これが、至るところ微分不可能であることは特別な\Delta tに対する\displaystyle \frac{\Delta f}{\Delta t}を計算することによって証明できる:

まず、c_n=0, \ \displaystyle \Delta t = \frac{1}{2^n}の場合は

\displaystyle \frac{\Delta f}{\Delta t} = \pi_n-\nu_n-2^{n+1}\tau_{n+1}

が成り立つ()。また、c_{n-1}=0, \ c_n=0, \ \displaystyle \Delta t = \frac{1}{2^n}の場合は

\displaystyle \frac{\Delta f}{\Delta t} = \pi_n-\nu_n

である()。

従って、c_n=0, \ c_{n+1}=0のときは、\displaystyle \Delta t=\frac{1}{2^n}のときの\displaystyle \frac{\Delta f}{\Delta t}の値と\displaystyle \Delta t=\frac{1}{2^{n+1}}のときの\displaystyle \frac{\Delta f}{\Delta t}の値の差は1-2^{n+1}\tau_{n+2}で与えられる()。

また、c_n=0, \ c_{n+1}=1のときは、\displaystyle \Delta t=\frac{1}{2^n}のときの\displaystyle \frac{\Delta f}{\Delta t}の値と\displaystyle \Delta t=\frac{1}{2^{n+1}}のときの\displaystyle \frac{\Delta f}{\Delta t}の値の差は2^{n+1}\tau_{n+2}で与えられる()。

nはいくらでも大きくできるので、これより微分不可能性が従う()。

補足

①(高木の公式)の補足
\overline{c_n}=1-c_nと書くことにします。c_n=0のときは、j \leq nなるjに対して

\displaystyle \gamma_j = \tau'_j = \frac{\overline{c_j}}{2^j}+\cdots +\frac{\overline{c_n}}{2^n}+\cdots

であるときにa_nに寄与します(\overline{c_n}=1)。こうなるのはc_j=1のときなので、a_nc_1, \dots, c_{n}までの1の個数\nu_nに等しいことがわかります。

c_n=1のときは、j \leq nなるjに対して

\displaystyle \gamma_j=\tau_j = \frac{c_j}{2^j}+\cdots +\frac{c_n}{2^n}+\cdots

であるときにa_nに寄与します。こうなるのはc_j=0のときなので、a_nc_1, \dots, c_nまでの0の個数\pi_nに等しいことがわかります。

距離関数を使った表示
高木関数をT(t)と書くことにしましょう。一般的な関数を表す記号である f(t)よりは固有名詞っぽくなります。実数tに対して、ttに一番近い整数の距離を\langle \! \langle t \rangle \! \rangleと書くことにします(これはLagariasさんが使っている記号です。文献によって記号が異なります*2 )。t \in [0, 1]に対しては\displaystyle \gamma_n=\frac{\langle \! \langle 2^{n-1}t \rangle \! \rangle}{2^{n-1}}が成り立ち、

\displaystyle T(t) = \sum_{n=1}^{\infty}\frac{\langle \! \langle 2^{n-1}t \rangle \! \rangle}{2^{n-1}}= \sum_{n=0}^{\infty}\frac{\langle \! \langle 2^{n}t \rangle \! \rangle}{2^{n}} ー⑦

と簡潔に表されることがわかります。これは明らかに一様収束する級数ですが、

\displaystyle [0, 1] = \bigcup_{k=0}^{2^{n+1}-1}\left[ \frac{k}{2^{n+1}}, \frac{k+1}{2^{n+1}}\right]

と分割すると、\displaystyle t \in \left[ \frac{k}{2^{n+1}}, \frac{k+1}{2^{n+1}}\right]に対して

\displaystyle \frac{\langle \! \langle 2^{n}t \rangle \! \rangle}{2^{n}} = \begin{cases}t-\frac{k}{2^{n+1}} & (k\in 2\mathbb{Z}) \\ \frac{k+1}{2^{n+1}}-t & (k+1 \in 2\mathbb{Z}) \end{cases} ー⑧

と書けるので、\displaystyle \frac{\langle \! \langle 2^{n}t \rangle \! \rangle}{2^{n}}はギザギザした[0, 1]上連続な関数であり、従って f(t)も連続であることがわかります(これで②の理由がわかりました)。

高木関数のアニメーションを載せているサイトを見つけたのでリンクを貼っておきます:高木関数

有理性
高木関数は有理数を有理数に写す関数です。つまり、tが有理数ならばT(t)も有理数になります。実際、tが有理数ならば2^ntの既約分数表示における分母の取り得る値はnを動かしたときに有界なので、\langle \! \langle 2^nt\rangle \! \rangleは周期的になります。よって、⑦の表示と等比級数の和の公式からT(t)が有理数になることがわかります。

高木関数の値域
T(t)の値の取り得る範囲は[0, 2/3]です。T(t) \geq 0, T(0)=T(1)=0, t \in (0, 1)に対してT(t) > 0であることは定義からすぐわかります。x \geq 0に対して

\displaystyle \langle \! \langle x \rangle \! \rangle + \frac{1}{2} \langle \! \langle 2x \rangle \! \rangle \leq \frac{1}{2}

であることはxの小数部分について丁寧に4通りに場合分けすれば示せるので、⑦において和を二つずつペアにしてこの不等式を適用すると

\displaystyle T(t) \leq \frac{1}{2}+\frac{1}{2^3}+\frac{1}{2^5}+\cdots = \frac{2}{3}

と評価できます。任意の非負整数nに対して\langle \! \langle 2^n\frac{1}{3} \rangle \! \rangle=\frac{1}{3}なので、T(\frac{1}{3})=\frac{2}{3}です。

③の補足
tを明示する場合は\tau_n(t)のように表示することにします(明示しなければtの場合)。c_n=0, \ \displaystyle \Delta t = \frac{1}{2^n}とします。

k \geq n+1のときは\tau_k(t) = \tau_k(t+\Delta t)なので、\gamma_k(t) = \gamma_k(t+\Delta t)

c_n=0なので、\gamma_n(t)=\tau_n(t) = \tau_n

c_n(t+\Delta t) = 1なので

\displaystyle \gamma_n(t+\Delta t) = \tau'_n(t+\Delta t) = \frac{1}{2^{n-1}}-\tau_n(t+\Delta t) = \frac{1}{2^{n-1}}-\left( \frac{1}{2^n}+\tau_n(t) \right) = \frac{1}{2^n}-\tau_n

k \leq n-1のときは\displaystyle \tau_k(t+\Delta t)  = \frac{1}{2^n}+\tau_k(t)なので、

c_k=0ならば

\displaystyle \gamma_k(t+\Delta t) = \tau_k(t+\Delta t) = \frac{1}{2^n}+\tau_k(t) = \frac{1}{2^n}+\gamma_k(t)

c_k=1ならば

\begin{align} \gamma_k(t+\Delta t) &= \tau'_k(t+\Delta t) = \frac{1}{2^{k-1}}-\tau_k(t+\Delta t) = \frac{1}{2^{k-1}}-\frac{1}{2^n}-\tau_k(t) \\ &=\tau'_k(t) -\frac{1}{2^n} = \gamma_k(t) - \frac{1}{2^n}\end{align}

以上より

\displaystyle \Delta f = f(t+\Delta t)-f(t) = \frac{\pi_{n-1}}{2^n}-\frac{\nu_{n-1}}{2^n}+\frac{1}{2^n}-2\tau_n

\pi_n=\pi_{n-1}+1, \ \nu_n=\nu_{n-1}, \ \tau_{n+1}=\tau_nなので③が得られました。

④の補足
これは計算が合わないというか、③を考えるとおかしいのですが、c_n=1の誤植です。c_{n-1}=0, \ c_n=1, \ \displaystyle \Delta t = \frac{1}{2^n}とします。このときもk \leq nのときを考えれば十分です。c_{n-1}(t+\Delta t) = 1c_n(t+\Delta t) = 0に注意します。

\displaystyle \gamma_n(t) = \tau'_n(t) = \frac{1}{2^{n-1}}-\tau_n(t), \ \displaystyle \gamma_n(t+\Delta t) = \tau_n(t+\Delta t) = \tau_n(t)-\frac{1}{2^n}なので、

\displaystyle \Delta \gamma_n = 2\tau_n-\frac{3}{2^n}

\gamma_{n-1}(t) = \tau_{n-1}(t) = \tau_n

\displaystyle \gamma_{n-1}(t+\Delta t) = \frac{1}{2^{n-2}}-\tau_{n-1}(t+\Delta t) = \frac{1}{2^{n-2}}-\left( \frac{1}{2^{n-1}}+\tau_n(t)-\frac{1}{2^n} \right) = \frac{3}{2^n}-\tau_n

k \leq n-2ならば

\displaystyle \tau_k(t+\Delta t) = \tau_k(t) -\frac{1}{2^n}+\frac{1}{2^{n-1}} = \tau_k(t) + \frac{1}{2^n}

以上より

\displaystyle \Delta f = \frac{\pi_{n-2}}{2^n}-\frac{\nu_{n-2}}{2^n} +\left( \frac{3}{2^n}-2\tau_n\right) + \left( 2\tau_n-\frac{3}{2^n} \right)

\pi_n = \pi_{n-2}+1, \ \nu_n = \nu_{n-2}+1より④が得られました。

⑤の補足
c_n=0, \ c_{n+1}=0のときは③から

\left. \frac{\Delta f}{\Delta t} \right|_{\Delta t = \frac{1}{2^{n+1}}} - \left. \frac{\Delta f}{\Delta t} \right|_{\Delta t = \frac{1}{2^{n}}} = (\pi_{n+1}-\nu_{n+1}-2^{n+2}\tau_{n+2}) - (\pi_n-\nu_n-2^{n+1}\tau_{n+1})

\pi_{n+1}=\pi_n+1, \ \nu_{n+1}=\nu_n, \ \tau_{n+2}=\tau_{n+1}なので、これは1-2^{n+1}\tau_{n+2}に等しいことがわかります。

c_n=0c_{n+1}=1のときは③、④から

\left. \frac{\Delta f}{\Delta t} \right|_{\Delta t = \frac{1}{2^{n+1}}} - \left. \frac{\Delta f}{\Delta t} \right|_{\Delta t = \frac{1}{2^{n}}} = (\pi_{n+1}-\nu_{n+1})-(\pi_n-\nu_n-2^{n+1}\tau_{n+1})

\pi_{n+1}=\pi_n\nu_{n+1}=\nu_n+1\displaystyle \tau_{n+2} = \tau_{n+1}-\frac{1}{2^{n+1}}なので、これは2^{n+1}\tau_{n+2}に等しいです。以上で⑤が確認できました。

⑥の補足
微分係数\displaystyle \lim_{\Delta t \to 0}\frac{\Delta f}{\Delta t}が存在すれば、

\displaystyle \left. \frac{\Delta f}{\Delta t} \right|_{\Delta t = \frac{1}{2^{n+1}}} - \left. \frac{\Delta f}{\Delta t} \right|_{\Delta t = \frac{1}{2^{n}}}

nを大きくするといくらでも小さくなっていく必要があります。例えばt2進展開に\cdots 000 \cdotsという部分が無数にあったとしましょう。このとき、000の部分を\displaystyle \frac{c_n}{2^n}+\frac{c_{n+1}}{2^{n+1}}+\frac{c_{n+2}}{2^{n+2}}とすれば、⑤より

\displaystyle \left. \frac{\Delta f}{\Delta t} \right|_{\Delta t = \frac{1}{2^{n+1}}} - \left. \frac{\Delta f}{\Delta t} \right|_{\Delta t = \frac{1}{2^{n}}} = 1-2^{n+1}\tau_{n+2} \geq \frac{1}{2}

なので微分係数を持ち得ないことがわかります。t2進展開の様子で幾つかの場合分けをすることにより⑤を使ってf(t)は至る所微分不可能であることを確認できます。ただ、私の確認した方法が高木博士の意図した方法である自信が全くないので、ここでは別の導出方法を解説することにします。

至るところ微分不可能であることのBillingsleyによる証明
t \in [0, 1)*3は正整数n毎に或る整数0 \leq k \leq 2^n-1が存在して

\displaystyle \frac{k}{2^n} \leq t < \frac{k+1}{2^n}

と挟むことができる。u_n=\frac{k}{2^n}v_n=\frac{k+1}{2^n}とおこう。このとき、

\displaystyle \frac{T(v_n)-T(u_n)}{v_n-u_n} = \sum_{j=0}^{n-1}\frac{\frac{\langle \! \langle 2^jv_n \rangle \! \rangle}{2^j}-\frac{\langle \! \langle 2^ju_n \rangle \! \rangle}{2^j}}{v_n-u_n}

であり*4、この和の中身は傾きを表しているが、それは⑧からわかるように\pm 1である。従って、tを固定したときに

\displaystyle \lim_{n \to \infty}\frac{T(v_n)-T(u_n)}{v_n-u_n}

は存在しない。ところが、高木関数のtでの微分係数が存在すれば、上記極限が存在して同じ値に収束するはずである(このことは簡単な\varepsilon-\delta論法で示せる)。すなわち、高木関数は至る所微分不可能である。 Q.E.D.

関数等式

定理 高木関数は次のような関数等式を満たす:
T(t) = T(1-t), \quad \displaystyle 2T\left( \frac{t}{2} \right) = T(t)+t
また、高木関数はこれらの関数等式を満たすような[0, 1]上定義された連続関数として特徴づけられる。

証明. 任意の非負整数nに対して\langle \! \langle 2^nt \rangle \! \rangle = \langle \! \langle 2^n(1-t) \rangle \! \rangleであることから最初の関数等式がわかる。二つ目の関数等式は、\langle \! \langle \frac{t}{2} \rangle \! \rangle = \frac{t}{2}であることに注意すれば、

\displaystyle 2T\left( \frac{t}{2} \right) = 2\left\langle \! \left\langle \frac{t}{2} \right\rangle \! \right\rangle + 2\left( \sum_{n=1}^{\infty}\frac{\langle \! \langle 2^n\frac{t}{2} \rangle \! \rangle}{2^n}\right) = t+T(t)

と示される。これらの関数等式から、[0, 1]区間に含まれる全ての2進有理数の値を決めることができるので、[0, 1]に含まれる2進有理数全体は[0, 1]で稠密であることと連続性からT(t)は一意に決定されることがわかる。 Q.E.D.

リーマン予想

次のような定理があることを知りました。証明はフォローしていないので紹介に留めます。

Kanemitsu-Yoshimoto (2000) Nを正の整数として、\mathcal{F}_Nを既約分数表示した際の分母がN以下であるような[0, 1]区間内の有理数全体集合とする。このとき、Riemann予想は次の高木関数を用いて表される漸近公式が任意の正の実数\varepsilon > 0に対して成立することと同値である:
\displaystyle \sum_{\rho \in \mathcal{F}_N}T(\rho)-\#\mathcal{F}_N\int_0^1T(t)dt = O(N^{\frac{1}{2}+\varepsilon}), \quad (N \to \infty)

*1:論文中で著者が定義したものであっても"We define ~"と書く慣習がありますが、この論文では"I define f(t) by"と書かれています。

*2:\mathrm{dist}(t, \mathbb{Z})は意味がわかりやすくて良い記号ですが、表記が長くなってしまいます。

*3:t=1での微分不可能性は次の節のT(t)=T(1-t)からわかるようにt=0における微分不可能性と同値。

*4:j \geq nに対して\displaystyle \frac{\langle \! \langle 2^jv_n \rangle \! \rangle}{2^j}=\frac{\langle \! \langle 2^ju_n \rangle \! \rangle}{2^j}=0であることに注意。

ウェダーバーンの定理

環と言ったら可換環のことを指すというようなことはなくて、普通は非可換環も含めて環なので、可換環しか扱わないような場合は最初に明言する必要があります。1を持つかなども基本的には書かなければなりません。一方、体と言ったら普通は可換体を表します。非可換の場合も含める場合は斜体とか可除環と呼ぶことが殆どです。次の定理は非常に基本的な事実です:

定理 (Wedderburn, Dickson) 有限斜体は可換である。

基本的な事実ではありますが、「有限性が可換性を保証する」と読めるので、初見では驚きの定理でもあります。証明はたくさん知られており、コホモロジー論からBrauer群が消えることを言うことも出来ますし、Skolem–Noetherを使う証明や、類等式を使う証明などをよく見る気がします。

しかしながら、Zsigmondyの定理を使う証明があることを知りました。せっかくZsigmondyの定理についてまとめたので、Zsigmondyの定理 - INTEGERS

それを使った証明を紹介することにします。Sylowの定理は既知と仮定します。

証明

Kを有限斜体とする。Kの素体をK(p)とする(pは素数でK(p) \simeq \mathbb{F}_p)。n:=[K:K(p)]とおく(n \geq 2を考えれば十分)。

n=2のとき
K\setminus K(p)の元aを任意にとる。このとき, aが生成するKの部分体FK(p)には一致しないため、元の個数を考えるとK=Fということになる。これは可換。

n > 2, (n, p) \neq (6, 2)のとき
Zsigmondyの定理によって、p^n-1の素因数qであって、任意の1 \leq k \leq n-1に対してq \nmid p^k-1なるものが存在する。K^{\times}は位数p^n-1の有限群であるから、位数qの元a \in K^{\times}が存在する(これはSylowの定理より弱いCauchyの定理と呼ばれている事実から分かる)。aの生成するKの部分体Fを考える。k:=[F:K(p)]とおく。このとき、\#F^{\times}=p^k-1なので、q \mid p^k-1である。従って、qの性質からk=nとなって、K=Fを得る。すなわち、Kは可換である。

(n, p) = (6, 2)のとき
\#K^{\times}=2^6-1=63=9\times 7なので、Sylowの定理より位数9の部分群Gが存在する(位数9の群は可換なものしかない)*1Gの生成するKの部分体をFとする。k:=[F:K(2)]とおくと(k \leq 6)、\#F^{\times}=2^k-1であるが、GF^{\times}の部分群なので9 \mid 2^k-1でなければならない。こうなるのはk=6のときのみである。すなわち、K=Fであり、これは可換である。

Q.E.D.

*1:体の乗法群の有限部分群は巡回群であるが、これは一般の斜体では成り立たない。正標数の斜体については成立することがHersteinによって証明されているが、その証明にはWedderburnの定理を用いるので注意が必要である。

Zsigmondyの定理

高校数学の美しい物語さんの記事

mathtrain.jp

を初めて見たとき、一つだけ知らない定理がありました。それがZsigmondyの定理です:

Zsigmondyの定理 a, bを互いに素な自然数とし、n2以上の整数とする。このとき、2^6-1^6およびn=2かつa+b2の冪であるという例外ケースを除いて、a^n-b^nの或る素因数pが存在して、p1 \leq k \leq n-1なる任意のkに対してa^k-b^kを割り切らない。

この定理は1892年にZsigmondyによって発見・証明され、1904年にBirkhoffとVandiverによって再証明されています。この記事ではZsigmondyの定理のBirkhof-Vandiverによる証明をMichelsが整理したものを解説します。定理の主張を満たすような素因数のことを原始的素因数と呼ぶことにします。

準備の補題

自然数nに対して、\Phi_n(X)を第n円分多項式とする。基本事項として

\displaystyle X^n-1=\prod_{d\mid n}\Phi_d(X) ー①

および

\displaystyle \Phi_n(X)=\prod_{d \mid n}(X^{\frac{n}{d}}-1)^{\mu(d)} ー②

が成り立つことを思い出します。ここで、\mu(d)Möbius関数です。

補題 p素数n, k自然数とする。このとき、
\displaystyle \Phi_{p^kn}(X) = \begin{cases}\Phi_n(X^{p^k}) & p\mid n\\ \displaystyle \frac{\Phi_n(X^{p^k})}{\Phi_n(X^{p^{k-1}})} & p \nmid n \end{cases}
が成り立つ。特に、任意の整数aに対して\Phi_{p^kn}(a)\Phi_n(a^{p^k})を割り切る。

証明. ②を用いることによって容易に確認できる。 Q.E.D.

補題 p素数とし、n=p^kqであるとする。ここで、k, q自然数qpで割り切れない。このとき、整数a\Phi_n(a) \equiv 0 \pmod{p}を満たすならば、a \bmod{p}の乗法群\mathbb{F}_p^{\times}における位数はqである。

証明. p \mid \Phi_n(a)なので、①よりp \mid a^n-1である。Fermatの小定理よりa^n-1 \equiv a^q-1 \pmod{p}であり、結局p \mid a^q-1となる。すなわち、a \bmod{p}は確かに\mathbb{F}_p^{\times}の元であって、その位数をeとするとe \mid qが成り立つ。補題1より\Phi_n(a) \mid \Phi_q(a^{p^k})であり、Fermatの小定理より\Phi_q(a^{p^k}) \equiv \Phi_q(a) \pmod{p}であるからp \mid \Phi_q(a) ー③がわかる。e < qであると仮定して矛盾を導く。②よりa^e-1=\prod_{d \mid e}\Phi_d(a)なので、或るd \mid eが存在してp \mid \Phi_d(a) ー④が成り立つ。e < qであることから、③と④より多項式X^q-1=\prod_{r \mid q}\Phi_r(X)\mathbb{F}_p[X]に還元して考えると重根をもつことになる。しかしながら、重根を持てるのはp \mid qの場合のみである。従って、我々は矛盾に到達した。 Q.E.D.

補題 n自然数aを整数とし、p\Phi_n(a)の素因数とする。このとき、p \equiv 1 \pmod{n}またはp \mid nのいずれかが成立する。

証明. これは鈴木の定理の記事105:円分多項式の係数と鈴木の定理 - INTEGERSにおける補題7に他ならない。 Q.E.D.

補題4(指数持ち上げ補題) pを奇素数とし、pで割り切れない相異なる整数x, yx\equiv y \pmod{p}なる関係を満たすとき、任意の自然数nに対して
\mathrm{ord}_p(x^n-y^n) = \mathrm{ord}_p(x-y)+\mathrm{ord}_p(n)
が成り立つ。

証明. 別途記事を書いた:指数持ち上げ補題 - INTEGERS Q.E.D.

補題 n自然数とし、x > 1を実数とする。このとき、不等式
(x-1)^{\varphi(n)} \leq \Phi_n(x) < (x+1)^{\varphi(n)}
が成り立つ。また、一つ目の不等式における等号はn=2でのみ成立する。ここで、\varphi(n)Eulerのトーシェント関数である。

証明. \zetaが絶対値1複素数であれば三角不等式

x-1 \leq \left|x-\zeta\right| \leq x+1

が成立する。一つ目の不等式は\zeta=1のときのみ、二つ目の不等式は\zeta=-1のときのみ等号が成立する。この不等式を全ての1の原始n乗根について考えて掛け合わせることにより

\displaystyle (x-1)^{\varphi(n)} \leq \prod_{\zeta}\left|x-\zeta\right| < (x+1)^{\varphi(n)}

が得られる。一つ目の不等式で等号が成立するのは\varphi(n)=1のときのみであり、それはn=2のときである。二つ目の不等式はx-1 < x+1であることから常に等号は成立しない。さて、定義より不等式の真ん中の数は\left|\Phi_n(x)\right|であり、②よりx > 1であることから\Phi_n(x) > 0である。 Q.E.D.

Zsigmondyの定理の証明

a, b, nはZsigmondyの定理の主張に現れるようなものとして固定する。ただし、a > bとする(主張の本質は変わらない)。また、例外ケースではないと仮定する。

n=2のとき a^2-b^2=(a-b)(a+b)で、例外ケースでないことからa+bは奇素数因子を持ち、それが原始的となる。何故ならば、もし、a-bも割り切るならばabを割り切ることになり互いに素であるという仮定に反するからである。

従って、以下n > 2とする。

若干の帰着
原始的素因数の存在を示すということは、a^n-b^nの素因数pが存在して1 \leq k \leq n-1なる任意のkに対してpa^k-b^kを割り切らないことを示すということである(定義そのもの)。しかしながら、実際には

a^n-b^nの素因数pが存在して、nの任意の真の約数dに対してpa^d-b^dを割り切らなければpは原始的素因数である。

が成り立つ。これを確認するにはa^n-b^nの素因数pに対して、pa^k-b^kの素因数であるような最小の自然数kをとったときにk \mid nとなっていることを示せばよい。a, bは互いに素であるからともにpで割り切れないことに注意する。bc \equiv 1 \pmod{p}なる整数cを一つとる*1p \mid a^k-b^kp \mid (ac)^k-1と同値である。よって、kの最小性からac\bmod{p}\mathbb{F}_p^{\times}における位数はkである。p \mid (ac)^n-1でもあるからk \mid nがわかる。

証明方針

\Phi_n(X, Y)斉次円分多項式とする。すなわち、

\displaystyle \Phi_n(X, Y) = Y^{\varphi(n)}\Phi_n\left( \frac{X}{Y} \right) ー⑤

\displaystyle X^n-Y^n=\prod_{d \mid n}\Phi_d(X, Y) ー⑥

\displaystyle \Phi_n(X, Y) = \prod_{d \mid n}(X^{\frac{n}{d}}-Y^{\frac{n}{d}})^{\mu (d)} ー⑦

が成り立つ。円分多項式に関する命題は大抵の場合斉次版に書き換えることができる。

示したいことはa^n-b^nが原始的素因数を持つことであるが、a^n-b^nの因数のうち原始的素因数からなる部分をP_nとする。すなわち、\mathcal{P}a^n-b^nの原始的素因数全体からなる集合とするとき、

\displaystyle P_n:=\prod_{p \in \mathcal{P}}p^{\mathrm{ord}_p(a^n-b^n)}

と定義される。\mathcal{P}=\emptysetならばP_n:=1とする。しからば、我々が示すべきことはP_n > 1となる。

ところで、各原始的素因数は⑥よりd\mid nなるdに対する\Phi_d(a, b)のいずれかに住んでいるが、原始的素因数の定義と⑦を合わせて考えるとd < nなるdに対する\Phi_d(a, b)には住んでいないことがわかる。すなわち、P_n\Phi_n(a, b)に格納されているのである。そこで、

\Phi_n(a, b)=\lambda_nP_n

\lambda_nを導入する。我々はP_n自体を攻めるのではなく、\lambda_nを攻めるという方針をとることにする。証明のKeyは\lambda_nは殆ど素因数を持ち得ないことを示すことである。具体的にいうと、\lambda_nは素因数を持ったとしても高々一つであり、更にその素因数の指数は1であることを示すことができる。この証明に指数持ち上げ補題が巧みに用いられることになる。そうして、\lambda_nが十分に小さいことを示した後に補題5を使って\Phi_n(a, b)を下から評価することによってP_nも下から評価できるという寸法である。

\lambda_nの構造

\lambda_nが素因数pを持ったと仮定する。このとき、

p \mid nを示す。 p=2のときは補題3のうち、p \equiv 1 \pmod{n}は成り立たない(n > 1なので)。よって、p \mid nが成り立つ。

pは奇素数であるとする。p \nmid nと仮定して矛盾を導く。\lambda_nの素因数は原始的ではないため、「若干の帰着」の内容と合わせると、d \mid n, d < nであってp \mid a^d-b^dなるものが存在する。まず、⑥より

\displaystyle \Phi_n(a, b) \left| \ \frac{a^n-b^n}{a^d-b^d} \right.

であり、特に

\displaystyle p \left| \ \frac{a^n-b^n}{a^d-b^d} \right. ー⑧

であることがわかる。一方、a^d \equiv b^d \pmod{p}であってd \mid nであるから、指数持ち上げ補題を適用すると

\mathrm{ord}_p(a^n-b^n) = \mathrm{ord}_p(a^d-b^d)

が成り立つことがわかる(p \nmid nと仮定していることに注意)。これは⑧と矛盾する。以上によりp \mid nが示された。つまり、\lambda_nの素因数はnの素因数によって支配される(とりあえずそんなにたくさんはないことがわかった)。p \mid \lambda_nを引き続き仮定する。

\lambda_nの素因数はpのみであることを示す。 n=p^kqと表示する。ここで、k, q自然数qpで割り切れない。補題1は斉次版でも成り立つため

\Phi_n(a, b) \mid \Phi_q(a^{p^k}, b^{p^k})

が成り立ち、Fermatの小定理より\Phi_q(a^{p^k}, b^{p^k}) \equiv \Phi_q(a, b) \pmod{p}であるから、p \mid \Phi_q(a, b)である。bc \equiv 1 \pmod{p}なる整数cをとるとp \mid \Phi_q(ac)が成り立つので、補題3よりp \equiv 1 \pmod{q}またはp \mid qとなる。今、p \nmid qであるからp \equiv 1 \pmod{q}が成立することがわかる。特に、p > qである。rnp以外の素因数としよう(これはq\neq 1のときのみ考える)。すると、r \mid qなので、p > qと合わせてp > rでなければならない。先ほどp \mid nを示したことと合わせて

\lambda_nの素因数は存在すればnの素因数のうち最大のものとして特徴付けられる。特に、\lambda_nの素因数はあったとしても一つである

ことが示された。引き続きp \mid \lambda_nと仮定しよう。今示したことから\lambda_n=p^jと書けることがわかる。

j=1であることを示す。 p=2のときから示す。nの最大の素因数が2ということになるので、n2の冪である。n > 2としているのだから、n/22の冪である。⑦とMöbius関数の性質より

\displaystyle \Phi_n(a, b) = \frac{a^n-b^n}{a^{\frac{n}{2}}-b^{\frac{n}{2}}} = a^{\frac{n}{2}}+b^{\frac{n}{2}}

である。a, bが互いに素であることと2 \mid \lambda_n \mid \Phi_n(a, b)からabはともに奇数である。すなわち、\Phi_n(a, b)は奇数の平方数の和になっていることがわかった。従って、\Phi_n(a, b) \equiv 2 \pmod{4}である。すなわち、\Phi_n(a, b)は単偶数(i.e. j=1)である。

次にpが奇素数であるとする。p \mid a^d-b^dなるd \mid nを任意に考える。今までと同じようにcをとると、p \mid \Phi_n(a, b)であることからp \mid \Phi_n(ac)であることがわかり、補題2よりac\bmod{p}\mathbb{F}_p^{\times}での位数はqである(n=p^kqという設定は続ける)。一方、p \mid (ac)^d-1なので、q \mid dであることがわかる。このことから、⑦を考えると

j=\mathrm{ord}_p(\lambda_n) = \mathrm{ord}_p(\Phi_n(a, b))=\mathrm{ord}_p(a^n-b^n)-\mathrm{ord}_p(a^{\frac{n}{p}}-b^{\frac{n}{p}})

となる(\muの値が0とならない因子のみを考えればよく、そのようなもののうち最後の二つ以外はpで割れない)。pが原始的でないことを考えると、上の議論と合わせてa^{\frac{n}{p}}-b^{\frac{n}{p}}は実際にpで割り切れることがわかるので、x=a^{\frac{n}{p}}, y=b^{\frac{n}{p}}, n=pとして指数持ち上げ補題を適用することができる。従って、

j=\mathrm{ord}_p(a^n-b^n)-\mathrm{ord}_p(a^{\frac{n}{p}}-b^{\frac{n}{p}})=\mathrm{ord}_p(p)=1

を得る。以上をもって、\lambda_n1であるか、或る素数pに対して\lambda_n=pとなることが示された。

証明の完結

\lambda_n=1のとき 補題5(n > 2に注意)より

P_n = \Phi_n(a, b) > (a-b)^{\varphi(n)} \geq 1

よって、P_n > 1が示された。

\lambda_n=p, a-b > 1のとき 補題5より

\displaystyle P_n= \frac{1}{p}\Phi_n(a, b) > \frac{1}{p}(a-b)^{\varphi(n)} \geq \frac{2^{p-1}}{p} \geq 1

となって、P_n > 1が示された(p \mid nなので\varphi(n) \geq p-1)。

\lambda_n=p, a-b = 1のとき \Phi_n(a, b) > pを示せばよい。p \mid a^n-b^nなのでpは奇数である(今、a, bパリティは異なる)。n=p^kqとおく。いつも通りk, q自然数qpで割り切れないものとする。k > 1と仮定する。n=p^{k-1}pqと考えて補題1の斉次版を適用すると

\Phi_n(a, b) = \Phi_{pq}(a^{p^{k-1}}, b^{p^{k-1}})

が成り立ち、

\displaystyle \Phi_{pq}(a^{p^{k-1}}, b^{p^{k-1}}) \geq (a^{p^{k-1}}-b^{p^{k-1}})^{\varphi(pq)} \geq a^p-b^p = \sum_{i=0}^{p-1}\binom{p}{
i}b^i > p

と評価できる。k=1、すなわちn=pqの場合を考える。補題1の斉次版と補題5の斉次版より

\displaystyle \Phi_n(a, b) = \frac{\Phi_q(a^p, b^p)}{\Phi_q(a, b)} > \frac{(a^p-b^p)^{\varphi(q)}}{(a+b)^{\varphi(q)}} \geq \frac{a^p-b^p}{a+b}

と評価できる。p \geq 3のとき関数y=\frac{(x+1)^p-x^p}{x}x \geq 1で単調増加なので、

\displaystyle  \Phi_n(a, b) > \frac{a^p-b^p}{a+b} \geq \frac{(2^p-1)b}{2b+1} \geq \frac{2^p-1}{3}

となるが、p > 3だとこれはpより大きい。こうして、p=3の場合が残った。n=pqで、前に示したようにq < p=3なのだから、n=3, 6しかありえない。

n=3としよう。a^3-b^3=(a-b)(a^2+ab+b^2)=a^2+ab+b^2 > 1なので、a^2+ab+b^2の素因数は原始的である(「若干の帰着」に注意)。最終的にn=6の場合が残ったが、

\displaystyle \Phi_6(a, b) = \frac{(a^6-b^6)(a-b)}{(a^2-b^2)(a^3-b^3)} = \frac{a^3+b^3}{a+b} = a^2-ab+b^2 = b^2+b+1

なので、b > 1ならば\Phi_6(a, b) > 3=pが示される。b=1, a=2のときは、例外ケースであった。 Q.E.D.

あとがき

Zsigmondyの定理は古い結果ですが、今ではZsigmondyの定理を特殊な場合として含む、はるかに強力な結果が得られています:
integers.hatenablog.com

この記事を書いたことによって、インテジャーズでは高校数学の美しい物語さんの「整数論の美しい定理7つ」の記事で紹介されている7つの定理のうち、フェルマーの最終定理以外の証明を解説したことになります。あと一つ!

*1:cの存在証明は integers.hatenablog.com に書きました。