素数的定义很简单,小学生都懂,但却有许多经典的数学未解之谜都与它有关。

因此,素数在数论中的地位非常重要。

现在,一个跟它有关的猜想,就被26岁的牛津大学在读博士生给证明了。

他26岁发表论文18篇 刚把上世纪的素数猜想给证明了-冯金伟博客园

这是匈牙利数学家最早在1930年代提出来的一个关于原始集的问题。

由于小哥用到的都是已有论点,许多数学家都被他的聪明方法惊到了。

具体是什么,一起来看。

(前方一些高能预警。。)

首先,不知道原始集(Primitive sets)这个概念大家熟不熟。

它和素数的定义差不多,指的是一组不能互相被整除的数字的集合,比如{6,28,496,8128}。

当然,这些数都要大于1。

由于素数只能被1和它本身整除,那么任何素数组成的集合就属于一种特殊的原始集。

他26岁发表论文18篇 刚把上世纪的素数猜想给证明了-冯金伟博客园

△ 图源Quanta Magazine

原始集这个概念是由匈牙利数学家Paul Erd?s在1930年代提出的,最早只是用于证明起源于古希腊的完美数。

虽然它的定义很简单,但围绕着它也产生了一些很有趣的属性。

比如你无法确定原始集到底有多少种组合,就比如在1-1000这些数中,占去一半数量的501-1000,拿出其中任意几个数字都可以构成一个原始集,因为它们都无法被互相整除。

不过虽然无法确定组合有多大,但Paul Erd?s发现对于任何原始集(包括无限集),它的“Erd?s和”都有上界,即小于或等于某个数字。

什么是“Erd?s和”?

就是对集合中的每个数字n求表达式1/(n log n)的和,用公式表达就是这样:

他26岁发表论文18篇 刚把上世纪的素数猜想给证明了-冯金伟博客园

比如集合{2, 3, 55},它的“Erd?s和”就等于 1/(2 log 2) + 1/(3 log 3) + 1/(55 log 55)。

前面说到,“Erd?s和”是有界的,但我们都没法知道最大的集合长什么样,这个界又何以知晓呢?

尽管如此,1988年,Erd?s还是给出了一个值,它推测这个界为某个素数组成的原始集的和,为1.64。

这个猜想也把素数再次推上了“特立独行”的“风口浪尖”(这也就是标题里所说的“一个素数猜想”的具体含义了)。

几十年来,数学家们在证明这个猜想方面只取得了部分进展。

从大四接触到这个问题就被迷住了

牛津大学的博士生小哥Jared Duker Lichtman,从2018年开始接触到这个问题。

那会儿他还是达特茅斯学院的一名大四本科生。

他回忆称,自己一下子就被这个猜想迷住了:“这么奇怪的推测怎么会是真的呢,太不可思议了吧?”

于是接下来的四年间,从本科到牛津大学读博,小哥就跟这个猜想“杠”上了。

谁能想到,2018年,他和他在达特茅斯学院的导师Carl Pomerance还真先一起侧面证明了原始集的“Erd?s和”不会大于1.78左右的猜想。

这个猜想是美国数学家弗兰兹·梅尔滕斯(Franz Mertens)提出来的。

他们算出这个常数的办法是先写下原始集中每个数字的倍数,然后将每个序列中这些倍数进行分解,出现了比当前原始数的最大质因数还要小的因数,就要丢掉。

然后将剩余的数字组成一个新集合。

举个具体例子。

假如原始集为{2, 3, 5},那么2的最大质因数是2,3的最大质因数是3,5的最大质因数是5。

所有2的倍数全部合格,因为它们都是2的公倍数,没有超过2的质因数2;

所有3的倍数中,只要是素数2的公倍数(因为没有超过质因数3),都要被扔掉,也就是6、12、18都不合格;

所有5的倍数中,只要是素数2和3的公倍数(因为没有超过质因数5),也要被pass,因此10、15、20、30不合格;

再比如55的倍数中,只要是素数2、3、5、7的公倍数,也要被pass,因为55的最大质因数为11。

他26岁发表论文18篇 刚把上世纪的素数猜想给证明了-冯金伟博客园

△ 图源Quanta Magazine

牛津小哥将这种方法比作字典的索引方式,只不过字典是按字母,这是按素数来组织每个序列。

得到新的集合后,他和导师又开始算这些倍数序列的“密度”。就拿所有偶数来说,它的序列“密度”就是为1/2,因为所有偶数占所有整数的一半。

然后啊,他们就观察到,如果给定的一个集合是原始集,那么所有倍数序列就不会重叠(overlap),因为他们的组合“密度”最多为1。

(为什么为1,因为整数的序列“密度”就是1。)

有了“密度”,就可以算集合的“Erd?s和”了,根据弗兰兹·梅尔滕斯提出的定理,一个大约等于1.78的特殊常数乘以集合倍数的组合“密度”,就可以得出原始集的最大“Erd?s和”。

由于小哥和导师证明集合的“密度”最大为1,也就从侧面证明了“Erd?s和”的最大值为1.78。

小哥在牛津大学的导师对此赞赏有加,称小哥和原导师的方法其实是Paul Erd?s最初方法的一种变体,但它更巧妙,得到了一个“not-tight”和“not-too-bad”的上界。

与此同时,大家认为他们的这个方法似乎已经是目前最顶尖的数学家才可以做到的。

好,成功了一小步,接下来如何才能把范围缩小,证明Erd?s给出的1.64呢?

小哥发现,他和前导师的那一套理论对于质因数较小的数字组成的原始集是有效的,可以比较轻松地就证明出来甚至比1.64还小的常数。

不过质因数大了就不太行。

左思右想,转眼到了博士三年级,他发现可以给集合中的每个数字关联不止一个倍数序列。

但和之前一样,所有这些序列的组合密度最多为1。

比如对于618这个数字(2 x 3 × 103)来说,按照以前的方法不可以出现比103倍还小的倍数,但现在可以用比103倍还小的倍数组成序列,比如5倍。

(至于5倍还是几倍,这都是有一套约束规则决定的。)

接着他又找到了一种更准确地算出这些序列的组合“密度”的方法。

最终,他仔细考虑了原始集的各种情况,在具有最大质因数和最小质因的数字之间找到了一个平衡,将2018年和现在的两部分证明拼凑在一起,最终证明了“Erd?s和”小于1.64。

前后一共花了四年的小哥表示,得出这个结果不知道是运气好碰上了还是啥,总之做到了。

详细证明过程已经被他写成了论文发在了arXiv。

他26岁发表论文18篇 刚把上世纪的素数猜想给证明了-冯金伟博客园

粗略一番……几乎是三行一个公式的情况。感兴趣的数学大佬可以去看看。

有数学家指出,牛津小哥这个证明结果真的太引人注目了,因为他的方法非常聪明,完全依赖于已有论点就做到了。

与此同时,同行还表示,这一证明巩固了素数在原始集合中的特殊地位。

ps. 小哥有多厉害,可以从大家的反应侧面感受到。

就比如有网友通过小哥的个人主页扒到他列出的最近出版物,发现从2018年到现在一共有至少18篇。

他26岁发表论文18篇 刚把上世纪的素数猜想给证明了-冯金伟博客园

才读到博士就有这么多论文,这一数字让大家很是震惊。

但有人就站出来表示了:不足为奇,毕竟天才就是天才啊。(手动狗头)

他26岁发表论文18篇 刚把上世纪的素数猜想给证明了-冯金伟博客园

论文地址:https://arxiv.org/abs/2202.02384

参考链接:[1]https://www.quantamagazine.org/graduate-students-side-project-proves-prime-number-conjecture-20220606/[2]https://news.ycombinator.com/item?id=31640297