教授认为中村的连胜在统计学上很正常,克拉姆尼克则不这么认为

教授认为中村的连胜在统计学上很正常,克拉姆尼克则不这么认为

29浏览次
文章内容:
教授认为中村的连胜在统计学上很正常,克拉姆尼克则不这么认为
教授认为中村的连胜在统计学上很正常,克拉姆尼克则不这么认为

一位世界顶级统计学家的最新研究发现,特级大师 Hikaru Nakamura 在 Chess.com 上与高水平对手的出色战绩完全在预期范围内。特级大师 Vladimir Kramnik 强烈批评了这份报告,称其“完全荒谬”,并指责 Chess.com“明显存在操纵行为”。

Jeffrey S. Rosenthal 是多伦多大学的统计学教授,也是全球公认的概率和统计学专家。他是多部广受好评的书籍的作者,例如《闪电击中:奇妙的概率世界》,并因其向公众解释复杂统计概念的能力而闻名。他还对国际象棋有着终生的热爱,并将国际象棋作为业余爱好。

罗森塔尔的结论:“并不特别令人惊讶”

这位加拿大教授发布了一篇新的 12 页论文,题为《在线国际象棋连胜概率》,这篇论文是响应 Chess.com 的建议而撰写的。在这项研究中,他根据美国特级大师 2014 年至 2024 年在该平台上进行的 57,421 场比赛,对中村的连胜进行了细致分析。罗森塔尔指出,他的研究应该被视为对不可能连胜的调查,而不是在线国际象棋作弊的更广泛问题。

在对中村的表现进行详细分析时,罗森塔尔重点分析了他在在线快棋比赛中取得的 45.5/46 的连胜纪录:“这项统计分析表明,光在网上国际象棋比赛中取得的连胜纪录并不特别令人惊讶。他最近备受争议的 46 连胜纪录完全在预期范围内,”罗森塔尔在他的研究中总结道。

这项统计分析表明,Hikaru 的在线象棋连胜纪录并不特别令人惊讶。他最近备受争议的 46 连胜纪录完全在预期范围内。

— 杰弗里·罗森塔尔 (Jeffrey Rosenthal),多伦多大学统计学教授

中村现居世界第二,在古典赛和快棋赛中均位居第二。去年,克拉姆尼克 (Vladimir Kramnik) 对他进行了严厉的审查。这位前世界冠军质疑中村的连胜纪录,并含糊其辞地说:“我相信每个人都会觉得这很有趣。”克拉姆尼克呼吁进一步调查这种连胜的可能性,尽管他没有明确指责中村作弊,但全球国际象棋界已将克拉姆尼克的言论解读为明显的暗指作弊。

Kramnik 在 Chess.com 的一篇博客文章中写道:

仔细检查了 Hikaru 的统计数据后,我发现他和他的一些对手都有很多低概率的表现。根据数学家的说法,其中一些数学概率极低。根据那些专业数学家的计算,远低于百分之一。

罗森塔尔:“看似稀有的东西并不一定稀有”

然而,罗森塔尔的研究发现,中村的连胜纪录虽然很出色,但完全符合他这种水平的棋手的统计预期。“在正确的背景下看待事情,看似非常罕见的事情并不一定非常罕见,”罗森塔尔在接受 Chess.com 采访时解释道。

如果你在正确的背景下看待某些事物,那么它们看起来确实非常罕见,但实际上并不一定非常罕见。

—杰弗里·罗森塔尔

杰弗里·罗森塔尔
杰弗里·罗森塔尔。照片:多伦多大学/YouTube 提供

罗森塔尔使用 Elo 评分系统计算了此类连胜自然发生的可能性。他指出,中村光的 45.5/46 连胜的概率约为 830 分之一,考虑到他在 50,000 多场比赛中的机会次数,这个概率并不大。

57,421 场比赛序列大约有 57,421/46 ≈ 1,248 种不同的、不重叠的独立机会来实现该长度的连续性,因此以 1/830 的概率找到连续性实际上是非常有可能的。

中村俊辅最引人注目的成绩分析

该研究还分析了中村连续获胜的概率,连续获胜的连续获胜是指连续几局不输,最多平局一局。罗森塔尔发现,中村连续获胜的连续获胜场次总计有 226 场,最长的有 121 场。

中村俊辅在这些比赛中的平均对手得分不到 1,600 分,罗森塔尔指出,长期连续得分并不一定是不可能的:“他在这 121 场比赛中至少得到 120.5 分的概率为 1/8.9,这并不是特别不可能。”

根据罗森塔尔的研究,在 Nakamura 最引人注目的连续上垒记录中,只有两次出现的可能性比他的 45.5/46 的得分要小得多:“这些是极不可能发生的事情,9,000 次连续上垒中只有一次的概率,或者 11,000 次连续上垒中只有一次的概率......大约 43% 的时间里,至少会出现一次这样的连续上垒记录,”罗森塔尔表示,他指的是下表中的第 4 行和第 6 行。

光条纹
中村光 (Hikaru Nakamura) 最不可能的连胜,概率不到五百分之一。图片:Jeffrey Rosenthal/在线国际象棋中的连胜概率。

为了进一步验证连胜纪录,罗森塔尔教授进行了蒙特卡罗模拟,这是一种使用重复随机抽样来估计不同结果可能性的方法。通过根据中村的等级分和对手的等级分模拟数千场随机比赛,罗森塔尔发现,实现 45.5/46 这样的连胜纪录的概率实际上是相当合理的。

在每次模拟中,罗森塔尔记录下与中村实际比赛结果相符或超过的连胜长度和频率。结果提供了连胜长度和频率的分布,罗森塔尔随后将其与中村的实际表现进行比较。

1 / 最小条纹概率。图形:
1 / 最小连胜概率。图片:Jeffrey Rosenthal/在线国际象棋中的连胜概率。

罗森塔尔指出:

我们从图中可以看出,虽然实际值 11,570.6 和 9,452.1 大于许多模拟的最大 1/概率值,但也有许多模拟的 1/概率值比这大得多。事实上,最大的模拟 1/概率值超过 284,000,平均模拟 1/概率值超过 26,000,甚至中位数模拟 1/概率值也是 10,461.92,接近 Hikaru 的 11,570.6 值。事实上,在 100 次模拟中,有 43 次(接近一半)最不可能的连胜比观察到的 1/11570.6 连胜的可能性更小。这进一步证实,在如此长的一系列比赛中,Hikaru 的最不可能连胜并不令人惊讶。

事实上,在 100 次模拟中,有 43 次(接近一半)最不可能连续出现的情况比观察到的 1/11570.6 还要小。这进一步证实了 Hikaru 在如此长的游戏中出现的最不可能连续出现并不令人意外。

—杰弗里·罗森塔尔

教授在结论中指出,尽管中村最不可能连续获胜的原始概率约为 1/10,000,但在如此多的比赛中实现这种连续获胜的概率仍然高于 10%,蒙特卡洛模拟中的概率约为 43%:换句话说,可能性不大。

出现两次如此显著的连胜的概率较小,但仍有 18% 的概率,完全在通常的统计变异范围内。总体而言,考虑到 Hikaru 长期比赛记录中玩家的评分,Hikaru 在 Chess.com 记录中观察到的连胜相当典型。

克拉姆尼克的回应:“完全荒谬”

弗拉基米尔·克拉姆尼克 (Vladimir Kramnik) 指责 Chess.com
弗拉基米尔·克拉姆尼克 (Vladimir Kramnik) 指责 Chess.com 在统计学教授杰弗里·罗森塔尔 (Jeffrey Rosenthal) 的一项研究之后存在“明显的操纵行为”。照片:Peter Doggers/Chess.com。

虽然研究结果表明中村的连胜在统计学上是正常的,但克拉姆尼克强烈否认了这项研究。在回应 Chess.com 就此事发表评论的请求时,这位前世界冠军发送了几封电子邮件,称这是“一份荒谬、毫无意义的报告”、“一个笑话”和“令人作呕”。

“恕我直言,这项‘研究’只是又一种操纵。我可以坚持我的说法,并在与这位先生的直接交谈中证明这一点。我认为他被误导了,或者对国际象棋了解不多,”克拉姆尼克在谈到罗森塔尔时说道。

恕我直言,这项“研究”只是另一种操纵。我可以坚持我的说法,并在与这位先生的直接交谈中证明这一点。我认为他被误导了,或者对国际象棋了解不多。

— 前世界冠军弗拉基米尔·克拉姆尼克 (Vladimir Kramnik)

他进一步声称,这位教授在研究中至少犯了“五个重大错误”,比如在分析连胜时混合使用不同的时间控制,以及使用 Elo 评级系统来计算 Chess.com 的 Glicko 系统的概率。“这是一个基本的原始错误。它让整个研究都错了。这真的很荒谬。相信我。”

克拉姆尼克还指责 Chess.com 的首席执行官埃里克·阿勒贝斯特 (Erik Allebest) 存在“明显的操纵行为”,暗示他故意向教授提供“完全错误的数据”。他向罗森塔尔发起挑战,要求进行现场讨论,就研究结果展开辩论,并表示他已经录制了一段 YouTube 视频,更深入地阐述了他的批评。

结论与独立分析一致

罗森塔尔的研究结果得到了两项独立研究结论的支持。Shiva Maharaj、Nick Polson 和 Vadim Sokolov 进行的“克拉姆尼克 vs 中村或贝叶斯 vs p 值”研究使用贝叶斯方法分析了中村的表现。他们的分析得出结论,中村作弊的可能性极低。

由软件工程师 Kiril Bobyrev 进行的另一项独立分析也得出结论:“在 Chess.com 上的在线快棋比赛中,顶级选手的连胜在统计上并非不可能”。

上周,美国统计学教授肯尼斯·里根 (Kenneth Regan) 也对克拉姆尼克在 X/Twitter 上的多篇帖子进行了评论:“这些帖子没有标准化。他没有采用建立参考基准所需的统计技术,而我有。我有一个预测分析模型,我设定了期望值,我知道它们的置信区间。这些都是自 18 世纪以来就为人所知的基本统计词汇,但他的帖子中却没有提到这些词汇,”他在 Clash of Blames 节目播出期间说道。

多伦多大学与罗森塔尔合作发布了他们自己的视频。

杰弗里·罗森塔尔指出,他没有从 Chess.com 获得任何报酬。

分类:

体育游戏

标签:

评估:

    留言