30名顶尖数学家联手出题被破解 AI解题后呛:无须引用、自己算出来
菁英数学家们要设计出自己可以解决但会让模型崩溃的数学题目,结果许多问题都遭到AI击溃。(美联社)
曾德峰/核稿编辑〔即时新闻/综合报导〕AI发展学习持续进步,近日一场秘密数学会议召开,30名来自世界各地的顶尖数学家在美国加州齐聚一堂,挑战人工智慧研究实验室OpenAI的o4-mini模型,菁英数学家们要设计出自己可以解决但会让模型崩溃的数学题目,结果许多问题都被AI击溃。据《生活科学》(LiveScience)网站报导,5月中旬在加州伯克利召开一场秘密数学会议,30名来自世界各地的顶尖数学家齐聚一堂,对决OpenAI最强推理模型o4-mini,这是一种大语言模型(LLM),它由OpenAI训练,能够进行高度复杂的推理;30名世界顶尖数学家分成5组,设计出他们可以解决但会导致模型崩溃的数学问题,若AI无法解答,设计问题的数学家即可获得7500美元(约新台币21.9万)。请继续往下阅读...
结果令数学家们大吃一惊,日裔知名数学家小野健设计一个博士论文级的题目,AI先花了2分钟寻找并掌握了该领域的相关文献,然后,它称想先尝试解决一个更简单的「玩具」版本的问题,以便学习;几分钟后,AI说自己准备好解决更困难的问题了。5分钟后,o4-mini给了一个正确但又很巧妙的解决方案,它还加注「不用引用文献,因为那个神秘数字是我亲手算出来的」。小野健惊讶表示,AI不仅能计算,还能像人类一样表现出结构化的推理过程,直呼「我从未在模型中见过这种推理。这就是科学家所做的事。这太可怕了。」虽然菁英数学家团队最终成功找到了10个让AI难以应对的问题,但仍对AI的进步感到震惊,认为已达数学天才等级,同时AI速度也让数学家印象深刻,只需几分钟就能完成人类专家需要数周或数月才能完成的...