菁英数学家们要设计出自己可以解决但会让模型崩溃的数学题目,结果许多问题都遭到AI击溃。(美联社)
曾德峰/核稿编辑
〔即时新闻/综合报导〕AI发展学习持续进步,近日一场秘密数学会议召开,30名来自世界各地的顶尖数学家在美国加州齐聚一堂,挑战人工智慧研究实验室OpenAI的o4-mini模型,菁英数学家们要设计出自己可以解决但会让模型崩溃的数学题目,结果许多问题都被AI击溃。
据《生活科学》(LiveScience)网站报导,5月中旬在加州伯克利召开一场秘密数学会议,30名来自世界各地的顶尖数学家齐聚一堂,对决OpenAI最强推理模型o4-mini,这是一种大语言模型(LLM),它由OpenAI训练,能够进行高度复杂的推理;30名世界顶尖数学家分成5组,设计出他们可以解决但会导致模型崩溃的数学问题,若AI无法解答,设计问题的数学家即可获得7500美元(约新台币21.9万)。
结果令数学家们大吃一惊,日裔知名数学家小野健设计一个博士论文级的题目,AI先花了2分钟寻找并掌握了该领域的相关文献,然后,它称想先尝试解决一个更简单的「玩具」版本的问题,以便学习;几分钟后,AI说自己准备好解决更困难的问题了。5分钟后,o4-mini给了一个正确但又很巧妙的解决方案,它还加注「不用引用文献,因为那个神秘数字是我亲手算出来的」。
小野健惊讶表示,AI不仅能计算,还能像人类一样表现出结构化的推理过程,直呼「我从未在模型中见过这种推理。这就是科学家所做的事。这太可怕了。」虽然菁英数学家团队最终成功找到了10个让AI难以应对的问题,但仍对AI的进步感到震惊,认为已达数学天才等级,同时AI速度也让数学家印象深刻,只需几分钟就能完成人类专家需要数周或数月才能完成的工作。
小野健指出,若AI达到能够计算出数学家无法解决的「第5级」问题,那数学家的角色将会发生巨大的变化,数学家可能会转向简单地提出问题并与推理机器人互动,以帮助他们发现新的数学真理,就像教授对待研究生一样。
来源:自由时报