星期日, 21 6 月

陆 AI 模型水准 马斯克按赞 认为与美国差距缩小

特斯拉CEO马斯克在社群平台X上发文回复网友提问表示,大陆AI大模型可能在2027年第1季,能够达到Anthropic最强的AI大模型Fable水准,并点名「陆版Open AI」之称的智谱公司的GLM-5.2已缩小了差距。意外钓出智谱CEO唐杰回复,「不需要那么久」。

观察者网报导,对于马斯克的言论,有AI业内人士认为,马斯克的预测相对保守,中美模型水准的时间差可能短于七个月。谷歌DeepMind首席执行官哈萨比斯先前也曾经表示,大陆的AI模型在能力上,可能「只差几个月」就能赶上海外。

智谱公司小档案
智谱公司小档案

智谱日前上线并开源了新一代旗舰AI大模型GLM-5.2。该模型在FrontierSWE程式设计基准测试中得分74.4,接近美国大模型企业Anthropic另一个顶级模型Claude Opus 4.8的水准,此前Anthropic于今年6月初推出的Claude Fable 5模型被公认为最强的AI模型,但由于美国政府的出口管制要求,此模型已暂停全球使用而下线。

GLM-5.2可以完整载入几百万字的长文档、几百页PDF,或者一个中型软体专案的全部代码。此前的开源模型不是做不到长上下文,而是在长程任务中表现不稳定,读到后面就开始遗漏前面的资讯。GLM-5.2在FrontierSWE、SWE-Marathon等长程任务测试里,得分仅次于Claude Opus 4.8,差距仅0.7%。

这是开源模型第一次在工程级的长任务上接近闭源顶级模型的水准。包括华为升腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等大陆国产算力平台都已实现适配。

智谱在发布时提到:「前沿智慧不应只属于少数人,也不应被少数规则随时收回。」这次没有附加任何使用限制。

跑分数据最初由智谱自行发布,市场态度谨慎。随后Artificial Analysis、Code Arena等第三方机构陆续发布独立测试结果,与官方数据基本吻合。

新浪财经报导,从1月8日上市到现在不到半年,智谱股价累计涨幅超过18倍。2025年营收人民币7亿元、亏损人民币47亿元的公司,当前最新市值已经达到9,336亿港元。这个数字超过了中芯国际,是百度的近三倍,腾讯的五分之一。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注