星期一, 28 7 月

阶跃星辰发布新一代基础大模型 联合多家晶片及基础设施厂商创联盟

2025世界人工智能大会(WAIC 2025)开幕前夕,大模型企业阶跃星辰25日在上海正式发布其新一代基础大模型Step 3。阶跃星辰还宣布将联合近10家晶片及基础设施厂商,共同发起「模芯生态创新联盟」,以打通晶片、模型和平台全链路技术。

据界面新闻,Step 3是阶跃星辰首个全尺寸、原生多模态推理模型,采用 MoE 架构,总参数量321B,启用参数量 38B。性能方面提升了视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉资讯的交叉分析,以及日常生活中的各类视觉分析问题。

成本方面,在大陆国产晶片上的推理效率最高可达DeepSeek-R1的300%,且对所有晶片友好。在基于NVIDIA Hopper架构的晶片进行分布式推理时,实测Step 3相较于 DeepSeek-R1的吞吐量提升超70%。

目前,Step 3已授权大陆多家晶片公司,其中华为升腾晶片已首先实现Step 3的搭载和运行;沐曦、天数智芯和燧原科技等也已初步实现运行Step 3。Step 3将于7月31日面向全球企业和开发者开源。

此外,阶跃星辰宣布,联合多家大陆国内领先的晶片、平台厂商发起成立「模芯生态创新联盟」,打通晶片、模型和平台全链路技术,通过推动模型和晶片产业链联合创新,加速大模型应用的落地,首批成员包括华为升腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。

据澎湃新闻,阶跃星辰创办人、执行长姜大昕表示,目前大陆大模型还在做追赶,ChatGPT、Sora、OpenAI o1出来后,「我们很快地追上,但这是在资源有限的情况下,一个比较有效的或是比较聪明的策略」。姜大昕强调,追赶的过程也是创新的过程,因为别人没有说该怎么做。

陆大模型企业阶跃星辰25日在上海正式发布其新一代基础大模型Step 3。(图/取...
陆大模型企业阶跃星辰25日在上海正式发布其新一代基础大模型Step 3。(图/取自界面新闻)

$(document).ready(function () {nstockStoryStockInfo();});

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注