2025世界人工智慧大會(WAIC 2025)開幕前夕,大模型企業階躍星辰25日在上海正式發布其新一代基礎大模型Step 3。階躍星辰還宣布將聯合近10家晶片及基礎設施廠商,共同發起「模芯生態創新聯盟」,以打通晶片、模型和平台全鏈路技術。
據界面新聞,Step 3是階躍星辰首個全尺寸、原生多模態推理模型,採用 MoE 架構,總參數量321B,啟用參數量 38B。性能方面提升了視覺感知和複雜推理能力,可準確完成跨領域的複雜知識理解、數學與視覺資訊的交叉分析,以及日常生活中的各類視覺分析問題。
成本方面,在大陸國產晶片上的推理效率最高可達DeepSeek-R1的300%,且對所有晶片友好。在基於NVIDIA Hopper架構的晶片進行分散式推理時,實測Step 3相較於 DeepSeek-R1的吞吐量提升超70%。
目前,Step 3已授權大陸多家晶片公司,其中華為升騰晶片已首先實現Step 3的搭載和運行;沐曦、天數智芯和燧原科技等也已初步實現運行Step 3。Step 3將於7月31日面向全球企業和開發者開源。
此外,階躍星辰宣布,聯合多家大陸國內領先的晶片、平台廠商發起成立「模芯生態創新聯盟」,打通晶片、模型和平台全鏈路技術,通過推動模型和晶片產業鏈聯合創新,加速大模型應用的落地,首批成員包括華為升騰、沐曦、壁仞科技、燧原科技、天數智芯、無問芯穹、寒武紀、摩爾線程、硅基流動等。
據澎湃新聞,階躍星辰創辦人、執行長姜大昕表示,目前大陸大模型還在做追趕,ChatGPT、Sora、OpenAI o1出來後,「我們很快地追上,但這是在資源有限的情況下,一個比較有效的或是比較聰明的策略」。姜大昕強調,追趕的過程也是創新的過程,因為別人沒有說該怎麼做。

$(document).ready(function () {nstockStoryStockInfo();});