辉达(Nvidia)传出已告知中国大陆客户,该公司专为AI资料中心打造的中央处理器新产品「Vera CPU」最快8月可以出货,客户现在可开始下单。
路透引述三名知情人士说法报导,一些大陆客户已对Vera CPU表达兴趣。这是辉达首款独立开发、专为「代理式AI」所设计的CPU。
最新推销行动凸显辉达正迅速转向新产品,盼逆转自家在中国市场快速恶化的处境。该公司性能排名第二强的AI晶片H200数月来无法顺利出货至中国,辉达急需新的成长动能。此举也提高辉达与两大CPU厂商英特尔与超微(AMD)的竞争力道,后两者正积极扩大AI资料中心伺服器CPU的供应能力。
其中一名消息人士表示,一家中国大型云端服务业者计划采购超过300台伺服器,每台伺服器搭载两颗Vera CPU。该公司将先部署这批系统进行测试,再根据测试结果决定是否正式大规模采购。
不过,另一名消息人士说,这种初步兴趣能否转化为大规模采用仍有待观察,因为涉及软体生态系统、相容性问题,以及企业将既有工作负载从中国国产AI晶片平台迁移至Vera平台的成本与难度。
相较于GPU,CPU在中国销售面临的监管障碍可能较少。GPU受到美国出口严格管制。华盛顿已核准约10家陆企业采购H200 GPU,但至今仍未有任何一批产品实际交付。知情人士说,中国官方基于扶植本土供应商的考量,尚未批准相关进口。
其中一名消息人士补充,中国客户初期计划仅在海外资料中心部署Vera CPU进行测试,而非直接在中国境内大规模使用。
根据研究机构SemiAnalysis估计,单颗Vera处理器售价将「远高于」2万美元,若建置完整的256颗晶片机柜,依记忆体配置不同,成本约可达1,000万美元。
SemiAnalysis指出,初期大部分Vera CPU将被搭载于大型、可直接部署的整机柜系统中,这类产品较受超大型云端业者青睐;较简单的双处理器伺服器产品则预计稍晚才会提升产量。
辉达预期,截至明年1月底的本会计年度结束前,Vera CPU晶片营收可望达到200亿美元。
中国市场对Vera CPU展性兴趣之际,正值全球AI竞赛从模型训练逐渐转向推论运算。推论运算是AI回答问题、执行任务时所需的即时运算。在这领域中,GPU面临来自CPU与客制化晶片更大的竞争压力。
这股趋势也导致全球CPU供应吃紧。英特尔在2月曾传出已通知中国客户,其伺服器CPU交货期可能长达六个月;超微上月表示,全球CPU市场供应吃紧,需求超出原先预期,供应受限情况短期内难以缓解。
