知情人士透露,Anthropic洽谈向英国晶片新创公司Fractile,采购无须DRAM的人工智慧(AI)推论晶片,以便在记忆体价格高涨、供给短缺之际,减少记忆体需求。
The Information 1日引述知情人士报导,Anthropic已和Fractile展开初步洽谈,拟采购推论加速器。若谈判成局,Anthropic将在辉达、Google与亚马逊之外,再添第四个AI伺服器晶片供应商。
不过,Fractile晶片预计要到2027年左右才会商用,因此不会出现在Anthropic的短期采购计划,大致与该公司和Google及博通合作开发张量处理器(TPU)的时程相近。
Fractile正在开发推论晶片,将记忆体与运算整合在同个晶粒上,采用静态随机存取记忆体(SRAM),而非将资料传输到独立的DRAM。GPU与外部DRAM间的资料移动,是大型AI模型高速运行的主要瓶颈之一。
Fractile创办人古德温(Walter Goodwin)2024年表示,该公司的晶片设计,是将运算所需的资料,直接储存在执行演算的的电晶体旁边,而非依赖外部DRAM,据当时模拟结果,执行大型语言模型(LLM)时,速度是辉达的绘图处理器(GPU)的100倍、且成本仅十分之一,但Fractile当时尚未生产测试晶片。
Anthropic一直刻意避免依赖单一晶片供应商。目前Claude在辉达GPU上运行,AI资料中心「雷尼尔计划」则采用亚马逊Trainium处理器。
Anthropic也用Google的TPU提供逾1百万瓩(GW)算力,预计2027年至2031年间的TPU算力规模,将提升至3.5GW。
外界对Anthropic既有基础设施的需求急速攀升,该公司年化营收3月突破300亿美元,远高于去年底的约90亿美元,但推论成本仍对毛利率构成压力。不同于OpenAI与xAI自行建设或扩大资料中心版图,Anthropic选择向多家供应商租用算力,透过分散晶片来源取得议价优势。
另外,知情人士透露,Anthropic正敲定一项约15亿美元的合资计划,将与黑石(Blackstone)、高盛及数个华尔街机构合作,向私募股权支持的企业销售AI工具。