大陆AI新创公司深度求索(DeepSeek)近期传出打破「从不融资」铁律,将启动首次外部融资,引发各界关注。陆媒指出引述投资人与业内人士分析指,此举除补充算力与资金需求外,更可能与员工期权定价与留才压力有关,在人才竞争加剧背景下,成为公司策略转向的重要考量。
第一财经指,曾让无数投资人吃了闭门羹的DeepSeek,传出首次启动外部融资的风声。美国科技媒体The Information引述消息人士称,DeepSeek正以超100亿美元估值,计划募集不少于3亿美元资金。对长期拒绝外部资本、强调独立性的DeepSeek,此举被视为战略重大转向。
报导称,引入外部资金后,有望取得更多算力资源推进模型开发,并提高薪酬竞争力以减少人才流失。分析认为,潜在投资方可能以大陆境内人民币资金为主,美国风险资本或心存顾虑。对此,目前公司尚未回应。
一位投过大模型的投资人表示,DeepSeek即便开放融资,也「不是大多数人的游戏」,且按照梁文锋的想法,条款也一定异常严苛。对于这次融资转向,该投资人判断「大概率是为了员工期权定价和兑现」,且「做得太晚了」。
由于长期未引入外部资本,员工期权依赖内部估值,在缺乏市场定价下对顶尖人才吸引力有限。在AI人才竞争加剧背景下,核心研发团队成为挖角目标,竞争对手开出的薪酬包可达数倍。
目前DeepSeek已有多位核心研究员出走,包括罗福莉加盟小米、郭达雅转至字节跳动Seed团队、阮翀加入元戎启行等。据澎湃新闻报导,DeepSeek薪资仅属中等水准,猎头正以2至3倍高薪及期权挖角。
业内人士指出,除期权定价需求外,公司亦面临资金压力。有AI创业者称,「梁文锋不可能一直拿幻方的钱无限制补贴DeepSeek,独立分拆出来按市场化估值融资,是更合理的商业选择」,转向市场化融资较为合理。随著大模型竞赛成本上升、算力投入快速增加,既有资金来源难以长期支撑。
第一财经还指,大模型竞赛成本持续上升,算力投入呈现指数增长。值得关注的是,DeepSeek已有15个月没有大版本更新,期间竞争对手已迭代多轮,DeepSeek原定今年2月发布的DeepSeek V4亦多次延期。
据了解,DeepSeek V4将由原本基于辉达CUDA架构,转向华为升腾晶片并适配CANN框架。业内人士表示,此举涉及整体架构重构与系统稳定性强化,开发难度较高。辉达执行长黄仁勋则指出,若完成适配,将削弱美国在AI生态的优势,对美国是「可怕的结果」。市场传出,DeepSeek V4最快可能于4月下旬发布。
