华为人工智慧研究部门驳斥网上有关其盘古大语言模型抄袭阿里巴巴模型的指控,称其为自主研发并独立训练的模型。
据快科技和澎湃新闻报导,开源平台GitHub一项研究称,华为盘古大模型与阿里通义千问Qwen-2.5 14B模型在注意力参数分布上有相关性,超正常范围。
这项研究称,这种相似性表明华为的模型可能是「再加工」(upcycling)而来,而非从头训练而成。该指控在人工智能圈子和中文科技媒体中引发广泛讨论。
针对质疑,华为诺亚方舟实验室5日发布声明称,盘古Pro MoE开源模型是基于升腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。
盘古团队在声明中称,盘古Pro MoE开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。盘古团队严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。
路透报导,华为早在2021年就推出初代盘古模型,较早进入大模型领域,但其后一直被外界视为在这一赛道上落后于竞争对手。今年6月底,华为将「盘古Pro Moe」模型开源,发布在中国开发者平台GitCode上,意在通过免费开放加快AI技术的推广与应用。
相较而言,阿里的「通义千问」更偏向面向消费者市场,具有类似ChatGPT的聊天功能,华为的盘古系列则更多应用于政务、金融、制造等行业场景。 $(document).ready(function () {nstockStoryStockInfo();});