星期二, 29 7 月

AI 模型抄襲阿里通義千問?華為盤古團隊否認

華為人工智慧研究部門駁斥網上有關其盤古大語言模型抄襲阿里巴巴模型的指控,稱其為自主研發並獨立訓練的模型。

據快科技和澎湃新聞報導,開源平台GitHub一項研究稱,華為盤古大模型與阿里通義千問Qwen-2.5 14B模型在注意力參數分布上有相關性,超正常範圍。

這項研究稱,這種相似性表明華為的模型可能是「再加工」(upcycling)而來,而非從頭訓練而成。該指控在人工智慧圈子和中文科技媒體中引發廣泛討論。

針對質疑,華為諾亞方舟實驗室5日發布聲明稱,盤古Pro MoE開源模型是基於升騰硬體平台開發、訓練的基礎大模型,並非基於其他廠商模型增量訓練而來。

盤古團隊在聲明中稱,盤古Pro MoE開源模型部分基礎組件的代碼實現參考了業界開源實踐,涉及其他開源大模型的部分開源代碼。盤古團隊嚴格遵循開源許可證的要求,在開源代碼文件中清晰標註開源代碼的版權聲明。

路透報導,華為早在2021年就推出初代盤古模型,較早進入大模型領域,但其後一直被外界視為在這一賽道上落後於競爭對手。今年6月底,華為將「盤古Pro Moe」模型開源,發布在中國開發者平台GitCode上,意在通過免費開放加快AI技術的推廣與應用。

相較而言,阿里的「通義千問」更偏向面向消費者市場,具有類似ChatGPT的聊天功能,華為的盤古系列則更多應用於政務、金融、製造等行業場景。 $(document).ready(function () {nstockStoryStockInfo();});