北京時間8月5日,在華為舉辦的昇騰計算產業發展峰會上,華為輪值董事長徐直軍宣布,華為昇騰硬體使能CANN全面開源開放,Mind系列應用使能套件及工具鏈全面開源,支持用戶自主的深度挖潛和自定義開發。
CANN的全稱是「神經網路異構計算架構」(Compute Architecture for Neural Networks),它的角色,是把上層AI訓練框架(如PyTorch、TensorFlow、MindSpore等)和底層昇騰晶元連接起來的橋樑,讓開發者不用關心晶元細節就能調用底層算力。
幾乎每一家算力卡公司都有類似的架構。最知名的是英偉達的CUDA和AMD的ROCm,在國內市場,有摩爾線程的MUSA、壁仞科技的BIRENSUPA、寒武紀的Neuware和海光信息的DTK等等。
英偉達CUDA與GPU和NVlink構成英偉達的核心護城河,如今英偉達的計算卡之所以在全球熱銷,與CUDA軟體系統生態的完善有著直接的關係。一旦用戶想要從英偉達的計算卡體系遷移到其他品牌的體系中來,面臨的問題是開發者必須重寫大量代碼,使用生態相對不成熟的替代庫,同時也會失去英偉達圍繞CUDA建立起來的龐大技術社區的支持。
華為在7月底的WAIC上展示了昇騰384超節點真機,這座由12個計算櫃+4個匯流排櫃構成的龐然大物,它擁有300 Pflops的算力,269TB/s的網路帶寬,1229TB/s的內存帶寬。
而隨著今天華為正式宣布開源CANN架構,意味著未來所有的開發者可以更好的利用昇騰計算卡配合、CANN建立的計算生態和華為自研深度學習框架MindSpore,建立華為昇騰的AI軟硬體一體化方案,以對標以英偉達為中心的PyTorch+CUDA。
根據華為公開資料顯示,CANN目前升級到8.0版本,新增200多個深度優化的基礎運算元、80多個融合運算元、100多個Ascend C API,典型運算元開發周期從2人月縮短至1.5人周,同時,支持圖模式能力擴展庫,提升PyTorch在昇騰上的大模型推理性能。
截至目前,CANN已支持包括PyTorch、MindSpore、TensorFlow、飛槳、ONNX、計圖、OpenCV和OpenMMLab等深度學習框架與第三方庫。
相比英偉達CUDA的閉源,此次CANN開源,華為無疑希望儘快通過開發者的合力共創,快速擴大CANN生態圈,讓昇騰的計算卡不但在硬體上有計算能力,也要在軟體上快速的彌補短板,真正意義上趕超英偉達。