應對Sora 2,谷歌發布新AI視頻模型Veo 3.1
美國當地時間周三,谷歌正式推出新一代AI視頻生成模型Veo
3.1,通過一系列創意與技術升級,顯著提升了AI視頻的敘事控制能力、音頻融合度與畫面真實感。
此次更新不僅為使用谷歌AI創作應用Flow的愛好者和創作者拓展了可能性,更為企業用戶、開發團隊和創意機構帶來了可擴展、可定製的視頻解決方案。
新模型在畫質、物理模擬效果上均有明顯提升,同時保持了與前代一致的定價體系。控制與編輯功能更加豐富多樣,操作體驗更為流暢。
與OpenAI上月發布的Sora 2相比,Veo
3.1的畫面風格更偏向電影質感,視覺效果更加精緻,但同時也稍顯「人工化」。這種差異各具特色:Sora
2擅長營造手持拍攝的\"自然抓拍\"風格,而Veo 3.1則更適合追求精雕細琢的視覺呈現效果。
敘事與音頻控制能力升級
Veo
3.1在前代基礎上,增強了對對話、環境音效及其他音頻元素的處理能力。值得關注的是,原生音頻生成現已全面集成到Flow平台的三大核心功能中:
●「幀轉視頻」:將靜態圖像轉化為動態場景
●「素材轉視頻」:整合多張圖像中的元素,創作複合視頻
●「延伸視頻」:基於已有片段持續生成,將初始視頻延伸至30秒甚至1分鐘以上
這些功能此前需要用戶手動添加音頻,現在則實現了音畫同步生成。這不僅讓用戶能更好地掌控作品的情感基調和敘事節奏,也省去了後期製作的繁瑣步驟。
對企業用戶而言,這種集成化的音視頻處理方式,使得製作培訓材料、營銷視頻等專業內容更加高效,顯著降低了製作門檻。
多模態輸入架構支撐精細編輯
Veo 3.1支持文本、圖像、視頻片段等多種輸入形式,並在輸出控制上更加精細。新引入的功能包括:
●最多支持3張參考圖像,精準把控輸出內容的視覺風格
●首尾幀插值技術,實現不同場景間的自然無縫過渡
●場景延伸功能,突破單次生成時長限制,智能延續原有視頻的動作與運鏡邏輯
這些工具讓企業用戶能夠精細調整內容的外觀...