影音串流巨头Netflix与索菲亚大学联手开发视觉语言模型「VOID」。这款AI影片编辑神器,不仅能一键抹除画面物件,更能自动运算并补齐符合物理逻辑的合理轨迹,可望颠覆全球影视特效后制流程。
传统AI影片修补工具常以背景像素直接填补空缺,一旦遇上物体与环境产生「物理互动」便破绽百出。而VOID最大的技术突破,在于它具备精准理解复杂动态物理因果关系的运算能力。
Netflix在论文展示两大场景:若要将「车祸爆炸大戏」改为「安全驾驶」,只需抹除对向来车,AI便会自动消除撞击产生的碎片、火光与烟雾,生成车辆平稳行驶在干净柏油路的画面;若移除跳入泳池的人,AI不仅让人消失,更会同步抹去激起的水花与涟漪,还原无人打扰的平静水面。这意味著剧组未来若拍错或修改剧本,无须再砸重金重新补拍。
研究团队测试发现,面对Runway、ProPainter与DiffuEraser等市面上知名工具,VOID在处理涉及复杂物理互动的抹除任务时效能全面碾压,且高达65%的受测者更偏好VOID生成的画面。
Netflix并未将这项强大的技术作为内部专用的资产,目前已经将VOID模型上架至知名的开源AI社群平台Hugging Face。