好莱坞导演AI作品引发“恐怖谷”争议
曾执导《黑天鹅》《鲸鱼》《母亲!》和《π》等影片的奥斯卡提名导演达伦·阿伦诺夫斯基,近期推出了人工智能生成系列《On This Day ... 1776》,以纪念美国独立战争250周年。该系列使用真实人声配音,并基于谷歌的生成式视频模型制作,在网络上获得数百万次观看。
不过,多地电视与电影评论者普遍将这一系列形容为“恐怖”,主要批评集中在人物面部僵硬、画面变形不自然等问题,被认为典型呈现了“恐怖谷效应”——即画面虽接近真实人类,但细微异常引发本能排斥感。
中国新模型被指显著缩小“恐怖谷”
与上述作品形成对比的是,本月在中国发布测试的两款新一代视频生成模型——字节跳动的 Seedance 2.0 和快手科技的 Kling 3.0,被多方认为在逼真度和连贯性方面取得明显进展。
有观点认为,这两款模型生成的内容在时间和主题上更具连贯性,整体观感更接近传统电影画面,被视为在“恐怖谷”问题上实现了阶段性突破。有评论将当前对部分AI视频的批评,与2000年代对CGI、1990年代对Photoshop的质疑相提并论,认为类似争议可能会逐步淡化。
Seedance 2.0:被称为“导演工具”的多模态系统
Seedance 2.0 由抖音母公司字节跳动开发,于2月9日开启测试,目前仅在中国境内开放使用。多家机构和从业者将其称为首个具备“导演级控制”的视频生成工具。
与以往主要依赖文本提示、结果较为随机的模型不同,Seedance 2.0 采用多模态输入方案。字节跳动对模型结构进行了调整,使其可同时接收图像、视频、音频和文本作为输入。创作者最多可上传12个参考文件,包括角色设定、特定机位运动示例以及音轨等,模型据此生成更符合电影叙事逻辑的场景。
一名来自广东的程序员王磊在测试中让 Seedance 2.0 生成了一段10秒的人类历史视频。他表示,从现实增强效果来看,“很难判断视频是否由人工智能生成”,并形容输出“叙事流畅,具有电影般的宏大感”。
有分析认为,Seedance 2.0 的表现与其训练数据密切相关。字节跳动利用抖音平台的大规模视频数据训练模型,使其在日常生活场景和更具“好莱坞风格”的镜头上,都能更好捕捉人物细节与人类行为特征。
Kling 3.0:强调物理一致性的“动作引擎”
如果说 Seedance 2.0 更偏向“导演工具”,快手科技于2月5日推出的 Kling 3.0 则被部分业内人士称为“动作引擎”,强调对物理规律和光线效果的模拟能力。
在其他模型仍可能出现车辆漂浮、人物穿墙等违背基本物理常识的情况下,Kling 3.0 被认为在重力、光影等方面表现更为自然。前谷歌产品经理、人工智能策略师比拉瓦尔·西杜在 LinkedIn 上表示,物理模拟的进步“终于让你可以艺术化地指导动作,而不是仅仅寄希望于它出现”。
这一特性被视为有利于商业内容制作,尤其是在产品展示等场景中,有助于确保生成画面中的物体外观和行为更接近真实。Reddit 上的部分用户对 Kling 3.0 在长镜头和多镜头生成方面的能力表示惊讶。
Kling 3.0 的一项关键功能是“元素”(Element),允许用户上传参考视频以锁定角色一致性。此前,生成式视频模型常出现角色面孔在不同镜头间随机变化的情况,阿伦诺夫斯基的系列作品中也被指出存在类似问题。借助“元素”功能,Kling 3.0 在不同镜头中可保持角色形象高度一致,被一些电影从业者视为接近传统制作流程中对演员连贯呈现的要求。
有观点认为,Kling 3.0 不仅在像素层面生成画面,还在一定程度上体现出对叙事节奏、剪辑逻辑和镜头连贯性的建模能力。
机构预期与资本市场反应
在应用前景方面,中国投资机构开元证券认为,新一代视频生成模型有望“首先在人工智能漫画和短剧领域得到广泛应用,降低成本,提高效率,惠及拥有大量知识产权或流量的企业”。
相关预期在资本市场上迅速反映。上述模型发布后,中国科技与数字内容板块出现明显波动。市场预期将使用相关技术的数字内容公司 COL 集团股价大幅上涨,影视公司华策影视和游戏开发商完美世界股价分别上涨约7%和10%。部分投资者押注,这类工具可能对游戏、电影和出版等传统制作流程产生替代效应。

一线创作者:工具正成为“新标准”但仍存“人工痕迹”
在一线创作层面,一些专业人士已将生成式视频工具视为工作流程的一部分。获奖导演兼创意制片人朱利安·穆勒表示,从今年超级碗广告中可以看到,许多作品已融入人工智能元素以实现特定创意效果。他认为,行业正处于在更紧张周期和更低制作投入下完成项目的转折期。
穆勒指出,Seedance 2.0 和 Kling 3.0“显然能产生惊艳的视觉效果”,但在他看来仍未完全达到真实拍摄的水准,“非常接近于真实制作画面,但我认为仍能察觉出人工痕迹”。
在使用态度上,他认为行业已出现明显转变。“不使用人工智能工具提升项目的导演和制片人将很快成为例外而非常态。这就是未来,我们绝不会回头。”
拥有17年好莱坞从业经验、在 YouTube 频道 Theoretically Media 分析行业动态的蒂姆·西蒙斯也持类似判断。他表示,大型制片厂由于内部架构和后期制作规范较为僵化,在采用新工具方面动作相对缓慢,而独立创作者和好莱坞体系外的国际制作公司则更快尝试。
西蒙斯称,大型制片厂需要为人工智能工具搭建定制化工作流程,而模型迭代速度又非常快,“基本上,当制片厂搭建好桥梁时,河流已经向北移动了150英里”。他预计,撇开工会和人才相关问题不谈,到2026年,大型制片厂可能会出现一些试探性应用,而独立制片厂和国际制作公司对这类工具的利用率将更快上升。
业内分歧:技术进步与“人类创作价值”之争
尽管技术在逼真度上不断提升,部分创作者对其对艺术创作的影响仍持保留甚至反对态度。以超现实、手工特效见长的视觉特效艺术家兼导演彼得·奎因表示,当下人们“从未像今天这样既惊叹又感到悲伤”,在他看来,宏大而精致的“艺术”在易于生成后变得“乏味”。
奎因认为,人们欣赏艺术不仅在于最终图像本身,还在于背后的人类努力——例如画家调色、定格动画师逐帧移动木偶等。他将 Kling 3.0 和 Seedance 2.0 形容为“2026年最新的闪亮人工智能玩具”,可以在数据中心中生成“无灵魂的奇迹”,并指出,一旦观众知道作品由人工智能生成,“那种‘哇’的感觉就消失了”。
目前,奎因正在制作一部名为《创作者》的反人工智能主题电视纪录剧集,邀请数十位“真实”艺术家参与,通过强调创作过程、时间和投入来呈现人类创造力。他介绍,节目中将展示画家连续数日调色作画、定格动画师数周工作的加速画面、舞者排练中的失误、拼贴艺术家手工剪裁数百个碎片、擅长逼真铅笔素描的画家、熟悉泥土细节的雕塑家以及善于捕捉他人忽略画面的摄影师等。他认为,时间和精力的投入本身构成了作品的价值,也是其值得被观看或收藏的原因。
部分知名导演也公开表达了对人工智能艺术的质疑。吉尔莫·德尔·托罗曾称人工智能艺术是“对生命本身的侮辱”,《绝命毒师》和《风骚律师》创作者文斯·吉利根则表示不会使用剥夺人类元素的工具。在作品《Pluribus》的片尾字幕中,制作方特别标注该片“由人类自豪地制作”。
有观点认为,未来电视和电影内容可能出现一定分化:一部分是完全由人类创作、面向画廊和艺术纯粹主义者的作品;另一部分则是面向大众的算法生成内容。这一趋势被拿来与克里斯托弗·诺兰、昆汀·塔伦蒂诺等坚持胶片拍摄、拒绝数字摄像机的导演立场进行类比。
历史类比与“新媒体”讨论
在围绕人工智能视频工具的争论中,也有声音尝试从历史角度进行类比。有观点指出,当前的技术变革在某种程度上类似19世纪末绘画领域的变化。在工业革命带来可折叠油画管和工厂预拉伸画布之前,油画创作成本高昂,主要局限于拥有赞助人的少数画家。工业化生产的颜料和画布降低了门槛,使莫奈、雷诺阿等画家得以走出画室,在户外捕捉光线,推动印象派兴起。
在这一视角下,Seedance 2.0 和 Kling 3.0 被部分人士视为电影和电视领域的“油画管”——在模拟与视频技术已显著降低成本的基础上,进一步扩大了可参与影像创作的人群。一些观点认为,这类模型以及谷歌等公司未来可能推出的产品,将为“真正由人工智能生成的故事”打开大门,其呈现效果在观感上可能与传统作品难以区分。
西蒙斯则提出,“一种‘新媒体’正在到来,它不仅仅是‘电影更便宜’”。在他看来,这类内容将以互动、生成和个性化等方式呈现,而当前行业对其理解仍非常有限。他将当下的讨论比作1990年代人们面对互联网时提出的疑问——“这会如何改变传真机?”——而实际答案并非“更好的传真机”。
在门槛方面,有观点认为,Seedance 和 Kling 等工具将视频创作的技术门槛大幅降低,潜在地让大量从未接触过摄像机的人也能讲述自己的故事。随着“恐怖谷”问题在技术层面逐步缓解,传统意义上的内容“守门人”角色可能被削弱。未来这类工具将如何被使用、会催生何种新形态内容,仍有待观察。
