当前位置：首页 > news >正文

AI视频赛道竞争激烈，Seedance 2.0迈向生产级，行业痛点待解资本动作不断

news 2026/6/13 12:48:23

刷分失效

从厂商层面看，竞争梯队快速拉长。互联网大厂中，字节有Seedance（即梦），快手有可灵，阿里有happyhorse。长视频平台爱奇艺推出面向短剧专业制作的全流程AI创作平台“纳豆”。大厂之外，垂直玩家也密集涌入，生数科技的Vidu、爱诗科技的PixVerse（拍我AI）、MiniMax的海螺、群核科技的LuxReal、商汤的Seko等围绕赛道展开卡位。当AI视频从模型演示走向真实生产线，外界对模型能力的判断标准发生变化。过去一年，围绕AI视频模型的榜单增多，放大了行业热度，也让外界看到不同模型的能力差异。但视频生成进入真实生产流程后，模型要面对的不再只是“能否生成好看样片”，而是能否稳定生成具有画面质感、动作流畅、人物主体一致性等的素材，这些能力很难被自动化榜单完整衡量。当前不少厂商内部开始弱化机器自动评审视频效果，更侧重于人工评价和真实场景反馈。对于下游创作者来说，一个模型是否好用，不是看它在榜单上的排名，而是看能否在连续生产中减少返工、提升出片效率，并真正进入工业化流程。这正在复现大模型Agent赛道中“刷分失效”的情况。从这个角度看，Seedance 2.0受到关注是因为它已开始被嵌入真实生产流。

从可用走向生产

据全天候科技走访多家下游应用方，Seedance 2.0带来的体感变化更直接。AI短剧制作公司可梦智能（北京）科技有限公司的内容负责人刘城表示，Seedance 2.0在对视频内容的理解、对物理世界规律的把握以及表演的自然度上都有大幅度提升。以视频内容理解为例，Seedance 2.0对抽象语义的理解有较大进步，虽然生成结果仍有不确定性，但已经不错。比如提示词是“让这两个人在场景中产生暧昧的互动”，AI会分析并生成带有暧昧的光影效果和色调，人物镜头运动可能更缓慢，会根据需求自动补充元素。原来武打动作、复杂多人交互场景中常出现的穿帮、穿模、人脸模型错位等问题，经过Seedance 2.0后基本得到解决。刘城直言，有些视频根本看不出来是AI还是真人。重庆一位短剧从业者也有相似观点，称Seedance 2.0出来后，人物、口型和声音的一致性更好，画面油画感减弱，分镜设计更聪明。西安一位AI短剧行业人士透露，在Seedance 2.0加持下，通过优化提示词，一到两次就能生成一段10秒钟左右的视频，至多三次便能实现满意效果。如果熟练操作，一部50集的真人AI短剧两周左右就能完成。正在创业、专注AI短剧工具的开发者星熹（化名）认为，字节跳动接入Seedance 2.0模型的即梦，功能易用性比其他厂商完善。星熹反馈，即梦视频生成的全能参考模式能较好理解九宫格分镜图片，上传包含九个分镜头的关键帧图片后，可基于分镜图标注顺序自动推理生成视频，但现在其他工具也有了这个功能。至少在当前AI视频竞争中，Seedance 2.0率先把模型能力从“可用”推向“更接近生产级”，让后来者追赶压力加大。

痛点主要是什么

尽管Seedance 2.0优势明显，但AI视频行业仍存在共性问题。一是随着生成视频时长拉长，人物主体难以保持一致性，尤其是人物从正脸转到侧脸时，脸可能发生变化。目前包括Seedance 2.0等模型的厂商基本解法是控制单个视频生成时长，保持在5 - 15秒，这导致用户只能片段式生成视频，再通过后期剪辑拼接成完整内容。但片段式生成又带来新问题，每进入新镜头，创作者需重新将人物定妆照、服装、场景、道具等信息带入模型，以维持前后画面一致性。学界也在探讨解法，例如北京大学计算机硕士生袁盛海团队发表的《Identity - Preserving Text - to - Video Generation by Frequency Decomposition》，提出的技术框架ConsisID，通过将人脸特征分为高频和低频信号，让模型分别学习，降低学习难度。二是人物与背景的“图层割裂”。许多观众能直观感受到，AI生成视频中的人物常“漂浮”在背景之上，仿佛不在同一图层。星熹分析，画面ai味根源在于光影和层次处理，部分从业者对光的角度、阴影、焦点、景深处理不协调，导致画面缺乏层次，给人扁平感或割裂感。有AI视频研究人员认为，这本质上是模型端的多模态参考融合问题，人物参考图和场景图色调、光感不同，难以融合。三是长叙事下的镜头逻辑与情感张力。星熹认为，即便大厂自研剧本生成和剧本拆分工具，在剧本层面仍存在“平铺直叙”和“剧情生硬老套”问题，针对特定类型和风格的泛化能力不足，缺乏波澜和起伏，小情节无法引起情绪共鸣，缺乏小冲突和逻辑严谨性。刘城也认为，Seedance 2.0的升级降低了AI内容制作门槛，但AI内容会泛滥，参差不齐，好作品仍需内容力才能打动观众。

差异化补位

在此背景下，大厂之外的玩家在工作流、案例库等方面形成差异化优势。刘城透露，可梦在项目生成过程中采用AI辅助功能，团队开发了分镜提示词和草图功能，用户修改提示词后，AI可完成80%至90%的创作，灵活运用AI提示词的用户还可进一步微调提示词提升效率。群核科技把工作流优化做到3D层面，5月27日推出短剧版的LuxReal。基于自研空间大模型等3D技术，LuxReal能将2D画面场景生成为可漫游的虚拟3D空间，创作者可自由调整机位、设置人物站位，系统基于同一个3D场景自动渲染对应画面。不过实际生成质量仍待观察，例如LuxReal短剧工作流设置较完善，但主动思考的优化程度有待提升，存在人物衣着与时间背景不符合等问题。爱奇艺的纳豆接入自研和Seedance 2.0等外部模型，结合爱奇艺IP库、数字资产库和创作者社区，形成可调用的平台能力，为创作者一站式提供从内容生产到运营等全链路支持。IP库、数字资产库是爱奇艺的独特优势，创作者可在数字资产库中调用电视剧《成何体统》中的皇宫、《花戎》的魔界大全等多部电视剧中的场景、武器、动物等IP形象。但据全天候科技观察，爱奇艺虽拥有丰富IP库和数字资产库，但纳豆平台中呈现的数量仍相对有限。总体来看，大厂之外的玩家引入Seedance 2.0后，主要在工程化、知识沉淀、流程协同等维度构建差异化优势。

战火不休

现阶段，AI视频行业在长视频稳定性、人物一致性、可控性等方面存在诸多痛点，竞争格局远未收敛。在这样的背景下，资本化成为部分厂商加速发展的重要选择。今年5月，市场传出快手正在加速推进可灵的分拆上市，计划明年启动独立IPO，Pre - IPO轮估值预计达200亿美元，随后快手在港交所公告中确认，公司董事会正评估重组可灵相关资产及业务的方案。无独有偶，垂直玩家也在加快融资和上市准备。生数科技在两个月内连续完成两轮共计逾26亿元融资后，被传计划于2026年上半年启动港股IPO，其工商主体已于3月底完成股份制改造。密集的资本动作意味着这条赛道的竞争只会更加激烈。这些资本动作背后，折射出AI视频赛道的现实：模型竞争不仅是技术竞赛，也是资金、算力、数据和场景落地能力的综合竞争。同时，AI视频的商业化仍处于早期阶段，短剧、广告、电商、游戏、影视预演等场景虽已验证需求，但形成稳定、规模化、高毛利的收入模型仍需时间。因此，资本市场的资金支持成为不少厂商留在赛道的重要筹码。当前AI视频赛道的竞争并未因Seedance 2.0的阶段性领先而结束，随着更多厂商补充资金、加速产品迭代，行业可能会继续经历模型能力、生产工具和商业化效率的竞速。

查看全文

http://www.zskr.cn/news/1423946.html