当前位置: 首页 > news >正文

AI视频赛道竞争激烈,Seedance 2.0迈向生产级,行业痛点待解资本动作不断

刷分失效

从厂商层面看,竞争梯队快速拉长。互联网大厂中,字节有Seedance(即梦),快手有可灵,阿里有happyhorse。长视频平台爱奇艺推出面向短剧专业制作的全流程AI创作平台“纳豆”。大厂之外,垂直玩家也密集涌入,生数科技的Vidu、爱诗科技的PixVerse(拍我AI)、MiniMax的海螺、群核科技的LuxReal、商汤的Seko等围绕赛道展开卡位。当AI视频从模型演示走向真实生产线,外界对模型能力的判断标准发生变化。过去一年,围绕AI视频模型的榜单增多,放大了行业热度,也让外界看到不同模型的能力差异。但视频生成进入真实生产流程后,模型要面对的不再只是“能否生成好看样片”,而是能否稳定生成具有画面质感、动作流畅、人物主体一致性等的素材,这些能力很难被自动化榜单完整衡量。当前不少厂商内部开始弱化机器自动评审视频效果,更侧重于人工评价和真实场景反馈。对于下游创作者来说,一个模型是否好用,不是看它在榜单上的排名,而是看能否在连续生产中减少返工、提升出片效率,并真正进入工业化流程。这正在复现大模型Agent赛道中“刷分失效”的情况。从这个角度看,Seedance 2.0受到关注是因为它已开始被嵌入真实生产流。

从可用走向生产

据全天候科技走访多家下游应用方,Seedance 2.0带来的体感变化更直接。AI短剧制作公司可梦智能(北京)科技有限公司的内容负责人刘城表示,Seedance 2.0在对视频内容的理解、对物理世界规律的把握以及表演的自然度上都有大幅度提升。以视频内容理解为例,Seedance 2.0对抽象语义的理解有较大进步,虽然生成结果仍有不确定性,但已经不错。比如提示词是“让这两个人在场景中产生暧昧的互动”,AI会分析并生成带有暧昧的光影效果和色调,人物镜头运动可能更缓慢,会根据需求自动补充元素。原来武打动作、复杂多人交互场景中常出现的穿帮、穿模、人脸模型错位等问题,经过Seedance 2.0后基本得到解决。刘城直言,有些视频根本看不出来是AI还是真人。重庆一位短剧从业者也有相似观点,称Seedance 2.0出来后,人物、口型和声音的一致性更好,画面油画感减弱,分镜设计更聪明。西安一位AI短剧行业人士透露,在Seedance 2.0加持下,通过优化提示词,一到两次就能生成一段10秒钟左右的视频,至多三次便能实现满意效果。如果熟练操作,一部50集的真人AI短剧两周左右就能完成。正在创业、专注AI短剧工具的开发者星熹(化名)认为,字节跳动接入Seedance 2.0模型的即梦,功能易用性比其他厂商完善。星熹反馈,即梦视频生成的全能参考模式能较好理解九宫格分镜图片,上传包含九个分镜头的关键帧图片后,可基于分镜图标注顺序自动推理生成视频,但现在其他工具也有了这个功能。至少在当前AI视频竞争中,Seedance 2.0率先把模型能力从“可用”推向“更接近生产级”,让后来者追赶压力加大。

痛点主要是什么

尽管Seedance 2.0优势明显,但AI视频行业仍存在共性问题。一是随着生成视频时长拉长,人物主体难以保持一致性,尤其是人物从正脸转到侧脸时,脸可能发生变化。目前包括Seedance 2.0等模型的厂商基本解法是控制单个视频生成时长,保持在5 - 15秒,这导致用户只能片段式生成视频,再通过后期剪辑拼接成完整内容。但片段式生成又带来新问题,每进入新镜头,创作者需重新将人物定妆照、服装、场景、道具等信息带入模型,以维持前后画面一致性。学界也在探讨解法,例如北京大学计算机硕士生袁盛海团队发表的《Identity - Preserving Text - to - Video Generation by Frequency Decomposition》,提出的技术框架ConsisID,通过将人脸特征分为高频和低频信号,让模型分别学习,降低学习难度。二是人物与背景的“图层割裂”。许多观众能直观感受到,AI生成视频中的人物常“漂浮”在背景之上,仿佛不在同一图层。星熹分析,画面ai味根源在于光影和层次处理,部分从业者对光的角度、阴影、焦点、景深处理不协调,导致画面缺乏层次,给人扁平感或割裂感。有AI视频研究人员认为,这本质上是模型端的多模态参考融合问题,人物参考图和场景图色调、光感不同,难以融合。三是长叙事下的镜头逻辑与情感张力。星熹认为,即便大厂自研剧本生成和剧本拆分工具,在剧本层面仍存在“平铺直叙”和“剧情生硬老套”问题,针对特定类型和风格的泛化能力不足,缺乏波澜和起伏,小情节无法引起情绪共鸣,缺乏小冲突和逻辑严谨性。刘城也认为,Seedance 2.0的升级降低了AI内容制作门槛,但AI内容会泛滥,参差不齐,好作品仍需内容力才能打动观众。

差异化补位

在此背景下,大厂之外的玩家在工作流、案例库等方面形成差异化优势。刘城透露,可梦在项目生成过程中采用AI辅助功能,团队开发了分镜提示词和草图功能,用户修改提示词后,AI可完成80%至90%的创作,灵活运用AI提示词的用户还可进一步微调提示词提升效率。群核科技把工作流优化做到3D层面,5月27日推出短剧版的LuxReal。基于自研空间大模型等3D技术,LuxReal能将2D画面场景生成为可漫游的虚拟3D空间,创作者可自由调整机位、设置人物站位,系统基于同一个3D场景自动渲染对应画面。不过实际生成质量仍待观察,例如LuxReal短剧工作流设置较完善,但主动思考的优化程度有待提升,存在人物衣着与时间背景不符合等问题。爱奇艺的纳豆接入自研和Seedance 2.0等外部模型,结合爱奇艺IP库、数字资产库和创作者社区,形成可调用的平台能力,为创作者一站式提供从内容生产到运营等全链路支持。IP库、数字资产库是爱奇艺的独特优势,创作者可在数字资产库中调用电视剧《成何体统》中的皇宫、《花戎》的魔界大全等多部电视剧中的场景、武器、动物等IP形象。但据全天候科技观察,爱奇艺虽拥有丰富IP库和数字资产库,但纳豆平台中呈现的数量仍相对有限。总体来看,大厂之外的玩家引入Seedance 2.0后,主要在工程化、知识沉淀、流程协同等维度构建差异化优势。

战火不休

现阶段,AI视频行业在长视频稳定性、人物一致性、可控性等方面存在诸多痛点,竞争格局远未收敛。在这样的背景下,资本化成为部分厂商加速发展的重要选择。今年5月,市场传出快手正在加速推进可灵的分拆上市,计划明年启动独立IPO,Pre - IPO轮估值预计达200亿美元,随后快手在港交所公告中确认,公司董事会正评估重组可灵相关资产及业务的方案。无独有偶,垂直玩家也在加快融资和上市准备。生数科技在两个月内连续完成两轮共计逾26亿元融资后,被传计划于2026年上半年启动港股IPO,其工商主体已于3月底完成股份制改造。密集的资本动作意味着这条赛道的竞争只会更加激烈。这些资本动作背后,折射出AI视频赛道的现实:模型竞争不仅是技术竞赛,也是资金、算力、数据和场景落地能力的综合竞争。同时,AI视频的商业化仍处于早期阶段,短剧、广告、电商、游戏、影视预演等场景虽已验证需求,但形成稳定、规模化、高毛利的收入模型仍需时间。因此,资本市场的资金支持成为不少厂商留在赛道的重要筹码。当前AI视频赛道的竞争并未因Seedance 2.0的阶段性领先而结束,随着更多厂商补充资金、加速产品迭代,行业可能会继续经历模型能力、生产工具和商业化效率的竞速。

http://www.zskr.cn/news/1423946.html

相关文章:

  • 别再死磕默认设置了!VirtualBox 6.1 给 Ubuntu 20.04 分配内存和硬盘的黄金法则
  • ESP32蓝牙音频开发实战:从A2DP应用到协议嗅探分析
  • Qt 6.2.4安装时,那个‘贡献匿名数据’的选项到底该不该勾?聊聊安装界面背后的细节与组件选择
  • 用STM32CubeMX HAL库驱动TB6612电机模块,从配置到代码的保姆级避坑指南
  • 2026甄选:乌鲁木齐马桶疏通/市政管道清淤/下水道改造服务公司专业评估 - 品牌企业推荐师(官方)
  • 性价比高的智慧校园哪个靠谱
  • StringIO和BytesIO
  • 终极SPT-AKI存档编辑器:快速定制你的塔科夫单机版游戏体验
  • 观察不同时段调用Taotoken旗舰模型的成功率与响应速度
  • AI自动化落地场景
  • 从“被审批”到“掌控一切”:我的OpenClaw驯化实录
  • 2026实力之选:辽宁压力容器、换热器、反应釜、标准件、波纹管、锆金属、镍金属、食品机械、镜面与拉丝抛光源头厂家指南 - 品牌企业推荐师(官方)
  • 华硕笔记本终极性能优化指南:G-Helper完整教程
  • G-Helper:华硕笔记本轻量化控制工具完全指南
  • 2026年咖博士与咖爷哪个好?从实际应用场景分析 - 品牌排行榜
  • 【英二】考研英语二历年真题试卷及答案解析PDF电子版(1980-2026年)
  • TA 系统选型避坑实录,千万级项目如何用 POC 验证巨额赎回场景
  • 基于Arduino与HT12协议实现433MHz射频信号克隆与模拟
  • vector的基本使用 + 手搓成员变量 size capacity begin end operator[] reserve扩容 拷贝构造 赋值析构
  • 2026年AI论文网站盘点:12款神器助你高效完成开题写作、改稿和答辩
  • 暗黑破坏神2终极优化指南:用d2dx让你的经典游戏焕然一新
  • 如何快速通过手机号找回遗忘的QQ号:终极完整指南
  • 激光武器反无人机作战效能评估综述
  • 100、CAN FD的软件栈与协议栈设计:驱动、配置与调试技巧
  • Raspberry Pi Pico WH MicroPython入门:从环境搭建到LED闪烁实战
  • DEAP脑电数据驱动的情绪识别实践包:微分熵三维特征+轻量CNN模型(含论文、代码与完整运行流程)
  • 百考通AI----多元分析,论文降重与降AIGC双重保障
  • GEO vs SEO:一场关于“被谁看见“的战争
  • 景区运营新利器——把一名员工升级为“一人部门”
  • 13604黄大年茶思屋榜文第136期:第四期 强干扰下,收发分离架构无源物联接收机的干扰抑制能力提升 标准化解题框架