豆包视频模型可生成30秒视频,企业内测已启动
字节跳动旗下豆包视频生成模型Seedance2.5在2026火山引擎FORCE大会上正式亮相,并启动全球企业内测,预计7月初正式发布。Seedance2.5突破行业瓶颈,单条视频最长可达30秒,大幅提升镜头连贯性,为长叙事短片制作提供可能。该模型支持高达50个多模态素材的联合输入,简化创作流程,并具备“局部重绘”功能,可在保持画面整体不变
30秒视频生成全球第一
在刚刚结束的火山引擎FORCE原动力大会上, 于2026年6月24日, 字节跳动正式发布了豆包视频生成模型.5, 并且同步启动了全球企业内测。官方透露, 该模型预计在7月初面向市场全面开放。其中最受关注的, 是视频生成长度突破到了30秒, 这一数据现在处于全球首位。和当前主流的15至20秒生成上限相比较, .5的升级意味着创作者能够实现更完整、更连贯的长叙事表达。
多模态素材联合输入能力
在创作灵活性这块儿, 豆包.5引入了全新的多模态素材处理机制, 此模型支持高达50个全模态素材的联合输入, 涵盖图像、文字、音频等多种格式。这表明用户能把多位演员、多个场景的素材一次性导入系统, 让模型自动进行编排与调度。这一功能极大地简化了从原始素材到成片的工作流程, 特别适用于需要大量角色和场景切换的短视频制作。

局部重绘功能解决电商痛点
豆包.5还推出了一项名为“局部重绘”的功能, 此功能允许创作者, 在保持整体画面不出现变化的前提条件下, 针对特定区域展开微调。比如说, 电商广告里经常会出现的那些情况, 像更换商品、替换模特或者调整背景等事例, 借由局部重绘都能够快速达成。在大会现场所做的演示过程当中, 这个功能顺利解决掉了以往那种需要重新进行拍摄或者经历复杂后期处理的难题。对于电商行业来讲, 由于其存在需要频繁迭代视觉素材的情况, 所以这一功能展现特性具备显著的实际应用价值。
图像与音频模型同步升级
不仅是视频模型, 火山引擎还一并展示出图像创作模型.0Pro以及音频生成模型Seed-.0。图像模型于交互式精准编辑、分层设计与原生文字生成这些方面表现优异, 能够直接产出可进行编辑的设计草图。音频模型具备零样本多模态参考能力, 能够同时生成多角色的生动对白、背景音乐还有拟音效果。三者的协同配合, 进一步让豆包系列模型的应用场景变得丰富起来。
多模态协同巩固技术优势
围绕视频、图像以及音频领域展开全面布局, 豆包系列模型借助多模态的深度协同, 将其在生成式AI赛道上所占据的技术优势予以更稳固的强化。字节跳动方面表明, 这些工具会于7月初正式推出上线, 到那时创作者能够以一站式全做完图像再到视频最后至音频的整个流程中的创作情形。这样的集成化作能力架势, 有着极大提高视频创作行业的工业化生产效率的可能性了。
视频创作行业迎来提速
随着豆包.5等模型正式发布, 视频创作行业工业化生产效率, 或是要迎来新一轮提速了。业内人士分析指出, 30秒长视频生成能力, 配合多模态素材处理,以及局部重绘功能, 会大幅降低专业视频制作门槛。不管是广告公司, 还是影视工作室, 亦或是个人创作者, 都要从中受益。火山引擎此次产品布局, 正试图凭借技术手段, 解决实际生产中的核心痛点。
假设你身为视频创作者, 最会选用豆包.5的哪一项功能去提高你的工作效率呢? 欢迎于评论区把你的看法分享出来, 进行点赞以及转发从而让更多人知晓这一技术突破!
登录后参与评论
评论仅开放给已登录并完成邮箱绑定的用户。
0
暂无评论。