跳到主要内容

火山引擎发布豆包视频模型Seedance2.5,30秒直出视频,企业级AI落地

21 0
AI摘要

火山引擎在2026年夏季FORCE大会上发布全新多模态与Agent技术。重点推出Seedance2.5视频生成模型,支持30秒视频直出、多模态素材联合生成及局部编辑,已应用于具身智能等领域。同时,发布Seedream5.0Pro图像模型和Seed-Audio1.0音频模型,巩固多模态优势。为Agent应用,升级AI云原生架构,推出方舟CLI、AgentKit、Hi

豆包视频模型.5三大突破重塑视频生成

在2026年6月23日, 火山引擎于夏季FORCE原动力大会上, 正式让豆包视频生成模型.5亮相, 宣称会在7月上线。该模型头一回达成30秒单段原生视频直接输出, 用不着进行拼接或者分段处理, 这样的突破极大地提高了视频创作效率。依据火山引擎官方所透露的情况, 这项能力是基于全新的端到端生成架构, 能够直接在单次推理当中产生完整的长视频内容。

豆包视频生成模型.5, 还具备支持多达50个全模态素材联合生成的能力, 能够同时处理图像、音频文字等不同类型的输入素材, 这表明用户只要提供50个以内的多模态素材, 模型便可自动整合并生成统一的视频输出, 另外, 该模型首次推出保持画面一致性的局部编辑功能, 准许用户对生成视频里的特定区域予以修改, 却不会影响整体风格。

产业落地拓展实体制造新场景

火山引擎总裁谭待于会上着重指出, 视频生成乃是通向世界模型的关键途径。当下, 豆包视频生成模型.5已在具身智能、工业制造、智能驾驶等实体产业实现落地。比如, 在工业制造范畴之中, 该模型运用于场景仿真以及数据合成, 为工厂自动化测试供给高保真模拟环境。

针对智能驾驶领域, 豆包视频生成模型.5助力车企产出多种路况下的驾驶场景数据, 以此可供训练以及验证自动驾驶系统, 对此, 谭待表明, 这些应用意味着视频生成模型从娱乐内容制造转向工业层级工具, 给予实体产业带来具备可量化特点的效率提高, 以火山引擎内部计数, 已有 20 多家制造与汽车企业相继开启合作试点。

火山引擎发布豆包视频模型Seedance2.5,30秒直出视频,企业级AI落地

图像与音频模型同步升级

火山引擎除推出视频模型外, 还呈现了豆包图像创作模型.0Pro, 此模型拥有交互式精准编辑功能, 用户借助点击亦或拖拽方法能够径直改动图像里的物体、颜色以及布局。与此同时,该模型支持生成可编辑的分层设计图, 所输出的文件含有独立图层, 这方便设计师于专业 software 里开展二次调整。

在音频范畴之中, 火山引擎推出了豆包音频生成模型Seed-.0, 此模型具备支持多角色对白以及拟音特效的0样本生成能力。这所表达的意思是, 用户并不需要去提供任何的训练样本, 仅仅依靠文字描述, 便能够使模型自动生成完整的音频片段, 这个片段中涵盖了不同角色的对话以及背景音效。这些模型已然被集成到了火山引擎的方舟平台, 以供企业用户借助API前来进行调用。

面向Agent应用发布AI云原生架构

在此次大会上, 火山引擎针对日益普及的Agent应用, 全面升级了AI云原生架构。新推出的方舟CLI命令行工具具备让开发者于终端中直接调用大模型服务的能力, 还支持批量任务管理以及自动化部署。于此同时, 火山引擎发布了与.0版本, 实现了对多模态Agent推理效率的更进一步优化。

在本次大会里, 企业级Agent工作台成为了另一重点被发布的内容 , 该工作台能提供可视化的Agent构建以及编排界面 , 这样一来企业用户不用编写复杂代码 , 就能够创建并且部署智能客服 、数据分析助手等应用。火山引擎也推出了AI Trust产品体系 ,其涵盖模型安全评估 、数据隐私保护以及输出合规审核 , 从基础设施和安全方面双向为企业级落地来赋能。

用户规模与Token调用量翻倍增长

火山引擎于会上披露了关键经营数据, 截至2026年6月, 使用火山方舟大模型服务的企业以及个人已超过1️⃣1️⃣0️⃣万, 相较于半年之前增长了4️⃣0️⃣%。其中, 年Token调用量突破万亿的企业已然达到2️⃣0️⃣0️⃣家, 此一数字在半年时间内达成了翻倍。这些数据显示出大模型服务正从尝鲜阶段朝着规模化应用转变。

从产业分布方面来看, 互联网企业依旧是最大的用户群体, 其占比大约为35%, 然而制造、金融以及汽车等支柱产业增长速度十分迅速。火山引擎副总裁李明进行介绍时表明, 制造业客户Token调用量在半年的时间里增长幅度超过150%, 用处主要聚焦于产品设计、工艺仿真以及质量检测等环节。金融行业客户更加注重风险控制和智能投顾场景。

大模型加速迈向工业级深水区

在本次大会上, 火山引擎密集发布的模型产品以及产业落地数据, 映现出那正从实验室迈向生产线的大模型技术。豆包视频生成模型.5有着三大核心能力突破, 这为视频生成于工业场景的应用清除了关键阻碍。30秒直接输出视频, 还有50素材合力生成, 大幅削减了长视频制作的时间与成本。

火山引擎确切地把视频生成定位成通向世界模型的关键途径, 这一战略方面的判断跟当下具身智能以及自动驾驶的发展趋向高度相符, 随着模型于仿真跟数据合成领域的价值被证实, 大模型在实体产业的渗透比率有希望进一步提高, 火山引擎宣称, 会持续降低模型运用门槛, 促使更多传统企业接纳AI技术。

你认为视频生成模型在工业制造和智能驾驶之外,还能在哪些实体场景中率先落地?欢迎点赞、分享并在评论区留下你的看法。

登录后参与评论

评论仅开放给已登录并完成邮箱绑定的用户。

评论 0

暂无评论。