跳到主要内容

字节跳动 FORCE 原动力大会推出多款重磅 AI 产品,亮点突出

30 0
AI摘要

字节跳动火山引擎 FORCE 大会发布 Seedance2.5、豆包 Seed2.1 等AI产品。Seedance2.5突破性支持单次生成30秒视频,支持3D白模和更精细编辑,提升长视频制作效率;豆包 Seed2.1能力达Opus4.6,推出专业版和办公产品。这些发布强化了字节在多模态AI领域的竞争力,推动视频生产效率跃升。

火山引擎大会现场直击:字节多模态AI全线升级

6月23日, 在北京国家会议中心, 字节跳动旗下的火山引擎FORCE原动力大会召开了, 大会现场, 人很多, 影视、广告、教育等行业的从业者和开发者, 齐聚在了一起, 共同见到了字节AI大模型的集中发布, 本次大会最为被关注的, 是视频生成模型.5, 它一次性能够直接出来30秒完整视频的能力, 成为了全场的焦点。

字节跳动 FORCE 原动力大会推出多款重磅 AI 产品,亮点突出

经过大会主办方的透露, 此次发布会总共推出了三款中心产品, 它们分别覆盖了视频生成、通用大模型以及图像生成这三大领域。字节跳动副总裁杨震原于主题演讲里讲道, 这些产品目的在于降低内容创作的门槛, 可以推动AI技术从实验室迈进工业级应用。

.5视频模型:30秒直出颠覆长视频制作

.5的核心升级之处在于, 单次生成能力, 从之前的短时长, 提升到了一次性直接输出30秒完整视频。这一技术上的突破, 在大会现场的演示环节, 引发了阵阵掌声。演示画面展示出, AI能够在30之中, 生成一段涵盖多场景、多角色的连贯性视频。

新版本同样支持3D白模输入, 这让用户能够先去构建三维场景框架, 之后再生成视频 , 与此同时, 参考素材容量有显著的大幅提升, 用户能够上传更多的图片, 还有视频片段用作参考, 并且AI可以保持品牌视觉的一致性 , 字节方面宣称, 该模型已经在广告制作、漫剧生成等领域完成了内测, 预计在9月开放API接口。

豆包2.1Pro:长视频理解能力逼近行业标杆

在同步发布的豆包Seed2.0系列那里, Pro版本变成了被聚焦的点。按照现场测试得出的数据, 这个模型于多项基准测试里的得分快要接近Opus那4.6的水平了, 已然拥有了能够完全进行生产部署的条件。字节跳动又推出了豆包专业版本加上豆包办公方面的产品呢, 着重去强化端到端任务处理的能力。

豆包2.1Pro具备着能够观看时长达到2小时视频的能力, 并且还能够开展端到端视频剪辑, 这所表达的意思就是, 用户只要上传较长的视频素材, 再输入剪辑所需下达的指令, AI 便能够自动去完成素材挑选、镜头拼接以及特效添加这些操作。字节AI产品总监李飞作出介绍, 表明该功能已经于部分企业客户那里进行试用情况了, 剪辑时效提高了大概能有5倍。

.0图像模型:多模态协同构建创作闭环

全新的图像模型.0于大会亮相, 此模型与.5以及豆包系列达成多模态协同, 用户能够在.0里生成高质量图像, 接着直接导入.5开展视频化处理, 达成从图像至视频的一站式创作闭环。

依照现场技术文档所展示的情况来看, .0于图像分辨率、色彩还原以及细节刻画这些方面相对前代而言有着相当显著的提升迹象。它具备有助于多种风格迁移以及局部修改的功能特性, 适用于电商产品图、广告海报等诸多商业场景类别。字节方面宣称, .0会以API的形式朝着外部提供相关服务, 其价格相较于竞品而言低了大约30%。

行业影响:国内AI视频赛道迎来强心剂

诸多参与会议的分析师表明, 那具有.5的30秒直接输出能力对中国国内人工智能视频跑道致使强大往前推进。当下中国国内主要的视频模型大多停留在5至15秒片段生成方面, 而对于有着30秒时间长度的连续视频来讲, 在叙事连贯程度以及场景丰富程度上拥有显著的优势。

在全球范围之内, OpenAI的Sora以及谷歌的VideoPoet还没有进行商用开放, 字节在此次发布当中充实了市场空白。按照IDC分析师所做的测算, AI视频生成市场在2026年的时候规模具有突破50亿元的可能情况, 字节依靠.5有希望占据30%以上的份额。然而, 有业内的相关人士也表明了, 模型的实际呈现效果以及稳定性仍然需要通过大规模去进行验证。

未来展望:商业化落地与开放进程加速

字节跳动宣告, .5、豆包2.1Pro以及.0等, 自7月起会逐步朝着企业客户去开放内测, 预估9月会全面开放API。到那时候, 影视工作室、广告公司、自媒体创作者能够申请接入。字节另外还打算推出开发者生态计划, 给予算, 力补贴以及技术支撑。

在普通用户这里, 豆包办公产品会率先把这些能力予以集成, 去支持视频剪辑、文档生成等功能。于大会现场之上, 多位客户代表表明期待模型能够尽快上线, 然而也对定价策略以及生成内容版权等细节予以关注。字节方面做出承诺会在合规的前提条件下供给公平透明的服务。

是更期待借助AI去生成时长为30秒的完整视频呢 , 还是期望率先解决那AI视频里人物表情显得生硬僵化的问题呢? 欢迎来到评论区留言 , 去分享你的看法 , 点赞并关注本账号哟 , 以此获取更多关于AI行业前沿动态的信息!

登录后参与评论

评论仅开放给已登录并完成邮箱绑定的用户。

评论 0

暂无评论。