跳到主要内容

巴西大模型被扒是套壳缝合:60%抄Nex,40%抄阿里

4 0
AI摘要

巴西里约热内卢市政府旗下IT公司推出的开源大模型Rio 3.5 397B,号称在多项基准测试中表现优异,引发广泛关注。然而,AI智能体开源项目联盟Nex-AGI发布声明,通过数学分析和对比,指出Rio 3.5实际上是一款套壳缝合模型,约60%的核心权重来自Nex团队此前开源的Nex N2 Pro,其余40%来自阿里的开源大模型Qwen

发布不足24小时遭反转

就在近日, 巴西里约热内卢市政府旗下的IT公司所推出的Rio 3.5 397B大模型, 在发布之后仅仅短短数小时的时间内, 就引发了全球AI圈的震动。可是, 这款号称在多项基准测试之中斩获SOTA的黑马, 很快就被AI开源联盟Nex-AGI揭露成为套壳缝合模型此事的戏剧性转折, 让业界重新去审视开源模型使用的道德边界。

根据Nex团队所发表的声明, 在他们针对Rio 3.5的权重展开深入的数学分析之后, 揭示出该模型之中大约60%的核心基因源自Nex N2 Pro, 剩余的40%出自阿里的Qwen 3.5。此一发现很快就在开发者社区里进行传播, 致使质疑声浪持续不断地高涨前行。

数学分析揭开真实底牌

Nex团队给出了两种彼此独立的验证方式, 目的在于证实套壳指控, 在移除Rio硬编码的系统提示词后, 研究人员发觉已部署的模型竟有高达79%的可能性宣称自己是“来自Nex-AGI的Nex”。更为让人震惊的是, 模型居然能够丝毫不差地复述出Nex团队定制好了的背景故事。

对谎言进行彻底揭穿的是统计学分析, Rio模型在所有60层网络上边, 呈现出精准的0.6与0.4的混合比例, Rio模型在其每个组成部分上, 也呈现出精准的0.6与0.4的混合比例, Rio模型其统计偏差达到了数千个标准差, Nex团队强调, 这在普通的微调模型中是绝不可能出现的情况, 只有直接拼接权重这样做才能够实现。

开源社区的道德红线

Nex团队于声明里宣称, 对方借助其开源底座拼凑出顶级性能, 这反过来证实了自身技术很强。他们着重指出, 开源社区接纳合理的技术运用, 然而署名与致谢是不可被跨越的道德底线。这般赤裸裸的套壳行径, 不光损害了原作者的权益, 还破坏了开源生态的互信基础。

目前, 里约市政府的 IT 公司对于此事还不曾正式作出回应, 然而在社交媒体层面已经涌现出数量众多的批评之声。有开发者明确提出, 倘使这样的套壳举动被予以纵容, 那么将会对开源社区的创新热情造成极为严重的打击。

技术细节的全面比对

团队Nex进一步公布了数据, 是详细的技术比对方面的数据。在模型架构这个层面, Rio 3.5它每层网络参数分布, 和Nex N2 Pro以及Qwen 3.5混合后得到的结果, 二者高度吻合。各层之间权重差异极小, 完全是符合0.6和0.4固定比例呈现出来的情况, 而不是正常微调的时候应当呈现的随机变化状态。

有一位AI研究员, 他不愿意透露自己的姓名。在对相关数据做出分析之后, 他表达了这样的看法: 这种精确无比的混合比例, 唯有借助直接拼接权重才能够达成, 任何并非采取拼接方式的迁移学习或者微调, 都会生出相当明显的偏差。他据此认定说, Nex团队所拥有的证据极为充分。

行业影响与后续处理

此项事件致使整个AI开源社区产生了震惊, 好多开发者正在再度评估自身是不是曾经在不经意间运用了类似套壳模型, 开源项目维护者倡导构筑更为严苛的代码以及权重溯源体制, 以此防止此类事件再度出现。

Nex团队讲, 他们不会排除采用法律办法去维护权益。与此同时, 团队还呼吁里约市政府IT公司公开作出道歉并且修正模型归属方面的信息。阿里的Qwen团队当下还没有发布官方声明, 不过有内部人员透露, 他们持续密切关注着事态的发展。

用户如何识别套壳模型

面对着数量日益增多的开源大模型, 普通用户究竟该怎么样去识别它是不是套壳的? 专家给出了建议, 可以试着采用非标准系统提示词来进行测试, 然后观察模型是不是会意外地暴露出来其他模型的身份。与此同时, 观察模型针对特定问题的回答风格以及知识边界, 其实也能够提供相关线索。

运用第三方工具来开展权重统计分析, 查看各层参数中是否存有可疑的固定混合比例, 这属于更为专业的鉴别方法。社区此刻也在着手开发自动化检测工具, 以此助力用户迅速识别潜在问题。

知晓于此, 你认为对于开源大模型的应用是不是得去设立更为严格严苛的署名规定呢? 欢迎于评论区域分享你的见解想法, 点赞并且转发这篇文章, 以使更多的人留意这场AI领域范围的诚信方面的风波状况。

登录后参与评论

评论仅开放给已登录并完成邮箱绑定的用户。

评论 0

暂无评论。