阿里联合人大开源科学模型LOGOS，1B参数超越微软8×7B模型｜AI指令集

Zevo

阿里联合人大开源科学模型LOGOS，1B参数超越微软8×7B模型

Zevo 更新时间 2026-06-21 12:01 19 0

AI摘要

阿里 ATH-Token Foundry 与中国人民大学高瓴人工智能学院开源了多领域科学生成基础模型 LOGOS，该模型基于统一科学语法，在六大科学任务中超越传统领域专用方法。LOGOS-1B 模型仅含 1B 参数，却超越参数量达 8×7B 的微软 NatureLM。LOGOS 构建了涵盖 7 类模态的 44.87B tokens 预训练语料库，

科学大模型首次实现多领域统一

在2026年6月21日这天, 阿里巴巴联合中国人民大学高瓴人工智能学院, 正式宣告, 开源首个基于统一科学语法的多领域科学生成基础模型LOGOS。在六大代表性科学任务里, 该模型依靠纯序列建模范式, 一致地匹配甚至超越了传统的领域专用方法。这一成果表明人工智能于科学研究领域跨出了关键一步。

阿里联合人大开源科学模型LOGOS，1B参数超越微软8×7B模型

按项目团队所讲, LOGOS模型当下已将全部模型权限, 推理代码以及技术报告予以开放。这表明全球范围之内的科研人员均可免费去下载, 进行使用且基于此开展二次开发。阿里云智能集团之中AI产品线的负责人表达, 开源为使科学进步得以推进的关键方式, 期望更多的研究者能够投身至这一生态里面。

参数效率惊人 1B超越8×7B

对于那展现出极高参数效率的LOGOS模型来讲其中相当值得予以关注的, 是。有数据明确表明, 仅仅只拥有1B这么数目的参数量的LOGOS-1B模型, 在好多核心任务方面所呈现出来的表现, 成功地实现了把自身展示水平提升到超越参数量高达8×7B的微软语言模型之上的程度。这样一种对比最终所形成的结果在学术领域引发了范围颇为广泛的讨论, 原因在于一般情况下更大数量的参数量就意味着具备更强的能力。

具体来讲, 在蛋白质结构预测这些情况里, 还有分子性质预测这类任务当中, LOGOS – 1B的准确率跟微软模型是一样的, 甚至还要稍微高那么一些, 然而计算资源的消耗却减少了差不多90%。项目组技术方面的负责人作出解释, 这是因为LOGOS有着独特的科学语法设计, 使得模型能够以更高的效率去学习科学知识的缘故。

首创科学语法统一异构对象

LOGOS构建了一个庞大的预训练语料库, 这个语料库涵盖生物大分子、化学实体以及界面互作等7类模态, 其总数据量达到44.87B。它通过设计共享词表, 把蛋白质和小分子等原本异构的对象, 全部编码为统一的离散Token序列, 进而实现了科学对象的统一表达。

这种别具一格的科学语法设计, 使得各异的科学对象, 能够于同一个生成空间里, 被大模型以自回归的方式去理解。更让人诧异的是, 它居然创造出了一种“文字描述法”, 用不着输入繁杂的3D坐标, 仅仅凭借序列预测, 便能在脑海之中构建起复杂的空间互作规律。这一创新, 被国际同行评定为“科学人工智能的范式转变”。

消除预训练与应用断层效果显著

于传统科研范式里, 更换一个研究环节常常要切换不一样的模型, 致使模型落地之际需要大量的微调。比如说, 从蛋白质结构预测转变到分子生成, 得重新训练或者加载不同的模型权重, 耗费诸多算力以及时间。而LOGOS达成了形式跟目标的高度一致。

阿里联合人大开源科学模型LOGOS，1B参数超越微软8×7B模型

其预训练数据的序列样式和下游任务的输入输出样式百分百一样, 这样的高度对应切实消除了预训练跟下游应用之间的差距。测试表明, LOGOS不用复杂的适配层就能直接触发生成能力, 在药物分子设计、材料筛选等真实场景里, 部署时间从数周缩短为數小时。

开源策略推动科学民主化

此次阿里把LOGOS模型、推理代码以及技术报告完整地进行了开源, 这种情况在业界是不多见的。通常来讲, 大型科技公司会把核心模型保留下来当作商业壁垒, 然而阿里却选择了全面开放。按照内部人士所透露的, 这一决策经历了长达半年时间的讨论, 最终做出决定将推动科学进步作为优先事项。

开源社区针对此呈现出热烈的反响, 截止到发稿的那个时刻, GitHub上面的项目已然收获了超过3000颗星, 多家科研机构以及初创公司宣称会依据LOGOS去开展药物研发还有材料设计方面的工作, 中国人民大学高瓴人工智能学院的教授讲道, 期望LOGOS能够成为科学人工智能领域的“Linux”。

未来展望与行业影响

据业内专家的看法, LOGOS的现身或许会使当下科学人工智能的局面发生改变。以往的时候, 研究人员得针对不一样的领域去训练专门的模型, 然而LOGOS证实了一个通用的模型能够胜任多项科学任务。这会极大地降低科研的门槛, 从而让更多的中小型实验室能够运用前沿的AI工具, 但这也可能改变当前科学人工智能的格局。

此刻, 项目团队围绕LOGOS的下一代版本展开规划, 打算增添更多科学模态以及更为复杂的推理能力。与此同时, 他们针对与云计算服务的融合进行探索, 目的在于给科研用户呈上更便利通顺的在线使用感受。阿里宣称, 会持续投入资源去完善这一开源生态。

你对于那种借助1B参数达致超越8×7B模型的技术突破持有怎样的看法呢, 欢迎于评论区去分享你的观点, 点赞并且转发给更多对AI以及科学予以关注的朋友！

登录后参与评论

评论仅开放给已登录并完成邮箱绑定的用户。

评论 0

暂无评论。

作者 Zevo

120 14 5 3

分类与标签

新闻资讯参数效率开源模型异构对象科学语法预训练应用

科学大模型首次实现多领域统一

参数效率惊人 1B超越8×7B

首创科学语法统一异构对象

消除预训练与应用断层效果显著

开源策略推动科学民主化

未来展望与行业影响

相关文章

AI算力借记卡来了！一张卡搞定多模型充值，省去切换烦恼

Kimi大模型B端定价真相：缓存命中率决定你的实际成本

DeepSeek V4七月上线，高峰时段API价格翻倍

登录后参与评论

评论 0