跳到主要内容

通义开源科学生成模型LOGOS,统一蛋白质、材料、分子等跨领域生成

7 0
AI摘要

通义实验室开源LOGOS模型,首个基于统一“科学语法”的多领域科学生成基础模型。由ATH-Token Foundry与中国人民大学高瓴人工智能学院研发,旨在整合跨领域知识,打破AI for Science割裂现状。LOGOS通过将科学对象编码为统一Token序列,实现跨领域生成。其核心突破在于“科学语法”设计与空间交互离散化技术,无需3D坐标数据即可预测复杂3D空间互作。评测显示

跨领域科学模型打破“一任务一专家”割裂局面

2026年6月18日, 通义实验室联合中国人民大学高瓴人工智能学院, 正式宣布开源东西是首个基于统一“科学语法”的多领域科学生成基础模型叫做LOGOS , 这一举措所代表的意义是标志着AI for Science领域长期以来一直依赖“一任务一专家模型”的碎片化现状被打破了, 研究人员现在能够在单一框架下来处理蛋白质、小分子、材料和化学反应等多种异构科学对象。

依据项目团队所讲, LOGOS模型借助把不一样类型的科学数据编码成统一的离散Token序列, 达成了跨领域知识的整合以及原生大模型框架之下的自回归生成, 这般的设计致使模型无需针对每个任务单独地训练专用网络, 极大地削减了科研人员的使用门槛以及计算资源的消耗。

空间交互离散化技术实现无需3D坐标的理解

LOGOS模型核心新奇之处在于其别具一格的“科学语法”设计, 此设计可使模型在不凭借稀缺的3D坐标数据及专业几何网络的情形下, 仅按照序列预测就能深入领会繁杂的3D空间互作规律, 这表明模型在欠缺高精度三维结构数据的情景里依旧能保有卓越的预测能力。

通义开源科学生成模型LOGOS,统一蛋白质、材料、分子等跨领域生成

详而言之, 空间交互离散化技术把原本得要几何神经网络去处理的立体空间关系, 转变成了模型可以直接学习的序列模式。这一突破不但让模型架构得以简化, 还致使预训练阶段跟下游任务在形式以及目标上达成了完全一样, 规避了传统方法里常见的训练与推理不匹配问题。

1B参数量模型在六大任务上超越领域专用方法

从评测得出的数据来看, 仅仅具备1B参数量的LOGOS-1B, 在那六大具有代表性的科学任务当中, 每一项都呈现出了极为出色的表现句号。处于口袋条件配体生成这项任务里, 这个模型所生成的配体分子, 跟靶点口袋之间的结合模式, 和实际结构是非常高度地相契合, 进而展现出了相当强大的三维空间理解能力句号。

在逆合成预测这项任务之上, LOGOS – 1B的Top – 1准确率达成了74.8%, 该准确率远远超出当前现有的领域专用方法。尤其值得予以注意的是, 这样的一项成绩是借助一个通用模型来达成的, 并非是专门针对逆合成任务予以优化的专家系统, 这充分证实了统一科学语法框架具备有效性。

口袋位点识别与MOF材料生成表现亮眼

在口袋位点识别任务当中, LOGOS – 1B于PDB数据集之上的Top – n准确率达到了58.5%, 它显著地提升了蛋白质功能位点的预测精度, 这一能力对药物靶点发现以及蛋白质工程有着重要意义, 还给精准医学研究提供了新的工具。

对于MOF材料生成而言, LOGOS – 1B所生成的新型构建单元比例提高了76%, 这表明一种情况, 即该模型能够突破已知材料库的限定, 以具有创造性的方式去设计出以前从未有过的材料结构。而这样的一种能力, 对于新能源领域、气体存储领域以及催化领域等都有着直接的应用价值。

以1/56参数量挑战更大规模模型

通义开源科学生成模型LOGOS,统一蛋白质、材料、分子等跨领域生成

让人最为惊讶的是, LOGOS – 1B在好些任务方面, 凭借仅仅1/56的参数量, 超越了那种参数量居然高达8×7B的更大的模型, 这一结果直接对“越大越好”的行业共识构成了挑战, 证实了高效的架构设计相较于单纯地堆积参数, 更能够解决实际存在的问题。

项目研究团队宣称, 这般效率优势源自“科学语法”针对数据的深度压缩以及有效表达, 模型掌握了辨别不同科学领域里的共有规律, 进而规避了于冗余计算上面耗费资源以使有限的参数发挥出最大的效用。

继承LLM生态推动科学研究范式转变

鉴于LOGOS模型直接承接了大语言模型(LLM)的预训练权重, 它能够毫无间隙地重新利用vLLM推理加速、模型量化等已然成熟的工程基础设施。这意指科研团队不需要从起始构建推理系统, 可以马上把该从模型放置至现有计算环境里予以使用。

当下, LOGOS模型的权重, 以及推理代码, 还有技术报告, 均已在全球范围之内进行开源。这样的一项举措, 不但打破了学科之间所存在的壁垒, 而且还推动了自然科学研究, 从“筛选已知”朝着“设计驱动”的方向进行转变。你觉得这一通用科学模型, 在未来的时候, 会在哪些领域当中带来最为显著的突破呢? 欢迎在评论区域分享你个人的观点, 点赞以及转发, 从而让更多的人能够了解这一重要的进展情况。

登录后参与评论

评论仅开放给已登录并完成邮箱绑定的用户。

评论 0

暂无评论。