据百度飞桨介绍,HELIX-GEM是业界首个基于几何构象增强的化合物表征模型,利用多任务学习同时融合了多种自监督和监督学习任务,在14个药物属性预测相关的 benchmarks 上效果达到业界最优,帮助提升药物筛选效率。该工作发表于 Nature Machine Intelligence 2022年2月刊。
据悉,模型的 GeoGNN 网络,包括两个图结构,1)Atom-Bond 图来建模原子和化学键的关系,2)Bond-Angle 图来建模化学键和键角的关系。通过这两个图的交互,来同时建模化合物的拓扑结构和空间结构。
此外,设计了3个基于空间结构的自监督任务,包括键长预测,键角预测和原子间距离预测。通过这几个自监督任务,让模型自动学习化合物的 3D 空间信息,提炼分子力场的知识,提升模型的泛化能力。
、
参见:文心·生物计算大模型