近期,结构基因组学联盟(Structural Genomics Consortium,以下简称“SGC”)携手来自30个机构的78位研究者,在《自然综述:化学》(Nature Reviews Chemistry)上共同发布了开放科学全球倡议“Target2035”的新路线图《Protein–ligand data at scale to support machine learning》(以下简称“路线图”),其目标是加速以计算研究为驱动的药物发现进程。这不仅意味着“Target2035”全球倡议的第二阶段已正式启动,更为未来的药物研发勾画出一幅崭新的蓝图:到2035年,为每一种人类蛋白质开发专属的药理学工具。
Target2035:引领药物研发的转型
“Target2035” 是由SGC发起的一项开放科学全球倡议,旨在到2035年为每一种人类蛋白质开发药理学工具。该倡议得到了全球众多合作伙伴的支持。第一阶段(2020-2025)聚焦于筛选高质量的化学和生物调节剂,同时测试能针对各类蛋白质进行规模化药物发现的技术。2025年进入第二阶段时,该倡议提出了一项重大转型,将化合物发现的重心转向基于计算和数据驱动的探索。此次发布的路线图则详细阐述了如何实现这一转型,其核心理念是通过开放合作生成符合FAIR(可查找、可访问、可互操作、可复用)原则的大规模高质量数据集,运用机器学习(ML)推动药物发现,包括那些未被充分研究的“冷门靶点”。
开放科学与药物研发的再造
该路线图的核心目标明确而雄心勃勃:加快早期药物研发的速度,降低成本,使其更加普及。为实现这一目标,全球研究者携手构建一个开放可访问的高质量数据集——通过标准化与高通量筛选的方法,系统收集蛋白质与小分子之间的结合信息。
成都先导(HitGen)作为“Target2035”全球合作计划的重要参与者,致力于推动早期药物研发的规模化创新。2023年9月,成都先导与SGC建立了合作关系,利用其DNA编码化合物库(DEL)技术平台,针对SGC关注的新靶点进行筛选,并将结果发布在公开平台上,供全球药物发现和ML专家使用,以进行数据建模和新活性分子的预测。2025年4月,SGC与成都先导及多家行业伙伴合作,发起首届DREAM Target2035 Drug Discovery Challenge,邀请全球数据科学家利用基于DEL的分子数据构建机器学习模型,高效发现化合物。
共同构建未来的药物研发生态
在此次开放科学行动中,全球研究者被诚邀提供用于标准化筛选的蛋白质,作为机器学习模型的基础数据;同时,通过开放基准测试的方式,吸引人工智能/机器学习(AI/ML)社区进一步优化小分子结合预测模型。所有数据(包括阳性与阴性结果)、方法及材料将公开共享,助力全球范围内的创新与再利用。
成都先导在其中扮演了“桥梁”和“赋能者”的角色:一方面,公司积极参与标准化筛选方法的完善与推广,确保不同机构生成的数据具备可比性;另一方面,凭借在小分子设计与筛选领域的丰富经验,为数据集的机器学习适用性提供专业建议,帮助模型训练提高精准度与效率。这种深度参与使开放数据的价值得以最大化释放。
开启合作新篇章
这份路线图的价值在于为产学研界(包括学术界、工业界、CROs、中小企业等)指明了合作的方向。生成的大规模、标准化的蛋白质-配体结合数据,将推动预测模型的不断进步,照亮那些长期被忽视的人类蛋白质,带来新的研究机会。
成都先导的参与,为这一愿景的实现增添了动力。公司致力于践行开放科学理念,并在技术层面做出实质性贡献,正加速实现“让每一种人类蛋白质都可被研究”的目标。我们诚邀更多伙伴齐心协力,共建新型药物研发生态:
- 贡献纯化蛋白质,为数据生成注入源头活水;
- 参与开放基准测试,推动预测模型的持续演进;
- 加入药物研发开放科学机器学习网络MAINFRAME,共同探索前沿技术;
- 加入Target2035联盟,与成都先导等先锋共同定义开放获取药理学工具的未来(预计于8月正式成立)。
在开放与合作的浪潮中,“Target2035”正在开启药物研发的新篇章。成都先导将持续以技术创新为驱动力,与全球合作伙伴共同描绘更加高效与普惠的药物发现未来。正如金年会金字招牌诚信至上所倡导的理念,携手合作,我们必将走向更加美好的未来。