刷新多项纪录!临港实验室首发AI虚拟疾病生物学家“元生”,破解药物靶标发现难题

发布时间:2025-06-07

新药怎么选“靶子”?靠经验,还是靠运气?2025年6月6日,由临港实验室牵头,联合上海人工智能实验室、上海交通大学、复旦大学、MIT等研发机构,共同发布国际首个专注于靶标发现与临床转化价值评估的多智能体虚拟疾病生物学家系统——“元生”(OriGene)。

这位“虚拟疾病生物学家”一出道便刷新多项纪录,基于团队构建的首个靶标发现问答基准测试集TRQA评价显示,“元生”能力显著超越DeepSeek-R1、OpenAI o3-mini等主流基座大模型,且靶标发现能力得到前瞻性实验验证。

AI也能“找靶子”?破解药物研发的源头难题

生物医药临床试验“九死一生”,新药研发道阻且长。新药研发的第一步,就是要找到那个“关键开关”——也就是靶标。

所谓靶标,就像战争中的"指挥部":找到癌细胞特有的异常蛋白,才能设计药物精准打击。但实际上,超过90%的候选药物会在临床试验阶段折戟,其中近半数是因为最初选错了靶标——要么这个靶标根本与疾病无关,要么药物根本无法抵达作用位置。

目前靶标发现主要依靠经验丰富的科研人员——翻阅海量文献、分析组学数据、设计实验验证,一个结论往往要耗费数月甚至数年。AI虽然在生成文本、辅助诊断方面已有突破,但在这个环节,一直“插不上手”。

“元生”的出现,正是为了打破这一局限。它不是一个简单的聊天机器人,而是一个会“看文献、查数据、推理分析、设计实验”的AI科学家,目标直指药物研发的源头——让AI找出具有临床潜力的新靶标。据介绍,通过自我进化框架,“元生”能够持续吸收人类专家和湿实验反馈,迭代优化其核心分析流程和工具组合,从而在精度与效率上持续进化。

“像科学家一样思考”:多智能体架构打造“AI智囊团”

“元生”并非传统意义上的单一模型,而是由多个“智能体”组成的协作系统,构建了多智能体协同决策架构。这一架构让“元生”在面对复杂的疾病机制或药物路径选择时,能够像科学家一样“拆解问题—查找数据—做推理—提建议”,并通过反馈进行优化。

微信图片_20250610132604

“元生”模型流程

它的思维方式不是凭空生成答案,而是模拟真正科学家的研究过程。研发团队从大量专业文献中总结出常用的推理范式与分析路径,构建了被称为“思维模板”的知识结构库,用于指导“元生”的问题理解与分析方式。这样,它不仅能“找到答案”,还能说出“为什么选这个靶标”、”基于哪些证据”,从而解决大模型常见的“看似聪明但逻辑混乱”问题。

为了让“元生”真正具备科研能力,系统内置超过500种领域常用工具和数据库,涵盖基础生物学、疾病机制、临床试验、药物专利等,确保其“用得顺手、查得全面”。更进一步,它还能在实践中“自我成长”。和其他AI不同,它不靠“背答案”,而是真分析、真推理。甚至,它还能根据实验反馈优化自己,每次“实战”都会“升级打怪”。

从“科学智脑”到新药引擎,“元生”刚刚起步,真正的挑战才开始

为标准化评估“元生”系统的实战能力,研究团队构建了领域内首个靶标发现专用基准测试集,涵盖1,921道多维验证题,包含文献解析与竞争格局分析两大模块,全面考察系统在生物学机制推断、临床转化评估等核心场景的认知能力。

在测试中,“元生”的表现不仅全面超过DeepSeek-V3、GPT-4o等大模型,还打败了专业疾病生物学家组,成为首个在生物医学问答中“赢人类”的AI系统。特别是在“看文献找规律”和“分析药物竞争格局”这两项任务上,它准确率最高。

为进一步验证“元生”提出的靶标是否“靠谱”,团队与复旦大学附属中山医院合作,对其在肝癌与结直肠癌两个方向提出的原创性靶标展开实验验证。“元生”分别提出了两个此前尚未被广泛关注的新靶标,表明其在科学家和实验的的迭代反馈下已具备发现原创靶标的能力。