在几乎所有传染病、免疫性疾病和癌症的治疗中,T细胞受体(T-cell receptor,TCR)都发挥着重要作用。但和抗体类似,T细胞受体也有着极高的多样性,和各种疾病抗原(antigens)相互作用的规则至今不明。
如何生成一个可以预测T细胞受体与抗原交互的计算模型,一直是像蛋白质结构预测(AlphaFold)一样悬而未决的重大问题。在过去几年里,尽管各种文献和算法(NetTCR、DeepTCR、AITCR等)不断为突破这一问题付出努力,但都局限在预测人类已知的几十个抗原的T细胞受体。近日,硅谷生物技术初创公司 Vcreate 在bioRxiv平台发布了一项题为:TAPIR: a T-cell receptor language model for predicting rare and novel targets 的最新研究成果,让人工智能(AI)模型预测稀有免疫治疗新靶点有了新的突破。Vcreate的科学家团队开发出一种名为TAPIR(T-cell receptor and Peptide Interaction Recognizer)的深度学习模型,用于预测T细胞受体(TCR)与各种稀有或未知肿瘤相关抗原的交互作用。相较于已有模型,TAPIR无论是预测能力还是运算效率都有显著的提高。这得益于研究团队使用了以下三种手段来提高TAPIR的预测能力:1)整合大量不同来源的训练数据,包括自己的高质量内部数据,涵盖了近千个常见和稀有抗原;2)使用两个卷积神经网络(CNN)分别编码T细胞受体和抗原,不再限制抗原系列;3)使用已知实验数据生成大量不完整的合成数据(bootstrap),使模型能够处理不完整的T细胞受体序列。TAPIR的诞生,为发现新型免疫治疗药物提供了有力支撑。上线后短短30天内,就有来自世界各地超过四十家生物技术企业和科研院所院校开始注册使用TPAIR。在这篇最新发表的论文中,Vcreate的科学家团队 Binbin Chen、Manjima Dhar 和 Ethan Fast 用多年积累的数据集,重新训练了三种最常见的已知预测方法(NetTCR、DeepTCR和AITCR),并对预测结果进行了比较。无论是常见抗原还是稀有抗原,TAPIR模型的预测结果都优于常用的三个机器学习。此外,他们还使用TAPIR模型产生新的抗流感T细胞受体序列(generative model)。结果表明,TARPIR生成的六个T细胞受体序列中,有两个能够准确识别流感抗原序列。图1. TAPIR预测T细胞和抗原相互作用的运行原理和5种应用前景令人振奋的是,该研究还使用TAPIR模型分析了乳腺癌病人的T细胞单细胞数据,发现并验证了一个能够准确攻击常见乳腺癌的癌变(PIK3CA)的T细胞受体——C-30。通过实验验证发现,C-30受体使正常T细胞攻击携带乳腺癌癌变的细胞,但不攻击未癌变的版本。这一令人激动的结果预示着,在不久的将来,像TAPIR这样人工智能的免疫工程平台将为治愈肿瘤、免疫系统疾病和传染病等人类顽疾带来新的曙光。陈滨滨(Binbin Chen),斯坦福大学医学院MD/Ph.D,Vcreate创始人、CEO。陈博士专注于免疫学领域的研究,目前已在 Nature、Nature Biotechnology 等顶级学术期刊发表论文二十余篇。2021年,他和斯坦福大学计算机系校友共同创立了Vcreate,并集结了全球范围内的顶尖科学家团队,共同探索应用机器学习等前沿技术,预测T细胞受体、寻找稀有靶点,为肿瘤、免疫系统疾病和传染病等人类顽疾寻找治愈之道。
目前,Vcreate已加入斯坦福大学Start X创新网络,并与全球制药巨头阿斯利康建立合作。此外,Vcreate还获得了医药企业默克的投资。2023年10月,Vcreate科学家团队最新研究成果深度学习模型TAPIR上线,为世界各地的研究人员预测T细胞受体与各种稀有或未知肿瘤相关抗原交互作用提供了全新的解决方案。doi.org/10.1101/2023.09.12.557285可注册并试用TAPIR模型:vcreate.io/tapir
版权声明:本网站所有注明来源“医微客”的文字、图片和音视频资料,版权均属于医微客所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源:”医微客”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,转载仅作观点分享,版权归原作者所有。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 本站拥有对此声明的最终解释权。
发表评论
注册或登后即可发表评论
登录注册
全部评论(0)