扫一扫
发布时间:2025-04-03 13:01:56 | 浏览:
,基于大语言模型(LLM),在来自许多物种的蛋白质序列和互作信息上训练,重新设计蛋白质以增强其功能,是
虽然该模型尚未正式发布,但在与抗衰老公司Retro Biosciences的合作中表现优异,研究人员称其改造后的特定蛋白的效率提升了50倍以上,“比科学家产出的蛋白质更好”。
利用AI破解生命科学难题,是AI应用领域中想象空间最大、商业价值最高的细分赛道之一,吸引黄仁勋、龙8long8手机登录比尔盖茨、扎克伯格等一众科技界大佬投身其中。
而OpenAI的入局,再次验证了AI在生物领域的广阔潜力,掌舵人Sam Altman也早已押下重注,以个人身份投资多家AI制药公司。
站在人工智能与生物科技的交汇点,一场技术创新的激烈角逐已然拉开帷幕,在科技巨头们的持续推动下,AI引领的生物学正在加速进行。
不同的是,GPT-4b micro被设计用于处理特定数据集的专门任务,它输入的不是一般人类的语言,而是“蛋白质语言”。
如果我们把蛋白质序列当作一段话,那么氨基酸就可以类比为其中的单词,与人类语言具有规律一样,具有特定性质的蛋白质,其序列也表现出相关性。
与DeepMind的Alphafold所依赖的多序列比对(MSA)方法相比,PLM往往在预测效率上具有很大优势,更适合大规模预测任务。
此前龙8long8,一些蛋白质语言模型已崭露头角,例如Meta推出的ESM-1、ESM-2,被认为是Alphafold的有力竞争者。
实际上,作为 OpenAI 倾力打造的最新一代语言模型,GPT-4 在蛋白质预测领域展现出的潜力,也早已进入科学家们的视野。
2023年11月,微软研究院的AI4Science部门和Azure量子计算部门发表了一篇长达230页的报告,其中提到GPT-4对“蛋白质语言”的理解和推理能力。
去年8月,一篇发表在Nature上的文章指出,GPT-4能够对氨基酸、多肽和蛋白质结构进行一定程度上的建模。
在GPT-4的基础上,GPT-4b micro进行了进一步开发,尤其是针对大量蛋白质序列以及蛋白质互作信息进行了训练。
随后,科学家通过提供一系列带有答案的示例来向聊天机器人提问,这一策略类似少样本学习(Few-shot Learning),能够引导任务模式、增强准确性。
结果发现,区别于理性设计和突变库筛选等效率低下的传统方法,GPT-4b micro能够帮助改造和设计更加理想的蛋白质提供有效指导。
在与Retro Biosciences的合作,科学家就根据GPT-4b micro的建议成功对Yamanaka 因子(一种关键的抗衰蛋白质)进行了重新设计,改造后的蛋白效率提升了50倍以上。
John Hallman本科毕业于普林斯顿大学,曾就职于谷歌、AKASA(A16z投资的一家AI医疗公司,用大语言模型自动化管理医疗保健文书),去年3月刚加入OpenAI。
Aaron Jaech博士毕业 于华盛顿大学,曾就职于苹果龙8long8,后来加入OpenAI,是OpenAI o1模型的贡献者之一。
Rico Meinl则是Retro Biosciences的应用人工智能主管,曾为时尚科技初创公司dresswell的联合创始人兼首席技术官,之后在多家公司担任机器学习工程师。
不过,OpenAI目前还没有想好以什么形式发布GPT-4b micro。“是以单独的模型面世,还是融入到我们主要推理模型中,这还有待确定。”
对于国人而言,对Retro Biosciences的第一印象,往往与清华大学药学院前院长丁胜联系在一起。
作为干细胞与再生医学领域的顶尖科学家,丁胜曾为加利福尼亚大学旧金山分校药物化学系教授,于2015年回国筹建清华大学药学院并担任创院院长。
2022年6月,丁胜团队首次发现了全能干细胞的体外定向诱导及其稳定培养的药物组合,这种以非自然方式创造生命起点的发现,是生物学领域的一个“圣杯”。
这项成果有多震撼,也许清华大学给出的描述更为生动形象:“在未来,不止像小说中孙悟空身上的毫毛,动物身上的血液、皮肤等任何一处体细胞,都能通过重新编程为多能干细胞,进而‘用药’后成为能够独立形成生命的全能干细胞。”
这一发现成为再生医学领域的里程碑事件,对于实现器官的体外再生以及创造或复原生命有着重大意义。
后来丁胜在一次公开演讲中表示,“为什么制药领域没有诞生万亿市值的公司?一个原因在于这个领域的产品(药物)不可连续迭代。”
他进一步表示,对通用型的诱导的多能或者全能细胞作为单一原料进行底层的基因编辑,使得细胞产品出现了可以迭代的场景,未来10—20年或许会出现万亿市值的医药公司。
针对公司未来运营计划,Joe Betts-LaCroix表示,将利用Altman的资金撑到2030年左右。然后考虑上市或者寻找更多的投资者。