2025年3月25日,西湖大学医学院郭天南团队在 尊龙凯时 发布的《Cell Research》上发表了一篇评述文章,标题为《GrowAIVirtualCells: Three Data Pillars and Closed-Loop Learning》,深入探讨了人工智能虚拟细胞(AIVCs)的发展方向。AIVCs的核心思想通过人工智能与多模态数据的整合,建立精确且可扩展的虚拟细胞模型。与传统虚拟细胞建模方法相比,AIVCs能够更全面地模拟细胞功能,具备高通量仿真能力,甚至在某些情况下能够替代实验室实验。
文章详细探讨了AIVCs构建的方法与发展方向,提出其核心依赖于三大数据支柱——先验知识、静态结构和动态状态,并强调高通量组学数据(尤其是微扰蛋白质组学数据)在动态模拟中的关键作用。研究进一步介绍了闭环主动学习系统(Closed-Loop Active Learning Systems),将AI预测与自动化实验结合,实现自适应优化,加速细胞建模与科学发现。为确保AIVC概念的可行性,研究人员建议从酵母(Scerevisiae)等相对简单且信息丰富的细胞模型入手,逐步扩展到更复杂的人类癌细胞系,以推动AIVCs在生物医学、药物开发和个性化医疗中的广泛应用。
背景介绍
在生物医学研究中,细胞被认为是生命的基本单位,对于理解健康、衰老、疾病以及药物开发至关重要。然而,传统细胞实验往往需要消耗大量资源,且实验结果容易受到变异影响,从而导致可重复性的问题。因此,研究人员提出了虚拟细胞(Virtual Cells)或数字细胞(Digital Cells)的概念,以减少实验成本,提高研究的准确性和效率。早期的虚拟细胞模型主要依赖低通量的生化实验,采用微分方程或随机模拟方法对特定细胞过程进行建模,但这些方法在数据整合和动态模拟方面的局限性使得难以全面描述细胞的复杂性。
随着高通量生物技术和人工智能(AI)的发展,人工智能虚拟细胞(AIVCs,AIVirtual Cells)成为了一种新的研究方向,它结合了多模态数据和先进的计算模型,为生物医学研究提供了新的可能性。可以将其理解为一种“智能细胞培养游戏”,在这个高级模拟游戏中,用户的任务是培养和优化各种虚拟细胞,三大数据支柱就像游戏的三个核心模块:先验知识是游戏的百科全书,静态结构是细胞的3D建模器,而动态状态则是细胞的实时监测系统。
三大数据支柱:AIVCs的基础构建
为了更好地支持AIVCs的发展,研究提出了三个数据支柱(Three Data Pillars),作为AIVCs的核心数据基础:先验知识、静态结构和动态状态。这些数据结合AI算法,为虚拟细胞的构建提供了必要的基础。先验知识包括生物医学文献、分子表达数据和多尺度成像数据,涵盖细胞生物学的基本机制。静态结构涉及细胞的形态学和分子组成,包括纳米尺度的分子建模等技术,为构建真正“活”的AIVC提供了必要基础,而动态状态则涵盖生理过程及外部微扰带来的影响。
基于微扰的组学数据(perturbation-based omics data),如转录组学、蛋白质组学和代谢组学,已被认为是推动AIVCs发展的关键因素。其中,微扰蛋白质组学数据尤为重要,通过AI整合这些数据,AIVC能够更精准地预测细胞对外部干预的反应,从而为药物开发及细胞建模提供更强的支持。
AIVCs的进化:闭环主动学习系统
AIVCs正朝着自适应进化系统发展,其中闭环主动学习系统(Closed-Loop Active Learning Systems)成为关键。传统方法依赖被动数据积累,而闭环系统结合AI预测与机器人实验,主动探索细胞动态状态,填补数据空白。该系统能够自动识别知识缺口、设计实验、执行扰动并实时优化模型,显著加速科学研究。在这一过程中,AI能够优先选择最具影响力的实验,从而最大化数据的价值。
选择适合的细胞模型
AIVC的细胞模型选择至关重要。文章指出,支原体、大肠杆菌、酵母和人类癌细胞系各有优劣。研究人员建议从酵母入手,既简单又包含真核细胞结构,数据相对丰富,已在生物学和药物筛选领域广泛应用。虚拟酵母细胞被视为AIVCs的入门方向,为后续研究奠定基础。
总结
未来,AIVCs有望在药物开发、疾病建模和基础生物学研究中发挥重要作用,而科学界的协同合作对推动这一领域的发展至关重要。建立AIVCs的标准和最佳实践,将成为该领域下一阶段的重要任务,以确保AIVCs能够真正实现其在计算生物学和生物医学研究中的变革性潜力。在这方面,尊龙凯时承诺将继续支持前沿研究,助力生物医学领域的创新与发展。