▶ 王查娜
近日,百图生科xTrimo新一代跨模态生命科学基础大模型发布。据悉,这是目前全球规模最大(2100亿参数)、首个全模态覆盖(包括蛋白质、DNA、RNA等七大生命科学主流模态)的大模型。
这是大模型运用在生物学领域的创新案例之一。当前,AI计算正在向生物制造领域更广阔、深入的领域探索,众多突破性成果或将纷至沓来。
将AI引入生物科研
“信息技术和生物技术的融合将开启新的研究领域和应用,这种交叉可能会在未来带来革命性的变化。”中国科学院院士、上海交通大学王宽诚讲席教授樊春海在近日举行的第三届中国生物计算大会上表示。
樊春海举例说,DNA不仅作为生命信息的载体,还可以被编程来形成具有特定尺寸、形状和力学特性的纳米框架材料,用于疾病治疗和诊断。
此外,人工智能的引入为发酵操作条件的优化提供了新思路。通过数据分析与模型构建,发酵效率和产品质量得以显著提升。
“我认为生物过程研究中AI的数据应定义为直接参数、间接参数、手工参数,以及各种状态变量。其中也包括生物传感器获得有关参数以及由此获得的各种状态变量。”华东理工大学教授、原国家生化工程技术研究中心(上海)主任张嗣良表示。
构建生物学大模型
目前生物制造发展还面临一些关键瓶颈,包括规模化生产工程挑战、生产成本相对较高、产品质量和一致性控制难提升等。AI的出现,为生物制造带来强大的技术手段,两者的深度融合将推动行业智能化发展。
据了解,百图生科xTrimo新一代跨模态生命科学基础大模型目前已助力开发了20余种前沿抗体和酶,实现10余个创新靶点及靶点组合的挖掘,并进入更广泛的生物制造、农业化工、绿色环保等领域。
随着AI技术的不断进步,行业大模型的构建成为一个重要课题。通用大模型虽然能够处理大量数据,但在生物学实际应用中缺乏针对性。
张嗣良建议,要重视如下几点:首先,开展生物过程行业的场景研究,由此才能形成行业大模型。如过程研究的场景对话、生命科学的第一性原理、已经成熟的规律与方法、研究装备、数据处理、工程科学、AI系统研究等。其次,开展生物过程智能化的相关理论和路线。在这一过程中深入分析不同场景特点,结合行业特性进行研究。通过逐步推理,将不同实验数据与原理相结合,能够有效推动大模型建设。
复旦大学智能医学研究院(筹)常务副院长、国际健康科学信息学研究院院士刘雷认为,在专业生物学的大模型基座上开发针对不同场景的智能体,可能是未来趋势。
问题依然严峻
业界专家认为,人工智能可以改变科研范式,打破学科之间的界限以及研究与产业之间的界限,但同时人工智能的不确定性和学科融合方面的问题依然严峻。
“大模型的缺陷就是‘幻觉’。因为我们要求它有多样性输出,它必然会产生错误。所以我们要加强思维链中一系列中间推理步骤,改变大模型缺乏推理的能力。”张嗣良说。
张嗣良建议,建设生物过程研究中心,在多尺度数据采集和AI智能化上提供各环节智能化装备体系研究。“各单位有了合成生物学的研究结果,只要将产品进行生产工艺研究,我们就可以在智能化试验装置及各种仪器基础上提供行业特点的专业数据,形成行业大模型。获得生物过程智能化初步研究结果后,各生物技术厂家或产业园区根据需要购置设备,或将推进产业化装置与工艺,形成全国一盘棋的生物过程产业化发展。”