合作升级至2.0 天津工业生物研究院与亚马逊云技术探索前沿技术体系创新

2023-10-07 19:12

作为我国工程生物学和合成生物学研发的中坚力量,中科院天津工业研究院与亚马逊云技术共同建设中国科学院和天津市人民政府。生物技术研究所(简称:天津工业生物研究所)已成为国家工业生物技术创新技术平台。

得益于科研团队孜孜不倦的技术攻关,天津工业生物研究所牵头组织承担了合成生物学、绿色生物制造等多项重点研发计划任务。天津工业生物研究所拥有从基础研究到产品生产再到产业转化运营的完整产业链生态系统,这在目前国内合成生物学和生物制造领域是罕见的。

2019年,天津工业生物研究所成立生物设计中心平台实验室,围绕生物计算设计,开始与亚马逊云技术共同探索生物技术与信息技术(BT+IT)技术体系的结合,进一步推动发展合成生物学研究,为健康、能源、农业、环境等领域重大突破提供技术支撑。

近期,此项合作升级至2.0阶段。双方在人工智能、大模型乃至量子计算等一系列前沿技术方面的合作已呼之欲出。

构建BT+IT技术体系

天津工业生物研究所与亚马逊云技术的合作始于2019年的云浪潮。当时,天津工业生物研究所的IT技术团队规模较小,开发人员数量较少。他们必须考虑多种应用场景,开发不同的应用需求,同时开发多个任务。

现实需求让天津工业生物研究所尝试从基于服务器的开发模式转向云原生的开发模式。借助云计算,科研业务效率得到大幅提升。 2019年以来,已有20多个云应用部署在云端。

天津工业生物研究所开辟了一系列不同的云应用开发方式,包括纯分析和面向用户的工具/网站平台开发。过去几年,围绕工业生物设计的不同子领域做了很多工作,如序列设计、图谱、各种分析平台的开发、数据库开发等。

1.0技术合作分三个阶段推进

亚马逊云技术与天津工业生物研究所合作已有四年多。从最初的数字中心到现在,所有的IT架构、开发理念、开发模式都已经通过云原生的方式实现。合作分为三个阶段:

最初在2020年及之前,我更专注于学习一些云计算技术,包括初步尝试使用一些新工具在云上进行构建。依托天津工业生物研究所的行业经验以及亚马逊云技术提供的优秀云计算解决方案和思路,研发人员了解云计算解决特定场景需求的能力。

第二阶段,2021年进入高速发展期,天津工业生物研究所陆续在云端部署了10余款软件应用,尝试构建云原生现代应用,探索出适合企业应用的商业模式生物设计中心。最佳实践。

第三阶段,2022年至今,天津工业生物研究所利用托管服务和创新服务开展云原生创新,加大云计算按需交付、快速扩展等优势的利用、弹性等,大大提高了开发效率、业务敏捷性、可扩展性和可用性,同时实现了成本节约。

生物计算设计成果频出

天津工业生物研究所与亚马逊云技术携手,突破传统开发模式,提升科研效率,在核心数据库和专业应用工具设计两大研发方向实现技术突破,有效推动合成生物学的发展。

天津工业生物研究所生物设计中心团队与亚马逊云技术团队在国际计算生物学杂志《Nucleic Acids Research》(《核酸研究》)上发表文章,首次发布基于大肠杆菌调控代谢关系的知识图数据库Amazon Neptune Map ERMer首次提供全局代谢调控图谱,并通过可视化框架实现丰富的搜索功能,如多步查询、最短路径查询等。ERMer采用专门为高度相关的复杂数据集的高效存储和查询,打破了传统低效的数据检索方法,有效增强了用户与图之间的人机交互,大大降低了使用门槛。

为了充分发挥知识图谱的价值,生物设计中心团队进一步利用图神经网络技术进行推理,成功实现了转录因子预测、转录因子目标预测等功能,有助于发现潜在的知识图谱。关键点。调控因素和调控目标,以及新的调控代谢网络的构建,可以为研究者提供新的思路和方向。

此外,天津工业生物研究所生物设计中心团队开发了AutoESD,这是第一个能够在所有类型的操作、任何基因组位点、跨领域进行精确、自动化、高通量编辑序列设计的云平台。物种。 AutoESD采用基于云的无服务器架构开发,以确保高可靠性、稳健性和可扩展性,并且可以在几分钟内并行处理数百个包含数千个编辑序列设计目标的设计任务。

开发者利用Amazon Lambda无服务器计算,对引物设计、同源臂设计等不同编辑序列设计模块进行封装打包,满足特定功能的模块化开发需求,并方便管理和共享功能模块;使用Amazon DynamoDB提供毫秒级动态资源响应性能并自动扩展所需资源以应对增加的业务需求;使用 Amazon Step Functions 实现可视化工作流程管理,实现编辑序列设计工作流程的串联,从而实现应用程序的快速构建和更新,同时通过快速查询处理异常任务。这些无服务器服务帮助天津工业生物研究所团队进一步简化运维,让开发者能够专注于业务代码和创新。与传统开发方法相比,开发时间缩短75%,总拥有成本降低50%。

战略合作升级至2.0 AI、大模型等是未来重点

中国科学院天津工业生物技术研究所副所长王勤红表示,研究所正式成立十年来,取得了一系列成果。尤其是近几年,随着积累的增加,出成果的速度还在逐渐加快。加速。从科技创新整体来看,研究院的创新首先要解决底层技术的创新。围绕工业生物创制体系底层技术进行了良好布局,取得了良好成效。

王勤红强调,要利用亚马逊云技术强大的云计算能力、强大的数据处理能力、强大的计算平台,为天津工业生物研究所认识生命、设计生命、合成生命提供更好的支撑。

中国科学院天津工业生物技术研究所生物设计中心主任马洪武认为,正如AI已经升级到2.0阶段一样,与亚马逊云技术的合作也准备进入2.0模式。需要将人工智能大模型、图数据库、知识图谱和工业生物大数据结合起来,进一步深化和提升双方合作到新的高度。

中国科学院天津工业生物研究所生物设计中心副主任廖小平表示,天津工业生物研究所生物设计中心团队去年就开始布局机器学习和推理的任务,今年上半年开始开发大型语言模型。我们希望用另一种方式来推动研发方式的转变,从而打造出新的研发范式。此外,我们也希望通过亚马逊云技术的全球科研能力,提升天津工业生物研究所在生物计算设计方面的国际影响力,为全球合成生物学研究人员提供优质服务。

亚马逊云技术中国商业及公共市场事业部总经理李晓芒表示:“亚马逊云技术为全球生命科学领域数千家客户提供云服务和行业解决方案,帮助从实验室走向现实世界,全面加速生命科学数字化创新,我们很高兴与天津工业生物研究所合作,通过云技术和深厚的行业实践,推动合成生物学领域的技术进步,开辟数字化创新之路。生物制造行业的创新之路。”

学川百科 |