风君子博客4月3日消息,近日,中国科学院天津工业生物技术研究所(以下简称天津工业生物所)与亚马逊云科技联合在天津举办“生物计算设计”沟通会,就生物技术与信息技术(BT+IT)结合助力合成生物学发展的现状和未来进行沟通交流。

早在2019年天津工业生物所成立了生物设计中心平台实验室,并围绕生物计算设计开始与亚马逊云科技共同探索生物技术和信息技术(BT+IT)相结合的技术体系,以进一步推动合成生物学发展,以期能够为在健康、能源、农业和环境等领域的科学研究提供技术支撑。至今已推出了全球首个基于图数据库的大肠杆菌调控代谢关系知识图谱ERMer和全流程高通量编辑序列设计云平台AutoESD等20多项生物计算设计网站工具。基于无服务器技术的云原生的开发方式较传统方式大幅缩短开发时间,总体运行成本大幅降低,使得团队可以专注于业务代码和创新。

基于图数据库的大肠杆菌调控代谢关系知识图谱ERMer

细胞中的代谢调控非常复杂,一个特定的细胞功能往往由一系列不同类型的代谢途径调控相互作用决定。例如,氨基酸的代谢通常由不同类型的相互作用组成的反馈或前馈回路来调节。由于缺乏对这些调控关系的全局性认识,对细胞进行代谢重塑时常触发胞内复杂调控而无法达到预期目标,这是目前细胞工厂构建中的存在的共性问题。

通常不同类型的调控数据散落在各个不同的数据库,生物学家很难通过仅关注与所研究的代谢物/蛋白质密切相关的一两类相互作用来识别这种复杂调控级联关系。因此,将这些不同类型的调控相互作用汇集在一起,并提供方便的交互方式,将极大的方便生物学家挖掘和理解生物体内的复杂调控关系。

对于这样的需求,传统的关系型数据库往往只能以非直接的方式来表示数据之间的关系,识别这种类型的复杂调控级联关系需要额外操作步骤且效率不高。相比之下,图数据库更适合这类异质性数据的管理和处理复杂查询。

中科院天津工业生物所携手亚马逊云科技推动生物计算设计领域发展-冯金伟博客园

天津工业生物所生物设计中心团队联合亚马逊云科技团队在计算生物学国际期刊Nucleic Acids Research上发表文章,发布了全球首个基于图数据库Amazon Neptune的大肠杆菌调控代谢关系知识图谱ERMer。ERMer实现了多种复杂调控级联或模式的快速检索和可视化,让科研人员能够以交互式、无需编程的方法探索完整的大肠杆菌调控图谱。例如用户可以通过指定代谢物-基因、最大搜索长度、最短或最全搜索方法,快速得到所有调控链路,有助于用户发现新的调控模式以及一些潜在的代谢工程靶点(调控策略)。
这打破了传统的低效数据检索方式,有效增强用户和图谱的人机交互,大大降低了使用门槛。

为充分发挥知识图谱的价值,生物设计中心团队进一步基于图神经网络技术进行推理,以实现转录因子预测和转录因子靶点预测等功能,这将有助于挖掘潜在的关键调控因子和调控靶点,构建新的调控代谢网络,为研究人员提供新的思路和方向。

基于云原生Serverless应用架构开发的AutoESD云平台 实现自动化和高通量的编辑序列设计

模块化、标准化,是所有工程学科的基础,也是合成生物学与传统代谢工程的主要区别。工程学的可控性,意味着其将能够与各种软硬件进行结合,从而走向自动化与高通量,摆脱过往劳动密集型的研究模式,获得更高的技术迭代能力。而对于这个过程,除了针对元件工具以外,将合成生物学的相关实验流程进行模块化、标准化,也是自动化研究当中不可或缺的一环。

中科院天津工业生物所携手亚马逊云科技推动生物计算设计领域发展-冯金伟博客园

面向大批量微生物遗传操作,天津工业生物所生物设计中心团队开发得到了第一个能够支持多种操作类型、任意基因组位点和跨物种进行精确、自动化和高通量编辑序列设计的云平台AutoESD。

通过对遗传操作技术的模块化解构与标准化处理,AutoESD实现了全流程、自动化的编辑序列设计,支持多种基于筛选标记的同源重组技术变种,理论上支持所有基因组序列已知的微生物,并可以在单批次任务中处理针对不同目标序列(CDS 或基因间区域)的多种类型的遗传操作(敲除、插入和替换)。用户仅需要在网站界面,选择参考基因组和遗传操作技术,上传目标操作序列与用户自己的载体和筛选标记序列,AutoESD即可自动实现编辑序列设计供用户下载,并可通过网站进行可视化分析。此外,AutoESD还提供失败任务原因分析、同源序列脱靶风险评估等功能,用户可以根据这些结果,更改默认的参数,进行优化再设计。

AutoESD 的开发采用了基于云端的无服务器架构,确保了高可靠性、稳健性和可扩展性,能够在几分钟内并行处理包含上千个编辑序列设计目标的数百个设计任务。开发人员利用Amazon Step Functions实现可视化的工作流管理,实现了编辑序列设计工作流的串联,从而实现应用的快速构建和更新,同时快速查询处理异常任务;利用Amazon Lambda无服务计算将不同的引物设计、同源臂设计等编辑序列设计模块封装打包,满足了具体功能的模块化开发要求,并方便地对功能模块进行管理和共享;利用Amazon DynamoDB提供毫秒级的动态资源响应性能,并自动扩展所需资源以应对增加的业务需求。这些Serverless服务帮助天津工业生物所团队进一步简化运维,使得开发人员可以专注于业务代码和创新,与传统开发方式相比,开发时间缩短了75%,总体拥有成本降低50%。

未来,天津工业生物所团队希望基于亚马逊云科技先进的服务技术和能力,开展更多“BT+IT”的研发工作,进一步助力研究所在合成生物领域的科研探索。此外,也期望通过亚马逊云科技的全球科研领域辐射能力,提升天津工业生物所生物计算设计方面的国际影响力,为世界各国的合成生物学科研工作者提供优质服务。

天津工业生物所生物设计中心主任马红武表示:“中国科学院天津工业生物技术研究所肩负着国家工业生物技术发展的重任,并正在加速利用云计算推动相关技术的研发和成果落地。亚马逊云科技提供的图数据库和Serverless服务,突破传统的开发模式、提升研发效率、不断优化云上成本,生物技术和信息技术相结合的技术体系将进一步推动合成生物领域的发展和创新。”

亚马逊云科技中国区商用与公共市场事业部总经理李晓芒表示:“亚马逊云科技为全球数千家生命科学领域客户提供云服务和行业解决方案,助力从实验室到真实世界,全面加速生命科学数字化创新。我们很高兴能够与天津工业生物所一道,通过云技术和深厚的行业实践推动合成生物学领域的技术进步,开拓生物制造产业的数字化创新路径。”