“重新编码”基因组的大肠杆菌,在培养基上生长。
在伦敦郊外 Jason Chin 的实验室中,一群大肠杆菌在撒有营养的肉汤的塑料小盘子里快乐地吃喝、幸福地繁殖、自由地呼吸着,它们看上去很普通。但它们与地球上的其他生物有着本质的不同。科学家们对这群大肠杆菌的基因进行了重新编辑,获得了有史以来最广泛的“重新编码”基因组。
Jason Chin 图片来源:MRC 分子生物学实验室
英国剑桥 MRC 分子生物学实验室的 JasonChin 教授与其同事重新编码了一个大肠杆菌菌株的全部基因组,只用 59 个密码子就合成出所有的必需氨基酸。该研究近日发表在《Nature》杂志上。哈佛大学生物学家 George Church 评价说:“这是一个重大的里程碑。”
DOI: 10.1038/s41586-019-1192-5
自然界的密码本
众所周知,虽然自然生物拥有着不同的形态特征,但生物遗传信息却是由同一套的 DNA 遗传密码来传递的。组成 DNA 的核苷酸含有A、T、G、C四种碱基,每含有三个碱基的核苷酸构成一个“密码子”编写一个特定的氨基酸。
排列出 64 种密码子构成生物的基础。然而,一种氨基酸对应的密码子不止一个,如果冗余的同义密码子可以得到替换,那么天然蛋白质的合成就可以通过替换生物体内“多余”密码子来实现。
有史以来最大的基因组合成
JasonChin 教授与其同事创造了一个 4M 字节的合成基因组的大肠杆菌变种。合成基因组优化和重构了编码方案:只需在七个位置进行简单的修正就可以替换基因组中所有已知的两个有意密码子和一个终止密码子。
研究人员重新编码了 18214 个密码子,创造了一个拥有 61 种密码子基因组的生物体。这种生物使用 59 种密码子来编码 20 种基本氨基酸,并能够删除以前必不可少的核糖体 RNA (tRNA)。
如何重新编码?
就像是平时在全文里把特定词组替换成同义词一样,生物体基因组的重新编码也是如此。鉴于生物基因组中拥有庞大的碱基对,为了实现高效替换,科学家们采用了一种巧妙的拆解和替换方法。
他们先把大肠杆菌分解为长度 10kb 左右的小片段。接着找出基因组开放阅读框中的 TAG 密码子,全部替换为同样表达终止的 TAA(一般而言 TAA、TAG 和 TGA 都代表终止信号)。在编码必需氨基酸时,用 AGC 替换了每一个编码丝氨酸密码子 TCG,用 AGT 替换了每一个 TCA (同样编码丝氨酸)。
Chin 把改编过的大肠杆菌称为“Syn61”,因为这些细菌中的三个目标密码子全部被同义密码子取代仅使用了 61 种密码子。伦敦帝国理工学院合成生物学专家 Tom Ellis 在审阅完这篇论文说:“他们创造了一种不使用自然界其他三种密码子的菌株。在未用到全部生物模块的情况下,生命依旧存在。”
值得注意的是,重新编码的基因组可能不受病毒影响。正如 George Church 所说,Syn61 可能不受病毒影响。从制药到食品,每年因病毒感染而造成的工业损失达到数百万美元,重新编码细菌基因组则有望大大降低这一损失。
参考资料:
[1]Totalsynthesis of Escherichia coli with a recoded genome
[2]With a ‘recoded’ bacteria genome made from scratch, scientists give life a newdictionary