合成生物学的概念最早出现于1910年,由法国物理化学家 Stephaneleda首次提出,在他的认知中合成生物学可以归纳为形态和结构的合成,包括形态发生、功能的合成、技能发育的有机体的组成以及有机合成化学等,受制于当时科技水平发展并未得到真正的发展。

随着重组DNA分子、重组质粒和转基因技术的发展使得DNA重组技术日益成熟,以及基因测序技术的发展,利用生物元件构建逻辑线路被成功实践。2000年,Eric Kool重新定义了“合成生物学”,是基于系统生物学的遗传工程,标志着这一学科的真正形成。

作者丨贝壳研究院

合成生物学

合成生物学所要达到的目的是通过生物技术手段构建特定的工具细胞,使其具有生产特定产物的能力。这个技术绕开了自然进化过程缓慢的阻碍,通过人工设计与编写基因组,可以依据特定的需求从模块化的角度来构建元器件,再将这些元器件与自然生物体系进行融合改造和优化,产生可控运行的人工生物体系。

合成生物学的发展大体上经历了四个阶段:

贝壳研究院制图

来源:公开资料

根据合成生物学实现难度高低可以划分为三类:

1、利用现有的天然生物模块构建新的调控网络并表现出新功能;

2、采用从头合成方法人工合成基因组 DNA;

3、人工创建全新的生物系统乃至生命体。

技术的进步对于合成生物学的大规模的应用起到了重要的作用,基因合成、基因编辑、蛋白质设计、细胞设计、高通量筛选等技术的发展对合成生物学的发展有着重要的支撑和推动作用,基因测序、DNA合成以及基因组编辑技术都是其核心使能技术。

技术路径

合成生物学技术路径

来源:《华安证券:合成生物学——属于未来的生产方式》

第一步,需要根据最终产品设计合适的技术路线。

第二步,选择一个合适的底盘细胞,作为产品生产的宿主细胞。

第三步,运用DNA合成、基因编辑等技术对宿主细胞的代谢路径进行改造。

第四步,对得到的宿主细胞进行筛选、优化,提高其耐受性并优化代谢路径。

第五步,发酵工程。

第六步,产品的回收和纯化。

底层技术

贝壳研究院制图

来源:公开资料

►►►

基因测序技术

基因测序技术已经从第一代发展至第三代,利用这一技术能加速发掘功能基因,可以用于制造合成生物学中使用的生物元器件。

贝壳研究院制图

来源:公开资料

一代测序

一代测序技术又称Sanger测序,其原理是利用了双脱氧核苷酸会终止PCR的原理,在合成DNA链的反应中掺杂与4种单脱氧核苷酸(dNTP)相对应的双脱氧核苷酸(ddNTP),通过ddNTP与dNTP竞争参与反应而中断DNA合成,使新合成的DNA链终止在不同的碱基位置,生成与模板DNA链序列互补的一系列长度不同的DNA片段。最后将制得的混合物通过电泳分离,经放射性自显影后,根据片段3’端的ddNTP依次阅读合成片段的碱基排列顺序。

二代测序

二代测序技术主要以Roche 公司的 454、Illumina公司的 Solexa和ABI公司的SOLID为代表。三家公司使用的测序技术细节有所不同,但大致步骤上可以划分为下列几步:1、将DNA进行打断,对两端修饰后加上接头序列。2、对DNA片段进行扩增。3、上机测序。

Roche 公司的 454测序时,放置在四个单独的试剂瓶里的四种碱基,依照 T、A、C、G 的顺序依次循环进入 PTP 板,每次只进入一个碱基。如果发生碱基配对,就会释放一个焦磷酸盐 (inorganic pyrophosphate, PPi) 分子。PPi 在ATP硫酸化酶的催化下与腺苷酰硫酸反应生成 ATP,ATP 与虫萤光素反应发光,光信号的最大波长约为 560 nm,此反应释放出的光信号实时被仪器配置的高灵敏度 CCD 捕获到。有一个碱基和测序模板进行配对,就会捕获到一分子的光信号,由此一一对应,就可以准确、快速地确定待测模板的碱基序列,读长可达到近 500 bp。

Illumina公司Solexa的反应与Sanger法类似,加入用4种不同荧光标记并结合了可逆终止剂的 dNTP。DNA 簇与单链扩增产物的通用序列杂交,由于终止剂的作用,DNA 聚合酶每次循环只延伸一个 dNTP。每次延伸所产生的光信号被标准的微阵列光学检测系统分析测序,下一次循环中把终止剂和荧光标记基团裂解掉,然后继续延伸 dNTP,实现了边合成边测序技术。

ABI公司SOLID在连接测序中,底物是 8 个碱基的八聚体单链荧光探针,在5′末端分别标记了CY5、Teaxs Red、CY3、6-FAM这四种颜色的荧光染料。

8聚体引物示意图

来源:《Next Gen SOLiD DNA Sequencing Method Explained》

3′ 端的第1、2位碱基类别排序分别对应着一个固定的荧光染料,第3、4、5位碱基“n”是随机碱基,第6、7、8位碱基“z”是可以和任何碱基配对的特殊碱基。一次测序中包括了五轮连接反应。每轮连接反应首先是由3个碱基“n”介导,将八聚体连接在引物上,测序仪记录荧光染料信号,然后断裂掉碱基“z”,准备连接下一个八聚体。

测序示意图

来源:《Next Gen SOLiD DNA Sequencing Method Explained》

一次循环后,将引物重置,进行第二轮连接反应,反应位置比前一轮错开一位,这样引物上的每个碱基都会有两次与第1、2位的相连接,显著减小了测序误差。

三代测序

三代测序技术通过单分子测序的技术,相比二代测序免去了PCR扩增的步骤,减少了错误引入。目前主流的三代测序平台为Helicos公司的HeliScope,Pacific Biosciences公司的SMRT和Oxford Nanopore公司的纳米单孔分子。国内从事三代测序仪研发生产的公司有深圳市真迈生物科技有限公司。

目前国内能够提供的测序业务主要以二代测序为主,企业都是通过购买Roche 、Illumina或Solexa的测序仪来实现的。在测序仪制造方面国内厂商华大智造已经于2019年9月完成首台超高通量基因测序仪的交付商用。

►►►

DNA合成技术

DNA化学合成法是当前主流的商业化合成方法,经历了从柱式合成到芯片合成的变革发展,并得到了广泛的市场化应用,在合成生物学中将会大量用到高通量DNA合成技术。

贝壳研究院制图

来源:公开资料

1、柱合成法

柱合成法主要用于生产Oligo即寡核苷酸链,根据功能不同,可以在Oligo上修饰荧光基团、化学基团(如羧基、氨基、巯基等)等,分子实验室常用的PCR引物、NGS捕获探针、qPCR探针和FISH探针等都是Oligo。技术相对成熟,目前亚磷酰胺法是商业化Oligo合成的主流方法。

柱合成法原理图

来源:《DNA合成、组装与纠错技术研究进展》

2、芯片合成法

芯片合成法其实是一种大规模集成的固相杂交,是指在固相支持位上原位合成寡核苷酸或者直接将大量预先制备的DNA探针以显微打印的方式有序地固化于支持物表面,然后与标记的样品杂交。

目前有3种成熟的技术路线,分别是喷墨法、光化学法和电化学法。

喷墨法:技术形式上和喷墨打印机类似。用于打印生物芯片的墨盒里,用带保护基团的A、G、C、T四种碱基底物代替了墨水。打印过程中按照设计的探针序列,依次将含有四种碱基底物的小液滴,打印在指定的位置上。碱基在连接延伸过程中要经过脱保护基团、偶联、氧化三个步骤,原理基于成熟的固相亚磷酰胺三酯法。Twist的硅基DNA合成平台能够在一次运行中生产100百万条独特的单链DNA。

光化学法:采用的技术原理是在合成碱基单体的5'羟基末端连上一个光敏保护基。首先使支持物羟基化,并用光敏保护基团将其保护起来。每次选取适当的蔽光膜(mask)使需要聚合的部位透光,其它部位不透光。

这样,光通过蔽光膜照射到支持物上,受光部位的羟基脱保护而活化。因为合成所用的单体分子一端按传统固相合成方法活化,另一端受光敏保护基的保护,所以发生偶联的部位反应后仍旧带有光敏保护基团。因此,每次通过控制蔽光膜的图案(透光与不透光)决定哪些区域应被活化,以及所用单体的种类和反应次序就可以实现在待定位点合成大量预定序列寡聚体的目的。使用多种蔽光膜能以更少的合成步骤生产出高密度的阵列,在合成循环中探针数目呈指数增长,可使一张芯片上合成多达500,000 个寡核苷酸。

电化学法:是在半导体硅片上接入大量 Pt 电极,同时在 Pt 电极周围形成虚拟的圆筒形负极,从而形成一个虚拟的圆筒形反应室,Oligo 的合成即在此虚拟的反应室中进行,每张芯片上有大量这样的虚拟反应室。在芯片上(一般为12,000或者90,000个合成池,即可同时合成12,000或者90,000个DNA的芯片),按照软件设计的DNA序列,合成一定长度的DNA,由待合成引物的3'端向5'端合成,相邻的核苷酸之间通过3'→5'磷酸二酯键连接,由此合成所需要的DNA/RNA。

3、 酶促合成法

酶促合成法的技术选择将末端脱氧核苷酸转移酶(TdT)与dNTP通过连接子连接,所得dNTP-TdT交联体可在10-20s的时间完成DNA链的延伸,Molecular Assemblies公司是首个将该技术推到早期商业化的公司。

酶促合成法原理示意图

来源:《DNA合成、组装与纠错技术研究进展》

目前的DNA合成市场主要以成熟的柱合成法为主,主要原因是柱合成法技术成熟,且能够提该技术的公司众多,而对于芯片合成,目前市场的需求并不强烈,加之其具有较高的技术壁垒目前能提供芯片合成的公司并不多。

目前在国内,金斯瑞通过收购customarray进入芯片合成DNA市场可以提供高通量合成服务,泓迅生物通过自研目前能够提供芯片合成服务,原合生物和迪赢生物目前具有芯片合成的相关技术储备,但还未能提供合成服务。随着合成生物学的发展对于DNA的需求将会大幅增长,未来DNA芯片合成将会成为主流。

►►►

基因编辑技术

基因组编辑技术是一种能够定向修改基因序列的强有力工具,在合成生物学中有着广泛的应用,包括以ZFN和TALEN为代表的早期基因组编辑技术,以及新型CRISPR/Cas9基因组编辑技术。

贝壳研究院制图

来源:公开资料

锌指核酸酶ZFN技术

锌指核酸酶(ZFN)是人工改造的限制性内切酶,由锌指蛋白和FokⅠ内切酶两部分组成,前者是拥有特异性识别的DNA结合域,用来确定靶点,后者是进行非限制性内切酶功能的DNA剪切域。通过ZFN将DNA双链断开后,细胞内的非同源末端(NHEJ)修复系统和同源重组(HR)修复系统会自动修复。非同源末端(NHEJ)修复系统可能产生随机插入和(或)缺失,引起移码突变,实现基因敲除,而同源重组(HR)修复,会使基因组DNA修复或者在切割部位发生基因替换。

ZFN原理示意图

来源:《Genome Engineering With Zinc-Finger Nucleases》

TALEN技术

TALEN技术的作用机制与ZFN类似,也是由特异性识别目标序列的TALE蛋白和介导切割的FokⅠ内切酶两部分组成。相较于ZFN技术,TALEN技术设计更简单,特异性更高。因其蛋白结构可以特异性识别A、T、G、C这4种碱基的一个或多个。

TALEN原理示意图

来源:《TALE and TALEN genome editing technologies》

CRISPR / Cas9技术

CRISPR / Cas9技术是最新出现的一种由RNA指导的Cas9核酸酶对靶向基因进行编辑的技术。CRISPR/Cas9是细菌和古细菌为应对病毒和质粒不断攻击而演化来的获得性免疫防御机制。在这一系统中,crRNA(CRISPR-derived RNA)通过碱基配对与tracrRNA(trans-activating RNA)结合形成双链RNA,此tracrRNA/crRNA二元复合体指导Cas9蛋白在crRNA引导序列靶定位点切断双链DNA。

CRISPR原理示意图

来源:《基因组编辑技术及其在合成生物学中的应用》

在合成生物学标准化以及模块化发展过程中,CRISPR系统发挥着重要作用:能够精准转录调控,被广泛应用于基因动态过程的调控以及细胞命运的操纵;介导微生物基因编辑,对特定基因或者同时对合成通路里的多个基因进行编辑,达到改良菌种的目的;在活细胞中动态更改遗传信息,并利用基因组DNA强大承载力对信息进行存储。ZFNs和TALENs方法因为其构建复杂,开发周期长,成本高等原因,已被CRISPR系统替代。

►►►

菌种筛选技术

主要采用适应性实验室进化(Adaptive laboratory evolution,ALE) 手段实现,微生物为了适应高抑制剂的环境会产生一系列基因型的变化来适应外界胁迫压力。因此将菌种暴露在抑制剂胁迫环境中,可以得到既能耐受不利的生长环境,又能在有利的培养条件下快速生长的微生物菌株。

衡量菌种性能的关键指标有三个:

1、比生产率:越大越好,单位输入条件下生产产品的产量。

2、维持因素:越小越好,维持基础代谢所消耗的基质和氧指标。

3、比生长率:越大越好,缩短生长周期,提高周转率。

ALE流程示意图

来源:《适应性实验室进化技术在微生物育种中的应用进展》

目前国内弈柯莱生物、恩和生物和衍进科技在菌株筛选方面都有布局,常用的菌株有大肠杆菌、毕赤酵母等。弈柯莱生物通过AI辅助设计和自动化筛选平台,可以实现优化基因路线、加速菌株的性能优化。

►►►

技术路径设计

由启动子、阻遏子、增强子等调节元件及被调节基因构成的遗传装置,同时也是生命体对自身生命过程控制的动态调控系统。人工基因线路通过遗传线路工程合成,主要分为基本型和组合型两类:

基本型:依据生物学知识,借鉴电路的逻辑控制原理,设计并构建基因开关、放大器、振荡器、逻辑门、计数器等合成器件。

组合型:以基本型人工基因线路作为基本元件搭建而成的用于模拟高级生命过程的遗传装置。

►►►

DNA元件库

是指将天然存在的基本DNA功能片段,如启动子、核糖体结合位点、增强子、定位信号、功能基因和终止子等进行优化,确定动力学模拟参数及载体、宿主背景,在各元件头尾两端加上特定的酶切位点,并采用统一的描述与分类方法使之标准化。

►►►

底盘细胞

底盘细胞是合成生物反应发生的宿主。由于细胞的复杂性,嵌入的合成装置或系统可能受到细胞原有无关代谢过程的影响,主要的应对策略是删除一些非必要基因。此举的另一个好处是减少细胞中其他代谢过程对于能量的消耗。

实际构建中,还需要根据需求对底盘细胞进行改造,包括嵌入、替换或删除一些基因或者基因模块。常见的底盘细胞有大肠杆菌、枯草芽孢杆菌、酵母菌等。

►►►

发酵工艺

发酵属于合成生物学的应用层,一般泛指利用经过改造筛选后的微生物制造工业原料或产品的过程。由微生物(细菌、酵母等)、培养基和反应器在一定的温度和pH等条件下进行。生产规模上发酵体积每增加10倍,生产成本下降37%-60%。大规模发酵罐需要机械搅拌以保证基质、氧气和热量的均匀分布,同时需要防范发酵过程中的染菌风险。

►►►

分离提纯

提纯是将所需要的产物从发酵液中分离出来的过程,也称后处理。主要包括细胞破碎,分离,醪液输送,过滤除杂,离子交换电渗析,逆渗透,超滤,凝胶过滤(层析),沉淀分离,溶媒萃取,蒸发,结晶,蒸馏,干燥包装等过程和单元操作。

目前,该技术相对成熟。

应用场景

随着合成生物学在理论和技术上不断取得突破,叠加其绿色环保、能耗少成本低的优势,合成生物学的应用领域不断拓宽,涉及生物医药、食品、农业等领域,成为当之无愧的生命科学利器。

生物医药领域:合成生物学通过设计全新的细胞内代谢途径,让微生物细胞利用廉价的糖类为原料生产出所需的医药产品。

美国Amyris公司在2013年利用微生物合成青蒿素前体;

定向改造细菌应用于早期癌症和糖尿病诊断;

改造酵母菌用于生产吗啡等止疼药前体。

食品领域:通过对营养物质表达基因的研究,采用人工元件对合成通路进行改造,制造出能够生产特定食品原材料的细胞,可以大幅降低食品生产周期和成本。

Impossible Foods改良酵母菌种使其产生大豆血红蛋白用于人造肉的生产;

通过合成生物技术还可以制造调味剂、甜味剂等。

化学及能源领域:利用合成生物学对菌种进行改造,使其具备生产化工原料的能力。与传统的原油合成路径相比,对于环境更加友好且成本更低。

凯赛生物通过合成生物学技术研发出DC10菌种,用于生产长链二元酸。

20N Labs公司拥有有机物合成的开源平台,生物合成对乙酰氨基酚、对氨基酚和对氨基苯甲酸。

农业领域:合成生物学在农业领域主要通过转基因技术实现,增加农作物的产量,提高耐虫害的能力。

Pivot Bio公司利用合成生物学方法重塑KV137基因组,使其表达固氮相关基因,进而开发了基于γ-变形杆菌( KV137)的玉米生物肥料PROVEN。

敬请期待:《合成生物学:当之无愧的什么科学利器(下)》

参考资料:

《合成生物学》,李春

《华安证券:合成生物学——属于未来的生产方式》

《基因组编辑技术及其在合成生物学中的应用》

《适应性实验室进化技术在微生物育种中的应用进展》

《中国合成生物学发展回顾与展望》