在大肠杆菌中高效表达外源蛋白的策略
2007-10-24 22:49:13   来源:本站原创   评论:0 点击:

翻译水平的调控
1.mRNA翻译起始
有关转录过程的大量知识使得能够在不被附近核苷酸序列影响的情况下,在表达盒中使用原核启动子[87]。对于决定蛋白质合成的起始因素,虽然尚不能完全弄清楚,但目前已经明白,mRNA转录本5’末端的独特结构是mRNA翻译起始效率的最主要决定因素。至今还没有发现通用的有效起始翻译的共同序列。已知序列的绝大部分(91%)E.coli基因的翻译起始区均含有起始密码子AUG,GUG的利用率为8%,而UUG的利用率则为1%[88,89]。Shine-Dalgarno(SD)位点在翻译起始阶段与16S rRNA的3’端相互作用。SD与起始密码子间的距离约为5-13bp,这一距离影响翻译起始的效率[90]。人们对此进行了深入的研究,以确定最佳的SD区序列和SD与起始密码子之间的最有效间隔[91,92]。Ringquist等[93]研究了RBS的翻译功能,得出了以下结论:(1)在间隔相同的情况下,UAAGGAGG的SD序列比AAGGA的SD序列能使蛋白质的产量提高3­­-6倍;(2)对于同一SD序列,存在一最佳的间隔。AAGGA的间隔为5-7个核苷酸,而UAAGGAGG的间隔为4-8个核苷酸;(3)对于同一SD序列,有一翻译所必需的最小间隔。AAGGA的最小间隔为5个核苷酸,而UAAGGAGG的最小间隔为3-4个核苷酸。这些间隔提示,在16S rRNA的3’末端和结合于核糖体P位点的fMet-tRNAf的反义密码子之间存在精确的物理关系。
在mRNA的翻译起始区的二级结构在决定基因表达效率方面具有重要作用[94,95,96]。如用一发卡结构封闭SD区和/或AUG密码子就会阻止其与30S核糖体亚单位的结合,从而抑制翻译[97]。已经设计了几种不同的策略以使mRNA形成二级结构的可能性最小。提高RBS中A、T残基的丰度能增强某些基因的表达[98]。同样地,突变SD区上游或下游的某些特定核苷酸就会抑制mRNA二级结构的形成和提高翻译效率[99]。另一途径得益于在E.coli中自然发生的一种翻译偶联现象[100]。翻译偶联的机制已被用来解释来自多顺反子mRNA的不同基因的并列表达。已经证明,当galK与上游基因偶联翻译时,经修饰的gal强启动子能够指导半乳糖激酶的高水平合成。这提示即使很弱的RBS,如果与核糖体结合也能非常有效。这种调节机制有可能在蛋白质超量生产生物技术中发挥重要作用。事实上,翻译偶联已经被广泛用于不同基因的高效表达。
除了SD区与16S rRNA结合之外,mRNA和核糖体的其他相互作用也参与翻译的起始。如核糖体S1蛋白直接参与30S亚基对mRNA的识别和结合[101]。
2.翻译增强子
     已经在细菌和噬菌体中鉴定了一些在E.coli中显著增强异源基因表达的序列。Olins等从T7噬菌体基因10前导序列( g10-L)中鉴定了一9bp的序列,该序列似乎能替代有效的RBS。同SD共有序列相比,g10-L能使多种基因的表达水平提高40-340倍[102]。若将其置于合成SD序列的上游,按照β-半乳糖苷酶的活性与LacZ mRNA的水平来估计,g10-L序列能使 LacZ的翻译水平提高110倍[103]。另外的研究小组在mRNA的5’非翻译区(UTR)鉴定了一U富含序列,该序列同样具有翻译增强子活性。McCarthy等[104]在 E.coli atpE基因中紧接于SD位点下游鉴定一类似区域。有文献用一30bp的序列超量产生IL-2和IFN-β[105]。另有人证明在编码RNase D的rnd mRNA SD位点的上游,有一U8序列对该mRNA的有效翻译是必需的。缺失这一区域会显著降低翻译,但不影响rnd mRNA的水平和转录起始位点[106]。研究证明这些类似序列的靶位是30S核糖体亚单位的S1蛋白[107]。在另一项有趣的研究中,研究者证明在紧接起始密码子下游的序列在翻译起始过程中发挥重要作用。位于T7基因0.3编码区+15至+26之间或位于T7基因10编码区+9至+21之间被称做下游框(DB)的特定区域具有翻译增强子的功能。DB区与16S rRNA的1469-1483核苷酸互补,这一区域称做反下游框(ADB)。缺失DB将废除翻译活性。相反,如果优化DB和ADB之间的互补则会以最高水平表达dhfr融合基因。有趣的是,如果将DB从起始密码子的上游移到SD序列的位置,DB则失去功能。DB序列存在于一些E.coli和噬菌体基因中[108,109]。


上述这些发现充分证明,除了SD位点和起始密码子以外,mRNA中的其他序列对于有效的翻译也是重要的。尽管其精确的机制还不太清楚,但有可能利用翻译增强子来达到超量表达蛋白质的目的。
3.mRNA的稳定性
     mRNA的快速降解势必影响蛋白质的产生。因此在这一部分重点阐述决定mRNA稳定性的因素,这将在E.coli高效表达外源基因中有实际应用。在E.coli中有多种不同的RNase参与mRNA的降解,其中包括内切核酸酶(RNase E, RNase K和RNase III)和3’外切核酸酶(RNase II和多聚核苷酸磷酸化酶[PNPase]),目前尚未在原核细胞中发现5’外切核酸酶[110]。mRNA的降解并非由非特异性的外切核酸酶随机剪切而引起,因为在mRNA的长度和半衰期之间并没有反向相关性[111]。已经证明,在E.coli中有两类保护性元件能够稳定mRNA。一类由mRNA的5’UTRs中的序列组成[112];另一类由3’UTRs和多顺反子间区的发卡结构组成[113]。其中一些元件与异源mRNA融合后起稳定剂作用,但只在严格的条件下如此。例如,噬菌体T4基因32的5’UTR在T4噬菌体感染的细胞中延长非稳定mRNA在E.coli中的半衰期[114]。革兰氏阳性菌如金黄色葡萄球菌和枯草杆菌的红霉素抗性基因(erm)编码的mRNA 5’UTR含有稳定元件。但ermC和ermA 5’UTRs的稳定作用需要由抑制翻译和引起核糖体失控的抗生素来诱导[115]。同样,噬菌体λPL对于λPL-trp转录本的稳定作用需要λ噬菌体的感染[116]。与此相反,E.coli ompA转录本能够在细胞快速增殖的正常情况下延长一系列异源mRNA在E.coli中的稳定性[117]。Emory等证明,在接近或紧接ompA 5’UTR的5’末端存在发卡结构对于其稳定效果是必需的。而且可以通过在5’末端添加发卡结构来延长在正常情况下不稳定的mRNA的半衰期[118]。这样看来,对异源基因添加ompA 5’稳定元有可能提高E.coli中的基因表达。另一类由3’UTR组成的mRNA保护性元件能够形成发卡结构,因而能够阻断外切核酸酶从3’末端对转录本的降解[113]。Wong和Chang[119]在苏云金杆菌的晶体蛋白基因的转录终止子中鉴定了一个这样的元件。将该“阳性反调节子”与地衣杆菌的青霉素酶基因(penP)的3’末端和人IL-2 cDNA融合,能够延长mRNA的半衰期,且提高了相应多肽在枯草杆菌和E.coli中的产量。然而,同某些5’稳定元一样,这类3’反向调节子不可能作为一个通用的mRNA稳定元。而且有证据表明,可以通过选用缺乏某些特定RNase如RNaseII或PNPase的宿主菌来提高基因的表达。这同样并非一有效途径。因为缺乏RNaseII或PNPase与RNase过量表达一样,对于E.coli整体mRNA的平均半衰期并无多大影响。而且缺乏RNaseII或PNPase的菌株常常是不稳定的[120,121]。
    4.翻译终止
 在mRNA中存在终止信号是翻译终止过程必不可少的。除了三个终止密码子UAA、UGA、
和UAG外,翻译终止这一复杂事件还包括核糖体、mRNA和终止位点的几种释放因子的特异相互作用[122]。在E.coli中,RF-1在终止密码子UGA处终止翻译;RF-2在UAA密码子处终止翻译[123]。最近还克隆了另外一个因子RF-3[124]。
在设计表达载体时,通常插入三个终止密码子以防止核糖体的跳跃。在E.coli中偏向于使用UAA密码子[125]。一项对于2000多个E.coli基因的统计分析表明,在终止密码子和紧接三联体的核苷酸序列中存在局部非随机性[126]。同时他们还利用体内终止试验测定12个可能的四核苷酸“终止信号”(UAAN、UGAN、UAGN)的终止力量。在体内终止试验中,通过其与框架移位的竞争测定其终止效率。转录效率依据终止密码子和第四个核苷酸而有显著的差异,这种差异从80%(UAAU)到7%(UGAC)不等。这些研究表明,紧接终止密码子后的核苷酸特性强烈地影响E.coli中的翻译终止效率[127]。UAAU是E.coli中最有效的转录终止序列。此外,终止密码子5’末端的邻近序列也影响终止的效率。因此,新生肽中倒数第二位(-2位)C-末端氨基酸残基的电荷和疏水性能引起多达30倍不同的UGA终止效率,而在UAG位的终止对于-2位氨基酸残基的特性不敏感[128]。对于-1位,α-螺旋、β-链和回转倾向是UGA终止中的决定因素[129]。
 
蛋白质靶向
   确定将目的蛋白表达在特定的细胞室,即细胞质、细胞间质或是培养基中,需要权衡各自的利弊。
1.细胞质表达
包涵体的形成仍然是在细胞质中进行基因表达的一个主要障碍。包涵体虽然具有多方面的好处,但这些优越之处与后期繁琐的蛋白重新折叠工作、重叠蛋白的生物活性的未知性以及重叠和纯化后蛋白的总产量降低相比,则显得微不足道。至今尚不明了包涵体形成的精确机制。对于形成和不形成包涵体的81种蛋白质的统计学分析表明,有6个主要的理化指标与此有关。这6个指标是电荷平均数、转变形成的残基组分、半胱氨酸组分、脯氨酸组分、亲水性和残基总数。其中前两个指标与包涵体形成密切相关。一种基于这些指标的模型可以根据某种蛋白质的氨基酸组成来预测包涵体形成的可能性。该模型曾成功地预测人T细胞受体Vβ5.3在E.coli中的可溶性[130] 。


已经建立了多种策略以帮助蛋白质天然空间结构的形成[131]。这些策略包括在较低温度下培养细菌[132],选择不同的E.coli菌株[133],替换某些氨基酸残基[134],与分子伴侣共表达[135,136,137],利用高溶解性的多肽作为共表达分子[138],在山梨糖醇和甘氨酸三甲内盐存在时,以低渗透压培养和诱导细胞[139],改变培养基的pH值[140]。与分子伴侣共表达或许是一种有望提高蛋白质可溶性和折叠效率的途径[141]。但这种策略似乎具有蛋白质特异性[142]。即便在分子伴侣存在的条件下,仍有多种因素使得过量表达的蛋白不能折叠成其天然构象。这些因素包括缺乏二硫键和/或翻译后修饰;细胞质的氧化还原状态妨碍了二硫键的形成。在E.coli中,有两条途径参与二硫键的还原。即硫氧还蛋白系统,该系统由硫氧还蛋白还原酶和硫氧还蛋白组成;谷氧还蛋白系统,该系统由谷胱甘肽还原酶、谷胱甘肽和三种谷氧还蛋白组成[143]。制造次还原细胞质环境,以利于二硫键形成的策略包括选用硫氧还蛋白还原酶(trxB)缺陷的E.coli菌株,这有助于巯基还原势能。
蛋白质在细胞质中被降解的可能性比其他细胞室要大得多。因为在细胞质中含有大量的蛋白酶。另外,从细胞质蛋白混合物中纯化目的蛋白相对比较困难,因为在此细胞室包含总细胞蛋白的绝大部分蛋白[144]。
2.细胞外周质表达
在细胞外周质进行蛋白质表达有许多优越之处。在外周质只有4%的总细胞蛋白,这显然有利于目的蛋白的纯化,外周质的氧化环境有利于蛋白质的正确折叠,在转移到外周质的过程中,信号肽在细胞内剪切更有可能产生目的蛋白的天然N-末端。此外,外周质中的蛋白质降解也少得多[145]。蛋白质通过内膜转运到外周质需要信号肽[146,147,148]。许多原核和真核细胞来源的信号肽已成功地用于Ecoli中蛋白质从内膜到外周质的转运。如E.coli的PhoA信号[149]、OmpA[150]、OmpT[151]、LamB和OmpF[152]以及金黄色葡萄球菌的A蛋白[153],鼠RNase[154]和人生长激素信号肽[155]等。但是,蛋白质转运到细菌外周质是一个特别复杂和尚未完全明了的过程,信号肽的存在并不总能保证有效的蛋白质通过内膜转运[156]。改善蛋白质转运到外周质的策略包括提供蛋白质转运和加工所需的成分:过量表达信号肽酶I[157],利用prlF突变株[158],共表达参与膜转运的几种蛋白质,降低蛋白质的表达水平以防止转运工具的过载[159]。
3.  细胞外分泌(外泌)
 将蛋白质分泌到细胞外是人们最期望的一种策略。因为这样容易纯化目的蛋白质,减少细菌的蛋白酶对目的蛋白质的裂解。但是,E.coli在正常情况下只有很少量的蛋白质分泌到细胞外。要解决蛋白质外泌方面的难题,必须弄清E.coli的分泌途径。Pugsley[160]对革兰氏阴性菌的分泌途径进行了详细的研究。在E.coli中将蛋白质分泌到培养基中的方法大致分为两类:(1)利用已有的“真正”的分泌蛋白所采用的途径[161];(2)利用信号肽序列、融合伴侣和具有穿透能力的因子。第一种方法具有将目的蛋白质特异性分泌的优点,并最小限度地减少了非目的蛋白的污染。最突出的例子是溶血素基因,该基因曾被用于构建分泌的杂交蛋白[162,163];第二种方法依赖于有限渗透的诱导而导致蛋白质的分泌。例如应用pelB[164]、ompA[165]和A蛋白引导序列[153,166];与细菌素释放蛋白的共表达[167];丝裂霉素诱导的细菌素释放蛋白和在培养基中添加甘氨酸[168]以及与kil基因共表达而进行膜穿透[169]。但通常情况下,外泌蛋白质的产量是中等的。有文献报道[170],在大肠杆菌表达系统中,金黄色葡萄球菌A蛋白的信号肽能引导带有E结构域的A蛋白片段或融合产物从细胞质外泌到培养基中,蛋白的外泌表达发生于细胞生长后期。但所用的启动子为A蛋白自身的启动子,该启动子在大肠杆菌中为非可控性的组成性表达,且强度较弱。如果能利用可控的强启动子进行A蛋白信号肽引导的基因表达,则有望在蛋白质外泌方面有所突破。目前我们正在进行这方面的尝试,且已经取得初步成效。
 
 密码子的使用
   原核和真核生物的基因对同义密码子的使用均表现非随机性[171,172]。对E.coli中密码子的使用频率进行系统分析得到以下结论[173]:(1)对于绝大多数的简并密码子中的一个或两个具有偏好;(2)某些密码子对所有不同的基因都是最常用的,无论蛋白质的含量多少,例如CCG是脯氨酸最常用的密码子;(3)高度表达的基因比低表达的基因表现更大程度的密码子偏好;(4)同义密码子的使用频率与相应的tRNA含量有高度相关性。这些结果暗示,富含E.coli不常用密码子(表1)的外源基因有可能在E.coli中得不到有效表达。已经证明[174],微精氨酸tRNAArg(AGG/AGA)是多种哺乳动物基因在细菌中表达的限制因子。因为AGA和AGG在E.coli中不常用。如果共表达编码tRNAArg(AGG/AGA)的argU(dnaY)基因,就会高水平表达目的蛋白[174]。但利用同方法所进行的另外几项研究的结果却不一致[175,176]。其他的研究表明,通过用常用密码子替换稀有密码子或与“稀有”tRNA基因共表达可以提高外源基因在E.coli中的表达水平[177,178]。许多研究者对有关密码子使用模式的进化意义和密码子使用效果的机制进行了研究,但至今尚未找到协调密码子的使用和转录本翻译的精确规则。似乎在转录本5’末端附近存在稀有密码子将会影响翻译效率。另外,基因5’编码区中GC含量似乎也影响其表达。这在人胸苷酸激酶(TS)中已经得到证明[179]。在不改变所编码蛋白的前提下,将TS cDNA的第三、四、五密码子的嘌呤碱基变成胸腺嘧啶,使得TS基因的表达占到E.coli中总蛋白量的25-30%。综上所述,有许多可变因素可能影响实验结果,如位置效应、稀有密码子的群集和mRNA的二级结构等等。
表1 E.coli中不常用的密码子

相关热词搜索:原核表达 大肠杆菌 外源蛋白

上一篇:为什么紫外线只能用于表面灭菌,而不能用于固体物质灭菌?
下一篇:CaCl2法制备大肠杆菌感受态细胞

分享到: 收藏