第六章  真核细胞染色质组成、结构和表达

 

    一、真核细胞染色质基本组成

    高等真核生物细胞核内的染色质是由DNARNA、组蛋白和非组蛋白构成。其中DNA与组蛋白重量比约为11,是稳定的成分,非组蛋白与DNA之比变化很大,RNADNA的比例为0.11

    (一)组蛋白 

    组蛋白中富含精氨酸和赖氨酸这样的硷性氨基酸,带有丰富的正电核,属于硷性蛋白质,可以和酸性的DNA紧密结合,在细胞中大量存在,平均每个细胞中约有6×107个分子,用聚丙烯酰胺凝胶电泳可以将组蛋白分为5种,5种组蛋白可分为核小体核心组蛋白(H2AH2BH3H4)和H1组蛋白两大类。

    核心组蛋白在进化上十分保守,分别由102-135个氨基酸残基组成,对形成DNA盘绕的核小体结构起关键性的作用。H1组蛋白种族保守性较差,约由220个氨基酸残基构成,与核小体的稳定和高级结构的组装有关。H1组蛋白具有进化上保守的中段球状核心区,其伸展的N端和长臂状的C端较少保守性。H1的中段球状核心区结合在DNA进入和脱离核小体核心的部位。当核小体上有H1组蛋白结合时,用微球菌核酸酶降解,分离出的片段为166bp,表明其长臂结构可以保护部分DNA连接区。H1组蛋白能结合相邻核小体的核心组蛋白,促使相邻核小体更加靠近,维持DNA的高级结构。

    (二)非组蛋白  

    非组蛋白指除了组蛋白以外的细胞核各种蛋白质,属于细胞中的可变成分,它们的分子量一般比组蛋白大,十分异质,Hela细胞中达450种之多。

    高迁移率蛋白群(high mobility group, HMG)是细胞核非组蛋白中一群较丰富而不均一的蛋白,富含天门冬氨酸、谷氨酸等酸性氨基酸,为酸性蛋白质,分子量一般≤3.0×104,在聚丙烯酰胺凝胶电泳中迁移率很高,在高等真核生物中,HMG可以分为3大类,即HMG-1/2HMG-I(Y)HMG-14/17

    HMG以外的非组蛋白还包括多种参与核酸代谢和修饰的酶类,序列特异性DNA结合蛋白等,种类繁多但是每种在细胞中的含量很少。

    (三)DNA  

    DNA是细胞中的稳定成分,多数情况下,同一个体的不同分化细胞中的DNA是相同的,1微微克DNA长度相当于51cm,一个人的二倍体细胞(除了生殖细胞以外的所有细胞)DNA链长约174cm,最长的第1号染色体能容纳7.2 cm DNA双链。

    (四)RNA 

    RNADNA转录而来,可以当作是DNA的镜像。不同分化细胞中转录出的RNA不同,所以RNA是细胞中的可变成分。

 

    二、真核细胞染色质基本结构

    (一)组蛋白8聚体  4种核心组蛋白各2个,按H2A-H2B-H4-H3-H3-H4-H2B-H2A的顺序连接,盘为直径7nm,螺距约为2.7nm的结构。组蛋白8聚体的形成顺序为先形成H4-H3-H3-H4 四聚体,然后再于两端各结合一个H2A-H2B异二聚体。

    (二)核小体  核小体是构成染色质的基本结构单位。组蛋白8聚体外缠双链DNADNA进入和脱离组蛋白8聚体的位置由H1联结,这是核小体的典型结构。DNA酶(DNase 1)首先将染色质降解为200bp结构(称为核小体,含组蛋白8聚体,H1和连接子DNA),进一步降解为166bp(称为染色质小体chromatosome,含组蛋白8聚体和H1),再接着形成146bp结构(称为核小体核心颗粒nucleosome core,含组蛋白8聚体,但是不含H1)。核小体紧密接触,成串排列形成直径10nm的染色质丝。这样,核小体是由核小体核心颗粒、H1组蛋白和连结相邻核小体核心颗粒的DNA(连接子DNA)构成。图6.1示意核小体结构。

 

连接子DNA

 

 

           核小体核心颗粒

 

     6.1  核小体结构示意图

 

 

核小体

 

  H1组蛋白

 

    当离子强度在3040mmolL以上时,H1分子能在不同染色质片段的结合位点之间进行迁移,这是进行任何有关H1的结合和分布研究所必须牢记的一个事实。将两个长度不同的染色质片段,一个用14C-赖氨酸进行体内放射性标记,另一个不标记,并在离子强度为75mmol/L下混合起来,然后再将两片段分开,发现两片段间放射性标记和非标记H1(但不包括核心组蛋白)是平衡的。能检测到这种交换的最低离子强度为30mmol/L。当离子强度为75mmol/L时,染色质以紧缩形式存在。然而,H1在不同位点之间的迅速交换现象与由H1来维持的高层结构是不矛盾的。因为如果大多数H1的结合位点经常是披占据着的,就可以维持其总体结构的稳定性。

    (三)螺线管(solenoid 

    在有H1存在的情况下,每个核小体紧密接触,形成直径约10nm的染色质丝,染色质丝按每圈6个核小体盘绕,形成螺距11nmH1组蛋白在内面,内径10nm,外径30nm中空的螺线管结构。DNA双螺旋与组蛋白8聚体包装为核小体,成串的核小体再盘成螺线管,模式图见图6.2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

    三、真核生物复制过程中的核小体结构

    DNA合成后很快与组蛋白结合,装配成核小体,用3H-Tdr标记DNA14C,15N标记组蛋白,发现新合成的DNA链几分钟内即与新合成的组蛋白八聚体组装成核小体。多数组蛋白在细胞周期的S期合成,少量组蛋白在整个细胞周期都可能合成,参加受损DNA的修复。

    真核生物细胞DNA复制时必然涉及到原有核小体的转移与分配,因为DNA是半保留复制,由于空间狭小,复制是分区进行的,已经用溴尿嘧啶脱氧核苷酸代替胸腺嘧啶核昔酸掺入到DNA,再用溴尿嘧啶脱氧核昔酸的抗体进行免疫检测而证实了染色体的分区复制。DNA属于半保留复制,那么组蛋白八聚体是以何种方式传递给子代分子呢?这主要涉及以下3个问题:

    1、老的组蛋白8聚体是否解聚  实验证明组蛋白8聚体以全保留的方式传给子代分子(不解聚,只传给一条DNA链)。现将得到这一结论的实验过程叙述如下:

    组蛋白的合成在细胞核中与DNA复制同步进行,因而细胞并不含有明显多余的组蛋白分子,其耦联的机制目前还不清楚。这个事实对于我们证明组蛋白八聚体的解聚与否却有很大的帮助,老的八聚体是否解聚及如果解聚又如何与新合成的组蛋白重组?将细胞置于轻培养基(12C,14N,1H)中生长很长时间。然后将细胞转移到重培养基(14C,15N,3H)中生长约1小时,分离组蛋白八聚体,在甲酸饱和的密度梯度中进行平衡离心。如果是全保留装配的话,则得到一个高密度的放射性带;如果是随机的话,则得到一个高密度到低密度的弥散的放射性带;如果是半保留的话,则在中等密度处得一个单一的放射性带;结果表明,组蛋白八聚体的装配是全保留的。

    2、老的组蛋白8聚体在子链DNA上的排列  这些老的八聚体和新的八聚体在两条子代DNA分子上是如何排列的呢?同样有三类可能性:1、老八聚体进入一条链,2、间插分布,3、随机分布。

    用蛋白质合成的抑制剂放线菌酮(cycloheximide)加到正在生长的细胞中,在此之前开始的一轮DNA复制将继续下去。上面我们已经谈到过组蛋白是现用现造,在加入蛋白质合成的抑制剂后,就没有新生的组蛋白八聚体了。这样在两个复制叉的两边,有一个分枝的DNA是裸露的。另一个分枝继承了亲代的组蛋白八聚体。用电子显徽镜可以看到这种现象。这一结果表明,组蛋白八聚体在DNA复制时并不离开亲本DNA链。

    3、老的组蛋白八聚体与哪条链结合  最后的问题是,老的即亲代的组蛋白八聚体到底与哪条链相结合?迄今,从一种动物病毒SV40的研究结果看,它的老八聚体是与先导链相结合的〔SV40也有核小体结构〕。如果一个复制单元从原点开始双向等速复制,则在子代分子的这一段序列上的组蛋白八聚体半截是老的,半截是新的。

 

    四、活化态染色质(active chromatin

    (一)活化、非活化和中间态染色质  

    染色质按其伸展程度分为活化染色质和非活化染色质。非活化染色质DNA不能被转录,其特点是以30nm染色质螺线管结构为基础,DNA压缩40-50倍。30nm染色质螺线管结构开启为可以转录的伸展(疏松)染色质结构,成为10nm的染色质丝,此时DNA压缩6倍。在细胞中染色质的活化与非活化态是可逆的,并有不同的中间状态。染色体的许多区域是凝缩的非活化态染色质,不能被转录。在体外,组蛋白以非特异的方式抑制DNA的转录,可以认为组蛋白是DNA转录的非特异性抑制剂。核小体的螺线管结构阻止转录复合体接近起始位点。已对DNA的特定区域与DNA酶的相互作用,进行了广泛的研究,并推测活化的基因对酶的作用比未活化的基因更敏感。这些研究已经阐明,无论是在与蛋白质结合的DNA中,还是在折叠和超螺旋的DNA-蛋白质结构中,活化的和未活化的基因之间都存在着差异。

    (二)活化态基因对DNA酶敏感 

    1DNA酶(DNase 1)可以均一地切割纯化的DNA,对DNA的降解无明显的序列特异性。用DNase 1消化来自不同组织的染色质但得到的结果不同,例如在红细胞前体的细胞核中,编码珠蛋白mRNADNA顺序对DNase 1的作用比其它序列更敏感,而在母鸡输卵管细胞核中,卵白蛋白的DNA顺序对DNase 1敏感性比珠蛋白序列更高。活化态基因对酶的高敏感性说明,活化态基因上的蛋白质构象的保护性作用比末活化的要小。用DNase 1处理全核之前或之后,用Southern印迹技术,揭示了活化基因对DNase 1的敏感性增加,例如,雏鸡成红细胞全核用不同浓度的DNase 1处理之后,纯化DNA,再用限制性酶消化,预先未用DNase 1处理的雏鸡DNA含有特异的珠蛋白DNA片段,可与标记的克隆化珠蛋白序列杂交进行检测。如果预先用DNase 1处理,切割了其中的珠蛋白基因,就不能见到这些片段。

    2如果说,活化的转录单位DNase 1的敏感性增高,那么,也是DNA的某些位点对酶的敏感性增高,如聚合酶结合的那些位点。根据这个逻辑,经过研究与探索,已经发现了存在着高敏感位点的证据。高敏感位点就是那些首先受到DNase 1消化的位点。因此限制性酶切位点之间的高敏感位点,可用来自DNase 1处理的全核的DNA进行Southern印迹试验,测出1个或2个特异性带,这l个或2个带要比未经DNase 1处理的核的限制性片段得到的带窄小。在珠蛋白基因和其它细胞的转录活跃的基因,高敏位点定位在5' 端。许多DNase 1高敏位点位于靠近转录起始的区域。

    3染色质中DNase 1 的敏感位点似乎是由这些部位的蛋白质与DNA的相互作用造成的。转录时特异的活化区域失去了蛋白质的保护作用,易受DNase 1的消化。也有可能蛋白质改变了结合的方式,从而易受酶的作用。雏鸡成红细胞核中,与DNA特异性结合的一种蛋白质已经得到纯化,这种蛋白质结合在雏鸡珠蛋白基因起始位点上游200个核昔酸处。已经知道,DNA的这个区域对酶的作用特别敏感,当这种纯化的蛋白质在组蛋白之前结合到这个位点,那么,该位点对酶的作用就变得很敏感。

    4有转录活性的核小体常缺乏H1,却有相对分子质量在3.0×104以下没有组织特异性的非组蛋白HMG14HMG17存在。在全部染色质中大约每10个核小体中可有一个核小体存在着这两种HMG蛋白。HMG14HMG17在每个核小体上有两个高亲和力的结合位点,同时也是目前已知唯一直接结合在核小体核心颗粒上的核蛋白。发现在爪蟾卵提取物体系中HMG17掺入到DNA复制后新组装的染色质中,会促进RNA聚合酶的基因转录,而HMGl4则可直接参与RNA聚合酶E对染色质中基因的转录等,都说明这些HMG蛋白与核小体的结合是产生活性染色质的重要细胞核内过程。

 

    五、表达的基因数目及表达丰度

    (一)表达的基因数目 

    为研究真核生物的基因表达,有必要对一个特定细胞类群中正常表达的基因数有一个粗略的估计。用RNA饱和杂交试验(RNA saturation hybridization)可以求出在非重复序列DNA中能与mRNA杂交部分的百分率。用这样的方法测得,酵母中约有4000个基因表达,高等真核生物的体细胞中约有1-1.5万基因表达。由于DNA中存在着序列相同或相似的重复基因家族,上述饱和试验中形成的DNA-RNA杂合体可能包括了没有转录的序列,使估计的表达基因数目偏高。

    (二)基因表达丰度(丰富mRNA和稀少mRNA

    上面介绍了处于表达状态的基因数目。那么,这些基因之间在表达水平上是否存在差异呢?以鸡输卵管细胞为例说明表达基因的表达丰度存在很大差异。在鸡输卵管组织的mRNA中,大约有50%为卵清蛋白mRNA,另外的7-8mRNA占了约15%,而剩下的35%包括了大约1.3万种mRNA。由此可见,同一组织中不同种类的mRNA在拷贝数上差异很大。鸡输卵管组织中每细胞含有mRNA 0.275pg。对于第一组分mRNA(卵清蛋白mRNA)来说,每个细胞中约有10万拷贝;而对于第二组分的7-8mRNA来说,每一种在每细胞中约有4000拷贝;而对于第三组分的1.3万种mRNA来说,平均每一种大约只有5个拷贝。

    绝大多数真核生物特定组织中mRNA的存在状况都和上述鸡输卵管的例子相似(虽然不是那么极端),即少数(不到100种)mRNA可达到数千甚至数万拷贝。它们往往占了全部mRNA的一半甚至更多。这类mRNA叫做丰富mRNAabundant mRNA)或优势mRNAsuper prevalent mRNA)。在上例中卵清蛋白mRNA和第二组分mRNA是丰富mRNA。另一方面,许多细胞中约一半的mRNA包括了数千甚至上万种,每种mRNA的拷贝数大多在10以下,它们叫做稀少mRNAscarce mRNA)或复杂mRNAcomplex mRNA)。

 

    六、持家基因和奢侈基因

    高等真核生物细胞中表达的基因一般有1万个-2万个,例如通过饱和杂交试验测得的表达基因数目在鸡输卵管中约为1.5万,在鸡肝中约为1.7万。这些基因在不同组织中有多少是相同的(重叠的),多少是组织特异性的呢?

    鸡输卵管中卵清蛋白mRNA占了全部的50%,而在肝细胞中这种mRNA却根本不存在。所以,若从绝对质量来说、这两种组织的mRNA至少有一半不同。但现在的问题是要求出mRNA种类在这两种组织的不同,这里除了包括为数不多的丰富mRNA外,还包括一部分稀少mRNA。现在尚不能对组织中mRNA的重叠情况进行直接测定,但可以用间接的方法估计。用来自一种组织的过量mRNA与非重复DNA杂交。凡能与mRNA杂交的DNA序列叫做mDNA。然后把参与杂交的mDNA组分和未参与杂交的无效DNAnulI DNA〕组分分开。分别用它们与来自第二种组织的过量mRNA杂交。mDNA中和第二种mRNA杂交的百分比代表了在两种组织中都表达的基因(重叠基因)的百分比;而无效DNA中和第二种mRNA杂交的百分比则代表了在第一种组织中不表达而在第二种组织中表达的基因。通过这些方法和其它方法,表明一个组织中的丰富mRNA在另一个组织中往往仅作为稀少mRNA而存在或甚至不存在。一般来说,哺乳动物某一细胞类型中只有10%的mRNA序列是该细胞类型所特有的,另外的90mRNA序列在某些其它的细胞类型甚至在所有的细胞中同样存在。这就是说,哺乳动物(其它高等真核生物也可能如此)各类不同的细胞中均有相同的一组基因在表达。这组基因数目约在1万左右。由于它们的功能对于每个细胞都必需,因此有时叫做持家(house keeping)基因;同时,不同细胞类型又往往有种类不多的只在该特定细胞类型中表达的基因,这些基因有时又叫奢侈(luxury)基因。尚不知在各种类型细胞中表达的奢侈基因的总和,有人估计可能超过持家基因的数目(1万),但不会超过它的2倍~3倍。由于持家基因和奢侈基因在各种细胞类型中的功能、表达范围和表达强度不同,因此,细胞对这两大类基因调控的途径和机制也可能不同。在个体发育过程中,表达的基因数目逐步减少。例如,海胆卵中含有1.8万种mRNA,在囊胚阶段,剩下1.3万种,在原肠胚阶段为8500种,到了幼虫阶段,只剩下7000mRNA。更有甚者,在某些高度特化的组织中,表达的基因数目就更少了,例如成体海胆的管足和肠等组织中,表达的基因数目只有2500-3000种了。实验表明,胚胎后期表达的基因,其大多数在胚胎早期也是表达的。

 

    七、基因启动原理  

    同样的基因在真核生物的不同细胞中呈现不同的表达,已经发现许多因素与这种差异表达有关。细胞互相作用、核质相互作用、细胞微环境对细胞的作用等都可以影响基因表达,导致细胞分化。在分子水平也提出了一些解释基因差异表达的模型:

    (一)DNA结合蛋白  

    DNA结合蛋白可以对转录产生正的或者负的影响。如DNA结合蛋白质对染色质疏松的作用,雏鸡成红细胞核中,与DNA特异性结合的一种蛋白质已经得到纯化,这种蛋白质结合在雏鸡珠蛋白基因起始位点上游200个核昔酸处。已经知道,DNA的这个区域对酶的作用特别敏感,当这种纯化的蛋白质在组蛋白之前结合到这个位点,那么,该位点对酶的作用就变得很敏感,由此看来,高敏位点似乎就是蛋白质与DNA相互作用的区域。

    (二)DNA甲基化转录调节

    真核生物DNA双螺旋中,胞嘧啶核苷的嘧啶环5位甲基化,并与其3'的鸟嘌呤形成mCpGDNA甲基化的形式。在一般哺乳动物基因组中,5%胞嘧啶甲基化成为mCpG的形式。低等真核生物如酵母和果蝇等基因组中没有明显甲基化。DNA的甲基化状态可以从母细胞传递到子细胞,有一定的遗传倾向。细胞的基因可以高度甲基化而处于非活化状态,如女性的一条X染色体;也可以在诱导下去甲基化,使细胞出现组织和发育阶段蛋白质表达特异性;或者始终保持低甲基化状态,而具有转录活性,如持家基因。可见基因的甲基化状态与基因表达密切相关。

 

                                                                  (吕占军)

 

参考文献

1. 朱作言,柯礼道,吴石君 译,真核基因  结构,活性,调节  科学出版社  198711

2. 孙乃恩,孙东旭,朱德煦   分子遗传学  南京大学出版社 第一版 1999年1月

3. 汪仁,薛绍白,柳惠图.  细胞生物学  北京师范大学出版社  第一版 199811

4. 敖世洲等  真核生物基因的结构与功能  科学出版社  19894

5.   仁,张和君,董德祥  编译  分子细胞生物学  中国医科大学、中国协和医科大学联合出版社  19902

6. 王羽 王非  方德福 主编  真核基因表达调控  高等教育出版社 199712

7. 来茂德  主编  医学分子生物学  人民卫生出版社  1999年9月

 


组蛋白八聚体

 

                  6.2  DNA及组蛋白形成螺线管模式图

 

  压缩

 

连接子DNA

 

DNA与组蛋白形成核小体,许多核小体成串排列形成11nm染色质丝(活化染色质);染色质丝进一步压缩为螺线管(30nm)为非活化染色质。