Mendel (1822-1884): “Mendelian factor”《Experiments on plant hybrids》 Particulate inheritance 1909 Johanson: “Gene”
1910 Morgan: genes were physically in the chromosomes 1941 Beadle & Tatum: “one gene one enzyme” 1951 McClintock: Ds-Ac Controlling element 1957 Benzer: Cistron 1961 Jacob & Monod: Operon
1977 Berger: Ad2 Interrupted gene 1978 Gibert: Intron and exon
1977 Sanger: Overlapping gene
一、基因是遗传结构和遗传功能的单位遗传结构的不可分割单位 基因位于染色体上 重组作图定位单个基因 是遗传信息结构和功能的基本单位
从结构和功能来看,它们以线性的形式相互连接(串珠理论,the beads on a string theory)。
噬菌体重组实验结果的挑战:基因可被分为更小的单位。 Seymour Benzer引入了突变子(muton),重组子(recon)和顺反子(cistron) 分别定义突变、重组和功能的不可分割单位。 在噬菌体感染中,如果突变位于同一基因不同亚元件中,那么,这只可能是基因内重组(intragenic recombination)的结果。这说明基因可被分为更小的单位,这些单位可发生重组和突变。这样,重组子和突变子等价于单个核苷酸对。
基因作为遗传功能的不可分割单位 顺反子 基因功能的不可分割的单位。 互补实验的基础是顺反测验(cis-trans test) 建立了一基因一顺反子的概念 即基因可被定义为遗传的功能单位 顺式测验是对照组,如果两个突变均在同一个基因组中,那么另一个基因组的两个基因座均为野生型,其产物为正常的基因产物,细胞表现出野生表型。反式测验是互补实验,可以确定功能单位的边界。
如果两个突变在同一个基因中,那么它们以反式构型出现在细胞中时,每一基因组都携带有这一基因的突变体拷贝,因而在细胞中不能产生具有功能的产物——即不出现互补。 如果突变位于不同基因中,当它们以反式构型出现时,那么每个基因组均可补偿另一个基因组缺少的正常产物。细胞具有所有基因产物,表现为野生型——这就是正互补(positive complementation)。
原核和真核细胞中基因——顺反子的相互关系 1.在简单基因组中基因与顺反子等价
原核和低等真核细胞:基因与产物之间的关系比较简单。通常是一基因一相应产物,而且基因往往与产物共线性。基因和顺反子等价:基因是遗传的功能单位;也是可表达的遗传信息的单位。在细菌中:基因是编码区 (开放阅读框)。
细菌基因常常组合成一个操纵子,这样几种产物均由一条多顺反子mRNA(polycistronic mRNA)翻译而成;(多顺反子)
在真核细胞中:基因是转录的单位。大多数基因以单顺反子 mRNA (monocistronic mRNA)的形式转录
单顺反子(monocistron):只编码一条多肽链的顺反子。
多顺反子(polycistron):可编码多条肽链的mRNA分子。 2.复杂基因组中基因与顺反子不等价
在高等真核细胞的基因组中,基因和产物之间的关系较为复杂(下图)。大多数高等真核细胞基因包含有内含子,它们是一些不出现在最终产物中因而不是功能组成部分的DNA插入序列。真核基因代表整个转录单位,而顺反子可能被内含子插入所分隔,因而顺反子等价于真核基因的外显子。
图2-9:在真核细胞中基因与顺反子不等价的例子(图中较宽的框表示DNA,窄框表示RNA,链表示蛋白质)。
(a)在反式剪接与RNA编辑中,单个多肽链的合成需要多个基因的表达,每个基因都是同一功能单位的部分并构成单个顺反子。空白的框代表来自某一基因的信息而填充的框代表来自另一基因的信息。注意在所有已知的反式剪接的例子中,5’剪接转录物不被翻译,虽然在理论上还不能解释它为何不产生蛋白产物。 (b)一个基因通过多种剪接方式或其他选择性信息利用方式产生多种产物。基因中包含相互覆盖的顺反子。内含子用有斜纹的框表示,它们在RNA加工过程中被剪切。外显子也用框表示,如果不被翻译用空白框表示,填充框表示编码区。注意内含子可以插入到编码或非编码的外显子中,而外显子可以包含翻译或非翻译信息(即外显子2和5)。
在真核基因中,基因与产物相互关系的复杂性还来源与某些遗传信息被选择地利用以产生多种产物。这种过程可通过选择性剪接来完成,这种选择性反映了在RNA加工过程中或在启动子选择,及转录过程中多聚腺苷酸位点的使用等水平的调节。这些结构上相联系的基因产物往往具有不同的功能,因而基因还可能包含一系列的相互重叠的顺反子。
同上述情况相反,有时一种产物需要两个基因共同产生,如反式剪接,即两个分别编码的mRNA被剪接在一起翻译,另一个例子是在锥体虫中的RNA编辑,mRNA和gRNA都是产生蛋白合成的成熟模板所必需的。这种情况中每个基因对于产生共同产物都是必需的;它们是同一顺反子的一部分。
还有一些例子中几种不同蛋白都来源于同一个开放阅读框:翻译首先产生一个多蛋白(polyprotein),随后再被剪切成具有不同功能的产物。一些RNA病毒采用这种策略以适应真核细胞中单顺反子的机制。这种情况也发生在一些内源基因中,例如在哺乳动物的脑中,前强啡肽原基因可以产生七种有着不同功能的多肽。在这种情况中,编码每种肽段的开放阅读框被认为是一个顺反子。
重叠和嵌套基因 :
重叠基因(overlapping genes):指调控具有独立性但部分使用共同基因序列的基因。 基因重叠发生在两种水平:
1.在细菌系统或其他的空间限制必需的情况中(如在RNA病毒基因组中和动物的线粒体DNA中),基因可以在阅读框水平上重叠,这样同样的遗传信息产生两种或多种互不相关的蛋白质。
例:轻小病毒的裂解蛋白基因(包括噬菌体MS2)与复制酶和衣壳蛋白基因重叠,但是它们从不同的方向和以不同的开放阅读框翻译。在一些种属中,裂解蛋白基因完全包含在复制酶基因中 2.在真核细胞中,基因在转录单位的水平中相互重叠,但是外显
子保持分立。
由于在一个基因中的外显子DNA被作为其重叠基因内含子的一部分,因而两个基因的蛋白产物中并不出现相同的信息(例如,人的TCRA和TCRDT细胞的受体基因在外显子水平上重叠)。偶然还会出现一个完整的基因包含在另一较大基因的内含子中:与内含子代谢有关的编码蛋白的开放阅读框往往位于自剪接内含子中(见RNA加工)。例如有3个小基因就隐含在较大的人类基因NF—1的第26号内含子中。重叠基因可能反映了一类调控机制。在质粒中,基因编码的反义RNA往往同其调控的基因相重叠(参见反向转录)。
嵌套基因(nested gene):指那些通过调节蛋白合成终点而产生两种或更多种嵌套蛋白产物的基因这可能通过终止子的渗漏通读(例如Qp病毒的衣壳蛋白基因),或者是翻译时发生移码(如在大肠杆菌danX基因和F质粒的trax基因)。真核细胞的RNA病毒也采用类似策略如反转录病毒,并且真核基因也可通过选择性剪接或采用选择性多聚腺苷酸位点产生嵌套产物。 二、基因的分类 按产物的类别 按 其 功 能
结构基因:可被转录形成mRNA,并进而翻译成多肽链,构成各种结构蛋白质,催化各种生化反应的酶和激素等。
调节基因:指某些可调节控制结构基因表达的基因,合成阻遏蛋白和转录激活因子。其突变可影响一个或多个结构基因的功能,或导致一个或多个蛋白质(或酶)量的改变。
只转录不翻译的基因: 核糖体RNA 基因rDNA基因 tRNA基因 蛋白质基因 RNA 基 因
结构基因:Structural gene 调节基因:Regulatory gene
三、基因的组构(Gene organization)
基因的结构和组成:通常是指结构基因的结构和组成。 结构基因 一定功能的RNA或蛋白质
必须具备以下几个基本的组成成分:启动子(Promoter)编码序列(Coding sequence)终止子(Terminator)以及基因在启动子的上游或其它区域有一些调节基因转录的序列:顺式调节元件(cis-regulatory element)/上游调节序列(upstream regulatory sequence)/上游激活序列(upstream activation sequence)它们是转录调节因子的识别和结合位点,是调节基因转录的杆杠 表达
一个真核生物的结构基因:
1、基因可划分为具有特定功能的分立区域 (定义基因功能性成分的术语)等位基因 基因的一个序列变异体(或者称为遗传标记,如RFLP,VNTR序列)。顺反子基因功能的一个单位,可以编码特定产物的一段DNA。编码区,开放阅读框 (ORF) 可以翻译成蛋白质的DNA区域,在细菌中,即为一个基因。在真核细胞中,编码区可以被内含子隔断。
分段基因 具有处于不同基因座上的外显子区的断裂基因,这些外显子必须分别转录并通过反式剪接相连接。实际上每 一基因座应被认为是一独立的基因,这属于术语的误用。 基 因在细菌中,是指编码一个独立的蛋白质或RNA分子的遗传
功能单位。在真核细胞中,是指编码一个或多个产物的,或对某一个产物产生有贡献的一个转录单位。
基因座 染色体上一个基因的位置,包括两侧的调控元件。基因座一词的本义是指任何标记物的位置——包括基因,调控元件,复制起始区,细胞遗传学中的标记等等。
操纵子 包含几个基因(可作为一个多顺反子的转录物被转录)及其共同调控元件的细菌基因座。 假基因 类似基因的一段无功能的序列。 被分隔基因 包含内含子的基因。
转录间隔区 RNA基因或RNA基因操纵子中不出现在成熟RNA分子中的部分。
转录单位,转录区域 可以转录为RNA的一段DNA区域。在真核细胞中即为一个基因。在细菌中可能包含多个基因。 非翻译区(UTR),非编码区(NCR) 转录单位中不能翻译成蛋白的部分。在编码区或操纵子两侧的UTRs为5’和 3’UTRs(或称为前导和尾随序列)
任何基因座,被转录的DNA称为转录单位(transcription unit)。 在原核细胞中,一个转录单位可能包括多个基因组成一个操纵子,但在真核细胞中,转录单位几乎总是等价于单个基因(由RNA聚合酶I转录的rRNA基因多顺反子,RNA病毒基因和细胞器基因组等例外;参见内部核糖体进入位点、反式剪接)。
对于编码蛋白质的基因,翻译成多肽序列后的信息和未翻译的信息之间可能存在差别。在细菌中,被翻译的区域[开放阅读框(open reading frame)、编码区(coding region)]同基因等价,并且,基因间通常被短的内部非编码区(internal noncoding regions)分隔。操纵子的末端基因的侧翼存在有5’非翻译区(5’untranslated region,UTR)或称为前导序列(leader sequence)和3‘UTR也称为尾随序列(trailer sequence)。这些序列往往具有调控功能;5’UTR控制核糖体的结合还可能促进衰减子控制(anenuator control);而3’UTR在mRNA的稳定性中起重要作用。
在真核细胞中,编码区的两侧也存在具有调控功能的UTRs,两侧的UTRs和开放阅读框都被非编码序列即内含子插入,内含子在RNA从核仁运输出来时被剪切掉,也就是说它们不出现在成熟的转录物中。
在真核和原核细胞中,RNA基因可被单独或作为操纵子的一部分转录。基因中与蛋白编码区类同部分即最终形成成熟RNA的部分。一些RNA作为成熟转录物被转录,而另一些需经过剪切,加工和内含子的剪接等过程。渐次丢失的所有序列都被称为转录间隔序列(transcribed spacer sequence) 2、基因命名法
基因的命名一般根据种属习惯。一般用斜体表示基因的名 称,等位基因及其基因型,或在必要时表示基因转录而成的mRNA,而蛋白产物和表型用正体来表示。
但是在研究不同生物的同一遗传机制时,往往会产生一些混淆,如在研究酿酒酵母和粟米酵母的细胞周期有关基因的命名中。此外,许多基因在不同实验中从相同组织被分离出好几次而具有不同命名:重要的果蝇的发育基因torpedo便是其中一例——它在筛选不同表型的过程中三次被鉴定并被命名三种不同名称。果蝇提供了关于遗传命名的最为丰富的例子,特别是在发育生物学中这种趋势也扩展至脊椎动物中。
在许多种属中,基因由包括几个字母和数字的符号来表示,一些种属命名惯例(如果蝇、大肠杆菌)认为使用小写字母表示隐性突变,而用第一个字母大写来表示显性突变。在其他一些种属包括人的基因命名中,基因全由大写字母表示。现在,通过大规模的测序方法,更多的基因不断被鉴定,因而十分需要一个统一的命名方法。
核质\"(nuclein)。核酸 (nucleic acids)这一名词于Miescher的发现20年后才被正式启用,当时已能提取不含蛋白质的核酸制品。早期的研究仅将核酸看成是细胞中的一般化学成分,没有人注意到它在生物体内有什么功能这样的重要问题。
核酸为什么是遗传物质? 1944年,美国著名的微生物学家Avery等做的肺炎球菌转化试验。结论是:S型菌的DNA将其遗传特性传统基因命名法提要 物种 惯例 大肠杆菌和其他细菌 传给了 R型菌,DNA就是遗传物质。从此核酸是遗传物质的重要
三个小写字母表示一个操纵子,接着的大写字母表示不同基因座。例如:lac操纵子;基因座:lacZ,lacY,lacA蛋白质:LacZ,LacY,LacA另外还采用特殊惯例命名B.subilis的孢子发生基因。这些基因以spo后加上表示孢子发生的形态阶段的罗马数字表示,再用大写字母表示操纵子,而后为基因座,例如,spoⅡGA就表示在第二阶段表达的操纵子G的第一个基因座。
酵 母 三个字母表明基因功能,而后的数字 表示不同的基因座。啤酒酵母基因:GAL4,CDC28蛋白质:GAL4,CDC28非洲粟酒酵母基因:gal4,cdc2蛋白质:Gal4,Cdc2
线 虫 用三个小写字母表示突变表型,如存在不只一个基因座,用连字符后接数字表示,例如,基因: unc—86,ced—9蛋白:UNC—86;CED—9
果 蝇 来自突变表型的描述可以用1~4个字母代表。例如,基因:white(w),tailless(tll),hedgehog(hh);而 蛋 白为:White,Tailless,Hedgehog。
植 物 虽然没有适用于所有植物的惯用法,但大多数用1—3个小写字母表示。Arabidopsis基因用果蝇的方法命名但使用大写字母,例如,基因AGAMOUS(AG),蛋白AGAMOUS。
脊椎动物 一般以描述基因功能的1—4个小写字母和数字表示其基因功能。例如,基因sey,myc,蛋白Sey,Myc。
人 类 方法如脊椎动物但需大写。例如基因MYC、ENO1蛋白MYC、ENO1
顺反子=细菌基因 它是基因功能的不可分割的单位功能相关的结构基因和操纵基因紧密连锁构成一个功能协调的操纵子 6)断裂基因和重叠基因
1978年 Gilbert 提出内含子、外显子概念
1977年 Berger 首次报道腺病毒基因中存在内部间隔区 Outline of splicing: The introns in a gene are transcribed along with the extrons (colored boxes) in the primary transcript. Then they are removed as the extrons are spliced together.
1977年 Sanger ΦΧ174 DNA 全序列测定 发现基因重叠现象 DNA seq: 5386bp But: coding 2000aa 6000-5386=641bp? 7)跳跃基因、可移动因子、转座子 1951年 Maclintock 玉米 Ds-Ac控制系统
突变子(muton): 顺反子内可能发生突变的最小单位,即核苷酸对。
重组子(recon):可进行重组的最小遗传单位。
顺反子(cistron):编码多肽链的遗传单位;基因的功能单位或遗传的功能 单位
第二章 染色体与DNA
核酸是怎么发现的? 1869年,F.Miescher从脓细胞中提取到一种富含磷元素的酸性化合物,因存在于细胞核中而将它命名为\"
地位被确立,人们把对遗传物质的注意力从蛋白质移到了核酸上。
1952年,美国冷泉港卡内基遗传学实验室科学家Hershey和他的学生Chase进行了噬菌体侵染细菌的实验,再次证明DNA是遗传信息的载体。
核酸为什么是遗传物质? 1944年,美国著名的微生物学家Avery等为了寻找导致细菌转化的原因,他们发现从S型肺炎球菌中提取的DNA与R型肺炎球菌混合后,能使某些R型菌转化为S型菌,且转化率与DNA纯度呈正相关,若将DNA预先用DNA酶降解,转化就不发生。结论是:S型菌的DNA将其遗传特性传给了R型菌,DNA就是遗传物质。从此核酸是遗传物质的重要地位被确立,人们把对遗传物质的注意力从蛋白质移到了核酸上。1952年,美国冷泉港卡内基遗传学实验室科学家Hershey和他的学生Chase进行了噬菌体侵染细菌的实验,再次证明DNA是遗传信息的载体。
第一节 DNA的化学组成
1 碱 基 2 戊 糖 脱氧核糖 核糖 3 核 苷 4 核 苷 酸
ATP(三磷酸腺苷)的结构 核酸分子中的核苷酸都以一磷酸形式存在,但在细胞内有多种游离的核苷酸,其中包括核苷一磷酸、核苷二磷酸和核苷三磷酸。
DNA和RNA都是由核苷酸头尾相连而形成的。相邻二个核苷酸之间通过3',5'—磷酸二酯键连接。无论是DNA还是RNA,其基本结构都是如此,故又称DNA链或RNA链。
寡核苷酸:一般是指二至十个、三十甚至更多个核苷酸残基以磷酸二酯键连接而成的线性多核苷酸片段。如:DNA合成的引物、基因探针等,在现代分子生物学研究中具有广泛的用途。 第二节
DNA的分子结构
一、DNA的一级结构
概念:指DNA分子中脱氧核苷酸的排列顺序,由于核苷酸之间的差异仅仅是碱基的不同,故可称为碱基顺序。 DNA物理图谱:指DNA链的限制性酶切片段的排列顺序,即酶切片段在DNA链上的定位。
限制性内切酶在DNA链上的切口是以特异序列为基础的,核苷酸序列不同的DNA,经酶切后就会产生不同长度的DNA片段,由此而构成独特的酶切图谱。因此,DNA物理图谱是DNA分子结构的特征之一。DNA测序就是从制作物理图谱开始,它是测序工作的第一步。制作DNA物理图谱的方法有多种,这里选择一种常用的简便方法──标记片段的部分酶解法,来说明图谱制作原理。此方法包括二个基本步骤:
(1) 完全降解:选择合适的限制性内切酶将待测DNA链(已经标记放射性同位素)完全降解,降解产物经凝胶电泳分离后进行自显影,获得的图谱即为组成该DNA链的酶切片段的数目和大
小。
(2) 部分降解:以末端标记使待测DNA的一条链带上示踪同位素,然后用上述相同酶部分降解该DNA链,即通过控制反应条件使DNA链上该酶的切口随机断裂,而避免所有切口断裂的完全降解发生。部分酶解产物同样进行电泳分离及自显影。比较上述二步的自显影图谱,根据片段大小及彼此间的差异即可排出酶切酸的排列顺序之中。不同基因的功能各异,各自分布在DNA的一定区域。基因的功能取决于DNA的一级结构,要想解释基因的生物学含义,就必须弄清DNA顺序。因此,DNA顺序测定是分子遗传学中一项既重要又基本的课题。 二、DNA的二级结构
1、 DNA双螺旋结构的主要依据 (1) Chargaff规则:
a 所有DNA分子中A=T、C=G;因此嘌呤碱基的总和与嘧啶碱基的总和相等,即A+G=T+C。
b 同种生物的所有体细胞DNA碱基组成相同,可作为该物种的特征。
c 不同生物组织DNA在总的碱基组成上有很大差异,表现在A+T/G+C比值(不对称比率)的不同,亲缘相近的生物,其DNA碱基组成相近,既不对称比率相近。
1949-1951年间,Chatgaff应用紫外分光光度法结合纸层析等技术,对不同来源的DNA进行了碱基定量分析,从中发现了碱基组成的一些共同规律,为DNA能携带遗传信息的论点提供了依据,而且为DNA 结构模型中的碱基配对原则奠定了基础。这些规律现称为Chatgaff规则,其要点如下:
(2) X射线衍射图: X射线衍射技术是一种在原子水平上间接观测晶体物质的分子结构的方法。Wilkins及其同事Franklin等用此方法获得DNA纤维晶体的X射线衍射图片,其影像表明了DNA结构的螺旋周期性,碱基的空间取向等。这些资料对Watson和Crick构建DNA双螺旋结构模型起了关键性作用。 被诺贝尔奖遗忘的玫瑰
(3)DNA碱基物化数据的测定:
片段在DNA链上的位置。DNA物理图谱测定后,便可对每一酶切片段进行核苷酸顺序分析。在测定了所有片段的DNA顺序后,根据物理图谱将各片段\"拼凑\"起来就得出了待测DNA链的全部核苷酸顺序。
生物世界里形形色色的遗传信息都包含在组成DNA的A,G,C,T这四种核苷
A-T或G-C配对,从几何大小和键长来看是合适的;酸碱滴定表明,DNA中的磷酸基可滴定,而碱基上的氨基不能滴定,这说明氨基可能与羰基氧原子之间形成了氢键。 2、DNA二级结构—双螺旋结构的要点
(1) 主链:由二条相互平行而走向相反的脱氧核苷酸链围绕一共同中轴以右手方向盘旋,形成双螺旋构型。主链处于螺旋的外则。
(2) 碱基对:碱基位于螺旋的内则,碱基对以氢键维系,A与T间形成两个氢键,G与C间形成三个氢键。碱基平面与螺旋中轴垂直。
(3) 大沟和小沟:大沟和小沟分别指双螺旋表面凹下去的较大沟槽和较小沟槽。
(4) 结构参数:螺旋直径2nm;螺旋周期包含10对碱基,螺距3.4nm;相邻碱基对平面的间距0.34nm。 DNA双螺旋结构与DNA复制:
双螺旋结构模型的成功之一是它能够圆满地解释作为遗传功能分子的DNA是如何进行复制的。Watson和Crick这样设想:DNA结构中的二条链看成是一对互补的模板(亲本),复制时碱基对间的氢键断开,两条链分开,每条链都作为模板指导合成与自身互补的新链(复本),最后从原有的两条链得到两对链而完成复制。严格的碱基互补配对保证了复制的高度保真性,也就是将亲链的碱基序列复制给了子链。因为复制得到的每对链中只有一条链是亲链,即保留了一半亲链,故这种复制方式又称为半保留复制。双螺旋结构建立时,复制原理只是设想,不久这一设想被实验证实
3、DNA结构的多态性
相对 类型 湿度 存在 旋转方向 RNA双螺旋区碱基距螺旋直径\\nm 离\\nm 每转碱基数 螺距\\nm 碱基对与水平面倾角 0.255 右 2.3 11 2.8 20° A-DNA 75% 域\\DNA-RNA杂合链 B-DNA 92% 实际在溶液中的构象 仅在实验室中观察到 人工合成CGCGCG 右 2.0 0.34 10 3.4 0° C-DNA Z-DNA 66% 右 左 1.8 0.37 12 4.5 7° B-DNA: Watson和Crick所推导出的DNA结构是根据在生理盐溶液中抽出的DNA纤维在92%相对湿度下进行X-射线衍射图谱为依据进行推设的。实际上在溶液中的DNA的确呈这一构象,这也是最常见的DNA构象。
A-DNA:在以钠、钾或铯作反离子,相对湿度为75%时,DNA分子的X-射线衍射图给出的是A构象。这一构象出现在RNA分子中的双螺旋区域,推测在转录和逆转录过程中形成的DNA-RNA杂合链是A型构象。
C-DNA:如果以锂作反离子,相对湿度进一步降为66%,则DNA是C构象。但是这一构象仅在实验室中观察到,还未在生物体中发现。
这些研究表明DNA的分子结构不是一成不变的,在不同的条件下可以有所不同。 DNA构象的可变性,拓宽了人们的视野。原来,生物体中最为稳定的遗传物质也可以采用不同的姿态来实现其丰富多采的生物的奥妙,也让人们在这一领域中探索和攀越时减少疲劳和厌倦,乐而忘返,从而有更多更新的发现。
A-\\B-DNA共同点:都是右手双螺旋;Watson-Crick碱基配对;链的重复单位是单核苷酸;螺旋中都有大沟与小沟,只是宽窄和深浅程度有所不同。
Z-DNA: Wang和Rich等人在研究人工合成的CGCGCG单晶的X-射线衍射图谱时发现它是左手双螺旋,在主链中各个磷酸根呈锯齿状排列,有如“之”字形一样,因此叫它Z构象(Zigzag)。这一构象中的重复单位是二核苷酸而不是单核苷酸;而且只有一个螺旋沟,相当于B构象中的小沟,狭而深。 4、DNA的其它螺旋结构
回文结构 镜像重复 三股螺旋(H-DNA)
回文结构:DNA序列中以某一中心区域为对称轴,其两侧的碱基对互补配对。回文结构能形成十字结构和发夹结构。
镜像重复:存在于同一股上的某些DNA区段的反向重复序列。此序列各单股中没有互补序列,不能形成十字型或发夹结构。 DNA三股螺旋(H-DNA)
多聚嘧啶和多聚嘌呤组成的DNA螺旋区段,其序列中有较长的镜像重复时,形成局部三股配对,并互相盘绕成三股螺旋,
后代含有与亲代相同的染色体。这种细胞分裂称为有丝分裂。 (4) 染色体的一些可察觉的变化常与遗传变化相关。例如同源染色体的两臂在减数分裂中的互换与同源染色体等位基因的互换是相关的。
根据这些和其它一些观察,人们终于得出结论:基因位于染色体上,控制同一特定性状的等位基因位于同源染色体的相应位点上。连锁基因则位于同一染色体上,除了发生交换外,它们常不服从基因的组合定律。 组蛋白具有以下特性: 1、进化上极端保守。
不同种生物组蛋白的氨基酸组成十分相似。牛、猪、大鼠的H4氨基酸序列完全相同,与豌豆序列相比也只有两个氨基酸的差异。
2、无组织特异性。只有鸟类、鱼类及两栖类红细胞染色体不含H1而带有H5。
其中两股的碱基按Watson-Crick方式配对,第三股多聚嘧啶(镜像重复)通过TAT和CGC配对,而处于双螺旋的大沟中。 三、DNA的三级结构
DNA的三级结构是指双螺旋进一步扭曲形成的更高层次的空间结构,也叫超螺旋结构或叫超卷曲。DNA的三级结构包括线状DNA形成的纽结、环状DNA形成麻花状结构等。 超螺旋可分为正超螺旋与负超螺旋两大类,它们在特殊情况下可以相互转变,如:
染色体在遗传上起着主要作用,因为亲代能够将自己的遗传物质以染色体的形式传给子代,保持了物种的稳定性和连续性。 第三节
DNA与染色体
一、染色体的化学组成
染色体中,DNA和蛋白质是染色体的主要化学成分,蛋白质含量约为DNA的二倍,RNA含量很少,还不到DNA量的10%。
根据组成染色体蛋白质的氨基酸特点将其分为:组蛋白和非组蛋白
1、组蛋白(histones)分为H1、H2A、H2B、H3及H4。组蛋白的含量与DNA含量之比约为1:1,它们都含有大量赖氨酸和精氨酸。 基因与染色体
(1) 基因成对存在,染色体也是如此。
(2) 每一细胞虽然同时含基因对的两个成员,但配子或生殖细胞仅含其中之一。同样,在配子形成过程中,同源染色体也分开,故配子为单倍体,这称为减数分裂。
(3) 每一细胞,除形成配子外,都含有一组与亲代相同的基因。同样,同一细胞的
3、肽链上氨基酸分布的不对称性。碱性氨基酸集中分布在N端的半条链上,而大部分疏水基团都分布在C端。碱性的半条链易与DNA的负电荷区结合,而另外半条链与其它组蛋白、非组蛋白结合。
4、存在较普遍的修饰作用。如甲基化、乙基化、磷酸化及ADP核糖基化等。修饰作用只发生在细胞周期的特定时间和组蛋白的特定位点上。
2、非组蛋白(non-histone protein,NHP)具有多样性、组织专一性和种属专一性,非组蛋白的量大约是组蛋白的60-70%,但种类多约有20-100种(常见的有15-20种),主要包括酶类、与细胞分裂有关的收缩蛋白、骨架蛋白、核孔复合物蛋白以及肌动蛋白、肌球蛋白、微管蛋白等。
二、染色质的结构单位——核小体的结构 核小体是由核心颗粒(H2A、H2B、H3、H4各两个分子生成的八聚体)和连接区DNA(大约200bpDNA)组成。DNA双螺旋沿八聚体核心的短轴旋绕1.75圈,而H1则在核小体的外面。每个核小体只有一个H1。
三、染色体的包装染色体的包装实际上是指细胞核DNA在双螺旋基础上的进一步结构变化,巨大的DNA链要包装成染色体需经多层次的结构变化才能实现。
一级包装:核小体 二级包装:螺线管纤维 三级包装:环状螺线管
上述三级包装完成后,具环形区的螺线管纤维需进一步以某种方式盘绕、折叠,最终完成细胞生长和繁殖的不同时期的染色体包装。这种在更高层次上的复杂的包装是以何种方式进行的,目前尚无明确定论。
经各级包装后染色体DNA总共被压缩了近万倍,这样,才能使每个染色体中几厘米长的DNA分子容纳在直径数微米的细胞核中。 一级包装:核小体 即由直径2nm的DNA双螺旋链绕组蛋白形成直径11nm的核小体\"串珠\"结构。
二级包装:螺线管纤维 由核小体纤维盘绕形成的一种中空螺线管,其外径为30nm,每圈含6个核小体,染色体的二级包装相当于将DNA长度压缩了近40倍。 三级包装:环状螺线管
螺线管纤维相隔一定间距的某些区段被\"拉拢\"固定在由某些非组蛋白构成的中心轴骨架上,从而产生了许多从骨架上伸出的纤维环。
上述三级包装完成后,具环形区的螺线管纤维需进一步以某种方式盘绕、折叠,最终完成细胞生长和繁殖的不同时期的染色体包装。这种在更高层次上的复杂的包装是以何种方式进行的,目前尚无明确定论。
经各级包装后染色体DNA总共被压缩了近万倍,这样,才能使每个染色体中几厘米长(如人染色体的DNA分子平均长度为4cm)的DNA分子容纳在直径数微米(如人细胞核的直径为6-7μm)的细胞核中。
四、原核细胞与真核细胞染色体、DNA特点 原核生物基因组
原核生物基因组很小,大多只有一条染色体,且DNA含量少,如大肠杆菌DNA的相对分子质量仅为4.6*106bp,其完全伸展总长约为1.3mm,含4000多个基因。
1、结构简炼。原核DNA分子的绝大部分是用来编码蛋白质的,只有一部分控制基因表达的序列不转录。
2、原核生物DNA序列中功能相关的RNA和蛋白质基因,往往丛集在基因组的一个或几个特定部位,形成转录单元并转录产生含多个mRNA的分子,称为多顺反子mRNA
3、一些细菌和动物病毒存在重叠基因,同一段DNA能携带两种不同蛋白质的信息。
4、原核生物基因主要是单拷贝基因,只有很少数基因(如rRNA基因)以多拷贝形式存在。几乎每个基因序列都与它所编码的蛋白质序列呈线性对应状态。
真核生物基因组 真核生物基因组最大特点是它含有大量的重复序列,而且功能DNA序列大多被不编码蛋白质的非功能DNA所隔开,这就是“C值反常现象或C值矛盾( C value paradox )”,目前无法用已知功能来解释基因组如此之高的DNA含量。 所谓C值,通常是指一种生物单倍体基因组DNA的总量,它是恒定的,是每一物种的重要特征。
不同物种的C值差异非常大,一般来说,随着物种复杂程度的提高,C值是增大的。但是,不能根据C值来考虑某一物种形态学上的复杂程度。例如,某两种十分相似的两栖类,其C值相差可达10倍。
真核细胞DNA序列可分为三类: 1、高度重复序列
只存在于真核生物中,占基因组的10-60%,由6-100个碱基组成,在DNA链上串联重复可达几百万次,一般成簇地排列在异染色质中,可能与染色体的稳定性有关。
卫星DNA (satellite DNA)是一类高度重复序列,这类重复顺序的重复单位一般由2-10bp组成,常富含AT。由于这类序列的碱基组成不同于其他部份,可用等密度梯度离心法将其与主体DNA分开,因而称为卫星DNA或随体DNA。 2、中度重复序列
中度重复序列在真核基因组中达十到几百个拷贝,它占DNA总量的30%。少数在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列。如Alu家族、rRNA基因、tRNA基因、组蛋白基因等属于这种类型的中度重复序列。
在动物卵细胞形成过程中,rRNA可进行几千次不同比例的复制,产生2*106个拷贝,使rDNA占卵细胞DNA的75%,从而是该细胞能积累1012个核糖体, 3、单拷贝序列(低度重复序列)
在单倍体基因组中,这些序列一般只出现一次或数次,在基因组中占10-80%。单拷贝顺序中储存了巨大的遗传信息,编码各种不同功能的蛋白质。但在单拷贝顺序中只有一小部份用来编码各种蛋白质,其他部份的功能尚不清楚。
血红蛋白、珠蛋白、蚕的丝心蛋白等都是单拷贝基因。 思考题
1、证明DNA是遗传物质的两个关键性实验是什么?
2、请阐明1953年Watson和Crick提出的DNA双螺旋模型内容。 3、请说明核小体的结构组成。
4、原核生物与真核生物基因组的区别。 第三章 DNA的复制 第一节
DNA复制的基本特点
一、DNA复制的半保留性在DNA复制时,亲代DNA的双螺旋先行解旋分开,然后以每条链为模板,按碱基互补配对原则,在这两条链上各形成一条互补链,这样从亲代DNA的分子可以精确地复制成2个子代DNA分子,每个子代DNA的一条链来自亲代DNA,另一条链则是新合成的。这种复制方式称为半保留复制(semiconservation replication)。
半保留复制实验证据:1958年Meselson & stahl用同位素示踪标记加密度梯度离心技术实验,证明了DNA是采取半保留的方式进行复制。[15N] DNA[14N- 15N] DNA[14N] DNA[14N- 15N] DNA 1958年Meselson和Stahl的实验首次有力地支持了半保留复制方式。将大肠杆菌培养在以15NH4Cl为唯一氮源的培养基中,经多代之后,细胞内所形成的DNA都为15N所标记,收集细胞并抽提出DNA,然后进行CsCl平衡密度梯度离心;而对照是在普通14N培养基中生长的大肠杆菌;将15N氮源培养的大肠杆菌转移到含14N的培养基中生长,每隔一段时间收集DNA进行离心。
(图)
二、复制过程的顺序性 双螺旋DNA是先全部解开成两股单链,然后分别作为模板合成新链,还是边解开边合成的? DNA分子中正在进行复制的部位成为复制叉(replication fork),它由两股亲代链及在其上新合成的子链构成。DNA的正在复制的部分在电镜下观察起来犹如一只眼睛,称为复制眼(replication eye)。这说明DNA是边解开边合成的。同时,多数DNA的复制是双向进行的。
三、DNA的半不连续复制以复制叉移动的方向为基准,一条模板链是3‘→5’,以此为模板而进行的新生DNA链的合成沿5‘→3’方向连续进行,这条链称为前导链(leading strand)。
DNA双螺旋的两条链是反向平行的,因此,在复制起点处两条DNA链解开成单链时,一条是5‘→3’方向,另一条是3‘→5’方向。以这两条链为模板时,以另一条链为模板的DNA合成也是沿5’→3‘方向进行,但与复制叉前进的方向相反,而且是分段、不连续合成的,这条链称为滞后链(lagging strand),合成的片段即为冈崎片段。这些冈崎片段以后由DNA连接酶连成完整的DNA链。这种前导链的连续合成和滞后链的不连续合成在生物是普遍存在的,称为DNA合成的半不连续复制(Semi-discontinuous replication)。
四、复制起点和复制子 复制起点(Origin of replication) :DNA复制在生物细胞中要从DNA分子上特定位置开始,这个特定的位置就称为复制起点,用ori表示。原核DNA较小,每一分子只有一个复制原点,而真核DNA则有多个复制原点。分子遗传学者们利用分子克隆技术,分离出大肠杆菌染色体DNA复制起点oriC。近年来,又克隆分析沙门氏杆菌,产气肠杆菌,肺炎克氏杆菌等许多细菌的ori区,发现它们在结构上相似,在核苷酸序列上有相当的保守性,说明了DNA复制起点的重要性。
复制子(replicon):DNA复制从起点开始双向进行直到终点为止,每一个这样的DNA单位称为复制子,主要包括复制起始位点和终止位点。原核生物中,每个DNA分子上通常只有一个复制子,但在宿主中可以多次地起始复制;而在真核生物中,每个DNA分子有许多个复制子,复制子长约50-200kb,这些复制子不是同时活化的,在S期的不同阶段,不同的复制子进行复制,但在每个细胞周期,它们必须活化一次。 第二节
DNA复制所需的酶和其它蛋白质
DNA复制实际上就是DNA指导的DNA合成代谢,以DNA作为复制的模板,脱氧核苷三磷酸(dATP,dGTP,dCTP,dTTP)是合成原料。除此外,细胞内还有许多酶和蛋白质参与DNA的复制。 一、拓扑异构酶 (旋转酶) 二、解螺旋酶(解链酶)三、单链结合蛋白(SSB)四、RNA聚合酶(引物酶)五、DNA聚合酶六、DNA连接酶
一、DNA拓扑异构酶(DNA Topisomerase)
由于DNA的解链,在DNA双链区势必产生正超螺旋,在环状DNA中更为明显,当达到一定程度后就会造成复制叉难再继续前进,从而终止DNA复制。在细胞内有两种机制可以防止这种现象发生:[1]DNA在生物细胞中本身就是超螺旋,当DNA解链而产生正超螺旋时,可以被原来存在的负超螺旋所中和;[2]DNA拓扑异构酶Ⅰ要以打开一条链,使负超螺旋状态转变成松弛状态,而
DNA拓扑异构酶Ⅱ(旋转酶)可以在DNA解链前方不停地继续将负超螺旋引入双链DNA。这两种机制保证了无论是环状DNA还是开环DNA的复制顺利的解链,再由DNA聚合酶Ⅲ合成新的DNA链。使双链DNA中一条链断裂,减少负超螺旋不需要任何辅助因子使双链DNA中两条链断裂,引入负超螺旋需要ATP水解供能 二、解螺旋酶(Helicase) 大肠杆菌中发现有两种螺旋酶参与这个过程,一种称为螺旋酶Ⅱ或螺旋酶Ⅲ,与滞后链的模板DNA结合沿5'→3'方向运动;第二种称为Rep蛋白,和前导链的模板DNA结合沿3'→5'方向运动。
三、单链DNA结合蛋白(SSBP) 解螺旋酶沿复制叉方向向前推进产生了一段单链区,但是这种单链DNA不会长久存在,会很快重新配对形成双链DNA或被核酸酶降解。在细胞内有大量单链DNA结合蛋白(single strand DNA binding protein SSBP)能很快地和单链DNA结合,防止其重新配对形成双链DNA或被核酸酶降解。 在大肠杆菌细胞中SSBP主要是177肽所组成的四聚体,可以和单链DNA上相邻的32个核苷酸结合。一个SSBP四聚体结合于单链DNA上可以促进其他SSBP四聚体与相邻的单链DNA结合,这个过程称为协同结合。SSBP结合到单链DNA上后,使其呈伸展状态,没有弯曲,有利于单链DNA作为模板。SSBP可以重复使用,当新生的DNA链合成到某一位置时,该处的SSBP便会脱落,并被重复利用。 四、引发酶(Primase)
引发酶催化引物RNA分子的合成,为DNA复制提供RNA引物。 引发酶活性较低,只有在其它蛋白质的存在下才显示较高活性。引发酶与其它蛋白质所形成的复合体称为引发体(primosome)。引发体在后随链的模板上移动到一定位置便可以引发RNA引物的合成。
机体之所以选择RNA作为引物的原因可能在于减少致死突变(lethal mutation)。DNA复制中,在模板上放置的最初几个核苷酸的正确性必然比其后的为低。如引物为RNA,这一部分所发生的差错就会避免或减少,因为引物随后即被降解。 它和传统的RNA聚合酶不一样,主要表现在: [1] 引发酶对利福平不敏感,而RNA聚合酶则敏感;
[2] 引发酶既可以利用核糖核苷酸,也可以利用脱氧核糖核苷酸,而RNA聚合酶只能利用核糖核苷酸;
[3] 引发酶只在复制起点处合成RNA引物而引发DNA的复制,而RNA聚合酶则是启动DNA转录合成RNA从而将遗传信息由DNA传递到RNA。
五、DNA聚合酶(DNA Polymerase)
1956年由A.Kornberg首先在大肠杆菌中发现DNA聚合酶,又称Kornberg酶。以后随着研究的深入,人们又发现了另外两种DNA聚合酶,为了区别,人们把Kornberg酶称为DNA聚合酶Ⅰ,另两种分别称为DNA聚合酶II和DNA聚合酶III。 DNA聚合酶的主要特性和功能介绍如下:DNA聚合酶Ⅱ 5´-3 ´聚合酶作用 3´-5 ´核酸外切酶作用 5´-3 ´核酸外切酶作用
DNA聚合酶5´-3 ´聚合酶作用:在引物RNA3'-OH末端,以dNTP为底物,按模板DNA上的指令由DNApol逐个将核苷酸加上去,
就是DNApol的聚合作用DNA聚合酶的3- 5 外切酶水解位点 1、DNA聚合酶Ⅰ(DNApolymeraseⅠ,DNApolⅠ)
DNApolⅠ经过枯草杆菌蛋白酶处理后,酶分子分裂成两个片段,较大的C-端片段分子量为76KD,通常称为Klenow片段,具有5'→3'聚合作用和3'→5'外切酶活性;较小的N-端片段分子量为34KD具有5'→3'外切酶活性。 DNApolⅠ功能:
a 5'→3'聚合作用:DNApolⅠ的聚合作用主要用于DNA的修复和RNA引物的替换。
b 5‘→3’外切酶活性: 冈崎片段5'末端RNA引物的去除依赖此种外切酶活性。
DNApolⅠ的5'→3'DNA聚合酶活性和5'→3'外切酶活性协同作用,可以使DNA链上的切口向前推进,即没有新的DNA合成,只有核苷酸的交换。这种反应叫切刻平移(Nick translation)。 如果新掺入的脱氧核苷酸三磷酸为α-32P-dNTP,则重新合成的新链即为带有同位素标记的DNA分子,可以用作探针进行分子杂交实验。
c 3‘→5’外切酶活性:主要功能是校对作用,在正常聚合条件下,3'→5'外切酶活性很低,一旦出现碱基错配,则聚合反应停止,由3'→5'外切酶将错配的核苷酸切除,以便重新在这个位置上聚合对应的核苷酸。可见,3'→5'外切酶活性对DNA复制真实性的维持是十分重要的。 d 焦磷酸解作用:
无机焦磷酸分解DNA生长链,可以认为是DNA聚合作用的逆反应,而且这种水解DNA链作用需要有模板DNA的存在。(dNMP)n+XPPi←(dNMP)n-x+X(dNPPP) e 焦磷酸交换作用:
催化dNTP末端的PPi同无机焦磷酸的交换反应。
最后两种作用,都要求有较高浓度的PPi,因此,在生物体内由于没有足够高的PPi而无重要意义。
尽管DNApolⅠ是第一个被鉴定的DNA聚合酶,但它不是在大肠杆菌中DNA复制的主要聚合酶。主要证据如下:
[1] 纯化的DNApolⅠ催化dNTP掺入的速率为667碱基/分,而体内DNA合成速率要比此高二倍数量级;
[2] 大肠杆菌的一个突变株中,此酶的活力正常,但染色体DNA复制不正常;
[3] 而在另外的突变株中,DNApolⅠ的活力中只是野生型的1%,但是DNA复制却正常,而且此突变株增加了对紫外线、烷化剂等突变因素的敏感性。这表明该酶与DNA复制关系不大,而在DNA修复中起着重要的作用。
2、DNA聚合酶Ⅱ(DNApolⅡ)该酶的催化特性如下:
(1) 有5'→3'聚合作用:但是对模板有特殊的要求,该酶的最适模板是双链DNA而中间有空隙(小于100个核苷酸)的单链DNA部份。对于较长的单链DNA模板区该酶的聚合活性很低。 (2) 该酶也具有3'→5'外切酶活性,但无5'→3'外切酶活性。 (3) 该酶对作用底物的选择性较强,一般只能将脱氧核苷酸掺入到DNA链中。
(4) 该酶不是复制的主要聚合酶,因为此酶缺陷的大肠杆菌突变株的DNA复制都正常。可能在DNA的损伤修复中该酶起到一定
的作用。目前该酶的功能尚不很清楚。
3、DNA聚合酶III(DNApolIII) DNA聚合酶III是细胞内DNA复制所必需的酶,也是主要的酶,尽管该酶在细胞内存在的数量较少,但催化脱氧核苷酸掺入DNA链的速率分别是DNA聚合酶I、Ⅱ的15倍和30倍。
α亚基的5‘→3聚合作用,ε亚基的3'→5'外切酶活性,提高了DNA复制的保真性;β亚基与复制起始有关,而γ和δ则与全酶功能的持续性有关,还有些亚基的功能尚不清楚。
T4-DNA聚合酶(T4-DNApol)近年来在枯草杆菌,鼠伤寒沙门氏杆菌等细胞及噬菌体T4、T5、T7中分离到DNA聚合酶。T4DNA聚合酶与大肠杆菌DNA聚合酶Ⅰ相似,也是一条多肽链,分子量亦相近,但氨基酸组成不同,它至少含有15个半胱氨酸残基。它在作用上与大肠杆菌DNApol不同: [1] 它无5‘→3’外切酶活性;
[2] 它需要一条有引物的单链DNA作模板。它利用单链DNA为模板,可同时利用它作为引物,即此单链DNA的3'端能环绕其本身的某一顺序形成氢键配对,3'端的未杂交部分即被T4DNA聚合酶的3'→5'外切酶活性切去,然后在其作用下从3'-OH端开始聚合,合成该模板DNA的互补链,再以互补链为模板合成原来的单链DNA。
六、 DNA连接酶(DNA ligase )DNA连接酶是是一种封闭DNA链上切口的酶,借助ATP或NAD水解提供的能量催化DNA链的5'-PO4与另一DNA链的3'-OH生成磷酸二酯键。这在DNA复制、修复和重组中起着重要作用。催化连接的两条链必须是与同一条互补链配对结合的(T4-DNA连接酶除外),而且必须是两条紧邻DNA链才能被DNA连接酶催化成磷酸二酯键。
连接酶连接切口噬菌体T4DNA连接酶的催化过程需要ATP辅助,可连接DNA-DNA,DNA-RNA,RNA-RNA和双链DNA粘性末端或平头末端。另外,NH4C1可以提高大肠杆菌DNA连接酶的催化速率,而对T4DNA连接酶则无效。无论是T4DNA连接酶,还是大肠杆菌DNA连接酶都不能催化两条游离的DNA链相连接。 以上只是DNA复制的几个主要蛋白质和酶。在DNA复制过程中还有许多蛋白质参与,如大肠杆菌细胞中就有三十多种蛋白质参与DNA复制,许多蛋白质的功能目前还只是猜测,而且其各种特性尚不明了。 第三节
原核生物DNA的复制过程DNA复制过程大致可以分为
复制的起始,链的延伸和终止三个阶段。大肠杆菌基因组以双链环状DNA分子的形式存在,其DNA从复制起点开始,双向同时进行,中间产物呈θ样形状,故又称\"θ\"型复制,最后两个复制方向相遇而终止复制。
一、DNA复制的起始复制的起始或引发阶段包括DNA复制起点双链解开,通过转录激活步骤合成RNA分子,RNA引物的合成,DNA聚合酶将第一个脱氧核苷酸加到引物RNA的3‘-OH末端。 1、DNA复制起点双链解开:
(1) 大肠杆菌复制原点oriC约为245bp长,oriC位点的一部分含有13个碱基对的被称为13聚体的重复序列(重复出现三次),而另外区域含有9个碱基对的被称为9聚体的重复序列(重复出现四次);
(2) DNA的复制起始需要DnaA蛋白质(由dnaA基因编码)与9
聚体结合。DnaA复合物的形成促使DNA成环状围绕着复合物。DNA的这个环刺激含有13聚体的oriC位点的部分中的双链解旋。 2、转录激活(transcriptional activation):DNA复制是从前导链的合成开始的,由RNA聚合酶(不是引发酶)在复制原点处转录一短的RNA分子。它的功能可能主要是使原点处的两条DNA链分开,暴露出某些特定序列以便引发体与之结合。这个过程称为转录激活作用。关于这段短RNA片断是否可以作为DNA合成引物的问题,有两种情况:一种情况是,该RNA分子经过加工成为DNA复制的引物;另一种情况是,这段RNA被完全降解掉,再由引发酶合成引物。
3、引发前体(preprimosome)的形成由复制因子n蛋白,n'蛋白,n\"蛋白,i蛋白,dnaB蛋白和dnaC蛋白等6种蛋白质与oriC组成引发前体,在单链DNA结合蛋白的作用下与单链DNA结合生成中间物,这是一种前引发过程。
4、引发体(primosome)与RNA引物的形成引发前体进一步与引发酶组装成引发体,它可以在单链DNA上移动,在dnaB亚基的作用下识别DNA复制起点位置。首先在前导链上由引发酶催化合成一段RNA引物,然后,引发体在滞后链上沿5'→3'方向不停的移动,在一定距离上反复合成RNA引物供DNA聚合酶Ⅲ合成冈崎片段使用。RNA引物形成后,由DNA聚合酶III催化将第一个脱氧核苷酸按碱基互补原则加在RNA引物3'-OH端而进入DNA链的延伸阶段。
引发体中许多蛋白因子的功能尚不清楚。但是,这些成份必须协同工作才能使引发体在滞后链上移动,识别合适的引物合成位置,并将核苷酸在引发位置上聚合成RNA引物。由于引发体在滞后链模板上的移动方向与其合成引物的方向相反,所以在滞后链上所合成的RNA引物非常短,一般挥?-5个核苷酸长。而且,在同一种生物体细胞中这些引物都具有相似的序列,表明引发酶要在DNA滞后链模板上比较特定的位置(序列)上才能合成RNA引物。
二、 DNA链的延伸DNA生长链的延伸主要由DNA聚合酶III催化。当冈崎片段形成后,DNA聚合酶Ⅰ通过其5'→3'外切酶活性切除冈崎片段上的RNA引物,同时,利用后一个冈崎片段作为引物由5'→3'合成DNA。最后两个冈崎片段由DNA连接酶将其接起来,形成完整的DNA滞后链。
DNA复制模型新生链延伸方向反向平行,但生物细胞内所有催化DNA聚合酶都只能催化5‘→3’延伸,根据计算,每一复制叉上仅结合着一个DNA聚合酶Ⅲ全酶,那么聚合酶Ⅲ全酶是怎样工作的呢?
DNA的复制模型:根据这一模型,当前导链上DNA开始合成、复制叉向前移动时,滞后链模板环绕DNA聚合酶Ⅲ全酶向后回折成环,并通过DNA聚合酶Ⅲ,然后再折向与未解链的双链DNA在同一方向上,则滞后链的合成可以和前导链的合成在同一方向上进行。当合成的DNA链到达前一次合成的冈崎片段的位置时,滞后链模板及刚合成的冈崎片断便从DNA聚合酶Ⅲ上释放出来。这时,由于复制叉继续向前运动,又产生了一段单链的滞后链模板,它重新环绕DNA聚合酶Ⅲ全酶,并通过DNA聚合酶Ⅲ开始合成新的滞后链冈崎片段。通过这样的机制,前导链的合成不会超过滞后链太多(最后只有一个冈崎片段的长度)。
三、 DNA复制的终止
1、环形DNA复制的终止在单方向复制的环形分子中,复制终点也就是它的复制原点。而双向复制的环形分子中,有的有固定的终点,而大多数没有固定的终点,只是两个生长点的简单碰撞,而不管在什么位置,如大肠杆菌。环形DNA复制的最后一步,会产生两个相互套接在一起的环,然后通过拓扑异够酶的作用去连环化。 43
2、线性DNA复制的终止一些病毒DNA的复制为此提供了解决这一问题的线索。T4DNA序列两端有160bp长的序列完全相同。在DNA复制时T4DNA两个子代DNA分子都会有一个3'端单链尾巴,两个子代DNA的3'端尾巴以互补结合形成两个单位T4DNA的线性连接。然后由DNA聚合酶Ⅰ填充和DNA连接酶连接后,继续复制便形成四个单位长度的T4DNA分子。这样复制下去,便可形成多个单位长度的T4DNA分子。这样的T4DNA分子可以被特异的内切酶切开,用DNA聚合酶填充与亲代DNA完全一样的双链T4DNA分子。
DNA复制中RNA引物被切除后,中间所遗留的间隙由DNA聚合Ⅰ所填充。但是,在线性分子的两端,其末端的RNA引物被切除后留下的是5'端,是无法被DNA聚合酶所填充的。痘病毒DNA在两端都形成发夹环状结构。DNA复制时,在线性分子中间的一个复制起点开始,双向进行,将发夹环状结构变成双链环状DNA。然后,在发夹的中央将不同DNA链切开,使DNA分子变性,双链分开。这样,在每个分子两端形成一个单链尾端要以自我互补,形成完整的发夹结构,与亲代DNA分子一样。 第四节
复制的其它形式在不同的物种中,DNA复制可以采用
不同的方式。根据复制叉的形状特点,可分为“θ”型复制,滚环复制,D环复制等。 一、滚环(Rolling circle)复制
许多病毒DNA的复制、F因子在接合转移时其DNA的复制,以及许多基因扩增时都采用这种方式。
双链环型DNA单向复制。。 在以这种机制进行的复制中,亲代双链DNA的一条链在DNA复制起点处被切开,其5‘端游离出来,并且很快被单链结合蛋白所结合。这使DNA聚合酶Ⅲ得以从3’-OH端逐渐增加脱氧核糖核苷酸。随着复制的进行,亲代DNA上被切断的5‘端长度继续增加,以后可移动的引发体便在其上形成,以引发RNA引物的合成,然后由DNA聚合酶Ⅲ催化合成冈崎片段。这个过程与前述的DNA滞后链的合成一样。最后由DNA聚合酶Ⅰ切除RNA引物,并填充间隙构成完整的DNA链。由于只有一条DNA链是完整的,因而在DNA解链时不会产生拓扑学上的问题,即未解链的双螺旋区不会产生超螺旋
滚环复制——单链环形DNA的复制 噬菌体ΦX174的复制 二、D环(D-loop)复制
单向复制的特殊方式。线粒体DNA的复制采取这种方式。D环复制的特点是两条链的复制不是同步的。
线粒体染色体的两条链可基于其密度来区别。以L链为模板,合成RNA引物,然后由DNA聚合酶γ催化合成一个500-600bp长的H链片段,将亲代的H链置换出来,产生一种D环复制中间物。当H链合成进行到一半以上时,暴露出轻链(L链)合成的
原点,从而引发L链的合成,后者延伸的方向与H链相反,合成也需要RNA引物。整个复制中,H链的合成提前完成,L链的合成随后结束。两条新合成的链都是连续的,不产生冈崎片段。 四、不需要RNA引物的DNA复制有些病毒的基因组是线性DNA,在原核细胞和真核细胞中复制时不需要RNA引物。研究发现,所有的腺病毒DNA生长链上都有一个特异的蛋白质分子附着在其5‘末端的胞嘧啶核苷酸上。在DNA复制开始之前,该末端蛋白质通过共价键与dCMP的5’磷酸基相连。胞嘧啶通过碱基配对与腺病毒DNA模板3‘末端的鸟嘌呤核苷酸配对结合,然后由病毒本身编码的DNA聚合酶以此末端蛋白-dCMP复合物为引物连续合成腺病毒整个基因组。这些DNA复制时,从一端开始,只能利用一条DNA链作为模板,即以3'→5'链为模板。这样,新合成的DNA链便将原来的亲代DNA链取代。原来的亲代DNA链作为单链从双螺旋中释放出来。然后在3'端开始以此链为模板重新合成另一条子链。这样,DNA复制即完成。产生两个与亲代DNA完成一样的子代DNA。
DNA聚合酶不能从头开始合成DNA链,那么,腺病毒和φ29DNA等没有RNA引物是怎样启动其DNA复制的呢?
在DNA复制过程中,由于DNA链被置换而产生了扭曲张力(torsional strain),但细胞内拓扑异构酶Ⅰ可以消除张力。病毒自身编码的72KD的单链结合蛋白可能也同时具有螺旋酶的功能促进DNA双链的解开。 第五节
真核生物DNA的复制
一、复制起始 真核生物DNA的复制速度比原核生物慢,然而真核生物DNA上有许多复制起点,在快速生长时,可以在多个不同位点同时起始复制。真核生物染色体DNA在全部复制完成以前起点不再从新开始复制。在快速生长的原核生物中,起点可以连续发动复制,即在第一次起始复制后而未完成之前,开始下一轮复制。
二、真核生物的DNA聚合酶 真核生物中几种DNA聚合酶都没有3'→5'或5'→3'外切酶活性。其聚合反应机制与原核生物的聚合一样。
DNA聚合酶α:主要负责核内染色体DNA的复制(引发酶与其结合,与Polδ协同作用),滞后链。
DNA聚合酶β:主要作用是核内缺口填充和DNA修复。 DNA聚合酶γ:负责催化线粒体DNA的复制。
DNA聚合酶δ:催化核内染色体DNA的复制与Polα协同作用),前导链的合成。
三、DNA连接酶 在真核生物细胞中也存在DNA连接酶,且有两型,分别称为连接酶Ⅰ和Ⅱ。DNA连接酶Ⅰ分子量约为200KD,主要存在于生长旺盛细胞中,DNA连接Ⅱ分子量约85KD,主要存在于生长于不活跃的细胞中。
四、真核生物染色体线性DNA分子末端复制:末端复制过程由DNA聚合酶的一个非常类型——端粒酶(由蛋白质和一个RNA模板构成)催化:
(a)外切核酸酶消化端粒5’末端的RNA引物,留下单链DNA作为引物。
(b)端粒酶通过作为模板的RNA成分与端粒单链的其余部分结合。
(c)端粒酶的蛋白质部分使用RNA作为模板从DNA引物的3’末端聚合脱氧核糖核苷酸。
最近的实验表明,真核生物染色体末端DNA复制是由一种特殊的酶将一个新的末端DNA序列加在刚刚完成复制的DNA末端。这种机制首先在四膜虫中发现。该生物细胞的线性DNA分子末端有30-70拷贝的5'TTGGGG3'序列,该细胞中存在一种酶可以将TTGGGG序列加在事先已存在的单键DNA末端的TTGGGG序列上。这样有较长的末端单链DNA,可以被引物酶重新引发或其他的酶蛋白引发而合成RNA引物,并由DNA聚合酶将其变成双链DNA。这样就可以避免其DNA随着复制的不断进行而逐渐变短。 (d)端粒酶沿DNA滑动,再一次把RNA模板暴露给其聚合酶活性部分。
(e)端粒酶的蛋白质成分再一次从DNA引物的3’末端聚合脱氧核糖核苷酸。重复此过程。
(f)端粒酶从延伸的单链DNA上解脱。延伸的ssDNA通过在鸟嘌呤之间形成非Watson~Crick碱基配对构成发卡样结构。DNA修复酶弥补缺口,连接酶封闭余下的切口。
五、核小体的装配 真核生物染色体以核小体为结构单位组成,因此,DNA复制后,核小体的装配是人们所瞩目的一个问题。 电镜观察证明,未复制和新复制DNA同样都呈现出念珠状外观。这表明新合成的DNA立即装配成核小休。用同位素标记新合成的组蛋白并分析子代的核小体,结果发现核小体或是全部都带有同位素标记的组蛋白,或是全部都不带同位素标记的组蛋白。这表明老和新的组蛋白并不混合,后证明有核小体的是前导链,无核小体的是滞后链。 在真核生物的复制子上,亲代染色质的核小体被逐个打开,组蛋白八聚体可直接转移到子代前导链和它的模板上并与与其缔合成核小体,新合成的组蛋白八聚体则与滞后链缔合成核小体。 因此,DNA复制是半保留的,而组蛋白则是全保留的,原来属于一个核小体的组蛋白在复制后,仍然属于一个核小体。 思考题:
1、原核与真核生物中的DNA聚合酶有哪些?功能如何? 2、DNA复制的基本特点。
3、DNA复制方式有哪些?有何区别? 6 . 端粒酶属于(B)
(A)限制性内切酶 (B)DNA聚合酶 (C)RNA聚合酶 (D)DNA连接酶 (E)拓扑异构酶
7. 端粒DNA的一条链由( A )重复单位构成。 A 5’—TTGGGG-3’ (b)5’—AAAAAAA
(c)5’—TTTTTTT—3’ (d)5’—TATATATA—3’ (e)以上没有 8. 线粒体DNA的复制是从(A )。
(a)单一ori位点双向进行的 (b)两个不同ori位点在同一方向进行 (c)两个不同ori位点在不同时间以相反方向进行 (d)许多位点双向进行的,同核染色体一样 (e)以上没有
9. 在原核生物复制子中以下哪种酶除去RNA引物并加人脱氧核糖核苷酸?( C )
(a) DNA聚合酶Ⅲ (b)DNA聚合酶Ⅱ (c) DNA聚合酶I (d)外切核酸酶MF1 (e) DNA连接酶
10. 真核生物中,后随链DNA是由(A )DNA聚合酶合成的。
(a)α (b)β (c)γ (d)δ (e)ε
11.大肠杆菌中哪种酶是承担基因组DNA复制的主要聚合酶 ( C ) A Pol I; B Pol II; C Pol III D Klenow 酶 12.能编码多肽链的最小DNA单位是D
顺反子B、操纵子C、启动子D、复制子E、转录子 13、I 型DNA拓朴异构酶( C)。
(a)使连接数改变士2 (b)需要ATP (c)将DNA双螺旋中的一条链打断
(d)是抗生素类药物的靶向 14. 一个复制子是:( C )
(a)细胞分裂期间复制产物被分离之后的DNA片段 (b)复制的DNA片段和在此过程中所需的酶和蛋白 (c)任何自发复制的DNA序列(它与复制起始点相连) (d)任何给定的复制机制的产物(如:单环) (e)复制起点和复制叉之间的DNA片段
16. 下述哪一个不是复制起始位点所具有的特征:( A ) (a)起始位点是包括多个短重复序列的独特DNA片段 (b)起始位点是形成稳定二级结构的回文序列
(c)多聚体DNA结合蛋白DnaA专一性识别这些短的重复序列 (d)起始位点旁侧序列是G-C丰富的,能稳定起始复合物 17. 滚环复制:(BD)
(a)是细菌DNA的主要复制方式 (b)可以使复制子大量扩增 (c)产生的复制子总是双链环状拷贝
(d)是噬菌体DNA在细菌中最通常的一种复制方式 二、是非题 正确的答案写“T”,错误的答案写“F”。 1、在原核细胞和真核细胞中,染色体DNA都与组蛋白形成复合体。F
2、每个原核染色体只有一复制起始点 F
3、半保留复制是指有50%的基因是新合成的,另50%的基因是上一代的。F
4、基因组DNA复制时,先导链的引物是DNA,后随链的引物是RNA ( F )
5、在细菌中,前导链DNA和后随链DNA的合成是由同一类型的DNA聚合酶催化的 T
6、真核生物的染色体中,DNA约占80%,其余为RNA和蛋白质。 ( F )
7、SV40DNA在复制后老的组蛋白都分布在先导链上。 T 第四章 DNA重组
所有的DNA都是重组体,可以说只要有DNA,就会发生重组。因为生物要生存就得适应,要适应就得有变异,而变异的来源就是突变和重组。就每个个体而言,发生突变的概率是很低的,涉及到的基因数目也非常有限。所以,如果只有突变而没有不同个体间的基因交流,则生物体难以迅速地组装产生最能适应环境的基因组合,同时通过不同个体间的基因交流,可以保证遗传的多样性,从而为选择奠定物质基础。
研究重组的分子机制可为基因的熟练操作提供新方法,重组技术的发展又为重组机制的研究开辟了广阔前景。
根据对DNA序列和所需蛋白质因子的要求可以把重组分为四种
类型,即:
同源重组(homologous recombination) 转座重组(transposition recombination) 位点专一性重组(site-specific recombination) 异常重组(illegitimate recombination)。 第一节 同源重组
同源重组也称为交换(crossing over),是指DNA分子内断裂——复合的基因交流。它发生在DNA的同源序列之间,真核生物非姊妹染色单体的交换,姊妹染色单体的交换,细菌及某些低等真核生物的转化,细菌的转导、接合,噬菌体的重组等都属于这一类型。
同源重组要求较大的DNA片段进行交换,只要它们的序列相同或接近相同,就可以在序列中的任何一点发生重组,当然也存在重组热点,即某类序列发生重组的概率高于其它序列。 一、 同源重组的机制 对于其作用机制有两种假设:
第一种假设:认为交换是完整DNA分子的断裂重接。这是染色体收缩所产生的张力造成的。断裂端可通过交叉重接而解除张力,从而产生两个相互重组的染色单体,按照这个模式,重组发生在染色体复制完成之后,那就是在每对联会染色体中有四条染色单体时发生。
第二种假设:称为拷贝选择,即配对的染色体复制时,沿着父本染色体形成的新DNA链转而以母本染色体为模板,假如母本链的互补链当达到相同点时也转换模板,结果就形成两个相对应的重组体。
这两种假设的基本区别在于对重组染色体物理起点的推测,前者为两个亲本染色体在断裂和重接之后,产生重组染色体的物理遗传物质,后者则为DNA在复制时由于选择不同的模板产生重组。实验证明交换是DNA分子的断裂重接。 二、原核生物同源重组
大肠杆菌的同源重组需要RecA蛋白质,类似的蛋白质也存在于其它细菌中。因此,细菌中的同源重组又被称为依赖RecA重组。如果DNA片段是单链:RecA蛋白与它结合并引导它到细胞染色体上的同源区域。RecA蛋白在该同源区域内进行解链,并促进 在该片段与一条染色体DNA链之间形成氢键。最后,UvrABC限制性内切核酸酶从该染色体上切除已解开的多余的链。连接酶修复切口。成功进行同源重组所需最少的同源核苷酸碱基数量约为60个
如果DNA片段是双链:在重组发生之前它必须被转换为单链DNA。从片段的一个末端起始,RecBCD蛋白行进到chi位点(5'GCTGGTGG3'),在此RecBCD的RecD亚基切断DNA的一条链。然后,RecA蛋白与该单链DNA结合,将其引入到细胞染色体的一个同源区域,如上所述。 三、在真核生物中如何形成同源重组 (a) 在减数分裂的前期I,同源染色体联会;
(b) 联会复合体中每个同源染色单体的一条链被限制性内切核酸酶切断并被交换;
(c) DNA聚合酶可延伸已交换的链,DNA连接酶除去链中切口,同时上面的染色单体旋转180度形成Holliday中间体(根据1964
年提出这个模型的科学家的名字命名),或称其为chi(x)型。这个阶段的DNA已从大肠杆菌中分离出来。
(d) 酶复合物RuvAB可促进分支移位,致使chi型中未切断的链被限制性内切核酸酶RuvC在四核苷酸序列5'-(A/T)TT(G/C)-3'处切断;
(e) 染色单体未断链的切开形成了分开的重组染色单体。重组染色单体中的切口被连接酶修复。 第二节 位点专一性重组
位点专一重组:在专一性酶催化下,使DNA分子从专一位点上断裂,然后插入另一基因或基因组,再重新连接起来的过程。 噬菌体基因组整合到细菌染色体基因组中去,是直接在专一序列之间配对而发生的重组,属于位点专一性重组。
重组只需要有限的同源序列存在,但必须有位点专一性的蛋白质因子参与催化。
在整合反应中,切割、插入(交换)、再连接一气完成,没有任何稳定的中间产物。专一性位点上两个DNA分子是同源序列,对其的切割是交错切割,形成类似于某些限制性内切酶作用产生的粘性末端。
第三节 转座重组 转座子(transposon,Tn)是存在于染色体DNA上可自主复制和移位的基本单位。转座过程中转座单元从染色体的一个区段转移到另一个区段,即发生转座重组,从基本上改变了染色体的结构,它既不依靠转座单元和插入区段序列的同源性,也不需要重组酶。转座作用除了单纯地移动基因,还打乱了DNA序列而造成缺失,倒位和重排。这种改变显然是染色体进化的关键特征,特别在真核细胞中更是如此。转座子已在所有生物中发现。
一、转座子的类型和结构特征 所有转座子都有两个结构特征:
(1) 两端有20-40个核苷酸的倒转重复序列。
(2) 具有编码转座酶的基因,这种酶催化转座子插入新的位置。 在细菌中发现两种类型的转座子:插入序列与复合转座子 (1) 简单转座子/插入序列(insertional sequence,IS) :只带有其本身转座所必需的基因,它们是细菌染色体或质粒DNA的正常组成部分,一个细菌细胞常带有少于10个IS序列。
(2) 复合转座子(composite transposon):是一类带有某些抗药性基因或其它宿主基因的转座子,其两端往往具有相同或高度同源的IS序列或残余IS序列。这表明,当插入序列跳跃到细胞基因的两端时就可产生复合转座子。一旦形成复合转座子, IS序列就不能再单独移动,只能将复合体作为整体来运动。 二、移位机理
(1)转座机制 主要可从三个方面加以说明:
a.转座子携带它插入在老位点上的全部序列准确移动,而不携带邻近任何DNA。
b.虽然大多数转座子几乎可以移动到新基因组的任何区域,但是它们的移动也并非完全是随机的,它们往往入侵某些DNA序列,某些转座子攻击专一的4或6个碱基对的对称序列,很像限制性内切酶切割DNA的作用一样。
C 在靶DNA的转座子插入位点上准确地复制3~12个碱基(取决于转座子),在转座子的每一端都要保留一个拷贝。为此在转座
过程中必须发生DNA复制以构建双份靶DNA插入位点。 (2) 转座作用模式 转座可分为复制性转座和简单转座(非复制性)。
a.转座酶与靶位点上插入位点的序列结合。
b.转座酶像限制性内切酶那样在靶DNA链上形成交叉切割,同时也在转座子的每条链的一端切割。转座子的两条链的自由末端分别和靶DNA的两个插入位点的末端连接在一起成桥,新老两个靶DNA分子就相互连接在一起。随着转座子和生长的具体条件不同有两种不同的选择:
c.简单转座 在转座子的另一末端进行第二次切割,使转座子完全转移到新的DNA中,由DNA聚合酶的作用插进几个核苷酸以完成靶位点复制,并在老的宿主靶DNA上留下一个致死性缺口。可见简单转座作用是将转座子转移到新的位点上。 d.复制性转座 转座子DNA没有第二次被切开,而是留下第二个转座子链靠DNA聚合酶从第一个切口的末端开始复制,这样产生的结构称为共合体。共合体结构的存在是这种转座过程的有力证据。离解酶催化两个转座子拷贝之间的位点专一性重组,结果每个分子都带有一个转座子拷贝。 三、转座子的某些遗传学效应 (1) 可引起插入突变。
如果插入的位置是一个操纵子前端的基因,那么可能造成极性突变,导致该操纵子后半部分结构基因表达失活。 (2) 插入位置上出现新的基因。
如果转座子上带有抗药性基因,那么它一方面造成基因插入突变,另一方面在这一位置上出现一个新的抗药基因。 (3) 转座子插入染色体后引起染色体的畸变。
当转座子在宿主DNA原有位点附近的第二位点插入一份拷贝时,宿主系统可以在转座子的两个拷贝之间产生相互重组,发生缺失和倒位。
(4) 转座重组引起生物进化。
例如转座子可将一些原来在染色体上相距甚远的基因组合到一起,组成现在被构建到一起的一些操纵子。也有可能把两段分离着的碱基序列转变成连在一起的DNA。这样在进化过程中就能产生一些新的蛋自质分子。 四、真核生物中的转座子
1、玉米中的控制因子(controlling element)
玉米中的控制因子分为两类,即自主性因子和非自主性因子。当基因组中存在与非自主性因子同家族的自主性因子时,它才具备转座功能。同一家族的自主性因子能为非自主性因子的转座提供反式作用蛋白(转座酶)。
Spm(suppressor-mutator)和En(enhancer)属于另一类转座子。Spm和En几乎是完全相同的,它们只有不到10个碱基的差异,两端各有一个13bp的倒转重复序列,在其靶DNA位点复制形成3bp正向重复。 2、果蝇中的转座子 (1)Copia转座子 2、果蝇中的转座子 (2)P转座子 异常重组
不需要DNA序列的同源性,也不需要重组酶参与。目前对这类重组的机制尚不清楚。
第五章 RNA的生物合成—转录 分子生物学
核糖核酸(ribonucleic acid, RNA) 的合成和DNA的合成,从核苷酸的水平上看来,是很相似的,但此二过程的生物学意义却十分不同。DNA的合成仅是基因组的精确复制,并且固定不变。但基因组转录成RNA,却涉及许多遗传和表达的复杂性。本章将从RNA的基本知识谈到原核生物的RNA,并进一步谈到真核生物的RNA。
一条RNA链在DNA模板上的转录,从何处起始,何处停止,何时起始,何时停止,如何使二者达到协调一致等,那是很重要的问题。 转录的概念
转录是在DNA指导下的RNA聚合酶的催化下,按照碱基配对的原则,以四种核苷酸为原料合成一条与模板DNA互补的RNA的过程。RNA的转录从DNA模板的特定位点开始,并在一定的位点终止。此转录区域为一个转录单位。
作模板的链称为模板链(template strand)或反义链(antisense strand) 。不做模板的DNA链称为编码链(coding strand) ,或有义链(sense strand)。
模板链 反意义链 编码链 有意义链 因为非模板链的核苷酸序列与转录出来的RNA序列一致,只是T与U有所区别。对于mRNA,也易于将DNA序列直接与氨基酸密码子联系起来。
第一节 RNA的结构及种类
RNA分子有三大类,即信使RNA(messenger RNA,mRNA)、核糖体RNA(ribosome RNA,rRNA)和转移RNA(transfer RNA,tRNA)。所有这些RNA都按DNA碱基序列合成。
一、mRNA mRNA是蛋白质生物合成的直接模板,单链,分子大小不一。mRNA的寿命较短,半衰期短。大多数细菌mRNA在转录开始1分钟后就开始降解。
mRNA的碱基序列从起始密码到终止密码以三个碱基为一组而读码,三个一组的碱基称为密码子(codon),每个密码子对应一个氨基酸或一个终止信号。
mRNA的二级结构是通过单链自身折叠而形成的茎环结构。 原核生物和真核生物的mRNA在结构上主要区别:
1、原核生物的mRNA是多顺反子,真核生物的mRNA是单顺反子。
“顺反子”(cistron)是通过顺反测验鉴定的遗传功能单位。对应于一条多肽链的DNA片段加上起始信号、终止信号称为顺反子(cistron),或编码一条多肽链的最短DNA片段。只编码一条多肽链的mRNA称为单顺反子。编码多条多肽链的mRNA分子称为多顺反子。多顺反子mRNA分子中顺反子间序列称隔离序列(spacer) 。
2、原核mRNA5'端无帽子结构,真核mRNA5'端有一段帽子结构。 不同真核生物的mRNA,5‘端帽子不同,可分为三种类型: 帽子结构通式为m7GpppNmpNmp。其中N代表mRNA分子原有的第一个核苷酸。(此结构式有误,左边鸟嘌呤6位应为碳氧双键)
零类帽子(cap0):m7GpppN,m7G是鸟嘌呤第7位氮被甲基化,是转录后加上去的;与下一个核苷酸连接是以5‘与5’相联的方式。
1类帽子(cap1):m7GpppNmp,即转录出的mRNA的第一位核苷酸也被甲基化。
2类帽子(cap2) :m7GpppNmpNmp,即mRNA的第一个核苷酸和第二个核苷酸均被甲基化。有2类帽子的mRNA只占有帽mRNA总量的10%—15%以下。 帽子结构的功能:
① 封闭mRNA的5‘端,使其没有游离的5-磷酸,从而阻止核酸外切酶的降解,使mRNA更稳定;
② 作为mRNA与核糖体结合的信号,无帽子结构的mRNA不能与核糖体的40S亚基结合;
③ 可能与蛋白质合成的起始有关,帽子结构附近区域能形成发荚结构,缩短了帽子结构与起始密码子之间的距离。 3、原核mRNA3'端无polyA,真核mRNA3'端有polyA结构。 大多数真核生物mRNA的3'端都有50-200个腺苷酸残基,构成poly(A)尾结构。poly(A)也是转录后加上去的。但有些真核细胞mRNA,如组蛋白、呼肠弧病毒及一些植物病毒mRNA上没有poly(A)。
多聚A是mRNA由细胞核进入细胞质所必需的形式,polyA可抵抗外切核酸酶从3‘端降解mRNA,增加mRNA的稳定性。 mRNA刚从细胞核进入细胞质时,其polyA尾一般较长,随着mRNA在细胞质内逗留时间延长, polyA尾逐渐变短消失, mRNA进入降解过程。 二、tRNA
在蛋白质生物全面过程中,tRNA主要起转运氨基酸的作用。由于tRNA分子的同工性,所以细胞内tRNA的种类(80多种)比氨基酸的种类多。
1、tRNA的一级结构
tRNA一般由73-93个核苷酸组成,其中有15-16个核苷酸为固定核苷酸,即在绝大多数tRNA上这些核苷酸的种类和位置不变。 tRNA一般有10-15个稀有碱基,如假鸟苷(ψ),各种甲基化的嘌呤和嘧啶核苷,二氢尿嘧啶(DHU)等。这些稀有碱基的功能不十分清楚。
2、tRNA的二级结构——三叶草结构
(1)二氢尿嘧啶环(D环) (2)反密码子环(3)额外环或可变环
(4) TψC环:由7个不配对的碱基组成,几乎总是含5‘GTψC3’序列。
(5) 3‘端含CCA-OH序列:称为氨基酸接受茎
上述的二氢尿嘧啶环,反密码子环,和TψC环分别连接在由4或5个碱基组成的螺旋区上,依次称为二氢尿嘧啶茎,反密码子茎和TψC茎。此外,前述的15-16个固定碱基几乎全部位于这些环上。
3、tRNA的三级结构—— \"倒L形\"
(1) 氨基酸接受臂CCA序列和反密码子处于倒L的两端。 (2) D环和TψC环形成了倒L的角。
(3) 绝大多数形成的三级结构的氢键涉及的碱基种类不同于标准的A-U和G-C碱基对;还有少数三级结构反应涉及核糖体-磷酸骨
架中的基团,包括核糖的2‘OH基。
不同tRNA仅在倒L形的角有轻微改变,说明此拐角区也许是可伸屈的,允许tRNA在执行不同功能时改变其构象。 三、rRNA
核糖体是合成蛋白质的场所,由核糖体RNA和具有各种功能的大量蛋白质组成。rRNA约占核糖体重量的三分之二,是由大约120-5000个核苷酸组成的单链。
rRNA的种类和大小一般用沉降系数(S)表示。(沉降常数指单位离心力场中沉降分子下降的速度,为了纪念超离心法创始人Svedberg用S作为沉降常数的单位,1S=1*10-13秒,S常用来描述核酸分子、蛋白质分子和核糖体等的大小)
不少rRNA的一级结构已经测定,如大肠杆菌核糖体中的5s rRNA含120个核苷酸、16S rRNA含1 542个核苷酸,23SrRNA含2 904个核苷酸。
rRNA的二级结构也是通过单链自身折叠形成的茎环结构,分子越大茎环结构越复杂。由于rRNA分子柔性较大,三级结构的研究较困难,目前对rRNA的三级结构还了解不多。 第二节
RNA合成的酶学
一、 RNA合成的基本特点
1、 RNA的前体是四种核糖核苷三磷酸:ATP、GTP、CTP、UTP。 2、RNA链的伸长方向也是从5'→3',核苷三磷酸加到新生链的3'端,与DNA复制时的情况基本相同。
3、转录必须以一条DNA链为模板,按照碱基互补配对的原则进行转录。
4、RNA聚合酶能起始一条新链的合成,起始的核苷酸一般都是嘌呤核苷三磷酸。
在转录区域内DNA双链必须暂时解开,新合成的RNA上的少数几个核苷酸与模板互补,随着链的增长和RNA聚合酶的向前移动,原来解链部分的DNA又恢复双链结构。 二、E.coli RNA聚合酶
E.coli细胞中约有RNA聚合酶分子3000个以上,催化RNA主链中核苷酸间的3',5'磷酸二酯键的形成。催化反应速度快,在37℃时RNA链的延伸可达40个核苷酸/秒。
1、RNA聚合酶的基本组成单位细菌的RNA聚合酶具有很复杂的结构。由5种亚基组成,即α2ββ'ωζ,其中α亚基有两个,其余亚基均只有一个,总分子量为450KDa,是目前已知最大的酶之一。整个酶分子称为全酶,ζ亚基和其他亚基的结合不很牢固,当ζ亚基脱离全酶后,剩下的β'βα2ω称为核心酶。 2、RNA聚合酶的功能
核心酶的作用是催化核苷酸间磷酸二酯键的形成。 β和β’亚基组成酶的活性中心。α亚基的功能可能是与核心酶的组装及启动子识别有关。ζ亚基参与全酶与启动子的牢固结合,识别启动子,使RNA聚合酶能在正确的位置上开始转录。 三、真核生物的RNA聚合酶
真核细胞的转录机构更加复杂,有三种RNA聚合酶,即RNA聚合酶I、RNA聚合酶Ⅱ和RNA聚合酶III,分别位于细胞不同的部位,且均有复杂的亚基结构。每种酶负责不同种类基因的转录。它们的一般性质见表:
RNA聚合酶Ⅱ合成mRNA,它是最直接和遗传调节相关的
酶。因此对聚合酶Ⅱ的研究是目前的热点之一。 第三节 RNA聚合酶的特定识别序列—启动子
启动子(promoter,P)是指能被RNA聚合酶识别、结合并启动基因转录的一段DNA序列。在基因表达的调控中,转录的起始是个关键,而RNA聚合酶能否与启动子相互作用又是起始转录的关键问题。
一、原核生物的启动子
将100个以上启动子的顺序进行了比较,发现在RNA合成开始位点的上游大约10bp和35bp处有两个共同的序列,称为-10和-35序列。 1、启动子的结构
(1) -35序列:又称为Sextama框,其一致序列为TTGACA。它是RNA聚合酶的初始结合位点,RNA聚合酶依靠其ζ亚基识别该位点,因此又称为RNA聚合酶的识别位点。
(2)-10序列: 又称为Pribnow框,其一致序列为TATAAT或是稍有不同的变化形式。它是RNA聚合酶的牢固结合位点,简称结合位点。-10序列富含AT碱基对,DNA双链容易被打开。 RNA聚合酶结合于-35序列 ,然后才结合于-10序列。
启动子中的-10和-35序列是RNA聚合酶所结合和作用必需的顺序。但是附近其他DNA顺序也能影响启动子的功能。上游顺序的变化可以影响到-10和-35区的DNA结构细节。例如,远隔部位的富有AT的DNA顺序被认为能增进转录起始的频率。 原核生物亦有少数启动子缺乏这两个序列(-35和-10)之一。在这种情况下,RNA聚合酶往往不能单独识别这种启动子,而需要有辅助蛋白质的帮助。 2、影响启动子活性的因素 a 调节蛋白对启动子的影响
调节蛋白有两类,能阻断RNA聚合酶与启动子序列相结合,从而抑制转录的,称为阻遏蛋白(repressor);能与RNA聚合酶结合并提高其活性的,称为激活蛋白(activator)。
b 模板的超螺旋张力对启动子效率的影响 RNA聚合酶首先要在启动子处使DNA解旋才能起始转录。因此,凡有利或不利于解旋的情况就会增高或降低起始的频率。 c 上游序列对启动子的影响
-10和-35序列是RNA聚合酶识别和发挥功能所必须的。除此以外,上游的某些区域,-50和-150区域也会影响启动子的活性。如果这个区域被外源DNA所取代,则启动子的活性大约会降低10倍。
启动子的效率高低不一。在不同的生长情况下转录可根据需要而改变。这种调节作用常常是由一些调节蛋白与启动子处或靠近启动子处的DNA相结合来实现的。凡需要激活蛋白才能充分发挥作用的启动子其-35序列往往与标准序列有很大差异。阻遏蛋白与激活蛋白没有绝对的界限,某种蛋白质是某种启动子阻遏蛋白但也可能是另一种启动子的激活蛋白,反之亦然。
所以细胞内一个重要的条件是DNA模板的超螺旋张力。如果旋转酶与拓扑异构酶Ⅰ的活性因突变或抵制剂而降低,通常即可使启动子的功能发生相应的改变。 二、真核生物的启动子
真核生物有三种RNA聚合酶,每种酶都有自己识别的启动子。
1、RNA聚合酶I的启动子
RNA聚合酶I是转录rRNA的,其启动子可分两部分: -40—+50称近启动子,其功能为决定转录起始的精确位置; -165—-40称为远启动子,其功能为影响转录的频率。 RNA聚合酶I具有明显的种族特异性,每种生物都有特定的转录因子与RNA聚合酶I结合,从而促进酶与启动子结合形成转录起始的复合物。
启动子均位于所谓“不转录的间隔区”(nontranscribed spacer ,NTS),但目前发现大部分的NTS是转录的。 2、RNA聚合酶II的启动子
转录起始位点碱基大多为A(指非模板链),两侧各有若干个嘧啶核苷酸。
(1) TATA盒,又称为Goldberg-Hogness box,其一致序列为TATAA/TAA/T,基本上都由A·T碱基组成,一般位于-25bp附近,功能类似原核生物pribnow盒,是RNA聚合酶的结合位点,使转录精确的起始。 在TATA盒的两侧倾向于富含G·C碱基对的序列,这也是TATA盒发挥作用的重要因素之一。
(2)CAAT盒,其一致序列为GGC/TCAATCT,一般位于-75附近。CAAT盒和GC区主要控制转录起始频率,基本不参与起始位点的确定。
真核生物RNA聚合酶II的启动子主要有四个部位,其中前三个部位是大多数启动子都具备的。
增强子,又称远上游序列,一般都在-100以上。它能大大增强启动子的活性。SV40的72bp重复序列的增强子作用主要是: 增强效应;距离效应;极性效应
增强效应 对依赖和不依赖于TATA盒的转录都有增强效应,但对前者增强效应高;
距离效应 离72bp的重复序列近的容易起始转录;
极性效应 转录方向离开72bp重复序列的起始序列优先转录,而朝向72bp重复序列的则效率差。
增强子具有组织特异性,例如免疫球蛋白基因的增强子只有在B淋巴胞内,活性才最高。 3、RNA聚合酶III的下游启动子
由RNA聚合酶III转录的5SrRNA基因中,其启动子位于转录单位之中,在转录起点的下游50个碱基以后(约在+55到+80之间),故又称内部启动子。
在tRNA基因中,其启动子分为两段,均在基因内部。A段在+8和+30之间,B段在+51和+72之间。两段必须同时存在,否则不能起始。
一般说,启动子均位于转录起点的上游。RNA聚合酶Ⅲ能识别各种各样不同的启动子顺序,在于有共同的转录因子TFIIIC和TFIIIB,但RNA聚合酶Ⅲ在转录爪蟾的5SRNA基因时,除这两个因子外,还需要一个转录因子,37KD的蛋白质TFⅢA的协助,它结合在+45到+96的部位。 第四节
RNA的酶促合成——转录过程
一、RNA合成的起始 1、RNA聚合酶与启动子的结合
a 酶找到启动子的-35区域相结合,此时DNA仍以双链形式存在,形成一种比较松散的复合物,称为闭合的启动子复合物。
b 闭合的启动子复合物转变为开放的启动子复合物,此时酶与DNA的结合比较紧密,-10区约有17bp被解旋,暴露出转录的模板链,以便合成RNA。
2、RNA链的合成从pppA或pppG开始 ,在第一个核苷酸参加之后ζ因子解离
在E.coli中,RNA链的起始通常在解开的双链部分离-10开始处大约12或13个碱基处。转录的第一个核苷酸通常是pppA或pppG,嘧啶是它的第二选择。但是这并不意味着RNA分子的起始末端都一定是原来的第一个嘌呤核苷酸,因为RNA合成之后,细胞中的核酸酶常常把5’末端的核苷酸切除掉了,因此,其5’末端的核苷酸没有三磷酸基团存在。
一般认为,ζ因子之所以被释放出是因为此时它已不起作用了,而且如果ζ因子仍然存在将会防碍核心酶在模板上有效的移动,不利于RNA链的延伸。RNA链的延伸阶段开始后,ζ因子即从核心酶-DNA-新生RNA复合体上解离下来,并可再用于和新的核心酶结合。
二、RNA合成的延伸—— DNA的解链和重复螺旋化
在转录过程中,RNA-DNA杂交分子的长度约为12bp长。保持解开状态的DNA链的长度约为17bp。
在RNA链的延伸过程中,RNA聚合酶不断地把前方的DNA双链打开,新合成的RNA不断离开模板,而后面已经转录过的部分不断还原成双链。
NusA因子参与RNA合成的延伸和抗终止
NusA蛋白: RNA聚合酶的一个附属因子,RNA聚合酶的基本活性并不需要NusA,但此因子对RNA合成很重要。
在细胞内当ζ因子离开RNA聚合酶之后,NusA蛋白便与核心酶结合,促使RNA链的延伸。一个NusA分子可与几个RNA聚合酶分子相作用。
在转录过程中NusA究竟有什么功能还不了解。遗传学实验证明它是不可缺少的蛋白质。
ζ因子由于与核心酶的亲和力强,所以ζ因子又马上取代了NusA蛋白。在体外,NusA对RNA合成的速率有明显作用,对不需ρ因子的RNA合成的终止也是必需的。可能NusA和噬菌体λ的N基因编码的蛋白类似,在介导某些调节因子的作用中有重要功能。
三、RNA合成的终止
DNA中有转录终止信号,其作用是在DNA模板的特异位点处终止RNA的合成,称为终止子(terminator)。在终止子处,RNA聚合酶停止其聚合作用,将新生RNA链释出,并离开模板DNA。转录终止信号分为两类,一类是不依赖ρ因子的终止,另一类是依赖ρ因子的终止。
1、不依赖ρ因子的终止 两个特征:
[1] DNA序列有富含GC的回文结构(集中在15-20核苷酸上),位于RNA尾部之前。
[2] 回文序列之后有一串约4-8个A的碱基,转录为RNA3'末端的一连串U。
这两个结构引起RNA合成终止
体外实验显示,如果掺入其他碱基以阻止发夹形成或将多聚dA序列中的一个碱基换掉或除去部分序列(缺失),终止即不发生。
转录本能形成发夹结构,它的形成破坏了一部分RNA-DNA杂交链,仅剩下多聚U序列和模板链杂交。而这样的由几个U和几个dA形成的RNA-DNA杂交双链是很不稳定的,于是新生RNA链将很快自DNA双链中被排除出来。 2、依赖ρ因子的终止
提纯的RNA聚合酶并不能识别特异性的转录终止信号,而加入大肠杆菌ρ因子后该聚合酶就能准确终止转录。 ρ因子是一个六聚体蛋白。
DNA膜板没有多聚dA序列,也不是都能形成稳定的发夹。ρ因子可能的作用机制如下:
[1] RNA合成起始后,ρ因子即附着在新生RNA链上,靠ATP水解放出的能量向RNA聚合酶移动,到达暂停在终止位点上的RNA聚合酶后,使之从模板DNA中释出RNA,完成转录。
[2] ρ因子通过催化NTP的水解促使新生RNA链从三元转录复合物中解离。
ρ因子是在以后才发挥作用而释出RNA的。即使是在没有ρ时,不过以后仍继续向前进。故有人认为,即使有一个很弱的发夹也可使RNA聚合酶停止前进。此时ρ因子即可发挥作用。 四、真核生物转录的起始和延伸
真核生物的转录机制十分复杂,真核细胞中RNA聚合酶通常不能单独发挥转录作用,而需要与其他转录因子(transcription factors,TF)共同协作,才能形成复杂的前起始复合物(pre-initiation complex,PIC),以保证有效地起始转录。
从启动子结构方面来说,它包含了许多启动子成分,每种成分均有相应的转录因子与之结合:
与RNA聚合酶I、Ⅱ、III相应的转录因子分别称为TFI、TFⅡ、TFIII,其中对TFⅡ研究最多。
RNA聚合酶Ⅱ的基本转录因子及功能: TBP( TFⅡ-D) 与TATA盒结合
TFⅡ-B 介导RNA聚合酶Ⅱ的结合 TFⅡ-F 解旋酶 TFⅡ-E ATP酶 TFⅡ-H 解旋酶
TFⅡ-A 稳定TFⅡ-D的结合 TFⅡ-I 促进TFⅡ-D的结合 TFⅡ-D包括两类成分:
TBP(TATA box binding protein):是唯一能识别TATA盒并与其结合的转录因子,也是三种RNA聚合酶转录时都需要的; TAF(TBP-associated factors):TFⅡ-D中其它蛋白因子称为TBP相关因子,至少包括8种能与TBP紧密结合的因子。 (1) TFⅡ-D与TATA盒结合;
(2) TFⅡ-A能稳定TFⅡ-D与TATA盒的结合,提高转录效率,但不是转录复合体所必需的。然后TFⅡ-B以其C端与TBP-DNA复合体结合,其N端则能与RNA聚合酶Ⅱ亲和结合;
(3) 接着由TFⅡ-F与RNA聚合酶形成复合体,依赖ATP供给的能量解开前方的DNA双螺旋,这样,启动子序列就与TFⅡ-D、B、F及RNA聚合酶Ⅱ结合形成一个“最低限度”能有转录功能基础的复合体。
转录前起始复合物(PIC)的形成:
以上所述是典型的启动子上转录复合体的形成,但有的真核启动子不含TATA盒或不通过TATA盒开始转录的。例如有的无TATA盒的启动子是靠TFⅡ-I和TFⅡ-D共同组成稳定的转录起始复合体开始转录的。由此可以看到真核转录起始的复杂性。
(4)TFⅡ-E不直接与DNA结合,能提高ATP酶的活性;TFⅡ-H具有依赖于ATP供给能量的DNA解旋酶活性,在转录延伸中发挥作用; TFⅡ-E和TFⅡ-H的加入就形成完整的转录复合体。 五、真核生物转录的终止
对于真核生物转录的终止信号和机制了解很少,其主要困难在于很难确定原初转录本(无论是mRNA,tRNA还是rRNA)的3'末端,因为大多数在转录后很快进行加工。
对于RNA聚合酶Ⅲ,体外与体内转录本相同,表明体内转录确是在RNA末端处终止的。爪蟾5SRNA的3'末端为4个U,而这4个U的前后均为富含G·C的序列,在G·C序列中分布着寡聚T(4个以上),这种序列特征高度保守,从酵母到人都很相似,是所有真核生物RNA聚合酶Ⅲ转录的终止信号。 第五节
RNA转录后的加工
不论原核或真核生物的rRNAs和tRNAs都是以更为复杂的初级转录本形式被合成的,然后才能加工成为成熟的RNA分子。绝大数原核生物的mRNA却不需加工,仍为初级转录本的形式。相反,真核生物从断裂基因产生的mRNA要经过复杂的加工历程,包括去除内含子的剪接反应(splicing)。 一、原核rRNA的加工
原核生物三种rRNA,即5SrRNA,16srRNA,23SrRNA与tRNA基因混杂排在一个操纵元中。E.coli有七个这样的操纵元。这些操纵元的组成基本相同,均含有顺序为16S-23S-5S的三个rRNA分子。每个操纵元均转录为一个RNA前体,然后被切割为成熟的rRNA分子。
真核生物有四种rRNA,即5.8srRNA,18srRNA,28SrRNA和5SrRNA。前三者的基因组成一个转录元,产生45S的前体RNA。 5SrRNA处在另一个转录单位中,与tRNA一起由RNA聚合酶III转录。 近年来发现,哺乳动物的原始转录本并不是45S,而是47S,由于3’端部分很快进行转录处理,5’端也除掉一小部分故变为45S。哺乳动物45SRNA的加工有几种不同方式,然而最终产物都是一样的。 二、tRNA的加工
tRNA基因往往成簇存在,不论在原核或真核生物中均如此。在E.coli中,同种或不同的 tRNA可以转录在一条RNA中,还有的tRNA与rRNA组成转录单元。每个tRNA均是一个长的前体RNA的一部分。
tRNA的转录后处理:
1、切除tRNA前体两端多余序列。tRNA前体5’端较成熟tRNA通常多几个到10个核苷酸,去除这些核苷酸是由高度专一的RNase P(即tRNA5’成熟酶)催化。tRNA3‘端的切除由RNase D(tRNA3’端成熟酶)催化。
2、在3’添加CCA序列,由tRNA核苷酸转移酶催化。 3、修饰,主要为甲基化修饰。4、切除内含子 三、真核生物mRNA转录后的加工
1、戴帽2、加尾:由RNA末端腺苷酸转移酶催化形成多聚(A)尾
3、内含子的切除
不连续基因的居间序列称内含子,被内含子隔开的基因序列称外显子。内含子的切除是所有的RNA在转录后加工中必须进行的一个重要步骤。
RNA剪接机制的研究,不仅解决不连续基因转录产物的剪接问题,而且对于了解不连续基因的起源甚至整个生命的起源与进化都是有力的推动。 第六节 RNA的剪接机制
一个基因的外显子和内含子都转录在一条原初转录本RNA分子中,把内含子切除,把外显子连接起来,产生成熟的RNA分子,这个过程就叫RNA的剪接。
内含子上游方向的一个拼接点称为5'拼接点或左拼接点,内含子下游方向的一个拼接点称为3'拼接点或右拼接点。 研究表明,内含子有四种类型: 核基因mRNA前体中的内含子。
I类内含子不具备二级结构和保守序列,如酵母线粒体细胞色素c氧化酶亚基a和亚基b基因的内含子等。
II类内含子有二级结构,构成此二级结构的是四个10-12碱基的保守序列,线粒体与核基因属于此种类型。 tRNA基因的内含子。
各类RNA内含子的切除及拼接皆有不同的特点,前三类内含子的剪接有共同特点。
一、核基因mRNA的剪接体系
编码蛋白质的结构基因在核中被转录,但最初转录出的RNA比较大且很不稳定,其顺序也比较复杂。由于它的大小很不一致,故称核内不均一RNA(hnRNA)。hnRNA经过加帽和加poly(A)尾,切除内含子后即成为mRNA,这是hnRNA转变为成熟的mRNA所必须的。
与自身剪接不同,许多相对较小(100-185bp)的核内RNA(称为snRNA,如U1、U2、U4、U5和U6)以及与这些RNA相结合的核蛋白(称为snRNP)参与mRNA剪接。核内剪接需要ATP。 在细胞浆中小分子RNA的称为scRNA、scRNP
核基因mRNA的内含子拼接点序列5‘端为GU,3’端为AG,距内含子3‘端约30个核苷酸部位上有保守序列CTGAC序列称为分支点,其中A非常保守。
第一步:由U1 SnRNP负责识别5‘拼接点,在ATP作用下切开内含子5’端。U2 SnRNP识别分支点。
第二步:U1snRNP与其它的snRNPs以及mRNA前体共同组成一个剪接体而参与剪接(U4/U6SnRNP负责剪接体的组装,而U5SnRNP识别3‘拼接点),内含子在其3’端被切开,形成一个套锁结构。两个外显子连接到一起。套索然后被\"脱支(debranch)\"而形成一线性内含子。
在这个过程中,几种SnRNP在剪接反应中功能是不同的: 二、I类内含子的拼接
I类内含子5‘拼接点和3’拼接点的序列绝大部分为U和G,如酵母细胞色素b基因,rRNA基因以及四膜虫rRNA基因的内含子等。
前体rRNA的拼接过程需要加入一种鸟嘌呤核苷酸(GTP、GDP、GMP和鸟苷),其拼接过程如下:
一种四膜虫的两个主要rRNAs的基因和其他真核生物相类似(见前文),被转录在同一个初级转录本中。此转录本称为35S前体RNA,较小的rRNA的序列在5'侧,较大的rRNA(26S)序列则在3'侧。在编码26SrRNA序列存在一个单一的,短的(约400bp)内含子。如将这个35S前体RNA在体外温育,可以发生自动剪接作用:内含子从前体中被切出,先呈线性RNA片段,后来又环化为环状RNA。
鸟苷酸的3‘-OH作为亲核基团攻击内含子的5’端的磷酸二酯键,从上游切开RNA链。再由上游外显子的自由3‘-OH作为亲核基团攻击内含子3’位的磷酸二酯键,使内含子被完全切开,上下游两个外显子通过新的3’-5‘磷酸二酯键相连。
这一拼接反应并不需要蛋白质的存在。RNA本身有催化剪接的作用,故称为自身催化。rRNA属于自我剪接。这种有酶活性的RNA称之为ribozyme。 T.Cech和S.Altman各自独立地发现RNA具有催化作用,从而改变了生物催化剂的传统概念,为此他们共同获得了1989年Nobel化学奖。
能够编码蛋白质的内含子—线粒体内含子剪接编码蛋白 某些真菌线粒体中内含子有编码功能,编码产物对于该序列所在的内含子的剪接是必须的。例:
编码细胞色素b的box基因在仅剪去内含子1时,会产生RNA成熟酶的mRNA。当内含子2亦被剪去时,才是细胞色素b的编码顺序。RNA成熟酶特异地剪去内含子2,外显子1和2即与外显子3相连接。
box基因中的外显子1有417bp,编码cytb的N端139个密码子。内含子1有765bp,不编码。外显子2非常短,仅?个密码子。其后是一个很长的内含子2。内含子2的特点是其开头840bp是一个开放读框(ORF),有280个密码子,其最后一个密码子为终止密码子。当将内含子1剪去后,翻译即从外显子1起始,通读过外显子2而进入内含子2的ORF,产生一个有423个氨基酸残基的蛋白质(其中144个是cytb的N税被幔?79个则由内含子2编码,称为RNA成熟酶(maturase)。 三、II类内含子的拼接
这类内含子在离开3‘拼接点6-12bp处的序列比较保守,其中含有一个非常保守的A。
第二类内含子3‘拼接点的保守A的2’-OH作为亲核基团攻击内含子5‘端的磷酸二酯键,从上游切开RNA链后形成套索结构;再由上游外显子的自由3’-OH作为亲核基团攻击内含子3‘核苷酸上的磷酸二酯键,使内含子被完全切开,上下游两个外显子连接在一起。
I、II类内含子的RNA本身具有催化活性,能进行内含子的自我剪接。
四、tRNA剪接体系
关于tRNA的拼接机理,研究最为完善的是酵母tRNA的剪接。此剪切过程可分为两步:
第一步:由内切核酸酶催化两个磷酸二酯键的断裂,释放出线状内含子和两个靠二级结构作用力连接在一起的tRNA半分子。内切核酸酶作用后产生3'磷酸和5'羟基,第一个外显子的3'磷酸很快转变为2',3'-环核苷酸。 这一反应不需要ATP
这个拼接机制有一些突出特点:
连接点上的磷酸基不是前体tRNA上的,而是由ATP供给的;从酵母细胞中分离出来的参与拼接反应的酶只能作用于酵母的前体tRNA,对RNA的拼接没有作用;相拼接的两个外显子只能来自同一个前体tRNA;内含子的长度变化或其末端核苷酸发生变化对拼接反应没有影响。上述事例说明,疤錿RNA外显子的特殊序列和三维结构是这种拼接机制的关键因素。半分子先发生碱基配对,形成成熟tRNA分子的构象,然后由RNA连接酶形成磷酸二酯键而将两个半分子共价连接起来。2',3'-环磷酸基的存在并不限于酵母,在植物和哺乳动物的tRNA剪接反应中也有环状基团的产生。在人的HeLa细胞中,RNA连接酶能将带有2',3'-环磷酸基的RNA和另一带有5'-OH基的RNA直接连接起来。酵母tRNA前体也可以在爪蟾的卵母细胞核提取液中正确地被剪接。这表示剪接反应没有种属特异性。爪蟾具有能识别酵母tRNA的内含子的酶类。
b 第二个外显子的5'末端在多聚核苷酸激酶的作用下,ATP供给磷酸基,使OH转变为磷酸基。
c 连接酶将两个外显子连接在一起,形成一个在左边外显子的3'端核糖上带有2'磷酸基的3'-5'磷酸二酯键。 d 磷酸酶将2'-磷酸基去掉,代之以羟基。
第二步:tRNA的两个外显子在ATP存在下,由RNA连接酶催化连接起来。具体反应如下:
a 第一个外显子的3'末端环式核苷酸在环式磷酸二酯酶作用下开环,使3'成为OH。 第六章 蛋白质的生物合成 分子生物学
蛋白质是生物信息通路上的终产物,一个活细胞在任何发育阶段都需要数千种不同的蛋白质。因此,活细胞内时刻进行着各种蛋白质的合成、修饰、运转和降解反应。
蛋白质是生命活动的重要物质基础,要不断地进行代谢和更新,因此细胞内利用20种氨基酸进行蛋白质合成便成了生命现象的主要内容。细胞内每个蛋白质分子的生物合成都受细胞内DNA的指导,在遗传信息传递的过程中,包括了如何将DNA分子中的碱基顺序转变为多肽链中的氨基酸顺序的信息传递问题,还包含了蛋白质生物合成的实际过程:即合成的起始;将氨基酸按一定的顺序联接;肽链的终止;完整的肽链从合成装置上的释放;肽链的折叠以及新合成肽链的修饰等等。本章以大肠杆菌为材料进行蛋白质生物合成的详细讨论。 第一节
制造蛋白质的工厂——核糖体
一、核糖体的组成与结构
核糖体是由多种核糖体RNA和几十种蛋白质所组成的亚细胞颗粒。一个细菌细胞内约有2万个核糖体,而真核细胞内可达106个。这些颗粒既可以游离状态存在于细胞内,也可与内质网结合,形成微粒体。
单核糖体有二个亚基,分别称为大亚基和小亚基。原核细胞: 真核细胞中核糖体的亚基组成: 1、5 S rRNA
2、5.8 S rRNA 这是真核生物核糖体大亚基特有的,长度为160个核苷酸,含有修饰碱基。它还含有与原核生物中5 S rRNA的保守序
列相同的序列,可能是与tRNA作用的识别序列。
3、18 S rRNA 酵母18 S rRNA由1789个核苷酸组成,它的3’端与大肠杆菌16S rRNA有广泛的同源性。
4、28 S rRNA 28 S rRNA长度约在3890-4500bp左右,目前还不清楚该rRNA的功能。
核糖体的装配 核糖体亚基的装配过程属于自我装配(self-assembly),该过程不需要其它任何因子参与,只要把rRNA和相应的蛋白质加入反应系统即可。如加入16SrRNA和21种蛋白质(S1-S21),即可装配成有天然活性的30S小亚基。
核糖体蛋白质与rRNA结合有先后之差,这可能是某一种蛋白质的结合,可诱导核糖体构象改变而暴露出结合位点。 二、核糖体的活性位点 第二节
遗传密码
一、遗传密码的破译
五十年代的数学推理阶段和1961-1965年的实验研究阶段。 1954年,物理学家George Gamov根据在DNA中存在四种核苷酸、在蛋白质中存在二十种氨基酸的对应关系,做出数学推理:结论:43=64这种关系是最理想的
基因密码的破译是六十年代分子生物学最辉煌的成就。乔治·伽莫夫(George Gamov)1904年生于俄国的敖德萨市。1928年在原苏联列宁格勒大学获物理学博士学.一个核苷酸为一个氨基酸编码,决定四种氨基酸(41=4); 二个核苷酸为一个氨基酸编码,决定16种氨基酸(42=16);三个核苷酸为一个氨基酸编码的,可编64种氨基酸(43=64);四个核苷酸编码一个氨基酸,可编码256种氨基酸(44=256),以此类推。的,因为在有四种核苷酸条件下,64是能满足于20种氨基酸编码的最小数。而44=256以上虽能保证20种氨基酸编码,但不符合生物体在亿万年进化过程中形成的和遵循的经济原则,因此认为四个以上核苷酸决定一个氨基酸是不可能的。
实验阶段:1961年,Brenner和Crick根据DNA链与蛋白质链的共线性,首先肯定了三个核苷酸的推理。
用核苷酸的插入或删除实验证明模板上每三个核苷酸组成一个密码子。
1961年,美国NIH的Nirenberg等使用了一个细菌的无细胞系统,该系统含有所有蛋白质合成所必须的装置,但不含有完整的细胞和mRNA分子。然后加入人工合成的多聚核苷酸,例如合成了polyU作为模板,把翻译产物分离、纯化和做序列分析后,结果产生了不同长度的全部由苯丙氨酸polyPhe组成的多肽。于是 规则共聚物(repeating copolymers)法破译密码: 由交替的核苷酸构成的重复规则序列,例如:
Khorana等人应用有机化学和酶学技术,制备了由交替的核苷酸构成的重复规则序列,例如,ACACACACAC,发现它们编码由Thr和His交替构成的多肽链。由于在无细胞系统的人工mRNA上的蛋白质合成不能识别在哪里开始翻译,因此就不能知道ACA或CAC密码子是编码哪个氨基酸的。为了解决这个问题,使用共聚物构成三核苷酸为单位的重复顺序,如(AAC)n,结果合成三种类型的多肽:全为Asn、全为Thr和全为Gln的多肽链。这些mRNA
可用三种可能的阅读框AAC、ACA、和CAA中的任何一种来阅读。在由交替的A和C构成的mRNA与由重复AAC三联体构成mRNA之间共同的密码子只有ACA,而在它们多肽产物中共有的氨基酸仅为Thr,因此Thr的密码子就应该是ACA。
使用共聚物构成三核苷酸为单位的重复顺序,如(AAC)n,进一步确定遗传密码,通过这种方法可把大多数的遗传密码解开。 Nirenberg和Leder于1964年建立了破译密码的新方法。这种方法解开了其它未明密码子。 遗传密码表
二、遗传密码的基本特点:
1、无标点符号,即两种密码子之间无任何核苷酸或其它成分加以分离;
2、一般情况下遗传密码是不重叠的,即碱基的使用不发生重复。但在少数大肠杆菌噬菌体的基因组中,部分基因的遗传密码却是重叠的。
3、密码子有简并性(degeneracy),一种氨基酸有几个密码子,或者几个密码子代表一种氨基酸的现象称为密码子的简并性。除了Met和Trp只有一个密码子外,其它氨基酸均有二个以上密码子,例如Arg有6个密码子。
4、密码子的摆动性:即密码的第一、第二碱基是必需严格按标准配对(A-U、G-C)而第三碱基配对可以有一定程度的摆动灵活性。 但也不是可以任意组合,只限于表中所列举的配对。
密码子中第三位碱基具有较小的专一性,密码的简并性往往只涉及第三位碱基。对于一种tRNA能识别几种密码子的现象,Crick(1966)提出了\"摆动假说\"(Wobble hypothesis),
5、共有64个密码子,其中AUG不仅是Met的密码子,也是肽链合成的起始密码子;UAA、UAG和UGA为终止密码子,不代表任何氨基酸。
6、密码子具有方向性,即mRNA从5‘端到3’端的核苷酸排列顺序就决定了多肽链中从N端到C端的氨基酸排列顺序。 7、密码子是近于完全通用的,所谓密码的通用性是指不论是病毒、原核生物还是真核生物可共用同一套密码。但最近的一些发现对密码的通用性提出了挑战: 三、密码子的使用频率
对一种氨基酸特异的几种tRNA,在细胞内的合成在量上有多和少之差,分别称为主要tRNA和次要tRNA。主要tRNA中反密码子所识别的密码子为高频使用密码子,相应地,次要tRNA中反密码子所识别的密码子为低频使用密码子。
实验表明,DNA中富含A-T碱基对的微生物,它的绝大数密码子3'端为U或A,在这种情况下,3'端为U或A的密码子被优先利用。
根据对E.coli mRNA的研究,证明一种氨基酸的某些密码子反复出现,而另一些几乎从不出现。
四、校正tRNA对基因或密码子突变的校正作用
针对基因或密码子突变可产生校正tRNA,这是经过其反密码子上发生某种突变,以“代偿”或校正原有突变所产生的不良后果,这样的tRNA称为校正tRNA,这种tRNA上反密码子的突变称为校正突变。
无义和错义突变校正均可通过校正tRNA介导。如编码Ser的密
码子UCG无义突变为UAG,校正tRNA的校正基因突变使其反密码子从CGA变成CUA。
移码校正如tRNAGly,它的反密码子产生插入突变 (CCC→CCCC) 。使得tRNAGly把四个碱基作为一个密码子阅读,如此使阅读框架正常。
它的反密码子产生插入突变由三个碱基变成四个碱基组成(CCC→CCCC) 。该突变不仅使得tRNAGly把四个碱基作为一个密码子阅读,也可使核糖体从A位到P位能跨越四个碱基长的mRNA序列,如此使阅读框架正常。
五、密码子结构与氨基酸侧链极性之间有一定关系
1) 氨基酸侧链极性性质在多数情况下由密码子的第二个碱基决定。第二个碱基为嘧啶时,氨基酸侧链为非极性,第二个碱基为嘌呤时,氨基酸侧链有极性。 2)
当第一个碱基为U或A,第二个碱基为C,第三个碱基无特异性时,所决定的氨基酸侧链为极性不带电;
3) 当第一个碱基不是U,第二个碱基是G时,氨基酸侧链则带电。在此前提下,若第一个是C或A时,表示带正电的氨基酸;第一个碱基是G,第二个碱基是A时,此种氨基酸带负电。但上述关系也有个别例外。 第三节
tRNA结构与功能
详见第五章
遗传学的第二套密码系统
存在于mRNA中的遗传密码称为经典密码系统或第一套密码系统。第二套密码系统,蕴含于tRNA分子中,tRNA氨基酸臂有一辅密码区(Paracodon region),可以被氨基酰tRNA合成酶识别,并决定tRNA的特异性。 第二套密码系统的特征:
[1] 与经典密码系统不同,第二套密码系统是非简并性的。 [2] 比经典的密码系统对氨基酸更具有决定性。 [3] 第二套密码系统比经典的密码系统更原始。
第二套密码系统的实验证据来自于tRNA分子上某些(个)碱基对能决定tRNA的特异性。第二套密码系统,蕴含于tRNA分子中,这是自1988年以来在分子生物学领域引人注目的新进展。 Christiande Duve提出了第二套密码系统的学说。 第四节
蛋白质的合成过程
AA+ tRNA +ATP AA~tRNA+AMP+PPi 一、氨基酸的活化与转运
氨基酸的活化反应 : 氨酰~ tRNA合成酶催化
在蛋白质生物合成中,各种氨基酸在参入肽链之前必须先经活化,然后再由其特异的tRNA携带至核糖体上,才能以mRNA为模板缩合成肽链。氨基酸活化后与相应的tRNA结合的反应,均是由特异的氨酰-tRNA合成酶(amino acyl-tRNA synthetase,简写为aaRS)催化完成的。
另发现有二种氨基酸(Gln和Ile)的活化有其特殊条件: (1)Gln-tRNA复合物的形成:先由一个Glu经GluRS作用接在tRNAGln上,形成Glu-tRNA;然后再经转氨基酶作用,将Glu(或Asn)的酰胺基接到Glu-tRNA复合物的Glu上,最终形成Gln-tRNA复合物。
(2)哺乳动物Ile-tRNA复合物的形成,在标准的tRNA氨基酰化反应系统中(50mmol/L Tris-HClpH7.5,50mmol/L K+,2mmol/L Mg2+,1mmol/L DTT,2mmol/L ATP,aaRS,tRNA和标记的某种氨基酸),必须加入1-2mmol/L的多胺(如精胺),否则哺乳动物的tRNAIle不能被氨基酰化。
装载同一氨基酸的tRNA被称为同工受体tRNA,与同义密码子结合的所有同工受体tRNA均被相同的氨酰-tRNA合成酶所活化。因此翻译过程只需20种合成酶。氨基酸即结合在tRNA的3-CCA末端腺苷酸(A)的核糖2'或3'游离-OH上,以酯键相连。 二、肽链合成的起始 如何正确选择起始密码子
(1)起始型蛋氨酸tRNA(tRNAf-Met)具有将甲酰蛋氨酸引入mRNA起始密码子AUG位置的特异功能,而中间型蛋氨酸tRNA(tRNAm-Met)则将Met引入mRNA分子内部的Met密码子, Met不能被甲酰化。
在原核细胞已发现了以Met-tRNAf为底物的转甲酰酶。该甲酰基的存在,阻碍了fMet以其α-NH2与其它氨基酸形成肽键的可能性。
从这个意义上讲fMet必然位于肽链的N端。然而,当肽链合成达15-30个氨基酸时,又经蛋氨酸肽酶的作用将N端的fMet水解掉。故肽链合成后,其N端为fMet仅占30%。
(2)IF2与tRNAf-Met的特异性反应亦有助于保证tRNAf-Met与起始密码子的结合。
IF2能促使fMet-tRNAf与起始密码子结合,或者说IF2能与tRNAf-Met反应。相反,IF2不能与tRNAm-Met反应,tRNAm-Met只能与延长因子TU(EF-TU)反应。在形成30S起始复合物过程中,必须有IF2参与。
(3)在mRNA分子中起始密码子的上游8-13个核苷酸处有一段富含嘌呤核苷酸的顺序,它可以与30S亚基中的16SrRNA3'端富含嘧啶的尾部互补,形成氢键结合,因此有助于mRNA的翻译从起始密码子处开始。上述mRNA分子的序列特征1974年由J.Shine和L.Dalgarno发现,故称为SD序列。后来在E.coli的多种mRNA分子中证实均存在SD顺序。 三、肽链合成的延长
这一过程包括进位、肽键形成、脱落和移位等四个步骤。肽链合成的延长需两种延长因子(Elongation factor,EF),分别称为EF-T 和EF-G,其中EF-T由EF-Tu和EF-Ts两种成份组成,Tu表示对热不稳定, Ts表示对热稳定。在E.coli细胞中EF-Tu没有直接活性,只有与GTP形成EF-Tu-GTP复合物才能与aa-tRNA结合。在形成由EF-Tu-GTP的过程中,需EF-Ts的参与。 (1)进位: 即新的氨酰-tRNA进入50S大亚基A位
在70S起始复合物的基础上,原来结合在mRNA上的fMet-tRNAf占据着50S亚基的P位点(当延长步骤循环进行二次以上时,在P位点则为肽酰-tRNA),新进入的氨酰-tRNA则结合到大亚基的A位点,并与mRNA上起始密码子随后的第二个密码子结合。 (2)肽键形成(转肽): 在大亚基上肽酰转移酶的催化下,将P位点上的tRNAf所携带的甲酰蛋氨酰(或肽酰基)转移给A位上新进入的氨基酰-tRNA的氨基酸上,即由P位上的氨基酸或肽的C端氨基酸提供α-COOH基,与A位上的氨基酸的α-NH2基形成
肽键。
此后,在P位点上的tRNA成为无负载的tRNA,而A位上的tRNA负载的是二肽酰基或多肽酰基。
(3)脱落与移位: 即50S亚基P位上无负载的tRNA(如tRNAf-Met)脱落。在EF-G和GTP的作用下,核糖体沿mRNA链(5'→3')作相对移动。第三个氨基酰-tRNA进入A位点,然后在
肽酰转移酶催化下,P位上的二肽酰tRNA又将此二肽基转移给第三个氨基酰-tRNA,形成三肽酰tRNA。同时,卸下二肽酰的tRNA又迅速从核糖体脱落。
延长过程每重复一次,肽链就延伸一个氨基酸残基。多次重复,就使肽链不断地延长,直到增长到必要的长度。肽链的延伸是从N端开始的。
肽链延长伴随着核糖体与mRNA的相对移动,移位的能量来自EF-Tu介导GTP水解和由EF-G介导的GTP水解。 在进位和移位二步中的GTP作用: [1] 加速核糖体的循环速度; [2] 增强核糖体对抑制剂的抵抗力; [3] 有利于翻译的保真性。 蛋白质生物合成的抑制剂
(1) 嘌呤霉素(puromycin):是氨酰-tRNA结构类似物,它能结合在核糖体活动A位上,抑制氨酰-tRNA进入,当生长着的肽链被转移到嘌呤霉素的氨基上去时,新生成的肽酰-嘌呤霉素会从核糖体上脱落下来。
2、核糖体上的\"空闲反应\"
当氨基酸缺乏时,未负载的tRNA进入核糖体A位,导致产生二种效应:
一是空载的tRNA与mRNA密码子结合,从而中止蛋白质合成; 二是relA基因开放,生成\"紧缩控制\"因子(stringent factor,简写为SF)¡£SF属一种核糖体相关蛋白质,可促使GTP或GDP与ATP反应,在核糖体工作的\"空闲\"状态时,合成ppp5'-G-3'pp(鸟苷五磷酸)或pp5'-G-3'pp(鸟苷四磷酸)。该步反应通常称为\"魔斑\"(magic spot)。当pppGpp(或ppGpp)生成后,即可抑制RNA聚合酶的活性,进一步使rRNA、tRNA的合成下降,多聚核糖体的数量及聚集状态改变。
由pppGpp(或ppGpp)引起的一系列紧急反应,主要包括: 1)节流:如抑制大部分蛋白质、rRNA、tRNA、脂肪、磷脂、核苷酸的合成£»抑制糖原水解及糖氧化£»抑制多胺吸收等。 2)开源:如促进lac¡¢his¡¢trp及arg等操纵子开放£»通过活化原有蛋白质水解系统,加速蛋白质水解,提供氨基酸,缓解氨基饥饿状态。
从上述可见\"紧缩控制\"的意义在于使细胞不要浪费性地生成过多的核糖体,并通过\"开源节流\"去维持生存。产生该反应的关键是无负载的tRNA进入A位,而导致核糖体的\"空闲\"反应所致。在正常细菌生长期间,pppGpp(或ppGpp)仅有少量产生。生成的这些效应分子可被pppGpp(或ppGpp)焦磷酸酶水解。pppGpp(或ppGpp)的发现和研究,不仅使人们了解了细菌中的一个重要调控机制,而且也为研究tRNA与核糖体A位相互作用提供了一个很好的模型。目前已发现,上述紧缩控制系统在原核细胞中具有普遍性。真核细胞中有无该控制系统,目前暂不能定论。
(2) 链霉素(streptomycin):是一种碱性三糖,能干扰fMet-tRNA与核糖体的结合,从而阻止蛋白质合成的正确起始,也会导致EF1βγ 使EF1α再循环 EF-Ts
EF2 转位
mRNA的错读。
(3) 四环素(tetracyclines):能阻断氨酰-tRNA进入核糖体A位点,从而抑制肽链的延长。
(4) 氯霉素(chloramphenicol):能阻断70S核糖体中的50S大亚基的肽酰转移酶的活性,从而抑制肽链的延长。
(5) 放线菌酮(cycloheximide):被认为与氯霉素的作用类似,但它主要作用于真核生物的80S核糖体中的60S亚基。
(6) 红霉素(erythromycin):与50S大亚基结合,并阻断移位作用因而将肽酰-tRNA\"冻结\"在A位点上。
对红霉素产生抗性是由于50S大亚基中某一个蛋白质产生突变之故。由于细菌核糖体与哺乳动物线粒体核糖体相似,因此上述能抑制细菌核糖体功能的抗菌素,往往也能抑制哺乳动物线粒体的核糖体循环。 四、肽链合成的终止
RF与EF在核糖体上的结合部位是同一处,它们重叠的结合部位防止了EF与RF同时结合于核糖体上而扰乱正常功能。 与mRNA分离的核糖体又分离为大小两个亚基,可重新投入另一条肽链的合成过程。核糖体分离为大小两个亚基的反应需要起始因子(IF3)的参与。
采用温和的条件小心地从细胞中分离核糖体时,可以得到多核糖体,即数个或数十个核糖体同时在一条mRNA链上进行翻译而联系在一起的结构,两个核糖体之间有一定的长度间隔,是裸露的mRNA链,所以多核糖体可以在一条mRNA链上同时合成几条多肽链,提高了翻译的效率。
上述只是单个核糖体的循环,即单个核糖体的翻译过程。 原核生物中转录与翻译是相偶连的,真核生物中加工为成熟的mRNA,从核转运到细胞质再进行翻译。 第五节 真核生物蛋白质生物合成
真核细胞的蛋白质生物合成过程基本类似于原核细胞。其差别除参与蛋白质生物合成的核糖体结构、大小及组成和mRNA的结构等不同外,主要区别在真核细胞蛋白质生物合成的起始步骤。这一步骤涉及的起始因子至少达十多种,因此起始过程更为复杂。 一、真核生物蛋白质的生物合成
1、核糖体更大 真核细胞核糖体为80S,可解离成60S与40S两个亚基。40S亚基含有18SrRNA,60S亚基含有5S、5.8S及28SrRNA。
2、起始tRNA 特异的起始型tRNA为Met-tRNAi,不需要N末端的甲酰化。
3、起始密码子 定位在mRNA5‘端的AUG(通常距5’端10-100个核苷酸)总被选择。mRNA5‘端帽的存在对于起始是需要的(除某些病毒mRNA外),附加的上游信号也是必要的 4、80S起始复合物的形成: 5、肽链延长和终止因子 因子 功能 相应的原
核细胞因子 EF1α 促使aa-tRNA与核糖体结合 EF-Tu
EF-G eRF
肽链释放
RF1 RF2
6、蛋白质激酶参与真核生物蛋白质合成的调节 81
在真核生物中,蛋白质激酶可以催化起始因子eIF2磷酸化。eIF2的作用是将eIF2被磷酸化后就难以再投入下一轮的起始作用,所以蛋白质合成受到抑制。
二、真核生物蛋白质生物合成的特异抑制剂
一些能够抑制原核细胞蛋白质生物合成的抑制剂同样也能抑制真核细胞的蛋白质生物合成。如aa-tRNA的类似物嘌呤霉素可提前终止肽链翻译。
有一些抑制剂对真核细胞的翻译过程是特异的,这主要是由于真核细胞翻译系统装置的特殊性。如7-甲基鸟苷酸(m7Gp)在体外抑制真核细胞的翻译起始,就是因为m7Gp与mRNA5'端竞争帽子结合蛋白。
又如梭链孢酸(fusidicacid)不仅可阻止完成功能后的原核细胞EF-G从核糖体释放,也能阻止真核细胞EF2的释放。还有些抑制剂是小分子,有的是多肽,如蓖麻蛋白(ricin),它是一种特异的核酸酶,能够通过使60S亚基水解失活而中止延长步骤。 第六节
多肽链合成的加工与折叠
大多数蛋白质肽链合成的同时或合成后,还要经过若干加工处理才能导致蛋白质的成熟。所谓成熟是指所合成的蛋白质形成正确的空间构象并表现出应有的生物活性。 成熟加工主要包括:
(一)氨基末端的 fMet或 Met的切除
氨基末端甲酰基被去甲酰化酶水解。不管是原核生物还是真核生物,末端的甲硫氨酸往往在肽链合成完毕之前就被切除,参与切除的酶是甲硫氨酸肽酶。50%的真核蛋白中,成熟蛋白N端残基会被N-乙基化。 (二)肽链的折叠
至少有两类蛋白质因子参与了体内的蛋白质折叠过程:
一类是酶,肽链内或肽链间二硫键的形成在新生肽链的折叠中起重要的作用。mRNA中没有胱氨酸密码子,而不少蛋白质都含有二硫键。蛋白质合成后往往通过两个半胱氨酸的氧化作用生成胱氨酸。
另一类是分子伴侣(或称监护分子,molecular chaperone):广泛存在于原核和真核生物中,由若干在结构上不相关的蛋白质家族组成的。它们能结合其它蛋白质并使其稳定处于非天然态构象,然后通过有控制地释放而促进这些蛋白质的正确折叠,但自身并不成为被折叠的蛋白质的一部分。有关分子伴侣的研究进展主要集中在2个分子伴侣家族Hsp70和Hsp60。
在最适条件下,合成一条含300至400个氨基酸的E.coli多肽链需要10s至20s。在这期间,正在延伸的肽链并不是保持随机卷曲状态,而是通过形成许多次级键,迅速取得它的大体上的最后的三维构象。对许多蛋白质来说,在最后几个氨基酸加上去之前,它们的最后形状已基本构成。关于新生肽链的折叠尚需进一步的
研究。
(三) 氨基酸残基的修饰
羟脯氨酸、羟赖氨酸等都不是遗传密码所能直接编码的。它们是在肽链合成后,由专门的酶催化修饰而成的。
共价修饰的主要反应类型有:羟基化(如胶原蛋白)、磷酸化(如核糖体蛋白质)、糖基化(如各种糖蛋白)、甲基化(如组蛋白等)。
蛋白质中除了一些脂肪族侧链外,大多数氨基酸残基的侧链都可被修饰,同一残基的侧链也可以有多种修饰方式。这种这些翻译后氨基酸残基的修饰对蛋白质的活性有重要意义。 (四) 切去一段新生肽链中不是功能所需的肽段
某些肽链合成后还要经特殊剪切,在酶催化下水解,切除一段肽链后才能显示出生物活性。如胰岛素刚合成时是一条由81~86个氨基酸残基组成的肽链,只有切除中间第31-60氨基酸的一段肽片段形成A、B链后才具有生物活性。 第七节 蛋白质合成后的转运 一、翻译-运转同步机制
蛋白质通过其N-端的信号肽在内质网中运转到不同的细胞器。 绝大多数被运入内质网内腔的蛋白质都具有大约15-30个氨基酸的N端信号序列——信号肽,其靠近N端常常有1个或数个带正电荷的赖氨酸和精氨酸;后半段一般带有约10-15个疏水氨基酸。人们提出了信号肽假说解释分泌蛋白质的分泌。 信号肽假说:当新生肽链正在跨越膜时,信号序列的疏水段能够形成一段螺旋结构。在信号序列之后的一段氨基酸残基也能形成一段螺旋结构。两个短的螺旋以反向平行的方式组成一个发夹结构,该发夹结构很容易插入到内膜疏水的脂质双层中。一旦分泌蛋白质的N端锚在膜内,后续合成的肽链将顺利通过蛋白孔道穿越疏水的脂质双层。信号肽在完成功能后,随即被一种特异的信号肽酶水解,膜上的蛋白孔道消失。
信号识别颗粒(Signal Recognition Particle简写为SRP) 是一个小分子RNA-蛋白质复合物,由于该复合物能与新生的信号肽特异性反应,故被命名为SRP。
SRP的作用是能与核糖体结合并使肽链延长暂时受阻, 当它碰到内质网膜上的SRP受体——停靠蛋白(docking protein,DP),新生肽链重新开始延伸,这时,SRP离开核糖体再去识别新的信号序列;而核糖体则通过信号肽进入内质网内腔。
SRP与DP的结合很可能导致核糖体受体聚集而形成膜孔道,使信号肽与其相连的新生肽得以通过。 二、翻译后运转机制 成的膜通道进入线粒体内腔。 线粒体蛋白质跨膜转运 叶绿体蛋白质跨膜转运
三、核定位蛋白的运转机制 核定位蛋白质跨膜转运 四、蛋白质的降解 第七章 基因表达的调控
随着生物个体的发育,DNA分子能有序地将其所承载的遗传信息,通过密码子-反密码子系统转变成蛋白质,执行各种生理生化功能。
基因表达(gene expression)就是指某一基因指导下的蛋白质合成,即从DNA到蛋白质的过程。蛋白质是基因表达的产物。对这个过程的调节就称为基因表达调控(gene regulation/gene control) 在生活中并非所有基因都一齐表达,而是有些基因进行表达,形成其基因表达的特异产物,有些基因却被关闭,不进行表达,而要在适当的时候才进行表达。如与生物发育过程有关的基因要在特定的时间或空间才进行表达。
细菌能随环境的变化,迅速改变某些基因表达的状态,这就是很好的基因表达调控的实验模型。人们就是从研究这种现象开始,打开认识基因表达调控分子机理的窗口。
基因表达很复杂,它包括DNA的复制、转录及翻译的各个步骤,每个步骤都受到内部遗传或外界环境的控制,但大多数是转录水平的调控。
操纵元是原核基因表达调控的一种重要的组织形式,大肠杆菌的基因多数以操纵元的形式组成基因表达调控的单元。
目前对基因表达调控机理的了解大部分是来自细菌系统的研究。真核生物中基因表达的情况复杂,了解较少。为此,我们主要讨论原核生物基因在转录水平上的表达调控。 一、操纵元的提出
大肠杆菌可以利用葡萄糖、乳糖、麦芽糖、阿拉伯糖等作为碳源而生长繁殖。大肠杆菌利用乳糖至少需要两个酶:促使乳糖进入细菌的乳糖透过酶和催化乳糖分解的β-半乳糖苷酶。在环境中没有乳糖时,大肠杆菌合成β-半乳糖苷酶量极少,加入乳糖2-3分钟后,细菌大量合成β-半乳糖苷酶,其量可提高千倍以上,在以乳糖作为唯一碳源时,菌体内的β-半乳糖苷酶量可占到细菌总蛋白量的3%。
针对大肠杆菌利用乳糖的适应现象,法国的Jocob和Monod等人做了一系列遗传学和生化学研究实验,于1961年提出乳糖操纵元(lac operon)学说。 第一节 操纵元
二、操纵元(operon)的基本组成
(一) 结构基因 操纵元中被调控的编码蛋白质的基因称为结构基因(structural gene,SG)。一个操纵元中含有2个以上的结构基因,多的可达十几个。每个结构基因是一个连续的开放读框(open reading frame ORF)。各结构基因串连排列,组成结构基因群。
至少在第一个结构基因5¡¯侧具有核糖体结合位点(ribosome binding site,RBS),
含多个结构基因的DNA被转录成多顺反子mRNA,核糖体沿mRNA移动,在合成完第一个多肽后,它可以不脱离mRNA而继续翻译合成下一个基因编码的多肽,直至合成完这条多顺反子mRNA所编码的全部多肽。
(二) 启动子 操纵元至少有一个启动子(promoter,P) ,一般在第一个结构基因5‘侧上游,控制整个结构基因群的转录。 (三)操纵子 操纵子(operator)是指能被调控蛋白特异性结合的一段DNA序列,常与启动子邻近或与启动子序列重叠,当调控蛋白结合在操纵子序列上,会影响其下游基因转录的强弱。 (四)调节基因 调节基因(regulatory gene)是编码能与操纵序列结合的调控蛋白的基因。与操纵子结合后能减弱或阻止其结
构基因转录的调控蛋白称为阻遏蛋白(repressive protein),其介导的调控方式称为负性调控(negative regulation);与操纵子结合后能增强或起动其结构基因转录的调控蛋白称为激活蛋白(activating protein),所介导的调控方式称为正性调控(positive regulation)。
某些特定的物质能与调控蛋白结合,使调控蛋白的空间构像发生变化,从而改变其对基因转录的影响,这些特定物质可称为效应物(effector),其中凡能引起诱导发生的分子称为诱导剂(inducer),能导致阻遏发生的分子称为阻遏剂或辅助阻遏剂(corepressor)。
负控诱导:阻遏蛋白不与效应物(诱导剂)结合,不转录 负控阻遏:阻遏蛋白与效应物(诱导剂)结合,转录 正控诱导:激活蛋白与效应物(诱导剂)结合,被激活,转录
正控阻遏:激活蛋白与效应物(辅助阻遏剂)结合,失活,不转录
(五)终止子 在一个操纵元中至少在结构基因群最后一个基因的后面有一个终止子(terminator,T) 。不同的终止子的作用有强弱之分,有的终止子几乎能完全停止转录,有的则只是部分终止转录,一部分RNA聚合酶能越过这类终止序列继续沿DNA移动并转录。如果一串结构基因群中间有这种弱终止子的存在,则前后转录产物的量会有所不同,这是终止子调节基因群中不同基因表达产物比例的一种方式。
某些蛋白因子能作用于终止序列,减弱或取消终止子的作用,称为抗终止作用(antitermination),这种蛋白因子就称为抗终止因子(antiterminator)。
以上5种元件是每一个操纵元必定含有的。其中启动子、操纵子位于紧邻结构基因群的上游,终止子在结构基因群之后,它们都在结构基因的附近,只能对同一条DNA链上的基因表达起调控作用,这种作用在遗传学实验上称为顺式作用(cis-action),启动子、操纵子和终止子就属于顺式作用元件(cis-acting element)。 顺式作用元件:不编码任何产物的DNA片段,能影响与之相联系的同一条DNA链上的基因表达。
调控基因可以在结构基因群附近、也可以远离结构基因,它是通过其基因产物──调控蛋白来发挥作用的,因而调控基因不仅能对同一条DNA链上的结构基因起表达调控作用,而且能对不在一条DNA链上的结构基因起作用,在遗传学实验上称为反式作用(trans-action),调控基因就属于反式作用元件(trans-acting element),其编码产生的调控蛋白为反式作用因子(trans-acting factor)。
反式作用因子:由调节基因编码,其编码产物(RNA或蛋白质)可以扩散,控制其它基因的表达(转录因子)。
基因表达调控机理的关键就在于蛋白质与核酸的相互作用上。 第二节 乳糖操纵元的表达调控 一、乳糖操纵元的组成
乳糖操纵元含有z、y和a3个结构基因。z基因编码β-半乳糖苷酶,催化乳糖转变为别乳糖,再分解为半乳糖和葡萄糖;y基因编码半乳糖苷透过酶,促使环境中的乳糖进入细菌;a基因编码转乙酰基酶,以催化半乳糖的乙酰化。
z基因5’侧具有大肠杆菌核糖体识别结合位点特征的SD序列,因而当乳糖操纵元开放时,核糖体能结合在转录产生的mRNA上,沿此多顺反子mRNA移动,依次合成这基因群所编码所有的蛋白质。
二、阻遏蛋白的负性调控
当大肠杆菌在没有乳糖的环境中生存时,lac操纵元处于阻遏状态。此调节基因在其自身的启动子Pi控制下,低水平、组成性表达产生阻遏蛋白R,R以四聚体形式与操纵子o结合,阻碍了RNA聚合酶与启动子Plac的结合,阻止基因的转录。
R的阻遏作用不是绝对的,R与o偶尔分开,半乳糖苷酶及透过酶少量生成。
当大肠杆菌在没有乳糖的环境中生存时,lac操纵元处于阻遏状态。, 当有乳糖存在时,乳糖受β-半乳糖苷酶的催化转变为别乳糖,与R结合,使R构象变化,失去与o的亲和力,与o解离,基因转录开放,使β-半乳糖苷酶在细胞内的含量可增加1000倍。这就是乳糖(实际起作用的是别乳糖)对lac操纵元的诱导作用。
当有乳糖存在时: 乳糖受β-半乳糖苷酶的催化转变为别乳糖,与R结合,使R构象变化,失去与o的亲和力,与o解离,基因转录开放,使β-半乳糖苷酶在细胞内的含量可增加1000倍。这就是乳糖(实际起作用的是别乳糖)对lac操纵元的诱导作用。 一些化学合成的乳糖类似物,不受β-半乳糖苷酶的催化分解,却也能与R特异性结合使R构象变化,诱导lac操纵元的开放。例如异丙基硫代半乳糖苷(isopropylthiog- alactoside,IPTG)就是很强的诱导剂,不被细菌代谢而十分稳定。X-gal(5-溴-4-氯-3-吲哚-β-半乳糖苷)也是一种人工化学合成的半乳糖苷,可被β-半乳糖苷酶水解产生兰色化合物,因此可以用作β-半乳糖苷酶活性的指示剂。IPTG和X-gal都被广泛应用在分子生物学和基因工程的工作中。
三、CAP的正性调控
细菌中的cAMP含量与葡萄糖的分解代谢有关,当细菌利用葡萄糖分解产生能量时,cAMP生成少,含量低;相反,当环境中无葡萄糖可供利用时,cAMP含量就升高。细菌中有一种能与cAMP特异结合的cAMP受体蛋白CRP(cAMP receptor protein),当cAMP浓度升高时,CRP与cAMP结合并发生空间构象的变化而活化,称为降解物基因活化蛋白(catabolic gene activator protein,CAP)。 编码CRP的基因也是一个调控基因,不过它并不在lac操纵元的附近。
在lac操纵元的启动子上游端有一段与Plac部分重叠的序列,能与CAP特异结合,称为CAP结合位点。CAP与这段序列结合时,可增强RNA聚合酶的转录活性。因此CAP是对转录起正性调控作用的蛋白──激活蛋白,它可以对几个操纵元都起作用。 当有葡萄糖可供分解利用时,cAMP浓度降低,CRP不能被活化,lac操纵元的结构基因表达下降。
由于Plac是弱启动子,单纯因乳糖的存在发生去阻遏使lac操纵元转录开放,还不能使细菌很好利用乳糖,必需同时有CAP来加强转录活性,细菌才能合成足够的酶来利用乳糖。lac操纵元的强诱导既需要有乳糖的存在又需要没有葡萄糖可供利用。通过这机制,细菌才去充分利用乳糖。
乳糖操纵元属于可诱导操纵元(inducible operon),这类操纵元通常是关闭的,当受效应物作用后诱导开放转录。这类操纵元使细菌能适应环境的变化,最有效地利用环境能提供的能源底物。 细菌对葡萄糖以外的其它糖(如阿拉伯糖、半乳糖、麦芽糖等)的利用上也有类似对乳糖利用的情况,在含有编码利用阿拉伯糖的酶类基因群的阿拉伯糖操纵元(ara operon)、半乳糖操纵元(gal operon)中也有CAP结合位点,CAP也起类似的正性调控作用。 第三节 色氨酸操纵元
色氨酸是构成蛋白质的组分,一般的环境难以给细菌提供足够的色氨酸,细菌要生存繁殖通常需要自己经过许多步骤合成色氨酸,但是一旦环境能够提供色氨酸时,细菌就会充分利用外界的色氨酸、减少或停止合成色氨酸,以减轻自己的负担。细菌所以能做到这点是因为有色氨酸操纵元(trp operon)的调控。 一、色氨酸操纵元的结构与阻遏蛋白的负性调控
合成色氨酸所需要的酶基因E、D、C、B、A等头尾相接串连排列组成结构基因群。调节基因在其自身的启动子作用下,以组成型方式低水平表达调控蛋白R,R没有与o结合的活性,当环境能提供足够浓度的色氨酸时,R与色氨酸结合后构象变化而活化,就能够与o特异性结合,阻遏结构基因的转录。
色氨酸操纵元属于一种负性调控的、可阻遏的操纵元,即这类操纵元通常是开放转录的,有效应物(色氨酸为阻遏剂)作用时则阻遏关闭转录。细菌不少生物合成系统的操纵元都属于这种类型,其调控可使细菌需要某种氨基酸时其基因即表达,不需要则关闭,遵循经济原则。
当色氨酸达到一定浓度、但还没有高到能够活化R使其起阻遏作用的程度时,产生色氨酸合成酶类的量已经明显降低,而且产生的酶量与色氨酸浓度呈负相关。这种调控现象与色氨酸操纵元特殊的结构有关。
在色氨酸操纵子与第一个结构基因E之间有一段162bp的先导序列,实验证明当色氨酸有一定浓度时,RNA聚合酶的转录会终止在这里。这段序列中含有编码由14个氨基酸组成的短肽的开放读框,其序列中有2个色氨酸相连。 二、衰减子及其作用
在先导序列的后半段含有反向重复序列1、2、3、4,它们在被转录生成mRNA时有机会在1与2之间或2与3之间、3与4之间形成发夹结构,序列4后面紧跟一串A(转录成RNA就是一串U),如果转录成mRNA时3与4之间形成发夹结构,就在E基因之前形成一个终止子,使RNA聚合酶停止转录。 先导序列起到随色氨酸浓度升高降低转录的作用,这段序列就称为衰减子(attenuator)。
在色氨酸浓度未达到能起阻遏作用时,RNA聚合酶沿DNA转录合成mRNA,同时核糖体就结合到新生成的mRNA上开始翻译。当色氨酸浓度低时,生成的tRNAtrp量就少,使核糖体沿mRNA翻译移动的速度慢,赶不上RNA聚合酶沿DNA移动转录的速度,这时核糖体占据短开放读框的机会较多,使1与2之间不能生成发夹结构,于是2与3之间就形成发夹结构,阻止了3与4之间形成终止子结构,RNA聚合酶得以沿DNA前进,继续去转录其后trpE等基因,trp操纵元就处于开放状态。 当色氨酸浓度增高时,tRNAtrp浓度随之升高,核糖体沿
mRNA翻译移动的速度加快,占据到2的机会增加,1与2之间或2与3之间生成发夹结构的机会减少,3与4之间形成终止结构的机会增多,RNA聚合酶终止转录的几率增加,于是转录减弱。 当其他氨基酸也短缺(短开放读框编码的14肽中多数氨基酸能由环境充分供应的机会是不多的)或所有的氨基酸都不足时,核糖体翻译移动的速度就更慢,甚至不能占据序列1,结果有利于1与2之间和3与4之间形成发夹结构,于是终止结构形成,RNA聚合酶停止转录。
在trp操纵元中对结构基因的转录,阻遏蛋白的负调控起到粗调的作用,而衰减子起到细调的作用。细菌其它氨基酸合成系统的许多操纵元(如组氨酸、苏氨酸、亮氨酸、异亮氨酸、苯丙氨酸等操纵元)中也有类似的衰减子存在。
等于告诉细菌“整个氨基酸都不足,即使合成色氨酸也不能合成蛋白质,不如不合成以节省能量” 第四节 真核基因表达的调控
和原核生物主要在转录水平上进行调控的情况相比,真核生物基因表达调控的活动范围更大,包括DNA水平、转录水平、转录后水平、翻译水平等许多层次的调控。然而,真核生物和原核生物一样,转录水平上的调控是最主要的调控。 一、真核生物的基因结构与转录活性 (一)基因家族(gene family) (二)真核基因的断裂结构
(三)真核生物DNA水平上的基因表达调控
DNA水平上的调控是真核生物发育调控的一种形式,包括基因丢失、扩增、重排等。
1、基因丢失 在细胞分化过程中,可以通过丢失某些基因而去除这些基因的活性。某些原生动物、线虫、昆虫等在个体发育中,许多体细胞常常丢失整条或部分染色体,只有将来分化产生生殖细胞的那些细胞一直保留着整套的染色体。
2、基因扩增 即细胞内某些特定基因的拷贝数专一性大量增加的现象,它使细胞在短期内产生大量的基因产物以满足生长发育的需要,是基因活性调控的一种方式。可能是瞬时的,也可能是永久的。
基因扩增也与肿瘤形成有关,许多癌基因都有扩增现象。除正常情况下因发育需要而出现的基因扩增外,外界环境因素也可能造成基因扩增。
3、基因重排 这是通过基因组结构的变化而改变细胞合成蛋白质种类的一种调控方式。如:将一个基因从远离启动子的地方移到较近的位点而启动转录。
哺乳动物的免疫球蛋白种类繁多,它们的差别主要是其可变区的氨基酸顺序不同。不同的免疫球蛋白是由不同的基因编码的,而那么多的免疫球蛋白基因是在淋巴细胞分化过程中通过DNA片段的重组形成的。
(四)DNA的甲基化与基因表达调控
DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达。
真核DNA中的胞嘧啶约有5%被甲基化为5-甲基胞嘧啶,这种甲基化最常发生在鸟嘌呤的旁边(CpG)。活跃转录的DNA段落中胞嘧啶甲基化程度常较低。研究证实, CpG二核苷酸中胞嘧啶
的甲基化导致了人体1/3 以上由于碱基转换而引起的遗传病。 如果用基因打靶的方法除去主要的DNA甲基化酶,小鼠的胚胎就不能正常发育而死亡,可见DNA的甲基化对基因表达调控是重要的。
(五)转录基因的染色质结构
1、转录基因的染色质结构 :转录的基因全部位于常染色质中,处于异染色质中的基因则不表达(高凝聚的染色质结构阻止基因转录)。在一个特定的时间内,只有一部分常染色质的基因在表达。 2、组蛋白的修饰作用 :活跃进行基因转录的染色质区段常有H1组蛋白水平降低、H2A、H2B组蛋白二聚体不稳定性增加、组蛋白乙酰化和泛素化(obiquitination)、以及H3组蛋白巯基化等现象,这些都是核小体不稳定或解体的因素。转录活跃的区域常缺乏核小体的结构。
3、转录活跃区域对核酸酶敏感度增加,出现了对DNaseⅠ高敏感点。在高敏感点区域内,核小体结构不存在或是不同寻常。 二、真核基因转录水平的调控
真核基因调控主要在转录水平上进行,受大量特定的顺式作用元件和反式作用因子调控。
(一)顺式作用元件(cis-acting elements)
顺式作用元件:不编码任何产物的DNA片段,能影响与之相联系的同一条DNA链上的基因表达。启动子、增强子属于顺式作用元件。
(二)反式作用因子(trans-acting factors)
反式作用因子:由调节基因编码,其编码产物(RNA或蛋白质)可以扩散、控制其它基因的表达(转录因子)。反式作用因子能直接或间接地识别或结合在各类顺式作用元件核心序列上,参与调控靶基因转录效率。
反式作用因子(转录因子)从功能上分析其结构包含: ① DNA结合域(DNA binding domain)
② 转录激活域(activating domain):不与DNA直接结合的转录因子没有DNA结合域,但能通过转录激活域直接或间接作用于转录复合体而影响转录效率。
③ 连接区 即连接上两个结构域的部分。
迄今发现的转录因子中,其DNA结合域有四种类型: ① 螺旋-转角-螺旋(helix-turn-helix,HTH): 这类蛋白质中至少有两个α螺旋,它们之间由短肽段形成的转角或环连接,其中位于大沟中的α螺旋对于识别DNA具有决定性的意义。
② 锌指结构(zinc finger):锌以4个配价键与4个半胱氨酸、或2个半胱氨酸和2个组氨酸相结合。每个重复的“指”状结构约含23个氨基酸残基,整个蛋白质分子可有2-9个这样的锌指重复单位。每一个单位可以其指部伸入DNA双螺旋的大沟,接触5个核苷酸。
例如与GC盒结合的转录因子SP1中就有连续的3个锌指重复结构。
③ 亮氨酸拉链(basic-leucine zipper bZIP):这类蛋白质分子中每隔6个氨基酸就有一个亮氨酸残基,结果就导致这些亮氨酸残基都在α螺旋的同一个方向出现。两个相同结构的两排亮氨酸残基就能以疏水键结合成二聚体,二聚体的另一端的肽段富含碱性氨基酸残基,借其正电荷与DNA双螺旋链上带负电荷的磷酸基团结
合。
碱性-螺旋-环-螺旋(basic-helix/hoop/helix,bHLH)
常见的哺乳类RNA聚合酶Ⅱ启动子中的元件与相应的蛋白因子: 元件名称 共同序列 结合的蛋白因子名称 TATA box TATAAAAT TBP GC box GGGCGG SP-1 CAAT box GGCCAATCT CTF/NF1 转录调控的实质在于顺式调控元件与反式作用因子的相互作用(包括反式作用因子之间的相互作用和反式作用因子与RNA聚合酶之间的相互作用),才能实现它们对于基因转录的调控。 (三)转录激活域(activating domain) (四)真核基因转录调控的主要模式
生物大分子间的辨认、相互作用、结构上的变化及其在生命活动中的意义,人们的认识和研究还只在起步阶段,其中许多内容甚至重要的规律我们可能至今还一无所知,有待于努力探索。 A、蛋白质磷酸化、信号转导及基因表达 5、蛋白质磷酸化参与细胞分裂的调控
细胞通过p53及p21蛋白控制CDK(cyclin-dependent protein kinase)活性,调控细胞分裂的进程。 B、激素及其影响
C、热激蛋白诱导的基因表达
能与某个(类)专一蛋白因子结合,从而控制基因特异表达的DNA上游序列称为应答元件(response element)。 三、其它水平上的基因调控 1、RNA的加工成熟 2、翻译水平的调控
真核生物的mRNA的“扫描模式”与蛋白质合成的起始 mRNA5’末端帽子结构的识别与蛋白质合成
反义RNA (anti sense RNA)是指与mRNA互补的RNA分子,它能与mRNA分子特异性地互补结合,从而抑制该mRNA的加工与翻译,阻断该基因的表达。 第八章
生物染色体与基因组结构
基因组是指细胞内遗传信息的携带者DNA的总体。
基因组结构是指不同功能区域在整个DNA分子中的分布情况。 一、 细菌染色体与基因组结构
细菌基因组的结构特点在许多方面与病毒的基因组特点相似,而在另一些方面又有其独特的结构和功能。
1、基因组很小,大多只有一条染色体,且DNA含量少,仅由一条环状双链DNA分子组成,细菌的染色体相对聚集在一起,形成一个较为致密的区域,称为类核(nucleoid)。染色体DNA通常与细胞膜相连。
2、原核生物基因主要是单拷贝基因,只有很少数基因(如rRNA基因)以多拷贝形式存在。几乎每个基因序列都与它所编码的蛋白质序列呈线性对应状态。不同的生物体,其基因组的大小和复杂程度各不相同,进化程度越高的生物体其基因组越复杂。 3、DNA序列中功能相关的基因,往往丛集在基因组的一个或几个特定部位,形成操纵子结构,转录产生多顺反子mRNA。 4、原核DNA分子的绝大部分是用来编码蛋白质的,不编码的DNA部份所占比例比真核细胞基因组少得多。
5、 和病毒基因组不同的是,在细菌基因组中不会出现基因重叠现象。
二、病毒基因组的结构特点:完整的病毒颗粒包括外壳蛋白和内部的基因组DNA或RNA,病毒不能独立地复制,必需进入宿主细胞中借助细胞内的一些酶类和细胞器才能使病毒得以复制。外壳蛋白(或被膜)的功能是识别和侵袭特定的宿主细胞并保护病毒基因组不受核酸酶的破坏。
1、 与细菌或真核细胞相比,病毒的基因组很小,但是不同的病毒之间其基因组相差甚大。组成病毒基因组的DNA和RNA可以是单链的,也可以是双链的,可以是闭环分子,也可以是线性分子。乙肝病毒DNA只有3kb大小,只能编码4种蛋白质,而痘病毒的基因组有300kb之大,可以编码几百种蛋白质。乳头瘤病毒是一种闭环的双链DNA病毒,而腺病毒的基因组则是线性的双链DNA,脊髓灰质炎病毒是一种单链的RNA病毒,而呼肠孤病毒的基因组是双链的RNA分子。
2、除了反转录病毒(两个拷贝)以外,一切病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。
3、病毒基因组DNA序列中功能相关的rRNA或蛋白质基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。它们可被一起转录为多顺反子mRNA,然后再加工成各种蛋白质的模板mRNA。
4、病毒基因组的大部分是用来编码蛋白质的,只有非常小的一份不被翻译,这与真核细胞DNA的冗余现象不同。
5、噬菌体(细菌病毒)的基因是连续的;而真核细胞病毒的基因是不连续的,具有内含子。
6、存在基因重叠现象,即同一段DNA片段能够编码两种甚至三种蛋白质分子,这种现象在其它的生物细胞中仅见于线粒体和质粒DNA,所以也可以认为是病毒基因组的结构特点。重叠基因可经济利用基因组,有以下几种情况:一个基因完全在另一个基因里面;部分重叠;两个基因只有一个碱基重叠。这些重叠基因尽管它们的DNA大部分相同,但是由于将mRNA翻译成蛋白质时的读框不一样,产生的蛋白质分子往往并不相同。这种结构使较小的基因组能够携带较多的遗传信息。 三、真核生物基因组特点
1、基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。
2、真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因组是双份的(即双倍体),即有两份同源的基因组。基因组中不同的区域具有不同的功能,有些是编码蛋白质的结构基因,有些是复制及转录的调控信号,有些区域的功能尚不清楚。
3、在基因组内,功能上密切相关的基因不如原核生物那样集中,目前在真核细胞还没有发现有操纵子存在。真核细胞基因转录产物为单顺反子mRNA 。
4、存在大量重复序列,其中有很大一部分是不被翻译的。 5、真核生物的大部分基因属于断裂基因,有内含子和外显子存在,基因是不连续的。断裂基因由于真核细胞极其DNA的复杂性,直到60年代后期才相继证明哺乳动物RNA合成时,核中的不均一RNA远远大于细胞质中的mRNA,而核中的初始转录本与基因
本身的序列是一致的,当hnRNA在核中输出进入细胞质之前这部分不在mRNA中出现的序列已被删除。内含子与物种进化的关系并不是所有的真核基因都有内含子,例如组蛋白基因、干扰素基因、某些哺乳动物病毒的基因中就很少有内含子。根据现在已经掌握的数据分析,越是低等的真核生物基因的断裂越少(有内含子的基因少),内含子也越短。例如,人和鼠的细胞色素C基因都有内含子,但酵母的这个基因却没有。果蝇乙醇脱氢酶基因有内含子,而酵母中的这个基因也没有。
6、真核基因组存在多基因家族。多基因家族是指由某一祖先基因经过重复和变异所产生的一组基因。如组蛋白基因家族、珠蛋白基因家族、rRNA家族。
内含子的存在使基因变长,这就会增加基因间发生重组的速率,同时也会减少在外显子内发生重组而形成一些为细胞所不能接受的蛋白质的可能性。如果重组主要是在内含子发生,由于拼接过程有可能在两个或多个内含子的5‘和3’末端进行,因此有可能形成一些新的蛋白质。加之由于突变作用,在外显子与内含子的交界处加进或减少一些核苷酸序列,就可能造成新的拼接部位。这些对真核基因的进化都是有益处的。
rRNA家族: 在原核生物如大肠杆菌基因组中,rRNA基因一共是七套; rDNA的重复单位在许多动物的卵子形成过程中进行大量复制扩增,用于组装核糖体合成大量的蛋白质,以满足受精后发育的需要。扩增rDNA的过程是采用滚环式复制方式在核仁区进行的,卵母细胞成熟后,大量的rDNA由于失去了存在的意义而逐渐降解。在大多数真核细胞中5SrRNA基因亦串联重复排列成基因簇。
Alu家族:Alu家族是哺乳动物包括人基因组中含量最丰富的一种中度重复顺序家族,在单倍体人基因组中重复达30万-50万次,约占人基因组的3-6%。Alu家族每个成员的长度约300bp,由于每个单位长度中有一个限制性内切酶Alu的切点(AG↓CT)从而将其切成长130和170bp的两段,因而定名为Alu序列(或Alu家族)。Alu顺序具有种的特异性,人的Alu顺序制备的探针只能用于检测人的基因组中的Alu序列。由于在大多数的含有人的DNA的克隆中都含有Alu顺序,因此,可以这样认为,用人的Alu序列制备的探针与要筛选的克隆杂交,阳性者即为含有人DNA克隆,阴性者不含有人DNA。Alu序列分散在整个人体或其他哺乳动物基因组中,在间隔DNA,内含子中都发现有Alu序列。在多基因家族中,某些成员并不产生有功能的基因产物,这些基因称为假基因(pseudo gene)。假基因与有功能的基因同源,原来可能也是有功能的基因,但由于缺失、倒位或点突变等,使这一基因失去活性,成为无功能基因。与相应的正常基因相比,假基因往往缺少正常基因的内含子,两侧有同向重复序列。假基因不被转录。
假基因的来源之一,可能是基因经过转录后生成的RNA前体通过剪接失去内含子形成mRNA,如果mRNA经反转录产生cDNA,再整合到染色体DNA中去,便有可能成为假基因,因此该假基因是没有内含子的,在这个过程中,可能同时会发生缺失,倒位或点突变等变化,从而使假基因不能表达。
四、线粒体DNA的结构和功能线粒体DNA(mtDNA)与质粒DNA
一样,也是双链的超螺旋环状分子。一般来说,动物mtDNA较小,植物的mtDNA较大。mtDNA的复制属于D环复制。线粒体有其自己的一套遗传控制系统,同时也受到细胞染色体DNA的控制。
线粒体的密码系统 线粒体tRNAtrp可以识别UGG和UGA两个密码子。多肽内部的甲硫氨酸由AUG和AUA两个密码子编码;而起始甲硫氨酸由AUG、AUA、AUU和AUC四个密码子编码。在线粒体密码系统中的4个终止密码子(UAA,UAG,AGA,AGG)。 通过近几年的研究发现哺乳动物mtDNA的遗传密码与通用的遗传密码有以下区别:
1、UGA不是终止信号,而是色氨酸的密码。因此2、3、AGA,AGG不是精氨酸的密码子,而是终止密码子,因而,现在已知线粒体的基因组至少含有如下基因:
(1)tRNA基因:在啤酒酵母mtDNA中有24个tRNA基因,粗链孢霉菌的mtDNA中有40个tRNA基因,而人类mtDNA中有22个tRNA基因。
(2)rRNA基因:在人类mtDNA中有一个拷贝的16S及12SrRNA基因。
(3)细胞色素氧化酶基因:细胞色素氧化酶有七个亚基,其中三个亚基mtDNA编码,四个亚基由细胞核DNA编码。 (4)ATP酶基因:ATP酶分子量为340KD,含有十个亚基,其中四个由mtDNA编码。
(5)细胞色素还原酶基因:此酶有七个亚基,基中一个由mtDNA编码。另外,还有一些抗药性基因也在mtDNA上。
线粒体DNA的双重遗传控制线粒体除具有DNA外,还有自己的蛋白质合成系统,如tRNA,核糖体等。这些成份与细胞质的相应组份不同,而与细菌的相似。此外,mtDNA的复制和转录都是自己的聚合酶来完成的。蛋白质合成时,线粒体核糖体上的蛋白质合成也受细菌蛋白质合成抑制剂如氯霉素,链霉素的抑制。这些情况说明线粒体的许多组份是自主的,不受细胞核的控制,而且在许多方面与原核生物的相似。另一特点是参与呼吸链的一些酶成份是受双重遗传控制的,即部份亚基为细胞核基因所编码,另一些亚基则是mtDNA编码的。
根据线粒体的这些特点Margulis提出了线粒形成的内共生学说(endosymbio-nttheory)。在进化过程中原始的厌气细菌吞噬了原核生物(如细菌,蓝绿澡等)形成共生关系。寄生为共生者提供营养和保护,共生者为寄主提供能量生成系统。最终,共生者演化成细胞的组成成份──线粒体。
等植物的RuBP羧化酶是一个由核基因和质体基因共同编码的基因产物,其大亚基的合成由叶绿体基因组中单一基因编码,而小亚基的合成则由核基因组中的多基因编码。
mtRNA聚合酶只是一条简单的多肽链,这也与真核细胞的酶不同。
五、叶绿体DNA的结构与功能和线粒体基因组的结构相似,叶绿体也含有自己的基因组,但我们对叶绿体基因组的了解不如线粒体那样多。叶绿体基因组DNA(chloroplast DNA,ctDNA) 是一个裸露的环状双链DNA分子,缺乏组蛋白和超螺旋,其大小在120kb到217kb之间,相当于噬菌体基因组的大小。一个叶绿体中通常有一个到几十个叶绿体基因组。叶绿体基因组中的基因数目多于
线粒体基因组,每个叶绿体中ctDNA的拷贝数随着物种的不同而不同,但都是多拷贝的。ctDNA不含5-甲基胞嘧啶,这是鉴定ctDNA及其纯度的特定指标。GC含量与核DNA及mtDNA有 很大的不同,因此可用CsCl密度梯度离心来分离ctDNA。 ctDNA基因组成有以下特点:
(1)基因组由两个反向重复序列(IR)和一个短单拷贝序列(short single copy seguence, SSC)及一个长单拷贝序列(long single copy seguence, LSC)组成;IRA和IRB长各10-24Kb,编码相同,方向相反。
(2)ctDNA启动子和原核生物的相似,皆由两个部分组成,即基因上游-10区的TATAAT和-35区的TTGACA序列。
(3)组织结构多为多顺反子操纵子(有的基因产生单顺反子的mRNA)。
(4)尽管ctDNA大小各不相同,但基因组成是相似的,而且所有基因的数目几乎是相同的,它们大部分产物是类囊体的成分或和氧化还原反应有关。
(5)其tRNA基因(IRA、IRB上各有7个,LSC上有23个,共37个)中有内含子存在,最长者达2526bp,此和原核tRNA不同。 (6)所有叶绿体基因转录的mRNA都由叶绿体核糖体翻译。 高等植物叶绿体DNA的内含子主要在tRNA基因中发现,很少在蛋白质结构基因中发现,但在绿藻中却发现大量的蛋白质结构基因也存在有内含子。
叶绿体基因组同线粒体基因组一样,都是细胞里相对独立的一个遗传系统。叶绿体基因组可以自主地进行复制,但同时需要细胞核遗传系统提供遗传信息。例如,光合系统Ⅱ中的chla/b蛋白质是在细胞质内的80S核糖体上合成后再转运进叶绿体的;RuBP酶的大亚基是在叶绿体内合成的,但其小亚基则是在细胞质中80S核糖体上合成后转运进叶绿体,然后同大亚基装配成有生物学活性的全酶。
第十章 分子生物学技术
分子生物学的发展,已经产生了一整套分子生物学技术。几乎在一夜之间,这一技术已经成了研究许多基本生物学问题的重要手段。通过对DNA或RNA的提取,基因的分离,核苷酸序列的测定,人们将了解到基因及其所编码的蛋白质的结构,进而对其功能也有所认识。通过对基因的表达的研究,我们能了解基因的表达调节过程,进一步认识生命活动的规律。通过对基因进行突变和改造,我们将深入了解基因及其产物的结构和功能的关系。 基因克隆(gene cloning)基因表达(gene expression)-原核基因表达真核基因表达
第一节 基因的克隆与表达
一、分子克隆的概念基因克隆(分子克隆molecular cloning)、重组DNA或基因工程都是指DNA的无性繁殖技术----通过体外重组技术,将一段目的DNA经切割、连接插入适当载体,并导入受体细胞,扩增形成大量子代分子的过程。基因克隆的核心-----体外重组(Recombination) : 人工将一段目的DNA插入一个载体的过程。
分子克隆、这种技术是70年代初期建立起来的。在1970年,发现了第一种限制性内切酶,这种酶能够在特定位点切割DNA,因此,任何DNA的限制性片段都能插入到一个载体DNA分子中(通
常是质粒DNA分子),形成重组DNA分子,将重组DNA分子氲郊闹飨赴?常见为细菌),每一个含有重组DNA分子的寄主细胞增殖后成为一个克隆,经过筛选,便可以从大量的克隆中得到含有目的基因的DNA片段的克隆,这一过程称之为基因克隆。 分子克隆、这种技术是70年代初期建立起来的。在1970年,发现了第一种限制性内切酶,这种酶能够在特定位点切割DNA,因此,任何DNA的限制性片段都能插入到一个载体DNA分子中(通常是质粒DNA分子),形成重组DNA分子,将重组DNA分子氲郊闹飨赴?常见为细菌),每一个含有重组DNA分子的寄主细胞增殖后成为一个克隆,经过筛选,便可以从大量的克隆中得到含有目的基因的DNA片段的克隆,这一过程称之为基因克隆。 基因克隆的技术路线目的基因 载体体外重组 转化 受体细胞 筛选阳性克隆 大量扩增,获得子代DNA 体外重组 重组子(杂合DNA) 受体细胞 二、分子克隆的步骤
1、带有目的基因的DNA片段的获得:
化学合成法合成目的基因:适用于已知核苷酸序列的分子量较小的目的基因的制备,目前多用DNA自动合成仪来完成; 构建基因组DNA文库和cDNA文库 ,然后从中筛选含有目的基因的重组克隆。
2、重组DNA分子的构建:
重组DNA分子中包括两部分,一部分是外源DNA,即目的DNA片段,另一部分是载体DNA。用作载体的有质粒、噬菌体或病毒DNA。如果用同一种限制性内切酶切割这两种DNA,则它们的末端完全相同,由于有互补的单链末端序列存在,在连接酶的作用下,就可以形成重组DNA分子。在没有互补 二、分子克隆的步骤
1、带有目的基因的DNA片段的获得:
化学合成法合成目的基因:适用于已知核苷酸序列的分子量较小的目的基因的制备,目前多用DNA自动合成仪来完成; 构建基因组DNA文库和cDNA文库 ,然后从中筛选含有目的基因的重组克隆。
2、重组DNA分子的构建:
重组DNA分子中包括两部分,一部分是外源DNA,即目的DNA片段,另一部分是载体DNA。用作载体的有质粒、噬菌体或病毒DNA。如果用同一种限制性内切酶切割这两种DNA,则它们的末端完全相同,由于有互补的单链末端序列存在,在连接酶的作用下,就可以形成重组DNA分子。在没有互补
二、克隆载体理想的载体应具备以下几个条件:能够自我复制; 分子量要小,小分子DNA易处理,不易损伤,而且小分子质粒为多拷贝质粒,可用于基因扩增;能给受体细胞提供可选择的标记;对多种限制酶只有单一的切点,否则切割重组后可能丢失某些片段。
三、受体细胞(外源DNA导入的细胞,是重组体扩增的场所) 1、转化:重组DNA分子必须进入宿主细胞中,才能得到扩增和表达,这个过程叫做转化。
2、要求:易于接纳外源DNA;无特异的内源性核酸内切酶;载体复制、扩增不受阻;与载体有互补性
大肠杆菌是目前使用最广泛的宿主细胞。除此以外,其它
细菌、酵母、哺乳动物细胞等也可作为宿主细胞,可以根据实验的需要加以选择。在被转化的宿主细胞中,不同的单个细胞(在平板上表现为单个菌落,亦称克隆)中可能含有不同的重组质粒或非重组质粒,因此必须进行筛选,以便确定哪些是重组克隆。筛选可以使用抗菌素抗性或其它方法,依载体的性质而定。 3、重组DNA分子的转化和重组克隆的筛选: 4、特定重组克隆的鉴别:
由于重组克隆往往是较多的,而在某一克隆实验中,我们感兴趣的目的克隆只有一个或几个,所以需要进一步鉴别。使用的方法主要有核酸杂交法和免疫化学法。 三、限制性内切酶和其它工具酶
1¡¢内切核酸酶可以分为几类,其中以第Ⅱ类内切核酸酶最为重要。第Ⅱ类内切核酸酶的特性:
a 有特定的识别序列。通常为4~6个碱基对(少数为8个),而且大多数具有回文结构和旋转对称轴。
b 切割点位于识别序列内的固定位置上。切割之后,在5¡¯末端有磷酸基,在3¡¯末端有羟基。
c 酶切后形成粘性末端或平滑末端。前者又分为3¡¯端突出和5¡¯端突出2种情况。
d 其酶活性的发挥只需要Mg2+作辅酶。 2、酶活性的定义和影响酶活性的因素:
酶的活性是以酶单位(u)来衡量的。一个酶单位的定义是:在标准条件下(25、最适pH、最适底物浓度),一分钟内催化1微摩尔底物转化的酶量定义为一个(酶)单位。 影响酶活性的因素很多,最重要的有: a DNA的纯度和甲基化程度。
在DNA提取过程中,常常使用到苯酚,十二烷基磺酸纳(SDS)、乙醇、氯仿等有机试剂,这些试剂如果未彻底去掉,以及过高的EDTA对酶活性有极大的抑制作用。识别序列内碱基的甲基化会影响酶活性。 b 反应条件。
不同的限制性内切酶对pH值,离子强度、反应温度等的要求有所不同。此外,由于酶制剂中通常加有50%的甘油,以便使酶稳定,并且低温保存(一20℃)时不会冻结。但是,如果酶反应体系中甘油的含量超过5%,则会抑制酶反应。 3、限制性内切酶的命名:
目前普遍采用的是Smith等人提出的命名法。用细菌属名的第一个字母作酶名称的第一个字母(大写斜体);种名的前2个字母作酶名称的第二、三个字母(小写斜体);菌株名由第四个字母表示出来(大写),同一种细菌中若有几种酶时,则用罗马数字加以区别。例如,从Bacillus amyto liquefacilens H中发现的第一种限制性内切酶命名为BamHI¡£ 4、限制性内切酶的应用
要进一步分析提取纯化的DNA,首先必须依赖于限制性内切酶的应用。利用限制性内切酶,我们可以把较大的DNA分子重复地切割成分子量符合要求的大小片段。也只有利用限制性内切酶,我们才能构建出DNA的物理图谱,了解限制片段之间的排列顺序,也才能够进行DNA序列分析和目的基因的克隆。 5、其他工具酶
(1) DNA连接酶:常见的DNA连接酶有两种,一种是T4DNA连接酶,另一种是大肠杆菌DNA连接酶,它们的区别是,前者需要ATP参与反应,而后者需要NAD+参与反应。 连接反应通常在15℃或更低的温度(如4℃)下进行。
(2) 末端转移酶:该酶能将脱氧核苷酸逐个地加到DNA分子的3¡¯OH上,不需要模板。常用在两种不同的DNA分子上造成互补的粘性末端。例如,在外源DNA上加dG,在载体上加dC,则外源DNA和载体之间可以通过G-C配对而结合起来。
(3) 逆转录酶:该酶最重要的活性是,在引物(寡核苷酸或寡脱氧核苷酸)存在下,以mRNA为模板,按5¡¯到3¡¯方向合成互补DNA,即cDNA。在分子克隆研究中,利用逆转录酶可将具有多聚A尾巴的mRNA反转录成cDNA,然后构建cDNA克隆。
(4) Sl核酸酶:这是一种降解单链核酸的酶。主要用于把具有不整齐末端的DNA变为平滑末端的DNA。此外,在DNA部分变性条件下,该酶也能在AT丰富的区域把DNA切断。 四、体外重组的策略
1、粘末端连接1)全同源粘末端连接最方便简单高背景-载体自身环化双向插入
2)定向克隆:使外源基因定向插入到载体中的克隆策略粘-粘连接:最有效、最快捷
粘-平连接:适用于外源基因仅与载体有一个相同酶切位点,可将另一末端补平
2、平末端连接:酶切点为平末端或任何两个末端补平的DNA效率低,酶用量大
3、人工接头连接 人工接头:人工合成含有酶切位点的寡核苷酸片段
4、T-A克隆 T-vector两条链的5’端含有一个游离的T,PCR过程中,普通的Taq酶可在产物的3’端多加一个A 五、基因克隆的工作流程 (一)目的基因的获得
1、直接分离—适用于克隆原核生物的基因组文库2、构建基因组文库3、构建cDNA文库4、PCR5、人工合成6、差异显 2、构建基因组文库,筛选目的基因 基因组文库(gene library):将某种生物的基因组DNA切割成一定大小的片段,并与合适的载体重组后导入宿主细胞,进行克隆。这些存在于所有重组体内的基因组DNA片段的集合,即基因组文库,它包含了该生物的所有基因。
特点及应用:包含所有遗传信息;构建难度大(单拷贝基因、长片段基因);筛选难度大;用于研究基因在基因组中的情况 构建流程 抽提基因组DNA 鸟枪法制备DNA片段 DNA片段与载体重组 转化宿主菌
筛选目的基因(核酸探针法、免疫结合法) 二、基因文库
概念:由大量的含有基因组DNA(即某一生物的全部DNA顺序)的不同的DNA片段的克隆所构成的群体,称之为基因文库。 一个完全的基因文库,应该能够保证从中筛选到目的基因。1976
年,L.Clark和J.Carbon提出了一个完全的基因文库所需克隆数的计算公式: N=1n(1-p)/1n(1-f)
在上述公式中:N是一个完全基因文库所应包含的重组体克隆数;p为所期望的目的基因在基因文库中出现的几率;f是插入片段的平均大小与基因组DNA大小的比值。从这一公式中,我们可以计算出不同来源的基因组构建基因文库时需要的最少克隆数的理论值。
建立基因文库的技术原理:
与cDNA文库是相似的,但是,由于构建基因文库的目的是要分离定位于染色体上的基因,而基因组DNA的总长度通常要比某一特定组织器官或细胞中的mRNA分子的长度的总和大许多倍。因此,通常选用λ噬菌体DNA作为载体分子,它所能克隆的插入片段的长度在20kb左右。λ噬菌体DNA的长仍加?0kb,但是中间部分的25kb可以删去,代之以外源DNA片段。经过这样重组的噬菌体完全具备对E.coli细胞的侵染和在E.coli细胞内进行复制的能力。
构建基因文库的第一步是从某一物种的任一组织中提取基因组DNA。动物的生殖细胞或早期胚,以及植物的叶片等都是常用于提取总DNA的材料。
然后,用限制性内切酶消化总DNA,如果选用EcoRI,经过消化后的DNA片段都具有粘性末端,当DNA片段的平均长度为20kb左右时终止消化。λ噬菌体 DNA也用相同的限制性内切酶EcoRI降解,EcoRI在λ噬菌体DNA上有两个识别位点,因此消化后的λDNA产生一条25kb长短的片段,这就是位于λDNA中部的非必需片段,此外还有两条位于两端的短的DNA片段,也称臂。λDNA的中间部分可通过电泳而与两条臂分开。这时,可将λDNA的两臂与基因组的DNA片段混合,混合的比例为1:1,由于粘性末端是互补的,相当于正常的噬菌体DNA大小的λDNA分子就会形成,其中包含有一段长度约为20kb的外源基因组DNA,在DNA连接酶的作用下,重组DNA分子连接起来。
再从感染的E.coil细胞中提取出噬菌体的外壳蛋白,在体外进行噬菌体的组装。只有长度正常的λDNA分子才能被有效的包装,形成具有感染能力的λ噬菌体。
含有重组λDNA分子的噬菌体感染E.coil细胞,在培养基上形成噬菌斑。通过原位噬菌斑杂交,我们便可确定含有特异基因的噬菌体在培养基上的位置。所用的探针可以是同位素标记的特异mRNA或cDNA分子以及其它物种的同源基因组DNA 。 在基因文库和cDNA文库中所使用的寄主细胞通常为大肠杆菌E.coli细胞。最近,酵母的人工染色体(YACs)技术已经出现。利用此技术可以方便地克隆非常大的基因组DNA片段。 三、特异基因片段的分离
如何才能分离得到含有目的基因的重组DNA分子,这是基因克隆的中心问题。基因文库或cDNA文库中的目的基因可利用核酸分子杂交技术,抗体与抗原的特异反应来筛选获得。
不同的生物基因的核苷酸序列虽然不尽相同,却享有一定的同源性,因此,如果另一种生物的同一基因已被克隆,那么,它便可以用作探针,筛选得到所需的目的基因。
合成的寡聚核苷酸序列也可作为探针,这尤其适用于只了解目的基因的产物——蛋白质的部分序列时的情况。因遗传密码具有
简并性,从蛋白质推导出的核苷酸序列与目的基因的相应序列可能并不一致,但这并不影响合成的寡聚核苷酸探针成为一种有效的筛选手段。
组织特异性表达的基因可以通过差别筛选法获得。具体的方法是这样的:提取A类细胞的mRNA构建cDNA文库。另外,标记从mRNA反转录形成的单链cDNA分子。以此由不同的单链cDNA分子组成的探针与所构建的cDNA文库进行分子杂交。再提取B类细胞的mRNA,同样标记反转录后形成的单链cDNA肿樱惨訠类细胞的单链cDNA为探针,与A类细胞的cDNA文库进行分子杂交。如果A类细胞中有相对于B类细胞来说是特异性表达的基因,那么,该基因应该只与A类细胞的单链cDNA探针杂交,而不与B类细胞的探针杂交。与两类单链cDNA探针都杂交的克隆则是在A类和B类细胞中都表达的基因。而与两类探针都不杂交的克隆则可能是由于其mRNA丰度较低导致无法检测出其存在与否。这一种筛选目的基因的方法也称为正负筛选法。同样原理,我们也可筛选得到不同的发育时期、不同环境条件下特异性表达的基因。
如果目的基因所编码的蛋白质易于提取,利用抗体对抗原的特异性识别进行筛选也是一种很好的方法。其中的抗原就是提取得到的蛋白质,制备出该抗原的抗血清后,构建一个表达的cDNA文库。由于选用了表达载体分子,插入的基因可融合到一个大肠杆菌基因的后面,因此可在大肠杆菌中盏急泶铮笨固宸肿邮侗鸪霰泶锪讼嘤乖目寺↔币簿褪钦业搅讼嘤Φ暮心康幕虻闹刈镈NA分子。
如果打算克隆一个未知的真核生物基因,也就是说,既没有目的基因的核酸探针,也没有基因所编码的蛋白质,但是该基因与某一表型有关。在这种情况下,通常采用的方法是引入一个示踪核苷酸序列到真核生物细胞内,该序列可插入到染色体上的某一位置,使所插入的位置上的基因结构⑸谋洌虻氖Щ钜鹆丝晒鄄斓降谋硇偷谋浠≡癖硇捅浠说南赴菇ㄆ浠蛭目猓允咀俸塑账嵝蛄凶魑秸耄秆〕龊惺咀俸塑账嵝蛄械牟迦肫危诖似沃校挥谑咀傩蛄辛奖叩暮塑账嵝蛄芯陀Ω檬怯敫帽硇陀泄氐幕虻男蛄小3S玫氖咀俸怂嵊胁《痉肿尤绶醋疾毒或转座子等,它们进入真核细胞后都具有整合到染休上的能力。
分离目的基因,离不开构建基因文库或cDNA文库。如何决定选用哪一种文库呢?首先,这取决于我们将采用的筛选方法。例如:若采用核酸探针的筛选方法,则两种文库都适用。如果采用抗体一抗原的特异性反应作为筛选的手段,则应选用构建cDNA文库的方法。其次,要考虑目的基因在这街治目庵械姆岫取R话闼道矗琧DNA文库较小,一个完全的cDNA文库所含的克隆数要比一个完全的基因文库所含的克隆数少得多,它们之间相差可达10~100倍,如果能恰当地选择mRNA的来源,从cDNA文库中筛选得到目的基因的机率就大些。但是有些基因组简单的生物如:酵母、盘基网柄菌龋康幕蛟诨蛭目庵械姆岫纫灿胨赾DNA文库中的丰度相当。此外,从cDNA文库中分离得到的基因可在大肠杆菌中表达,因为mRNA经过加工修饰后,切掉了内含子。而表达的产物有时对于研究者来说是重要的。从基因文库中得到的目的基因包含了完整的基因结构信息如:5’-上游区的调控序
列、外显子、内含子等。因此要研究基因的完整结构,如确定内含子在基因中的精确位置,则具有来自这两种文库的目的基因是必不可少的。?f1 二、基因文库
概念:由大量的含有基因组DNA(即某一生物的全部DNA顺序)的不同的DNA片段的克隆所构成的群体,称之为基因文库。 一个完全的基因文库,应该能够保证从中筛选到目的基因。1976年,L.Clark和J.Carbon提出了一个完全的基因文库所需克隆数的计算公式: N=1n(1-p)/1n(1-f)
在上述公式中:N是一个完全基因文库所应包含的重组体克隆数;p为所期望的目的基因在基因文库中出现的几率;f是插入片段的平均大小与基因组DNA大小的比值。从这一公式中,我们可以计算出不同来源的基因组构建基因文库时需要的最少克隆数的理论值。
建立基因文库的技术原理:
与cDNA文库是相似的,但是,由于构建基因文库的目的是要分离定位于染色体上的基因,而基因组DNA的总长度通常要比某一特定组织器官或细胞中的mRNA分子的长度的总和大许多倍。因此,通常选用λ噬菌体DNA作为载体分子,它所能克隆的插入片段的长度在20kb左右。λ噬菌体DNA的长仍加?0kb,但是中间部分的25kb可以删去,代之以外源DNA片段。经过这样重组的噬菌体完全具备对E.coli细胞的侵染和在E.coli细胞内进行复制的能力。
构建基因文库的第一步是从某一物种的任一组织中提取基因组DNA。动物的生殖细胞或早期胚,以及植物的叶片等都是常用于提取总DNA的材料。
然后,用限制性内切酶消化总DNA,如果选用EcoRI,经过消化后的DNA片段都具有粘性末端,当DNA片段的平均长度为20kb左右时终止消化。λ噬菌体 DNA也用相同的限制性内切酶EcoRI降解,EcoRI在λ噬菌体DNA上有两个识别位点,因此消化后的λDNA产生一条25kb长短的片段,这就是位于λDNA中部的非必需片段,此外还有两条位于两端的短的DNA片段,也称臂。λDNA的中间部分可通过电泳而与两条臂分开。这时,可将λDNA的两臂与基因组的DNA片段混合,混合的比例为1:1,由于粘性末端是互补的,相当于正常的噬菌体DNA大小的λDNA分子就会形成,其中包含有一段长度约为20kb的外源基因组DNA,在DNA连接酶的作用下,重组DNA分子连接起来。
再从感染的E.coil细胞中提取出噬菌体的外壳蛋白,在体外进行噬菌体的组装。只有长度正常的λDNA分子才能被有效的包装,形成具有感染能力的λ噬菌体。
含有重组λDNA分子的噬菌体感染E.coil细胞,在培养基上形成噬菌斑。通过原位噬菌斑杂交,我们便可确定含有特异基因的噬菌体在培养基上的位置。所用的探针可以是同位素标记的特异mRNA或cDNA分子以及其它物种的同源基因组DNA 。 在基因文库和cDNA文库中所使用的寄主细胞通常为大肠杆菌E.coli细胞。最近,酵母的人工染色体(YACs)技术已经出现。利用此技术可以方便地克隆非常大的基因组DNA片段。 三、特异基因片段的分离
如何才能分离得到含有目的基因的重组DNA分子,这是基因克
隆的中心问题。基因文库或cDNA文库中的目的基因可利用核酸分子杂交技术,抗体与抗原的特异反应来筛选获得。
不同的生物基因的核苷酸序列虽然不尽相同,却享有一定的同源性,因此,如果另一种生物的同一基因已被克隆,那么,它便可以用作探针,筛选得到所需的目的基因。
合成的寡聚核苷酸序列也可作为探针,这尤其适用于只了解目的基因的产物——蛋白质的部分序列时的情况。因遗传密码具有简并性,从蛋白质推导出的核苷酸序列与目的基因的相应序列可能并不一致,但这并不影响合成的寡聚核苷酸探针成为一种有效的筛选手段。
组织特异性表达的基因可以通过差别筛选法获得。具体的方法是这样的:提取A类细胞的mRNA构建cDNA文库。另外,标记从mRNA反转录形成的单链cDNA分子。以此由不同的单链cDNA分子组成的探针与所构建的cDNA文库进行分子杂交。再提取B类细胞的mRNA,同样标记反转录后形成的单链cDNA肿樱惨訠类细胞的单链cDNA为探针,与A类细胞的cDNA文库进行分子杂交。如果A类细胞中有相对于B类细胞来说是特异性表达的基因,那么,该基因应该只与A类细胞的单链cDNA探针杂交,而不与B类细胞的探针杂交。与两类单链cDNA探针都杂交的克隆则是在A类和B类细胞中都表达的基因。而与两类探针都不杂交的克隆则可能是由于其mRNA丰度较低导致无法检测出其存在与否。这一种筛选目的基因的方法也称为正负筛选法。同样原理,我们也可筛选得到不同的发育时期、不同环境条件下特异性表达的基因。
如果目的基因所编码的蛋白质易于提取,利用抗体对抗原的特异性识别进行筛选也是一种很好的方法。其中的抗原就是提取得到的蛋白质,制备出该抗原的抗血清后,构建一个表达的cDNA文库。由于选用了表达载体分子,插入的基因可融合到一个大肠杆菌基因的后面,因此可在大肠杆菌中盏急泶铮笨固宸肿邮侗鸪霰泶锪讼嘤乖目寺↔币簿褪钦业搅讼嘤Φ暮心康幕虻闹刈镈NA分子。
如果打算克隆一个未知的真核生物基因,也就是说,既没有目的基因的核酸探针,也没有基因所编码的蛋白质,但是该基因与某一表型有关。在这种情况下,通常采用的方法是引入一个示踪核苷酸序列到真核生物细胞内,该序列可插入到染色体上的某一位置,使所插入的位置上的基因结构⑸谋洌虻氖Щ钜鹆丝晒鄄斓降谋硇偷谋浠≡癖硇捅浠说南赴菇ㄆ浠蛭目猓允咀俸塑账嵝蛄凶魑秸耄秆〕龊惺咀俸塑账嵝蛄械牟迦肫危诖似沃校挥谑咀傩蛄辛奖叩暮塑账嵝蛄芯陀Ω檬怯敫帽硇陀泄氐幕虻男蛄小3S玫氖咀俸怂嵊胁《痉肿尤绶醋疾毒或转座子等,它们进入真核细胞后都具有整合到染休上的能力。
分离目的基因,离不开构建基因文库或cDNA文库。如何决定选用哪一种文库呢?首先,这取决于我们将采用的筛选方法。例如:若采用核酸探针的筛选方法,则两种文库都适用。如果采用抗体一抗原的特异性反应作为筛选的手段,则应选用构建cDNA文库的方法。其次,要考虑目的基因在这街治目庵械姆岫取R话闼道矗琧DNA文库较小,一个完全的cDNA文库所含的克隆数要比一个完全的基因文库所含的克隆数少得多,它们之间相差可达10~
100倍,如果能恰当地选择mRNA的来源,从cDNA文库中筛选得到目的基因的机率就大些。但是有些基因组简单的生物如:酵母、盘基网柄菌龋康幕蛟诨蛭目庵械姆岫纫灿胨赾DNA文库中的丰度相当。此外,从cDNA文库中分离得到的基因可在大肠杆菌中表达,因为mRNA经过加工修饰后,切掉了内含子。而表达的产物有时对于研究者来说是重要的。从基因文库中得到的目的基因包含了完整的基因结构信息如:5’-上游区的调控序列、外显子、内含子等。因此要研究基因的完整结构,如确定内含子在基因中的精确位置,则具有来自这两种文库的目的基因是必不可少的。?f1
3、构建cDNA文库,筛选目的基因
cDNA文库(complementary DNA library)以组织细胞中的mRNA为模板,反转录合成双链cDNA ,各cDNA分子分别插入载体形成重组子,再导入宿主细胞克隆扩增。这些在重组体内的cDNA的集合即cDNA文库。
特点及应用:cDNA文库仅包含正在表达的基因;不同物种、不同组织的cDNA文库不相同 基因总量少,易筛选 一、cDNA文库
概念:由RNA经反转录形成的cDNA分子所构成的重组DNA克隆群体,称为cDNA基因文库。 建立cDNA文库的原理:
反转录酶是合成cDNA的关键酶。它是以mRNA为模板把脱氧核糖核苷酸逐个加到引物上,由5’→3’的方向合成出与mRNA链互补的cDNA链。在反转录酶作用前,必须将一个短的引物杂交到mRNA分子的3’端,而真核生物的mRNA分子在其3’端通常有一段长度约为50~250个核苷酸组成的多聚腺蚜牒塑账?polyA)结构。因此,多聚脱氧胸腺嘧啶核苷酸poly(dT)可以完全满足作为引物的要求。在cDNA链合成完毕后,模板mRNA用碱处理降解,DNA链不受影响。双链的DNA可以cDNA链为模板合成出来。其中一种技术路线是首先利用末端转移酶在cDNA的3’末端加上同聚物(polydC)尾巴。然后以一段多聚脱氧鸟嘌呤核苷酸(polydG)作为第二条链合成的引物,在DNA聚合酶催化下,合成出双链的DNA分子。
下一步是把合成好的双链cDNA分子与载体分子相连,这里选用的载体分子为质粒。在质粒分子上,有一个抗药性基因,我们也称之为选择性标记。因为带有这种质粒的细菌对相应的抗生素不敏感。若在培养基中加入相应的抗生素,没有质粒的细菌就不能生长,而带有相应质粒的细菌便会增殖形成菌落。
经过特殊处理的细菌细胞具有吸收外源DNA的能力,我们把它们称为感受态细胞。当重组质粒分子与感受态细胞混合,由于感受态细胞的数量远大于重组质粒分子的数量,因此,在培养基上长出的单菌落可以认为是由每一个重组质粒分子导入一个细菌细胞后经过增殖而形成的。含有目的基因的cDNA克隆可利用原位杂交进行筛选。
概念:由RNA经反转录形成的cDNA分子所构成的重组DNA克隆群体,称为cDNA基因文库。 建立cDNA文库的原理:
反转录酶是合成cDNA的关键酶。它是以mRNA为模板把脱氧核
糖核苷酸逐个加到引物上,由5’→3’的方向合成出与mRNA链互补的cDNA链。在反转录酶作用前,必须将一个短的引物杂交到mRNA分子的3’端,而真核生物的mRNA分子在其3’端通常有一段长度约为50~250个核苷酸组成的多聚腺蚜牒塑账?polyA)结构。因此,多聚脱氧胸腺嘧啶核苷酸poly(dT)可以完全满足作为引物的要求。在cDNA链合成完毕后,模板mRNA用碱处理降解,DNA链不受影响。双链的DNA可以cDNA链为模板合成出来。其中一种技术路线是首先利用末端转移酶在cDNA的3’末端加上同聚物(polydC)尾巴。然后以一段多聚脱氧鸟嘌呤核苷酸(polydG)作为第二条链合成的引物,在DNA聚合酶催化下,合成出双链的DNA分子。
下一步是把合成好的双链cDNA分子与载体分子相连,这里选用的载体分子为质粒。在质粒分子上,有一个抗药性基因,我们也称之为选择性标记。因为带有这种质粒的细菌对相应的抗生素不敏感。若在培养基中加入相应的抗生素,没有质粒的细菌就不能生长,而带有相应质粒的细菌便会增殖形成菌落。
经过特殊处理的细菌细胞具有吸收外源DNA的能力,我们把它们称为感受态细胞。当重组质粒分子与感受态细胞混合,由于感受态细胞的数量远大于重组质粒分子的数量,因此,在培养基上长出的单菌落可以认为是由每一个重组质粒分子导入一个细菌细胞后经过增殖而形成的。含有目的基因的cDNA克隆可利用原位杂交进行筛选。 4、PCR扩增目的基因片段 适用于克隆序列清楚的基因
以基因组DNA为模板,直接进行PCR扩增较难 多采用以mRNA为模板的RT-PCR法 5、人工合成较短的DNA
6、差异显示法(differential display, DD)—筛选差异表达的基因 (二)体外重组 连接体系的建立:
温度:粘末端连接:12-18℃平末端连接:室温(低于30℃) DNA量:载体分子数/目的基因分子数=1:1-3 酶量:平端连接时需加大酶量 (三)转化—Cacl2法、电击法 (四)重组子的筛选及鉴定
1、筛选:平板法(抗生素、蓝白斑)原位杂交 2、鉴定:
长度鉴定:酶切、PCR 方向鉴定:联合酶切 测序
一.表达系统:
基因工程中用来获得有功能的异源蛋白质的体系,包括克隆载体,表达载体及受体细胞。 据受体细胞的不同可分为:
1.原核表达系统: 将外源基因引入原核细胞,并使其在原核细胞中以发酵形式快速高效地表达、合成基因产物的体系。 2.真核表达系统:使外源基因在真核细胞中表达的体系。 1、原核生物染色体DNA是裸露的环形DNA,其转录和翻译是偶联的连续进行。
2、原核生物形成多顺反子mRNA:mRNA在合成过程中和多个核糖体结合,翻译形成多条肽链。
3、一般不含内含子,没有转录及翻译后加工系统 4、原核生物中功能相关的基因串联在一起,形成操纵子。 5、原核生物中参与转录的基因结构:启动子、终止子 6、与转译有关的原核细胞结构——核糖体结合位点:转译起始密码子AUG 或GUG、SD顺序 二.原核表达系统
(一)原核生物基因结构和表达特点
操纵子(operon):是一组功能上相关,受同一调控区控制的基因组成的一个遗传单位
原核生物基因表达的基本单位(即一个转录单位)。 共同协调作用,完成某一多肽的表达调控。
包括:调控区(调节基因,启动基因, 操作基因)、 结构基因
(二)外源基因在原核表达系统中表达的必要条件: 1、删除内含子和5’非编码区
2、外源基因置于强启动子和SD顺序控制下 3、维持正确开放阅读框架(ORF)
4、mRNA稳定且可有效转译,形成的蛋白质不被降解 (三)影响外源基因在原核细胞中表达效率的因素 1、启动子:建立表达载体时,选择强启动子。 常见原核强启动子:
Plac:受Lac阻遏蛋白负调,受IPTG的诱导 Ptrp:取自大肠杆菌色氨酸操纵子。
Ptac : Lac启动子和Trp启动子的杂合启动子。
PL和PR启动子:噬菌体早期左/右向启动子,受λ噬菌体CI基因负调控。温度诱导。 2、基因剂量: 3、核糖体结合位点:
SD顺序与16srRNA3’末端互补程度;AUG—SD间距离;AUG后的核苷酸
(四)原核表达载体:适用于在原核细胞中表达外源基因的载体。 主要元件:强启动子;SD顺序;筛选标志;其它调控基因 类型:融合型表达载体:----融合蛋白 非融合型表达载体:---天然完整蛋白
分泌型表达载体:----产物可跨膜分泌至胞周间隙 融合型表达载体 P SD
Foreign DNA 融合型表达载体 融合基因
技术关键:克隆基因插入原核序列3’端而维持正确阅读框架。 选择合适酶切位点 加人工合成的DNA接头 构建位相载体
----ATG ---- AAC CTG GAA TTC CTA GGT --- ----TAC -----TTG GAC CTT AAG GAT CCA---
EcoRI BamHI
AAT CGG AAG AAT TCA GAC CTA GGT TTA GCC TTC TTA AGT CTG GCT CCA 载体部分序列 DNA序列
位相载体----含有3种读码框的系列载体
优点:表达效率高 产物稳定 易鉴定:融合蛋白分子量大,电泳可鉴定 易纯化:利用融合原核多肽的特性 Ptac:IPTG诱导 GST融合蛋白—直接纯化 产物切割方便:
pGEX-1T—凝血酶 pGEX-2T---凝血酶 pGEX-3T---X因子 位相载体
融合型载体----pGEX系列 非融合型表达载体 P SD
Foreign DNA 非融合型表达载体 非融合基因
主要元件:强启动子;SD;ATG:第一个密码子 非融合型表达载体----pPL-Lamda PL启动子---温度诱导 插入位点--HpaI 分泌型表达载体: 1、主要元件:
启动子;SD序列;信号肽序列
信号肽序列 :SD下游,编码信号肽,可引导蛋白跨膜 2、优点:分泌表达,避免降解。 分泌型表达载体 ----pINIII-ompA1
分泌型融合表达载体----pEZZ18 (五)提高表达水平的手段 1、选择合适载体,提高翻译水平 强启动子----提高转录水平 核糖体结合位点(ATG---SD)
避免产物降解 :分泌/融合表达;细菌蛋白酶抑制剂
2、选择合适宿主 Lac 启动子----LacI菌;PL/PR----- CI857 溶源菌
3、诱导表达 温度诱导------ PL/PR;IPTG的化学诱导----Plac、Ptac 4、提高表达蛋白的稳定性,防止被宿主降解 (六)表达产物的检测:
1、特异性鉴定:荧光抗体法 ;免疫沉淀法;免疫印迹法;ELISA 2、生物学活性鉴定 (七)原核表达系统的缺点
1、没有转录后加工系统,不能识别、剪除内含子
2、缺乏翻译后加工系统,不能对翻译的蛋白质进一步修饰加工 三、真核表达系统
真核表达系统的必要性及优势:
1. 具转录后加工系统 2. 具翻译后修饰系统3. 可实现真正的分泌表达4. 基因治疗 (一)真核基因结构及表达调控特点 真核基因组的复杂性
真核基因组庞大,具大量非编码序列 ---mRNA丰度不同 结构复杂:染色质、核膜、线粒体---表达调控多样 不连续性:内含子、外显子 没有操纵子结构 (二)真核表达系统组成:
真核表达载体;受体细胞;基因转移方式据受体细胞及表达载体的不同分为3种:
酵母表达系统;哺乳动物细胞表达系统;昆虫细胞表达系统 (三)转化
1、原生质体法:去除厚壁2、电穿孔法:效率较高
(四)外源基因的表达1、胞内表达2、分泌表达:在MCS前加入信号肽序列
(五)缺点不能实现全部的翻译后修饰功能
第二节 核酸的分子杂交核酸分子杂交技术(hybridization) ,是在1968年由华盛顿卡内基学院(Cavnegie Institute of Washington)的Roy Britten及其同事发明的。所依据的原理是,带有互补的特定核苷酸序列的单链DNA或RNA,当它们混合在一起时,其相应的同源区段将会退火形成双链的结构。 这一技术是分子克隆技术的重要组成部分,在基因的表达调控和物种的亲缘关系研究中也发挥重要作用。核酸的分子杂交有不同的形式和方法,下面介绍常用的几种。
一、Southern分子杂交(萨瑟恩DNA印迹杂交) 根据毛细管作用的原理,使在电泳凝胶中分离的DNA片段转移并结合在适当的滤膜上,然后通过同标记的单链DNA或 RNA探针的杂交作用检测这些被转移的DNA片段,这种实验方法叫做DNA印迹杂交技术。由于它是由E.Southern于1975年首先设计出来的,故又叫Southern DNA 印迹转移技术。
DNA样品用一种或几种限制性内切酶消化后,DNA片段按照分子量的大小在电泳凝胶中进行分离。凝胶经过变性处理(通常加入碱性缓冲液),使其中的DNA双链分子变性为单链,然后利用毛细管作用原理或其它物理方法,将疑胶中的单链DNA分子转移并固定到固相支持物表面上(一般为硝酸纤维素膜或尼龙膜),此时的DNA片段还保留着原来在凝胶中的分布图式。用一段放射性标记的核苷酸序列(称之为探针)与膜上的DNA片段杂交。那么,与探针有同源性的DNA片段在膜上的位置便可通过放射自显影而得以了解。
Southern分子杂交技术具有很高的灵敏度,可以检测出相当于人的基因组中只出现一次的DNA序列(约1/106)。它与绘制DNA物理图谱相结合,可以确定目的基因(探针或同源序列)在图谱中的位置及其限制性酶切位点的分布。 Southern DNA 印迹杂交之X光显像图片
水稻(Oryza sativa L.)的叶绿体DNA分别用核酸内切限制酶BglⅡ
(A-C)、BamHⅠ(D-F)、EcoRⅠ(G-I)、和HindⅢ(J-L)消化,加样在含有EtBr染料的1%的琼脂糖凝胶电泳中作电泳分离,然后同32P标记的玉米psbA探针作Southern杂交。X光底片中显现的阳性条带 ,表明含有水稻的psbA基因序列。
二、Northern分子杂交技术(诺赛恩RNA印迹技术)1979年,J.C.Alwine等人发展而来,是将RNA分子从电泳凝胶转移到硝酸纤维素滤膜或其他化学修饰的活性滤纸上,进行核酸杂交的一种实验方法。由于这种方法与萨瑟恩DNA印迹杂交技术十分类似,所以叫做诺赛恩RNA印迹技术(Northern blotting)。mRNA样品经过电泳,转移到硝酸纤维素膜上,与放射性标记的DNA探针进行杂交,经过放射自显影,特异的mRNA分子在样品中的存在与否、长度大小以及量的多寡便可得知。Northern分子杂交技术已广泛用于研究特异的mRNA分子在细胞处于不同条件下发生的量和质的变化或不同组织器官中基因表达的差异。
三、蛋白质杂交技术(Western blotting)将蛋白质从电泳凝胶中转移到硝酸纤维素滤膜上,然后同放射性同位素125I标记的特定蛋白质之抗体进行反应,即可用来检测相应抗原(蛋白质)的存在,这种技术叫Western blotting。
四、原位杂交技术是指在细胞、组织切片上直接进行分子杂交,通过检测细胞内特异mRNA的存在与否,它能够告诉我们,在哪些细胞中有特异基因的表达。要进行原位杂交,首先要进行组织的固定,常用的有甲醛、戊二醛等交联固定剂。以后依次经过脱水,石蜡包埋和切片,组织样品的准备就算完成。 原位杂交所用的探针要短,这样才能尽量使探针掺入细胞内。同时,在杂交进行以前常用蛋白酶消化,使细胞的空隙增大,从而提高探针对靶子mRNA序列的可接近度。原位杂交所需杂交液的用量很小,杂交反应可在盖玻片下进行。与前面所介绍的分子杂交技术不同,原位杂交的放射自显影不是利用X-光片而是将乳胶涂在切片上,经过曝光、显影、定影来完成。然后,进行组织切片的化学染色,便可观察到切片组织的形态结构以及放射自显影信号在。 标记探针的同位素常用32S和3H,32P因为具有过高的能量导致分辨率降低而往往成为落选者 第三节 多聚酶链式反应技术 历史
60s-70s:基因的体外分离技术。
Khorana(1971):美国MIT教授、1968年诺贝尔医学奖得主 “经过DNA变性,与合适引物杂交,用DNA聚合酶延伸引物,并不断重复该过程便可克隆tRNA基因”。
核酸体外扩增最早设想遗忘:当时很难进行测序和合成寡核苷酸引物;当时(1970)Smith等发现了内切酶,体外克隆基因成为可能。 Kary Mullis(1985)
发明过程 :Mullis 在“偶然想出的聚合酶链反应”一文中写到:“这种简单得令人惊奇,可以无限量地拷贝DNA片段的方法是在不可想象的情况下,即驾车行驶在月色下的加利福尼亚山间公路上时想出来的”。
发展过程:开始使用大肠杆菌•DNA聚合酶Klenow片段,该酶不耐热,每次加热变性DNA后都要重新补加。耗时、费力、易出错。耐热DNA聚合酶的应用使得自动化。
PCR发展速度:惊人,没有一种技术能与之相比;引用论文最多、
应用范围十分广泛。
1993•年度诺贝尔化学奖:Mullis,与开创了“寡核苷酸基因定点诱变”加拿大籍英国科学家Michael Smith共获。 专利官司
1987年美国专利局专利授权
1989年,DuPont异议,大小公司对簿公堂,将决定谁将获得诺贝尔奖。DuPont理由是,1971年PCR•的雏形已由Khorana一系列文章阐明,并公布于众,应当是公共产权。斯坦福大学Kornberg(研究DNA聚合酶获诺贝尔奖)也认为,任何具备生物技术知识的人都可以从Khorana等的文章中推知如何操作PCR。 美国专利局驳回DuPont异议,地方法院判属Cetus
Cetus获胜后马上反诉,指出DuPont已侵犯另一项与•PCR有关的专利并要求对方赔偿以及不再销售与PCR有关试剂和仪器 一、PCR技术的基本原理类似于DNA的天然复制过程,其特异性依赖于与靶序列两端互补的寡核苷酸引物。PCR由变性--退火--延伸三个基本反应步骤构成: ① 模板DNA的变性
② 模板DNA与引物的退火(复性) ③ 引物的延伸:
重复循环变性--退火--延伸三过程,就可获得更多的新链,而这种新链又可成为下次循环的模板。每完成一个循环需2~4分钟,2~3小时就能将待扩目的基因扩增几百万倍。 二、PCR反应条件与反应体系 1、温度与时间的设置:
① 变性温度与时间:一般情况下,93℃~94℃ l min足以使模板DNA变性,若低于93℃则需延长时间,但温度不能过高,因为高温环境对酶的活性有影响。
② 退火(复性)温度与时间:取决于引物的长度、碱基组成及其浓度,还有靶基序列的长度。引物的复性温度可通过以下公式帮助选择合适的温度:Tm值(解链温度)=4(G+C)+2(A+T), 复性温度=Tm值-(5~10℃)在Tm值允许范围内,选择较高的复性温度可大大减少引物和模板间的非特异性结合,提高PCR反应的特异性。复性时间一般为30~60sec,足以使引物与模板之间完全结合。由于模板DNA比引物复杂得多,引物和模板之间的碰撞结合机会远远高于模板互补链之间的碰撞。
③ PCR反应的延伸温度一般选择在70~75℃之间,常用温度为72℃,过高的延伸温度不利于引物和模板的结合。PCR延伸反应的时间,可根据待扩增片段的长度而定,一般1Kb以内的DNA片段,延伸时间1min是足够的。
2、循环次数:决定PCR扩增程度。PCR循环次数主要取决于模板DNA的浓度。一般的循环次数选在30~40次之间,循环次数越多,非特异性产物的量亦随之增多。 3、标准的PCR反应体系: 10×扩增缓冲液 10ul Mg2+ 1.5mmol/L 4种dNTP混合物 各200umol/L 引物 各10~100pmol 模板DNA 0.1~2ug Taq DNA聚合酶 2.5u
加双蒸水至 100ul
③引物碱基:G+C含量以40-60%为宜,G+C太少扩增效果不佳,G+C过多易出现非特异条带。ATGC最好随机分布,避免5个以上的嘌呤或嘧啶核苷酸的成串排列。
④避免引物内部出现二级结构,避免两条引物间互补,特别是3'端的互补,否则会形成引物二聚体,产生非特异的扩增条带。 ⑤引物3'端的碱基,特别是最末及倒数第二个碱基,应严格要求配对,以避免因末端碱基不配对而导致PCR失败。
⑥引物中有或能加上合适的酶切位点, 被扩增的靶序列最好有适宜的酶切位点, 这对酶切分析或分子克隆很有好处。 ⑦引物的特异性:引物应与核酸序列数据库的其它序列无明显同源性。
② 酶及其浓度 目前有两种Taq DNA聚合酶供应,一种是从栖热水生杆菌中提纯的天然酶,另一种为大肠菌合成的基因工程酶。催化一典型的PCR反应约需酶量2.5U(指总反应体积为100ul时),浓度过高可引起非特异性扩增,浓度过低则合成产物量减少。 ③ dNTP的质量与浓度 dNTP的质量与浓度和PCR扩增效率有密切关系,dNTP粉呈颗粒状,如保存不当易变性失去生物学活性。多次冻融会使dNTP降解。使用时应配成高浓度后,小量分装-20℃冰冻保存。在PCR反应中,dNTP应为50~200umol/L,尤其是注意4种dNTP的浓度要相等(等摩尔配制)缙渲腥魏我恢峙ǘ炔煌谄渌钢质?偏高或偏低),就会引起错配。浓度过低又会降低PCR产物的产量。dNTP能与Mg2+结合,使游离的Mg2+浓度降低。
④ 模板(靶基因)核酸 模板核酸的量与纯化程度,是PCR成败与否的关键环节之一,传统的DNA纯化方法通常采用SDS和蛋白酶K来消化处理标本。SDS的主要功能是:溶解细胞膜上的脂类与蛋白质,因而溶解膜蛋白而破坏细胞膜,并解离细胞中的核蛋白,SDS 还能与蛋白质结合而沉淀;蛋白窴能水解消化蛋白质,特别是与DNA结合的组蛋白,再用有机溶剂酚与氯仿抽提掉蛋白质和其它细胞组份,用乙醇或异丙醇沉淀核酸。提取的核酸即可作为模板用于PCR反应。RNA模板提取一般采用异硫氰酸胍或蛋白酶K法,要防止RNase降解RNA。
⑤ Mg2+浓度 Mg2+对PCR扩增的特异性和产量有显著的影响,在一般的PCR反应中,各种dNTP浓度为200umol/L时,Mg2+浓度为1.5~2.0mmol/L为宜。Mg2+浓度过高,反应特异性降低,出现非特异扩增,浓度过低会降低TaqDNA聚合酶的活性,使反应产物减少。 PCR的反应动力学
PCR的三个反应步骤反复进行,使DNA扩增量呈指数上升。反应最终的DNA扩增量可用下式计算: Y=(1+X)n Y代表DNA片段扩增后的拷贝数,X表示平均每次的扩增效率,n代表循环次数。平均扩增效率的理论值为100%,但在实际反应中平均效率达不到理论值。反应初期,靶序列DNA片段的增加呈指数形式,随着PCR产物的逐渐积累,被扩增的DNA片段不再呈指数增加,而进入线性增长期或静止期,即出现“停滞效应”。
PCR扩增产物 可分为长产物片段和短产物片段两部分。短产物片段的长度严格地限定在两个引物链5'端之间,是需要扩增的特定片段。短产物片段和长产物片段是由于引物所结合的模板不一样
而形成的,以一个原始模板为例,在第一个反应周期中,以两条互补的DNA为模板,引物是从3'端开始延伸,其5'端是固定的,3' 端则没有固定的止点,长短不一,这就是“长产物片段”。进入第二周期后,引物除与原始模板结合外,还要同新合成的链(即“长产物片段”)结合。引物在与新链结合时,由于新链模板的5'端序列是固定的, 这就等于这次延伸的片段3'端被固定了止点,保而“长产物片段”则以算术倍数增加, 几乎可以忽略不计, 这使得PCR的反应产物不需要再纯化,就能保证足够纯DNA片段供分析与检测用。
三、PCR扩增产物的分析 PCR产物的分析,可依据研究对象和目的不同而采用不同的分析方法。
1、凝胶电泳分析:PCR产物经电泳、EB染色后于紫外仪下观察,初步判断产物的特异性。PCR产物片段的大小应与预计的一致。 2、酶切分析:根据PCR产物中限制性内切酶的位点,用相应的酶切、电泳分离后,获得符合理论的片段,此法既能进行产物的鉴定,又能对靶基因分型,还能进行变异性研究。 3、分子杂交:
4、核酸序列分析:是检测PCR产物特异性的最可靠方法。 64
第四节 DNA的序列分析 有两种DNA测序的方法:Maxam-Gilert法和Sanger终止法。 一、 Maxam-Gilert法的原理 Maxam-Gilert法的原理
Allan Maxam和Walter Gilbert在1977年发展了一种测序方法,基于DNA在特定位点的化学裂解而非酶解。该技术的第一步是在待测序的DNA分子上标记放射性同位素如32P或35S然后分离双链。一旦许多份拷贝的模板DNA标记上后,将其均分成4份。每份标记的DNA进行不同的化学修饰。一份修饰DNA中所有的鸟嘌吟,另一份修饰鸟嘌呤和腺嘌吟,再另一份修饰所有的胞嘧啶,最后一份修饰所有的胞嘧啶和胸腺嘧啶。通过控制每管的化学反应,使只有少量的DNA受到怼P奘魏螅尤肽茉诿扛鲂奘渭罨Χ狭袲NA分子的试剂进行反应。例如,在所有胞嘧啶(C)被修饰过的那一份中,用裂解剂处理后,每一个32P标记的DNA片段在末端都会有一个碱基对应为在断裂的C*之前的那个碱基: 5’—32P ATGGAC*TTA—3’ 5’—32P ATGGA—3’
每管反应液分别上样到变性聚丙烯酰胺凝胶的上样孔里进行电泳。电泳将每个DNA片段按长度分开,从大到小,以一个碱基递减。大的片段是在靠近5’端被切断的,小的片段则是在靠近3’端。现在已经很少使用这种方法了,Sanger终止法将其取而代之。
二、Sanger终止法的测序原理 DNA的酶促合成源于不断加入的核苷酸上的5’磷酸基团与增长链上的3’OH基团间的磷酸二酯键的形成。这个过程一直进行到DNA的全长合成完毕。双脱氧核糖核苷酸(dideoxynucleotide)没有3'OH,相应位置被3’H所取代。在存在双脱氧核糖核苷酸时,DNA合成会由于二磷酸键无法形成而停止,链增长在该点结束,在3’端的最后一个碱基就是该双脱氧终止子。Sanger测序法的这种修饰叫做双脱氧终止法测序(dideoxy termination sequencing)。
在Sanger测序法中,模板DNA变性以便与放射性标记的引物杂
交。通过选择合适的引物,可以决定从何处开始进行DNA测序。由于DNA每一链由放射性标记引物起始,由引物延伸而生成的DNA子代分子也是放射性标记的。这使得通过DNA聚合酶进行的引物延伸能进行下去直到一个ddNTP合成到增长的链上。在引物杂交后,样品平均分配到四个离心管里,每管除依次含有四个双脱氧核苷酸终止子(ddATP,ddCTP,ddGTP,ddTTP)中的一个外,还含有DNA合成所需其他试剂。这些包括反应缓冲液、DNA聚合酶、dATP、dCTP、dGTP和dTTP。反应混合物中的双脱氧核苷酸浓度是测序反应的关键。例如,管里含ddATP,其与dATP的浓度比为l:50,这样,合成反应不会在需要A时都被终止掉,而是大约在每50个A时有一个是双脱氧终止的核苷酸。在测序反应持续了几分钟(通常是5分钟)后,含有的离心管NA,其末端都是。同样,含有ddATP 、ddCTP、ddGTP和ddTTP的离心管中分别含有末端是A 、C、G和T的不同长度的DNA分子。合成反应得到的DNA通过电泳按顺序排列。 形态标记、细胞学标记、生化标记
分子标记数十种技术问世,万变不离其宗:分子杂交、PCR扩增
第一类:电泳、分子杂交为核心,代表:RFLP、DNA指纹 第二类:电泳、PCR为核心,代表:RAPD、SSR、AFLP 第三类:DNA序列为核心,代表:ITS测序分析 第五节 分子标记及其应用
分子标记优点数量丰富、信息量大;与生长发育无关,取材不受限制;较多共显性,信息量完整
在真核生物中,基因组DNA多态性要远远多于各种基因的遗传多态性,因为基因组中存在着大量的不编码的DNA序列,它们的变异不受或较少地受自然选择的制约
分子标记应用 种质资源研究 品质纯度鉴定(包括DNA指纹鉴定) 构建遗传连锁图
基因定位(QTL) 标记辅助选择 比较基因组研究 基因克隆(图位克隆) 生物起源、进化、医学及法医学
RFLP (Restriction Fragment Length Polymorphism) by Botstein(1980) A1ec Jcffreys等从人的染色体DNA中分离出一种中度重复序列作为探针,对人的染色体DNA进行RFLP分析(称为DNA指纹)。他们将总DNA用限制性内切酶完全酶解以后,用放射性的探针进行Southern印迹,每个人的DNA所产生的阳性杂交条带都是特异性的,而且子女的阳性杂交条带中,有一半与父亲的DNA阳性杂文带相同,另一半是与来自母亲的阴性杂交条带相同。用这种中度重复序列作为探针,对不同的人的DNA进行指纹分析,产生完全相同的图谱的机会小于60亿分之一,因此这一方法用于法医鉴定,血缘关系的识别等。
这一实验方法所提供的证据巳于1988年得到英国法庭认可,由于英国有着严重的移民问题,DNA指纹技术的应用,为新移民血缘关系的鉴定提供了令人信服的技术手段。
基本原理:物种的基因组DNA在限制性内切酶作用下,产生相当多的大小不等的片段,用放射性同位素标记的DNA作探针,把与被标记DNA相关的片段检测出来,从而构建出多态性图谱。 限制性片段长度多态性的分类
随着分子生物学技术的不断发展,人们从DNA 水平上直接分析
生物体的突变成为可能。假如DNA 顺序中的某个碱基发生了突变,使突变所在部位的DNA 序列产生(或缺失)某种限制性内切酶的位点。这样,利用该限制性内切酶消化此DNA 时,便会产生与正常不同的限制性片段。这样,在同种生物的不同个体中会出现不同长度的限制性片段类型,即限制性片段多态性(Restriction Fragment Length Polymorphism ,RFLP )。 RFLP分为两类型:
一类是由于限制性内切酶位点上发生了单个碱基突变而使这一限制性位点发生丢失或获得而产生的多态性,故称之为点多态性(point polymorphism )。这类多态性实际上是双态的,即有(+ )或无(- )。另一类是由于DNA 分子内部发生较大的顺序变化所致。这一类多态性又可以分成两类:第一类是由于DNA 顺序上发生突变如缺失、重复、插入所致。第二类是近年发现的所谓“高变区”。高变区(highly variable region ),是由多个串联重复顺序组成的,不同的个体高变区内所串联重复的拷贝数相差悬殊,因而高变区的长度变化很大,从而使高变区两侧限制性内切酶识别位点的固定位置随高变区的大小而发生相对位移。所以这一类型的RFLP 是由于高变区内串联重复顺序的拷贝数不同所产生的,其突出特征是限制性内切酶识别位点本身的碱基没有发生改变,改变的只是它在基因组中的相对位置。实际上,在DNA 顺序中,存在着大量的单个碱基的替换,但用通常所用的技术只能检测出影响到限制性内切酶识别位点上的突变。 单体型
不同的多态性切点在一特定人群中出现(+ )的频率不一样。如在一段DNA 中,切点A出现的频率为0.6 (即60 %的人含有该切点,而另外40 %的人在同一位点处不含该切点);而切点B的出现的频率为0.4。如果这两个多态性切点(A,B)是随机相关的,那么,A、B同时存在(++ )的概率等于每个位点存在频率的乘积,即0.6 ×0.4=0.24, 即24%的人同时含有A、B两个切点。如果它们是非随机相关的,那么同时存在的可能性将和预期的频率相差较大。这种相关的非随机性称为连锁不平衡。如果多态性切点数目为n,则可有2n 种不同的组合,每种组合称为一种单体型(haphotype),每种单体型随机相关的预期出现频率为各个位点频率乘积。但是,实践证明多态性切点之间并非随机相关。例如,在β珠蛋白基因簇内多态性切点2 到9 共8 个,理论应有28=256 种组合,即256 种单体型。但实际上有3 种单体型在稀腊、意大利和亚洲印度人βA 染色体(携带正常β-珠蛋白基因的染色体)中就有94 %,而有些理论上的组合在实际上却是不存在的。在理论上,单体型(从切点2 到9 )的频率为0.46 ×0.48 ×0.7 ×0.27 ×0.83 ×0.52 ×0.37 ×0.32=0.0021,而实际上该单体型的频率为0.64 ,两者相差甚大。这说明各个多态性切点之间是非随机相关的(连锁不平衡)。但也有例外,如切点10(HinfI切点)与β基因簇各个切点都是连锁平衡的。从单体型与疾病基因的关系的研究发现,某一β-地中海贫血(简称β-地贫)基因在某一人群中与某些单体型存在着强烈的相关性;而且,在某些人群中,引起β-地贫的某种突变与某些特定的单体型密切关联,只有少数例外。这样,在该人褐校灰颐侨范四掣鋈说牡ノ恍途涂梢曰旧先范ǜ酶鎏迨欠窈心持滞槐浠颉5牵词乖谕恢肿宓娜巳夯蛲磺
虻娜巳褐校庵至允遣煌耆摹U庵饕硐衷诹礁龇矫妫旱谝唬骋RFLP单体型与某一突变基因相连锁,但在正常人中也能找到相同的单体型。因此,应用单体型就不能肯定地说某一个体是否存在该突变基因。但是,即使在同一种族的人群中或同一区域中的人群中,这种连锁也不相同。因此,应用单体型就不能肯定地说某一个体是否存在该突变基因。第二、同恢滞槐湟部梢院图钢值ノ恍拖喙亓6杂谡饬礁銮榭觯私胁罢锒希梢韵韧ü蚁档鞑椋范ㄔ诟眉蚁抵心持值ヌ逍腿酚肽持滞槐浠蛳喙亓螅偌觳馓ザ牡ヌ逍屠慈范ǜ锰ザ腔购姓庵滞槐浠颉5惺蓖ü蚁档鞑橐参薹ㄈ范持值ヌ逍褪欠裼肽持滞槐湎嗔馐保就无法对其胎儿作出正确的判断。这也是RFLP用于诊断的缺点所在。高变区DNA与DNA指纹 图 RFLP是限制性片段长度多态性(re5trietlon fragment length polymocphism)的英文缩写。RFLP是由于不同个体的等位基因之间碱基代换、重排、插入、缺失等引起的。限制性内切酶能把很大的DNA分子降解成许多长短不等的较小片段,所产生的DNA片段的数目和各个片段的长度又反映了限制性内切酶的切点在DNA分子上的分布。对于每一个DNA/限制性内切酶组合来说,所产生的片段是特异性的,它能作为某一DNA(或含这种DNA的生物)所特有的“指纹”。
当一个基团组比较小时,例如植物叶绿体基因组,只有十几万碱基对,就可以将提纯的DNA用限制性内切酶消化成各种长度的DNA片段,进行琼脂糖凝胶电泳分离并用溴化乙锭染色以后,可以在紫外光下直接观察多态性(图)。但对于大分子染色体DNA,就不能直接观察限制性片段长度的多态性,因为各种长度的DNA片段在电泳胶上相互交盖,连成一片,不能进行分析,要检测限制性片段长度的多态性就要借助于分子杂交手段,用某一标记的DNA片段作为探针,与被转到硝酸纤维素膜或尼龙膜上的电泳后的DNA片段进行杂交,这样只有与探针有高度同源性的片段能够被检测出来,因此提到限制性片段长度的多态性一般都要通过DNA分子杂交(Southern blotting)来检测。
十多年来RFLP作为共显性遗传标记,被广泛地用于很多种生物的分析中,这主要是由于RFLP的普遍性以及检测方法的简便性。限制性片段长度多态性在植物遗传图谱的构建尤其有用。过去跟踪染色体片段和观察它们在配子形成时重组的唯一方法是观察发生在该片段上的基因作用所引起的表现型的变化。通过观察表现型变化,如花色、株高、抗性等,人们可以推测在减数分裂和重洹RFLP提供了一个直接跟踪重组期间染色体片段的方法,而且大大地简化了遗传图的构建过程。人们只需直接看片段本身的RFLP标记,而不必看染色体片段上基因存在所引起的表现型变化。因此可以直接看到植物的基因型,而不是间接地通过基因产生的表现型来推测。
由于在一个作图群体中可以分析大量的RFLP标记,所以能够构建一个分离群体的染色体片段图。这些图能表示群体中每一植株的整个基因组中来自父、母本双方的染色体片段的分布,这在遗传育种中是非常有用的。例如在一个回交计划中,目标是导入一个单基因,那么我们要选择的植株应该是:含轮回亲本染色体片段数目最大,同币A 优点:共显性,非常稳定
缺点:检测步骤多,周期长,费时、费钱; 用作探针的DNA克隆制备、保存不方便;
放射性同位素自从人的RFLP图谱构建后,又分别构建了果蝇、牛、大豆、小麦、水稻等多种生物的RFLP图谱。
RAPD (Random Amplified Polymorphism DNA)与常规PCR的不同 A.引物长度短 常规PCR中需要两个引物,长度20-30个核苷酸。RAPD只需一个引物,长度9-10个核苷酸,而且是随机引物。 B.退火温度低 RAPD引物短,因此退火温度要低,一般为35-37℃。
RAPD是随机扩增多态性DNA (random amplified polymorphic DNA)的英文缩写。RAPD是1990由J.G.K.Williams等发明的是一种新奇的遗传标记。其方法是用随机序列的9?10个核苷酸的引物,对基因组的DNA进行PCR扩增,再进行电泳分离和溴化乙锭染色,多态性的产生可以由DNA序列中与互补寡聚核苷酸引物中一个碱基的差别形成。 通用性
--实验步骤少,省工、省力、进度快 --不需先知道基因组的任何分子信息
--所用材料不需有性世代,可用任何单一亲本、任何部位的材料,在没有有性世代的线粒体、叶绿体•DNA研究中也可使用; --引物没有严格的种属界限,同一套引物可用于任何一种植物的研究,具有广泛性和通用性。
RAPD只产生显性标记(即有或没有),所以不能用来鉴定杂合体,但对自交系和回交群体来说这是不成问题的,因为所有或大多数的基因位点都是同源的。RAPD也不能单独地 用来对没有基因标记的生物进行遗传图谱分析,因为它所产生的多态性是随机的。
然而RAPD图谱比RFLP有一定的优点,人工合成的随机引物可在实验空间进行交换, 这要比克隆DNA片段作为探针要容易和迅速得多;可以免去DNA分子杂交的手续;对大的基因组中低拷贝数序列也同样灵敏;RAPD要求对每个分离群体中的标记所进行的PCR扩增和电泳分离有高度的重复性,所以操作一般采用自动化。因此RAPD有可能成为将来遗传图谱构建中的一种普遍方法。 植物分子生物学中的应用
用于种属特异性鉴定外源导入基因的追踪遗传作图
RAPD标记从理论上讲是无限的,而且在端粒及重复顺序上可以找出RAPD标记位点,因此可以做出很密集、很详细的遗传图来。
鉴定染色体上特异的DNA片段,进行基因定位和分离
RAPD易发现多态性,敏感性高。可找出与靶基因连锁的RAPD标记,进行基因定位。
AFLP(Amplified Restriction fragment polymorphism)
瑞士Zabeau等1992年发明,结合了RFLP和PCR技术的特点,具有RFLP技术的可靠性和PCR•技术高效性。
基本原理:对基因组DNA进行酶切,连上双链人工接头,根据接头的核苷酸序列和酶切位点设计引物,进行选择性扩增。 它将RAPD随机性和专一性扩增巧妙结合,再选用内切酶以达选择的目的。
三个步骤:(1)DNA•酶切及人工接头连接,对提取DNA质量要求
较高,需避免其它DNA•污染和抑制物质的存在;
(2) 扩增反应;(3) 通常在4%-6%的变性聚丙烯酰胺凝胶上分离 特点
--理论上,可以采用的限制性内切酶及选择碱基的种类、数目很多,所以标记数目是无限的。
--每次谱带在50-100条之间,多态性检测非常有用 --呈典型的孟德尔方式遗传
--可用于作为遗传图谱和物理图谱的位标。 --可用于分析基因组DNA、克隆的DNA大片段,
—对模板浓度不敏感,即使模板浓度存在差异,也会得到强度一致的谱带。
缺点 专利技术,试剂盒价格贵; 需要同位素或非同位素标记引物,须具特殊防护措施、配套仪器设备; 基因组的不完全酶切会影响实验结果,所以实验对DNA纯度和内切酶的质量要求较高。
SSR( Simple sequence Repeat ) =(microsatellite)
=(Short Tandem Repeat,STR)
Satellite DNA:真核生物基因组酶切、离心后,在主带附近会出现(AT)含量很高的简单高度重复序列。
Microsatellite DNA:一类由几个核苷酸(一般1-5个,基序很短)为重复单位串联而成的DNA序列。继RFLP之后的第二代分子标记,多态性好、重复好、共显性标记
人的卫星DNA 或称随体DNA 是由一些短的DNA 片段(10bp 左右)多次重复所构成的。重复片段的组成和拷贝数在不同的个体及基因组的不同位置上不一样。提取不同个体的基因组DNA 后,用其切点能识别序列为4 个碱基而又不切割该重复片段的限制性内切酶在重复片段的两侧切割基因组DNA ,然后将样品进行凝胶电泳。不同长度的重复片段(主要是由于重复单位的拷贝数不同所致)就会分开,再与含有这些重复序列的特异性探针杂交,便形成有个体特异性的放射性自显影图,亦称为DNA 指纹。DNA 指纹的图谱取决于所用探针的核心序列(即重复序列中的重复单位)。目前所用的探针有两种,即探针33.15 。其核心序列为AGAGGTGGGCAGGTGG, 和33.6 ,即AGGGCTGGAGG 。这就是说这两种序列在人体基因组中不同的位置上分别重复不同的次数,而在不同个体的基因组中,对应位置上这两种核心序列的重复次数也不相同。这样用这两种探针之一与合适的酶切割的人体基因组DNA 片段杂交,在不同的个体将得到不同的DNA 指纹,而且探针33.5 的DNA 指纹图也不相同。DNA 指纹具有细胞稳定性和种系稳定性,是按孟德尔规律遗传的,而且杂合性高。杂合性可以这样来理解,对于由点突变引起的RFLP ,就某一个多态性切点来说只有两种多态性,即切点有(+ )或切点无(- )。而对由于高变区重复片段长度不同所引起的RFLP 来说,在基因组上某一个位置核心序列的重复次数在不同的个体不一样,比如在个体A为10 个拷贝,个体B为15 个拷贝,而个体C又可能为18 个拷贝等等。因此,在不同个体同一个相应位置上核心序列的重复次数就是多态的,而不是双态的。即使在基因组上的某一个位置处核心序列的次数一样,从而被酶切出的长度相同,但在基因组的其他位置上该核心序列重复次数又可能不同。由于
DNA 指纹是按孟德尔规律遗传的,子代的DNA 指纹图可以追溯到其父母DNA 指纹图上,而在不是其父母的DNA 指纹图上则很难找到与其一样的小随体DNA 片段。在父亲的5 条可分辨的小随体DNA 片段中,有4 条处于杂合状态,即这4 条DNA 片段有不同的个体长度。因此,因高变区核心序列重复次数不同引起的RLFP 才是真正的多态性。在不同个体,这种RLFP 即DNA 指纹可以说不存在相同的。即使使用一种探针产生的DNA 指纹图无法鉴定这两个个体,如再用另一种探针便有可能将这两个个体区分开。DNA 指纹技术已被应用于亲子鉴定和法医学上对罪犯的确认等领域。
特点 微卫星DNA广泛存在:人和动物(TG)n,植物(AT)n 微卫星DNA长度的多态性
微卫星DNA两端多是高度保守的单拷贝序列
原理 根据两端序列的保守性,设计引物;进行PCR,电泳分离,染色显带以检测微卫星序列多态性。
应用 构建遗传连锁图;种质资源鉴定;标记辅助育种;基因诊断与治疗:一些人类基因病的产生与三核苷酸重复序列动态有关。 其他
简单序列重复区间(Inter-simple Sequence Repeat, ISSR) 序列标记位点(Sequence-Tagged Sites,STS) 小卫星DNA(Minisatellite DNA)
单链构型多态性(Single-strand Comformation Polymorphism,SSCP) 变性梯度凝胶电泳(Denaturing Gradient Gel Electrophoresis,DGGE) 补充: 核酸的提取和纯化
要进行分子生物学研究,首要任务就是从组织或细胞中提取核酸。 一、核酸的提取 1、DNA的提取
DNA的提取没有统一的方法,但它们的第一步都是将细胞破碎,然后去除蛋白质以及多糖等的污染。
DNA在体内通常都与蛋白质相结合,蛋白质对DNA制品的污染常常影响到以后的DNA操作过程,因此,需要把蛋白质除去。一般采用苯酚氯仿抽提的方法。苯酚—氯仿对蛋白质有极强的变性作用,而对DNA无影响。经苯酚 —氯仿抽提后,蛋白质变性而被离心沉降到酚相与水相的界而,DNA则留在水相,这一方法对于去除核酸(无论是DNA或RNA)中的大量的蛋白质杂质行之有效,因此也是一个基本方法。 DNA制品中也会有RNA杂质,但RNA极易降解,况且,少量的RNA对DNA的操作无大影响,必要时可加入无DNA酶的RNA酶以去除RNA的污染。
DNA的提取其最根本的要求是保持核酸的完整性。在提取DNA的过程中有许多因素能导致DNA降解成小片段:
① 物理因素降解。因为DNA分子量较大,机械张力或高温很容易使DNA分子发生断裂。因此在实际操作时应尽可能轻缓,尽量避免过多的溶液转移,剧烈的振荡等,以减少机械张力对DNA的损伤,同时也应避免过高的温度。
② 细胞内源DNA酶的作用。细胞内常存在活性很高的DNA酶,细胞破碎后,DNA酶便可与DNA接触并使之降解。为了避免和钝化DNA酶的作用,在溶液中常加入EDTA,SDS以及蛋白酶等。
EDTA具有螯合Ca2+和Mg2+的作用,而Ca2+和Mg2+是DNA酶的辅因子。SDS和蛋白酶则分别具有使蛋白酶变性和降解的作用。 ③ 化学因素也会降解DNA。如过酸的条件下,由于DNA脱嘌吟而导致DNA的不稳定,极易在碱基脱落的地方发生断裂,因此,在DNA的提取过程中,应避免使用过酸的条件。
细胞器的DNA提取,一般采取先提纯细胞器,再溶解细胞器膜,待释放出细胞器DNA后,再进一步取纯化之。 2、mRNA的提取
mRNA的提取对于进一步研究基因的结构及其表达调控是必要的。 mRNA主要存在于细胞质中,大部分mRNA均与蛋白质结合在一起形成核蛋白体。原核生物的mRNA半衰期较短,提取困难。真核mRNA较稳定,相对来说比较容易提取。 要成功的提取mRNA,关键在于尽可能完全抑制或去除RNA酶的活性。RNA酶是非常稳定的酶,它由一条多肽链组成,变性后容易复性,因此很耐热,煮沸后还能保持大部分活性。操作者的手、唾液等含有较丰富的RNA酶。因此,mRNA的提取方法,也是根据尽量减小mRNA的降解,把RNA酶的活性降低到最低限度的原则而设计的。
提取mRNA一般有二条途径:
其一是先提取多聚核糖体,再将蛋白质与mRNA分开。利用抗原抗体的反应,还可以将含量极微的、特异的mRNA提取出来。因为没有合成完的蛋白质还停留在多聚核糖体上。这些新生肽链能与完整蛋白质的抗体发生抗原抗体的反应,因此,可以选择性沉淀特异的mRNA。
其二是提取细胞总RNA,利用寡聚脱氧胸腺嘧啶核苷酸纤维素柱层析(oligo(dT)-cellulose),把mRNA与其它的RNA,如tRNA、rRNA分开。进行oligo(dT)-纤维素柱层析时,只有3’端有poly A的mRNA才与oligo(dT) 结合,从而达到与其它RNA分离的目的。 在所有RNA的操作中,凡接触RNA的器皿必须严格消毒,溶液中必须加入RNA酶的抑制剂,如RNasin、氧钒基-核苷复合物、异硫氰酸胍等。所用溶液和水一般先用焦碳酸二乙酯处理,再经高温灭菌。操作者必须戴塑料手套。 二、核酸的纯化 1、密度梯度离心
(1) 根据样品的质量来进行分离,称之为速度区带离心。样品铺在梯度介质的顶部,在离心过程中以不同的速度往下沉降。沉降的速度与样品的质量、密度、离心力的大小、介质的密度以及样品与介质的摩擦力大小有关。离心完成时,不同的样品在离心管中位于不同的区带上。
(2)根据样品的密度大小不同而进行分离,称之为密度梯度离心,平衡密度梯度离心是分子生物学研究中最常用的一种。密度梯度可在离心开始以前做好,也可在离心时依靠离心力自己形成密度梯度。后者就是平衡密度梯度离心技术。
在上面所说的两种情形中,介质的密度梯度既要比样品的密度大,又要比样品的密度小。离心时,样品或往上或往下移动,当介质的密度与样品自身的密度相等时,样品停止移动,并停留在该介质梯度的位置上,甚至在很大的离心力作用下,样品也不会沉降到比它自身密度大的位置。在CsCl溶液中,Cs+主要结合在DNA的磷酸基上,而对RNA,除了结合在磷酸基上外,还结合在
核糖的羟基上,因而RNA的密度比DNA大。蛋白质的平均电荷比核酸少,结合的Cs+也少。
2、电泳 电泳能够分离混合物中大小不同的分子。在电场作用下,溶液中的带电粒子的移动速度决定于它们的电荷一质量比。核酸在溶液中由于它们有磷酸基而带负电荷,在电场中核酸向正极移动。常用的凝胶有聚丙烯酰胺凝胶和琼脂糖凝胶,凝胶的孔径大小限制了分子移动的速度。具有相同荷质比但长度不同的分子移动的速度不同,长的分子移动逮度慢。
琼脂糖凝胶电泳是DNA电泳的常规方法。它可用来测定DNA的分子量,分离经限制性内切酶水解后的DNA片段,进一步纯化DNA等。琼脂糖凝胶的孔径大小主要取决于凝胶中琼脂糖的浓度。RNA也可用琼脂糖凝胶电泳进行分离鉴定。
聚丙烯酰胺凝胶电泳常用于蛋白质及小分子量核酸的分离。
因篇幅问题不能全部显示,请点此查看更多更全内容