![](http://www.zwbk.org/edit/smallImg/20100311012124799_5841.jpg)
概述
最早分离出DNA的弗雷德里希·米歇尔是一名瑞士医生,他在1869年,从废弃绷带里所残留的脓液中,发现一些只有显微镜可观察的物质。由于这些物质位于细胞核中,因此米歇尔称之为“核素”(nuclein)。到了1919年,菲巴斯·利文进一步辨识出组成DNA的碱基、糖类以及磷酸核苷酸单元,他认为DNA可能是许多核苷酸经由磷酸基团的联结,而串联在一起。不过他所提出概念中,DNA长链较短,且其中的碱基是以固定顺序重复排列。1937年,威廉·阿斯特伯里完成了第一张X光衍射图,阐明了DNA结构的规律性。 1928年,弗雷德里克·格里菲斯从格里菲斯实验中发现,平滑型的肺炎球菌,能转变成为粗糙型的同种细菌,方法是将已死的平滑型与粗糙型活体混合在一起。这种现象称为“转型”。但造成此现象的因子,也就是DNA,是直到1943年,才由奥斯瓦尔德·埃弗里等人所辨识出来。1953年,阿弗雷德·赫希与玛莎·蔡斯确认了DNA的遗传功能,他们在赫希-蔡斯实验中发现,DNA是T2噬菌体的遗传物质。 到了1953年,当时在卡文迪许实验室的詹姆斯·沃森与佛朗西斯·克里克,依据伦敦国王学院的罗莎琳·富兰克林所拍摄的X光衍射图及相关资料,提出了最早的DNA结构精确模型,并发表于《自然》期刊。五篇关于此模型的实验证据论文,也同时以同一主题发表于《自然》。其中包括富兰克林与雷蒙·葛斯林的论文,此文所附带的X光衍射图,是沃森与克里克阐明DNA结构的关键证据。此外莫里斯·威尔金斯团队也是同期论文的发表者之一。富兰克林与葛斯林随后又提出了A型与B型DNA双螺旋结构之间的差异。1962年,沃森、克里克以及威尔金斯共同获得了诺贝尔生理学或医学奖。 克里克在1957年的一场演说中,提出了分子生物学的中心法则,预测了DNA、RNA以及蛋白质之间的关系,并阐述了“转接子假说”(即后来的tRNA)。1958年,马修·梅瑟生与富兰克林·史达在梅瑟生-史达实验中,确认了DNA的复制机制。后来克里克团队的研究显示,遗传密码是由三个碱基以不重复的方式所组成,称为密码子。这些密码子所构成的遗传密码,最后是由哈尔·葛宾·科拉纳、罗伯特·W·霍利以及马歇尔·沃伦·尼伦伯格解出。为了测出所有人类的DNA序列,人类基因组计划于1990年代展开。到了2001年,多国合作的国际团队与私人企业塞雷拉基因组公司,分别将人类基因组序列草图发表于《自然》与《科学》两份期刊。 有人认为克里克与Raymond Gilising 不配作诺贝尔奖的获奖者,他们“偷窃”了富兰克林的数据。然而在领奖时,富兰克林已经因肺癌死去3年了。·DNA的大小和形状
最小的如病毒和噬菌体DNA,分子量d也在百万以上,大肠杆菌的DNA分子量为2.5×109,人的DNA为1.5×1012。DNA的大小还可以所含碱基对数目和分子长度来表示,如猴肾病毒40的DNA含有5100碱基对,其分子长为1.7微米,即长度为1微米的DNA相当于3000碱基对,其分子量为3000×660或2×106(每一碱基对分子量以660计)。 DNA分子大多是线性,不分枝,如真核生物染色体中的DNA;有些是环状分子,如大肠杆菌的DNA,线粒体DNA,叶绿体DNA和一些病毒DNA等。绝大多数DNA是双链,只有少数噬菌体和病毒DNA是单链,如ΦX174的DNA是环状单链分子。·碱基组成
由脱氧腺苷酸、脱氧鸟苷酸、脱氧胸苷酸和脱氧胞苷酸等脱氧核苷酸所组成。其中腺、鸟即腺嘌呤(A)和鸟嘌呤(G);胸、胞即胸腺嘧啶(T)和胞嘧啶(C)。 测定这4种碱基的克分子比也就代表了4种脱氧核苷酸的克分子比。分析了许多不同生物材料,如人肝、牛胸腺、 麦胚、酵母、大肠杆菌等的DNA中碱基的克分子比,发现嘌呤碱克分子含量和嘧啶碱克分子含量近似相等,腺嘌呤克分子含量和胸腺嘧啶克分子含量近似相等,鸟嘌呤克分子含量和胞嘧啶克分子含量近似相等(在单链的 DNA中没有这些规律)。![](http://www.zwbk.org/edit/smallImg/20100311012242314_9047.png)
·一级结构
也称化学结构,即核苷酸的排列顺序。至1983年中期已经测定了许多种含几千个核苷酸的 DNA的一级结构,主要有病毒、噬菌体、质粒和某些基因的DNA。几万对核苷酸的DNA如人的线粒体DNA,牛线粒体DNA和λ噬菌体DNA的一级结构也已测出。这样迅速的发展,是由于:①发现了限制性核酸内切酶,从而可以把大分子DNA在特定的部位切成许多片段,再分别进行结构测定;②测定方法有很大进展,特别是化学降解法(用特殊的化学试剂专一性地作用于A、G、C、T)和末端终止法(用2',3'-双脱氧核苷三磷酸代替正常的3'-脱氧核苷三磷酸以使 DNA链在酶促合成时停止延伸)起了很大作用;③运用重组DNA的方法获得大量的纯DNA;④新技术的应用,如用高比放射性的32P同位素标记DNA片段,使样品大为节省;又如用电子计算机帮助排列各酶解片段的先后。中国学者洪国藩在此基础上,于1982年又创造出一种系统地非随机测定法,进一步提高了效率。![](http://www.zwbk.org/edit/smallImg/20100311011714408_5096.gif)
·高级结构
1953年,J.D.沃森和F.H.C.克里克根据DNA分子中碱基组成的规律性,DNA的X射线衍射图谱以及其他一些实验结果,提出了DNA的双螺旋模型。 这个模型的特征是:① DNA由两条多核苷酸链构成,这两条链的方向相反,即一条链的5'-末端和另一条链的3'-末端相对应,两条链都以右手螺旋方式盘绕同一中心轴成双螺旋结构,这样的旋转形成了大沟和小沟;②脱氧核糖和磷酸形成的骨架在外侧,碱基在双螺旋内侧,两两配对,A对T,G对C,T对A,C对G,配对碱基之间以氢键联系,从而使两条多核苷酸链形成固定的关系。此外,堆集碱基之间的疏水作用也有助于维持 DNA的双链结构。由于DNA两条链的碱基具有严格的配对关系,通常叫它们为互补链,如果一条链的核苷酸顺序弄清楚了,另外一条链上的核苷酸顺序也就一目了然;③每对碱基处于同一平面,而和中心轴垂直,不同碱基对的平面互相平行,相邻两平面的间距为3.4埃,螺旋每转一圈的螺距为3.4埃,所以每一圈螺旋含10对碱基,螺旋的直径为20埃。DNA的双螺旋结构有3种,即A型,B型和C型,在生物体内和溶液中最常见的为B型,就是具有上述各种特征的一种类型。A型和C型与B型类似,但有微小差异。 1979年以来对人工合成的dCpGpCpGpCpGp,dpCpGpCpG晶体和聚d(GC)纤维进行X射线衍射研究,发现这些化合物为左旋结构,被命名为Z型DNA。其他嘌呤和嘧啶相间的DNA片段也具有Z型的左旋结构。Z型DNA比B型DNA细而长,碱基对偏离轴心,靠近双螺旋的外侧,呈现一种比较暴露的状态,可能较易受外来因素的影响。Z型DNA还能在异体动物体内诱生抗体,用Z型DNA抗体进行实验,发现它能和天然DNA结合,说明天然DNA分子中有Z型DNA的结构。 DNA还有三级结构,如超螺旋结构,由双螺旋链扭曲而成。在原核生物内长1毫米的 DNA链能压缩在直径1微米的细胞内就是这种盘旋扭曲的结果。在真核生物细胞染色体上,DNA链与组蛋白组成核小体,在电子显微镜下呈念珠状,在一根长丝上附着很多小球,小球直径100埃左右,由长约140碱基对的DNA绕在由组蛋白H2A,H2B,H3和H4各两分子组成的八聚体蛋白质核心外面,小球之间为细丝,由DNA和组蛋白H1构成。核小体进一步旋绕折叠压缩而成染色质。·超螺旋
DNA链在双螺旋基础上如绳索般扭转的现象与过程称为DNA超螺旋。当DNA处于“松弛”状态时,双螺旋的两股通常会延着中轴,以每10.4个碱基对旋转一圈的方式扭转。但如果DNA受到扭转,其两股的缠绕方式将变得更紧或更松。当DNA扭转方向与双股螺旋的旋转方向相同时,称为正超螺旋,此时碱基将更加紧密地结合。反之若扭转方向与双股螺旋相反,则称为负超螺旋,碱基之间的结合度会降低。自然界中大多数的DNA,会因为拓扑异构酶的作用,而形成轻微的负超螺旋状态。拓扑异构酶同时也在转录作用或DNA复制过程中,负责纾解DNA链所受的扭转压力。![](http://www.zwbk.org/edit/smallImg/20100311011815955_2205.png)
·各种类型的双螺旋结构
DNA有多种不同的构象,其中有些构象之间在构造上的差异并不大。目前已辨识出来的构象包括:A-DNA、B-DNA、C-DNA、D-DNA、E-DNA、H-DNA、L-DNA、P-DNA与Z-DNA。不过以现有的生物系统来说,自然界中可见的只有A-DNA、B-DNA与Z-DNA。DNA所具有的构象可根据DNA序列、超螺旋的程度与方向、碱基上的化学修饰,以及溶液状态,如金属离子与多胺浓度来分类。三种主要构象中以B型为细胞中最常见的类型,与另两种DNA双螺旋的差异,在于其几何形态与尺寸。 其中A型拥有较大的宽度与右旋结构,小凹槽较浅且较宽,大凹槽则较深较窄。A型一般存在于非生理状态的脱水样本中,在细胞中则可能为DNA与RNA混合而成的产物(类似酵素及DNA的复合物)。若一段DNA上的碱基受到一种称为甲基化的化学修饰,将使其构型转变成Z型。此时螺旋形式转为左旋,与较常见的右旋B型相反。某些专门与Z-DNA结合的蛋白质可辨识出这种少见的结构,此外Z型DNA可能参与了转录作用的调控。![](http://www.zwbk.org/edit/smallImg/20100311014310205_2462.png)
·四联体结构
线状染色体的末端有一段称为端粒的特殊区域,由于一般参与复制DNA的酵素无法作用于染色体的3'端,因此这些端粒的主要功能,是使细胞能利用一种称为端粒酶的酵素来复制端粒。如果端粒消失,那么复制过程将使染色体长度缩小。因此这些特化的端帽能保护染色体结尾不被外切酶破坏,并阻止细胞中的DNA修复系统将其视为需修正的损毁位置。在人类细胞中,端粒是由重复出现数千次TTAGGG序列的单股DNA所组成。 这些序列富含鸟嘌呤,可形成一种由四个碱基重叠而成的特殊结构,使染色体末端较为稳定。四个鸟嘌呤可构成一个平面,并且重叠于其他平面之上,产生稳定的G-四联体结构。碱基与位在四个碱基中心的金属离子螯合物之间,是经由氢键结合以稳定结构。左图显示由上方观看人类端粒中的四联体,图中可见每四个碱基为一组,共三层碱基重叠而成的单股DNA环状物。在碱基环绕的中心,可见三个螯合在一起的钾离子。也有其他类型的结构存在,例如中心的四个碱基,除了可以是属于单一的一股DNA之外,也可能是由多条平行的DNA各自贡献一个碱基而形成。 端粒另外还可形成一种大型环状结构,称为端粒环或T环(T-loop)。是由单股DNA经过端粒结合蛋白的作用之后,卷曲而成的一个大循环。在T环长链最前端的地方,单股的DNA会附着在双股DNA之上,破坏双螺旋DNA与另一股的碱基配对,形成一种称为替代环或D环的三股结构。物理与化学性质
DNA是一种由核苷酸重复排列组成的长链聚合物,宽度约22到24埃(2.2到2.4纳米),每一个核苷酸单位则大约长3.3埃(0.33纳米)。在整个DNA聚合物中,可能含有数百万个相连的核苷酸。例如人类细胞中最大的1号染色体中,就有2亿2千万个碱基对。通常在生物体内,DNA并非单一分子,而是形成两条互相配对并紧密结合,且如蔓藤般地缠绕成双螺旋结构的分子。每个核苷酸分子的其中一部分会相互连结,组成长链骨架;另一部分称为碱基,可使成对的两条DNA相互结合。所谓核苷酸,是指一个核苷加上一个或多个磷酸基团,核苷则是指一个碱基加上一个糖类分子。 DNA骨架是由磷酸与糖类基团交互排列而成。组成DNA的糖类分子为环状的2-脱氧核糖,属于五碳糖的一种。磷酸基团上的两个氧原子分别接在五碳糖的3号及5号碳原子上,形成磷酸双酯键。这种两侧不对称的共价键位置,使每一条DNA长链皆具方向性。双螺旋中的两股核苷酸互以相反方向排列,这种排列方式称为反平行。DNA链上互不对称的两末端一边叫做5'端,另一边则称3'端。DNA与RNA最主要的差异之一,在于组成糖分子的不同,DNA为2-脱氧核糖,RNA则为核糖。 两股DNA长链上的碱基以氢键相互吸引,使双螺旋形态得以维持。这些碱基可分为两大类,以5角及6角杂环化合物组合而成的一类称为嘌呤;只有一个6角杂环的则称为嘧啶。组成DNA的碱基,分别是腺嘌呤(缩写A)、胞嘧啶(C)、鸟嘌呤(G)与胸腺嘧啶(T)。碱基、糖类分子与磷酸三者结合之后,便成为完整的核苷酸。还有一种碱基称为尿嘧啶(U),此种碱基比胸腺嘧啶少了一个位于环上的甲基,一般出现在RNA分子中,角色相当于DNA里的胸腺嘧啶。通常在DNA中,它会作为胞嘧啶的分解产物,或是CpG岛中未经甲基化的胞嘧啶突变产物。少见的例外发现于一种称为PBS1的细菌病毒,此类病毒的DNA中含有尿嘧啶。在某些特定RNA分子的合成过程中,会有许多尿嘧啶在酵素的作用下失去一个甲基,因而转变成胸腺嘧啶,这种情形大多出现于一些在构造上具有功能,或者具有酵素能力的RNA上,例如转运RNA与核糖体RNA。 两股DNA长链会以右旋方式相互缠绕成双螺旋结构,由于以磷酸联结而成的骨架位于外部,且两股之间会留下一些空隙,因此位于螺旋内部的碱基,即使从螺旋外侧依然可见(如右方动画)。双螺旋的表面有两种凹槽(或称“沟”):较大的宽22埃;较小的宽12埃。由于各个碱基靠近大凹槽的一面较容易与外界接触,因此如转录因子等能够与特定序列结合的蛋白质与碱基接触时,通常是作用在靠近大凹槽的一面。![](http://www.zwbk.org/edit/smallImg/20100311012447799_9228.gif)
·碱基配对
一股DNA上所具有的各类型含氮碱基,都只会与另一股上的一个特定类型碱基产生键结。此种情形称为互补性碱基配对。嘌呤与嘧啶之间会形成氢键,在一般情况下,A只与T相连,而C只与G相连。因此排列于双螺旋上的核苷酸,便以这种称为碱基对的方式相互联结。除此之外,与DNA序列无关的疏水性效应,以及π重叠效应所产生的力,也是两股DNA能维持结合状态的原因。由于氢键比共价键更容易断裂,这使双股DNA可能会因为机械力或高温作用,而有如拉链一般地解开,这种现象被称为DNA变性。由于互补的特性,使位于双股序列上的讯息,皆以双倍的形式存在,这种特性对于DNA复制过程来说相当重要。互补碱基之间可逆且具专一性的交互作用,是生物DNA所共同拥有的关键功能。 两种不同的碱基对分别是以不同数目的氢键结合:A-T之间有两条;G-C之间则有三条。多一条氢键使GC配对的稳定性高于AT配对,也因此两股DNA的结合强度,是由GC配对所占比例,以及双螺旋的总长度来决定。当DNA双螺旋较长且GC含量较高时,其双股之间的结合能力较强;长度较短且AT含量较高时,结合能力则较弱。双螺旋上有某些部位必须能够轻易解开,这些部位通常含有有较多的AT配对,例如细菌启动子上一段含有TATAAT序列的普里布诺盒。在实验室中,若找出解开氢键所需的温度,也就是所谓熔点(Tm),便能计算出两股之间的结合强度。当DNA双螺旋上所有的碱基配对都解开之后,溶液中的两股DNA将分裂成独立的分子。单股DNA分子并无固定的形体,但仍有某些形状较为稳定且常见。·正意与反意
一般来说,当一段DNA序列为合成信使RNA(mRNA,可转译成蛋白质)所需时,称为“正意”。而相对并互补的另一股序列,则称为“反意”。由于RNA聚合酶的作用方式,是根据模板上的讯息来合成一段与模板互补的RNA片段,因此正意mRNA的序列实际上与DNA上的反意股相同。在同一股DNA上,可能同时会有属于正意和反意的片段。此外,反意RNA在原核生物或真核生物体内皆存在,但是其功能尚未明了。有研究认为,反意RNA可利用RNA与RNA之间的碱基配对,来调控基因的表现。 少数属于原核生物、真核生物、质体或病毒的DNA序列(后两者较前两者多),会由于正意股与反意股之间的差异难以区分,而产生重叠基因,这类DNA序列具有双重功能,一方面能以5'往3'的方向合成蛋白质,另一方面也能以相反方向合成另一个蛋白质。这种重叠现象一方面在细菌体内参与调控基因的转录,一方面则在较小的病毒基因组中,扮演增加讯息量的角色。为了缩减基因组的大小,也有某些病毒以线状或环状的单股DNA作为遗传物质。DNA生物机能
DNA于真核生物细胞内,通常是以长条状染色体形式存在;在原核生物细胞内则是环状染色体。细胞内的所有染色体合称基因组。人类基因组中大约有30亿个碱基对,共组成了46个染色体。DNA所携带的讯息,是以序列形式,保存于一些称为基因的片段中。基因中的遗传讯息是经由互补的碱基配对来传递,例如在转录作用中,细胞里的RNA核苷酸会与互补的DNA结合,复制出一段与DNA序列互补的RNA序列。一般来说,这段RNA序列将会在转译作用中,经由RNA之间的互补配对,合成出相对应的蛋白质序列。另一方面,细胞也可以在称为DNA复制的过程中,单纯地复制其自身的遗传讯息。![](http://www.zwbk.org/edit/smallImg/20100311014736314_3241.png)
·基因组结构
真核生物的基因组DNA主要存放于细胞核中,此外也有少量位于粒线体或叶绿体内。原核生物的DNA则是保存在形状不规则的类核(nucloid)当中。基因是DNA的一段区域,保存了基因组里的遗传讯息,是遗传的单位,影响了生物个体的特定表征。基因中含有可转录的开放阅读框架,以及一些可调节开放阅读框架表现的调控序列,如启动子与强化子。 许多物种的基因组都只有一小部分可编译成蛋白质。以人类为例,在人类的基因组中只有1.5%属于含有蛋白质编码的外显子,另有超过50%属于无编码的重复序列。真核生物基因组中如此大量的非编码DNA,以及物种之间不寻常的基因组大小或C值差异,长久以来一直是个难题,人们称之为“C值谜”。不过这些不含蛋白质编码的DNA序列,仍可能合成出具有功能的非编码RNA分子,用以调控基因表现。 染色体中的某些非编码DNA序列,本身具有结构上的功能。例如一般只带有少量基因的端粒与着丝粒,对于染色体的稳定性及机能而言显得相当重要。人类体内有一类大量存在的非编码DNA,称为伪基因,是一些因突变累积而变得残缺无用的基因复制品。这些序列通常只可算是分子化石,不过有时候也会因为基因重复与趋异演化,而成为新基因里的新遗传物质。·转录与转译
基因是指一段含有遗传讯息,且可影响生物体表现型的DNA序列。基因里的DNA碱基序列决定了信使RNA的序列,而信使RNA的序列又决定了蛋白质的序列。转译作用可依据基因所含有的核苷酸序列,以及遗传密码规则,生产出对应的蛋白质氨基酸序列。遗传密码的组成单位称为密码子,是含有三个字母的“指令”,这些单位则由三个核苷酸组成,例如ACT、CAG或TTT。 在转录作用中,基因里的密码子会在RNA聚合酶的作用下,复制成为信使RNA。之后核糖体会帮助带着氨基酸的转移RNA与信使RNA进行碱基配对,进而将信使RNA解码。由于组成密码子的碱基共有四种,且以三字母为一单位,因此可能存在的密码子一共有64种(43)。与这些密码子对应的标准氨基酸有20种,因此大多数氨基酸对应了一种以上的密码子。另外有三个密码子称为“终止密码子”或“无义密码子”,是编码区域的末端,分别是TAA、TGA与TAG。![](http://www.zwbk.org/edit/smallImg/20100311014816111_2843.png)
热门信息