核心概念 人体健康 发表时间 2023年09月27日

生命的转录: 从 DNA 到 RNA

摘要

在过去的 50 年中, 我致力于研究生物学的基础问题。这些问题关乎于生命的基础运转, 例如, “有着同样遗传信息的细胞如何分化成人体中 200 多种不同的细胞?”又比如, “细胞如何因应环境信息作出自我调控?”在这篇文章中, 我将带你踏上我的研究之路。我会讲述 RNA 聚合酶 II 的精巧机制——在其作用下, DNA 如何转录成 mRNA?最终, mRNA 会被翻译成蛋白质。而蛋白质在机体内扮演一系列重要的角色——包括构建细胞, 响应外部刺激, 加速化学反应, 以及在距离很远的组织之间传递信号。最后, 我会分享当前我们还在探索的问题, 以及给你们——未来科学家们一些建议。

罗杰 · 大卫 · 科恩伯格教授因真核转录的分子基础所作的研究, 于 2006 年获得诺贝尔化学奖。

我的 RNA 研究之路

我的父亲是一名生物化学家, 他在 1959 年因对脱氧核糖核酸 (DNA) 复制的研究获得诺贝尔奖。对于自己的研究, 他抱有极大的热情, 十分愿意与感兴趣的人分享。我在大学里学过数学, 物理和化学, 读博士期间研究的是膜的动力学 (图 1, 左)。膜对于生物体起着至关重要的作用, 因为正是这层围绕着活细胞的薄膜定义了细胞的存在, 而细胞是所有生命的基本的组成单位。

图 1 - 细胞膜以及含有 DNA 的细胞核。
  • 图 1 - 细胞膜以及含有 DNA 的细胞核。
  • 细胞是生命的基本单位。细胞核是细胞的信息中心, 包含染色体。每条染色体都是一个“X”形结构 (红色圆圈), 其中包含一部分 DNA。图片来源: 维基百科 (https://en.wikipedia.org/wiki/Chromosome)。

关于膜的研究将要告一段落之时, 我知道我还想继续研究与生命科学相关的物理和化学。当时, 研究细胞的组成结构和功能的结构生物学领域正在快速发展。新技术的产生使得简单蛋白质的结构得以破解 (见图 1)。我逐渐意识到, 染色体的结构会是个很有趣的问题。

在细胞中, 我们的遗传物质 DNA 存在于染色体这一结构上。结构生物学家对染色体的结构很着迷, 因为作为基础生物大分子, DNA 的功能很重要, 不过它本身的结构却很简单。我们已经知道染色体是由 DNA 和等量的四种非常小的蛋白质组成。我们需要弄清楚的就是, DNA 和这四种蛋白质是如何排列在一起形成染色体结构的。

事实上, 想要弄清楚这个问题一点都不简单。从数百篇关于染色体结构的研究论文中, 我找到了与之相关的几篇。这些论文帮助我找到了解决方案。我进行了相关实验, 把拼图般的碎片拼凑起来, 阐明了染色体的结构。后来, 一种名为 X 射线晶体学的技术证明了结论的正确。

在解决了染色体的结构之后, 下一步自然是研究这种结构对生物学, 以及生命本身的影响。在染色体内, 以这种形式存在的 DNA 如何参与遗传信息的表达?基因表达始于“转录” 这一过程, 在该过程中, 由 DNA 转录成信使 RNA (mRNA) 分子。

mRNA 分子类似于 DNA 分子, 但它具有不同的结构和功能。与 DNA 复制所需的两条链不同 (图 1, 右图), mRNA 分子由一条较短的单链组成, 它是 DNA 序列特定片段的副本。mRNA 作为中间体, 将 DNA 中编码的遗传信息与最终根据这些信息合成的蛋白质连接在一起。为了研究染色体在基因表达中的作用, 我首先研究了参与转录的三种之一, 这种酶即是 RNA 聚合酶 II [1]。

从 DNA 到 RNA——RNA 聚合酶 II 的转录机制

RNA 聚合酶 II 的转录机制是为了制造 mRNA。正如我前面提到的, mRNA 是遗传密码及由此编码产生出的蛋白质之间的链接。而 RNA 聚合酶 II 的转录机制由近 60 种不同的蛋白质组成!我将在此讲下三种主要成分 [2]: RNA 聚合酶 II、一组被称为通用转录因子 (general transcription factors) 的蛋白质, 以及被称为中介体 (Mediator) 的蛋白质复合物。

RNA 聚合酶 II——结构和功能

转录过程发生在 RNA 聚合酶 II 这一结构之中 (图 2A)。也就是说, DNA 从一个方向进入该酶, 而 mRNA 产物从另一个方向退出。我们所做的大部分工作都围绕着厘清这种酶的复杂结构。在解决这种酶本身的结构后, 我们还弄清了在转录过程中, DNA 和 RNA 同时在场时它的结构 (图 2B)。

图 2 - 转录前和转录过程中 RNA 聚合酶 II 的结构。
  • 图 2 - 转录前和转录过程中 RNA 聚合酶 II 的结构。
  • (A) RNA 聚合酶 II 由 12 个亚基 (用不同颜色表示) 和数万个原子组成。其中有一个通向镁离子 (粉红色点) 的中央通道 (白色箭头)。镁离子所在的区域称为活性中心, 因为这是由 DNA 合成 mRNA 的区域。(B) 一条双链 DNA (蓝色和绿色链) 通过 RNA 聚合酶 II 的中央通道 (水平白色箭头), 在酶的中心分开。负责 mRNA 合成的链 (蓝色) 在活性中心附近向上翻转 90 (向上指的白色箭头), 并按此合成一条短 mRNA 链 (中间的红色短链)。这种 DNA-mRNA 杂合物以垂直于 DNA 最初进入的方向离开酶。图片来源: 罗杰 • 科恩伯格教授。

RNA 聚合酶 II 由 12 种不同的蛋白质组成, 由图 2A 中的不同颜色表示, 并且由近 3 万个原子构成。RNA 聚合酶 II 具有通向镁离子的中央通道。中央通道就是转录发生的地方。双链 DNA 进入中央通道, 然后两条 DNA 链分开 (图 2B)。一条链在靠近酶中心的镁离子的地方弯折。就在这个被称为活性中心的位置, mRNA 按照 DNA 链弯曲部分的模板进行合成。最后, DNA-mRNA 杂合结构以相对于进入酶的 DNA 约 90 的角度离开酶。

通用转录因子 (GTFs)——基因表达的关键成分

转录的开端最为重要, 我们称这一过程为“起始” (initiation)。当 DNA 转录成 mRNA 时, 不是全部都会被转录。为了特定的目的, 只有其中的特定部分会被转录。这部分 DNA 被称为基因。每个基因都含有生产我们体内特定蛋白质所需的信息。

为了识别特定基因并决定是否转录它, RNA 聚合酶 II 采用了 5 个额外的分子, 这些即是被称为通用转录因子 (GTFs) 的蛋白质, 它们在转录过程中与 RNA 聚合酶 II 接触 (图 3 中底部的灰色球体)。从广义上讲, 在转录过程中, 这些 GTFs 决定着“开启”或“停止”转录特定基因。

图 3 - RNA 聚合酶 II 转录机制。
  • 图 3 - RNA 聚合酶 II 转录机制。
  • 底部: 通用转录因子 (GTFs, 灰色) 与 RNA 聚合酶 II (pol II, 蓝色) 相互作用以启动酶内的 DNA 转录。中介体 (粉红色) 作为连接纽带, 将细胞内外的基因调控信息传递给 pol II 酶。此图中所示的是, 中介体从激活蛋白 (红色) 处传递一个特定基因的激活以进行转录的信息。图片来源: 罗杰 • 科恩伯格教授。

正如我们之前在图 2B 中看到的, 当 DNA 在 RNA 聚合酶 II 内部移动时, 需要弯折才能转录成 mRNA。然而, 正常情况下的 DNA 非常硬, 不易弯曲。想要弯曲的话, 它需要被分成单链——这种形式才完全灵活并且可以自由弯曲。这便是 GTFs 的用武之地: 在 GTFs 找到 DNA 分子中基因的开端后, 它们接着打开 DNA, 并将其弯折到 RNA 聚合酶 II 中转录的活性位点附近。通过这种方式, GTFs 开启了转录过程。

中介体 (Mediator)——基因调控的“中间人”

在 DNA 转录的过程中, 有一些关键的问题需要被决定: 转录哪个基因, 在身体的什么位置以及何时进行。这些决定和行动被称为基因表达调控, 这对于我们机体的正常运行至关重要。我们在 1990 年发现了一组在基因调控机制中扮演着重要角色的蛋白质 [3], 那就是中介体: 它们能够处理所有的调控信息并将其传递给 RNA 聚合酶, 来把关是否转录某个特定基因。

图 3 示意了中介体在转录过程中的功能: 中介体 (粉红色) 连接着 RNA 聚合酶 II (蓝色) 和一种被称为激活剂 (activator) 的蛋白质 (红色)。激活剂影响着基因转录的“启动”。换句话说, 中介体充当“中间人”, 将有关基因表达的调控信息传递给 RNA 聚合酶。

有待探索的问题

为了激发你的好奇心, 我想再简要提及与前面内容相关的两个尚待解决的问题。这些问题也是当今生物化学领域的研究前沿, 也是我们实验室中目前正在研究的两个课题。

第一个问题与染色体的结构有关。在细胞分裂的某个阶段, DNA 会被压缩 1 万倍, 这样, 原来占据整个细胞核的 DNA 就会被压缩成染色体的形状。但是, 以我们对染色体结构的确切了解, 只能解释 DNA 长度可以缩短 5 倍, 而不是 1 万倍。那么, 悬而未决的问题是: 对于染色体中的 DNA 来说, 那额外 2000 倍是如何进行压缩的?

第二个问题与中介体和基因表达的调控有关。正如我们在 图 3 中看到的, 中介体将调节信息传递给 RNA 聚合酶 II。但是, 中介体是如何处理调控信息的呢? 这些信息究竟是如何传递给聚合酶的? 中介体是如何帮助打开 DNA 双链, 以允许其被转录的? 对于这些过程和方式我们已经有了一些初步的想法, 但仍然是我们在继续探究的问题。

给年轻人的建议

前面我讲的这些问题, 在很大程度上也引领着我开启了自己的学术生涯。你们可能已经知道, 很多科学问题都很复杂, 需要很多年的努力才能完全解释清楚。科学很有挑战性, 需要付出辛苦, 还时常让人灰心丧气, 感到困难重重。但对我来说, 偶尔的回报就完全值得这一切。

如果你热爱科学并想以此为职业, 那么我的第一个建议是, 在科研的本身中发现乐趣, 享受科研工作的日常, 享受那些基础“小”事。例如, 对我而言, 我喜欢这些实验性的工作——混合、溶解各种材料, 为我的实验制作试剂——我享受这些流程的每一步。我喜欢呆在实验室。

另一个重要的建议是, 学会将失败当作一种刺激、一种挑战——学会用对成功同样的期待再次做出尝试。研究过程中时不时会发生一些令人惊讶和新鲜的事。不过, 优秀的科学家不会立刻就选择相信这些新出现的结果。首先, 你必须确保这不是一个错误的结果——因此你需要想办法证明你是错误的。一个真正优秀的科学家会想出极其精密的方法去证明他们是错误的。如果即便是极致巧妙的实验也无法证明他们是错误的时, 就意味着一个新发现诞生了。而这些, 对于一个科学家来说, 是职业生涯中独特而难忘的时刻, 此前的辛苦工作与此相比, 也就根本算不上什么了。

术语表

脱氧核糖核酸 (DNA) (Deoxyribonucleic Acid (DNA)): 活着的生物体中携带着基因信息的材料。DNA 是由两条链组成的双螺旋结构, 位于细胞核内。

蛋白质 (Proteins): 大分子, 存在于所有活着的细胞中, 在生物体中扮演重要角色。

染色体 (Chromosome): 细胞核中 DNA 排列成的基本结构。

转录 (Transcription): 基因表达的第一步, 这时 DNA 的一个片段被拷贝至 mRNA 分子。

信使 RNA (Messenger RNA (mRNA)): 一种 RNA, 它会基于存储在 DNA 中的信息制造蛋白质。

酶 (Enzymes): 大分子, 能够促进身体内或细胞内发生的化学反应。

转录因子 (General Transcription Factors (GTFs)): 一组蛋白质, 能够协助 DNA 到 RNA。

中介体 (Mediator): 一种多蛋白复合体, 能够处理关于基因调控的信息, 并把该信息传送至转录因子和 RNA 聚合酶 II 中。

基因 (Gene): DNA 的片段, 包含用于制造蛋白质的信息。

利益冲突声明

作者声明, 该研究是在没有任何可能被解释为潜在利益冲突的商业或财务关系的情况下进行的。

致谢

感谢 Noa Segev 的采访并在此基础上合作了本文。感谢“赛先生” 公众号及其译者于茗骞对本文中文翻译的贡献。


参考文献

[1] Cramer, P., Bushnell, D. A., and Kornberg, R. D. 2001. Structural basis of transcription: RNA polymerase II at 2.8 Å resolution. Science 292:1863–76. doi: 10.1126/science.1059493

[2] Boeger, H., Bushnell, D. A., Davis R., Griesenbeck, J., Lorch, Y., Strattan, J. S., et al. 2005. Structural basis of eukaryotic gene transcription. FEBS Lett. 579:899–903. doi: 10.1016/j.febslet.2004.11.027

[3] Kelleher, R. J., Flanagan, P. M., and Kornberg, R. D. 1990. A novel mediator between activator proteins and the RNA polymerase II transcription apparatus. Cell 61:1209–15. doi: 10.1016/0092-8674(90)90685-8