核心概念 化学与材料 发表时间 2023年09月27日

为生物学服务的计算机模拟技术

摘要

计算机模拟是当今科学界的一种重要研究工具。计算机允许我们对复杂 (生物) 系统的行为, 用前所未有的方式进行计算和模拟 (模仿)。你可以把计算机模拟想象成电脑游戏, 游戏里有一个虚拟世界, 而虚拟世界按照某些规则 (如物理规则) 运行。我们玩游戏时, 会学习到统治这个虚拟世界及其环境的那些规则, 以及我们作为玩家如何反过来影响虚拟世界。在这篇文章里, 我将解释如何利用计算机模拟在结构生物学的世界里研究分子的结构和功能。我还会讲一讲我们如何能够利用对生物学和计算机模拟的理解来推动社会进步。

迈克尔 · 莱维特教授因为复杂的化学系统发展了多尺度模型于 2013 年获得诺贝尔化学奖。

什么是计算机模拟?

要理解什么是计算机模拟, 有个简单的办法是想一想电脑游戏。

假设在一个冒险类游戏中, 你的人物围绕某个环境展开一系列行动。为了让游戏看起来真实, 电脑要创造一个与现实世界相仿的虚拟世界。比如你在游戏里扔球时, 电脑必须使用恰当的物理方程 (这里应该使用牛顿运动方程) 来估算球的运动轨迹, 为其运动路径做出具有真性感的模拟 (图 1)。

图 1 - 电脑游戏实现的计算机模拟 (扔球的例子)。
  • 图 1 - 电脑游戏实现的计算机模拟 (扔球的例子)。
  • 图片来自一款叫做 “堡垒之夜” 的网络游戏。挑战是投球, 使其在落到地面之前击中房间内的物体 15 次。这个游戏实际是对物理定律的计算机模拟。为了在游戏中真实地再现球的运动情况, 电脑要根据物理学方程——牛顿运动方程——来计算球的路径。换句话说, 计算机模拟该物理定律, 并将模拟结果在屏幕上显示出来。同理, 计算机可以模拟自然界的各种过程, 包括天气和生物过程, 以便我们更好地理解这些过程 (来源: Forbes)。

同理, 如果我们知道相关法则, 就能用电脑模拟其它的现实过程。我们不仅能模拟物体运动, 还能模拟更为复杂的过程, 比如天气、化学反应和各种各样的生物过程。下面我们将讨论蛋白质折叠的计算机模拟。

我们能从计算机模拟中学到什么?

现在我们用冒险游戏“刺客信条”来做例子。假设你的任务发生在意大利佛罗伦萨, 你在计算机模拟的佛罗伦萨大街小巷里穿行。你一边走, 一边看各式房屋和名胜古迹, 比如美丽的米兰大教堂。游戏玩久了, 你对佛罗伦萨的地理知识会大幅增长。有了这些知识, 将来你可以在真实的佛罗伦萨漫步。你不仅会感到亲切, 还能找到与电脑游戏里不同的地方。

虽然你并没有真正造访过这个城市, 但游戏给你带来了关于这个城市的真实的知识。而且, 通过计算机模拟进行学习是一个安全的过程。玩游戏时你不怕受伤, 可以在游戏里做真实生活中不敢做的动作。有的游戏还让你体验真实生活中体验不到的东西, 比如具有飞行能力、遇到想象中的生物等等。

在科学世界里, 我们也可以利用计算机模拟来获得知识。先建立一个我们正在研究的物理或者化学过程的模型, 然后用计算机来模拟这个过程。模型建立在描述过程的数学方程式之上 (如图 1, 该模型用牛顿运动方程来描述球的运动过程)。

计算机帮助我们看到过程如何随时间而展开, 从而检验模拟结果是否与真实世界发生的相一致。如果一致, 那模型就是有效的, 它能帮助我们更好地理解现象。如果不一致, 那模型就需要修改。修改模型的过程中我们能发现对过程的理解错在哪里。

由于模拟没有危险性, 我们可以把所有的模型都挨个试一遍, 包括在真实世界中不可能探索的情形。计算机模拟有时会让我们惊掉下巴: 一个“胡乱狂野”的模型对现象的描述竟然最为贴切。计算机模拟给我们足够的自由去发挥创造力, 寻找通常情况下很难解释的事实现象。

“正好” 原则

在将计算机模拟服务于科学时, 有一条被我称为“正好” (just right) 的重要原则。这条原则的意思是模型既不能过于简单也不能过于复杂。过于简单, 就无法将研究对象的具体细节都描述清楚。过于复杂, 我们也就无法用它去获取更多有益的知识。

我认为每位科研人员都应该对自己的工作有一种简单、基础性的理解, 以便向其他人解释自己在研究什么。如果有人声称自己做出了重大发现, 但那个发现却复杂得无法解释, 我就会充满疑惑, 很难相信他们真的知道自己在做什么。

我自己永远在寻找正确而最简单的模型, 如下面图 2 的蛋白质折叠模型。我相信日常生活中也是如此: 每个解释都有一个恰如其分的程度。我建议你们追求问题的最简答案—要不多也不少, 刚刚好。

图 2 - (A): 计算机模拟蛋白质的一个简单模型。
  • 图 2 - (A): 计算机模拟蛋白质的一个简单模型。
  • 蛋白质被比作一条串着不同类型珠子的项链。每种颜色代表一种珠子, 每颗珠子代表一组原子及其相互作用 (如珠子上方或下方的圆圈内所示), 详见文献 [1]。(B): 蛋白质的项链模型还包含一系列数学公式, 用来描述不同颜色珠子之间的相互作用。该模型可以充分地描述蛋白质如何折叠成为稳定的三维结构 (见ResearchGate 链接)。

结构生物学中的计算机模拟

现在, 我要向你们展示如何利用计算机模拟和“正好”原则来理解生物学中的一个重要现象: 蛋白质折叠。对蛋白质结构的研究是结构生物学的一部分。先来想想生物体是如何运作的。在生物体内存在很多线状的结构, 叫蛋白质。蛋白质能折叠起来形成三维结构。

每个蛋白质都有自己独特的结构, 这在每个生物体内都是完全相同的。神奇的是, 这些立体的蛋白质履行着生命体的一切职能——形成身体结构、进行化学反应、促使肌肉运动、消化食物等等。所以, 理解蛋白质折叠过程, 认识蛋白质最终结构的形成是一个非常重要的科学问题。

蛋白质是由几千个原子通过相互作用而形成的大分子。如果用计算机来模拟蛋白质内部的分子及其相互作用, 那情况一定会过于复杂。上世纪七十年代早期, 我和亚利耶• 瓦谢尔 (Arieh Warshel) 开始研究这个问题。1975 年, 我们在一本重要的学术期刊上发表了研究结果 [2]。

我们发现可以建立一个简单的蛋白质模型, 这个模型就像是一条项链, 上面串着不同类型的珠子, 每种珠子都和其它珠子略有不同 (图 2A)。每个珠子代表一组 (如 10 个) 原子及其相互作用。一种特定的珠子 (如红珠子) 被另一种特定的珠子 (如蓝珠子) 所吸引。

这个简单的模型对蛋白质折叠 (图 2B) 做出了充分而有效的解释, 并被用做很多其它分子计算的模型 [1]。这些模拟帮助我们理解甚至预言不同的蛋白质三维结构, 并且更好地认识它们的生物活性。同时我们还能用电脑来设计分子, 用到药物开发中去。

生物学之外的计算机模拟: 展望未来

多样性、多样性、多样性

生物系统面临的独特挑战在于, 必须准备应对未来某个时候可能发生的意外情况。而一个系统如何才能为没有经历过的情形做准备呢?答案很简单: 多样性。大自然往往会在系统内部创造大量的变化, 使得系统有能力适应和修正其工作过程, 应对不可预见的挑战。

比如对动物来说, 每个后代都从父亲和母亲体内随机获得一半遗传信息 (DNA), 这使得每个后代都是独一无二的, 增强了物种内部的多样性。这提高了动物群体应对未来的能力和整个物种对意外情况的抗逆性。

生物学教给我们的这条多样性原则也适用于日常生活的许多方面。比如, 一个多样化的社会才是强大的社会, 其中不同社会背景、性别、教育的人们学习如何共存、相互理解和接受他人。在学校或在家, 我们其实总能找到办法与周围的人协商解决问题。有时我们不得不应付困难复杂的社会情境, 而有些人就是比其它人更擅于处理冲突。

我们的生命本身也是多样的, 潮起潮落, 充满意外。能否营造更好的未来、更稳定的社会, 这部分取决于我们保证生命多样性的能力。化解各种社会情境和个人情形需要高情商。我相信我们可以用计算机模拟来帮助每个人提高情商。

服务于情商开发的计算机模拟

用计算机模拟来提高情商, 一种可能的形式是在互动游戏中模拟难以对付的社会情境, 允许玩家尝试不同的策略来解决问题 (图 3)。

图 3 - 服务于情商开发的计算机模拟。
  • 图 3 - 服务于情商开发的计算机模拟。
  • 计算机模拟或许能对生活中复杂情况的处置提供启示。想象有一个如图所示的游戏, 允许你来体验一个复杂场景并尝试不同的回应方法、获得不同的结果。这个游戏或许能帮助人们获得更高的情商。(摘自Rockpapershotgun 网站)。

例如有同学在课堂上侮辱你。你该如何回应才不至于断绝将来与这位同学合作的可能性?利用计算机模拟, 你可以看到采取不同回应后产生的不同结果。这种游戏在促进情商发展方面可以发挥重要作用。

给年轻人的建议

最后, 我想和读者们分享我在科研和生活中的一些感想。

首先, 做你所爱的事, 这很重要。不要做你父母想让你做的事, 不要做社会让你去做的事。努力从事你真正热爱的工作, 就是你能拥有的最好的人生。

第二, 不放弃。相信自己, 不为成败大喜大悲。记住, 每件坏事都有益处, 而每件好事都有坏处, 我们从好事和坏事中都能学到东西。要始终相信自己, 最终别人也会相信你。

第三, 尽量做别人没做过的事。我们每个人都是特殊和独一无二的。试着去表达你的独特之处, 而不是做他人的翻版。

第四, 准备好犯错误。我总是说一个好的科学家有 90% 的时间在犯错误, 而一个相当好的科学家 99% 的时间都在犯错误。为什么呢?因为如果你是你领域里的顶尖人才, 那就要解决最难的问题。如果你不准备犯错误, 那说明你永远不回去挑战那些难题。

第五, 请做一个善良的人。要慷慨、热情, 这是每个人都要努力培养的品质。

最后想和你们谈的事跟计划有关。我觉得人生确实需要提前计划, 但计划得太多会让你失望。人生从来不会完全按照计划发生, 计划外的事经常找上门来。如果你整天忙于按照原计划开展人生, 你反而会错过新的机会。最好是在遵循计划和随时准备迎接意外之间找到微妙的平衡。

扩展阅读

诺贝尔讲座——迈克尔• 莱维特 (Michael Levitt) 教授。

术语表

计算机模拟 (Computer Simulation): 一种基于电脑运算进行科学研究的工具。你可以把它想象成电脑游戏, 能够帮助科学家更好地理解正在研究的现象。

蛋白质 (Proteins): 大生物分子, 能够执行生命的所有功能——筑造身体, 参与化学反应, 消化食物等等。你可以将蛋白质想象成项链, 由各种不同的珠子组成, 折叠成独特的 3D 形状, 因此每个蛋白质都有自己独特的折叠形状。

结构生物学 (Structural Biology): 研究由小分子组成的大分子的结构的学科。研究者们试图理解分子是按照什么规律折叠成特别的 3D 结构的。

情商 (Emotional Intelligence): 识别自己和他人情绪, 理解并使用它们来更好地和不同的人互动的能力。

利益冲突声明

作者声明, 该研究是在没有任何可能被解释为潜在利益冲突的商业或财务关系的情况下进行的。

致谢

感谢 Noa Segev 的采访并在此基础上合作了本文。感谢“赛先生”公众号及其译者辛玲对本文中文翻译的贡献。


参考文献

[1] Cragnell, C., Rieloff, E., and Skepö, M. 2018. Utilizing coarse-grained modeling and Monte Carlo simulations to evaluate the conformational ensemble of intrinsically disordered proteins and regions. J. Mol. Biol. 430:2478–92. doi: 10.1016/j.jmb.2018.03.006

[2] Levitt, M., and Warshel, A. 1975. Computer simulation of protein folding. Nature 253:694–8. doi: 10.1038/253694a0