细菌汤
当我们把1个细菌放到营养丰富的培养基里,我们会看到这个细菌会从1个分裂为2个,然后4个,8个,没完没了,最后有意思的事情就发生了。正如我们前面谈到过的,DNA无时无刻不在复制和再生产,在这个过程中会产生一些被称为突变的随机错误。它们会被当作自然而然产生的汤谱配方变化传递到下一代身上。在对细菌进行归类时我们能够看到同样的模式。因而,在我们那锅快速增殖的细菌汤里,作为发生在基因组上的细小变化累积的结果,我们会看到一个独一无二的基因谱系逐渐成形。如果我们只是在几代分裂发生后就从这锅细菌群里挑选出一个DNA序列样本加以观察,我们能够清楚看到它们之间没有太多不同。但是,一旦这些细菌分裂上百代(对于细菌来说也就是一两天的事),我们就能看到巨大差异的产生。正如祖卡坎德尔和鲍林在研究蛋白质进化时得出的结论,群体延续的时间越长,我们能够看到的变异就越多。简而言之,从历时更长的细菌群体里随机选出来的两个样本之间存在的基因差异,远比从历时更短的菌群里挑出来的多。
我们适才以细菌汤这个实验为例来详述在任何以指数方式增长的群体中发生的事情,每一子代的数量都会比上一代翻番。最明显的是,这些群体的规模增长极为迅速,如果我们放任这些细菌分裂而不加以限制的话,它们能够铺满整个星球。所以,对于我们的故事来说,至关重要的一点在于,之所以会出现群体规模的爆炸式扩展,是因为群体中的每个个体都会留下后代。没有谁会在进化长廊中走丢——所有个体都会分裂出子代,子代再分裂出自己的子代,没完没了,永无休止。这对于群体整体的基因构成来说,会产生一个有意思的连锁反应(knock-on)。
如果要问在这个不断增殖扩大的群体中,平均会有多少种基因差别可以用来区别组成群体的这些细菌,答案取决于这个群体增殖的时间究竟有多长。事实上,在这些不同的细菌个体间确实存在着差异的正态分布(distribution)。有点像数学课上曾经折磨过我们的钟形曲线。正态分布的平均数(mean)——样本中不同个体之间差异的平均数——取决于这个群体扩张的时间(time),如果我们把这个曲线想象成波浪的话,从左到右的移动意味着越来越多的差异的积累,越靠右的地方(换句话说,离中点最远的部分),积累的多样性越多。就像我们比较马和大猩猩的血红蛋白序列,这个曲线从左向右移动的比率是可以预知的,因为变异发生的概率是个常量——我们的分子钟总是在A和C、G和T之间摆动。正是因为这个原因,通过评估正态分布的中位值之所在,也就是这条波浪线的中点,我们可以计算出这个群体呈几何级数增长的时间究竟有多长。现在,也许你会说,这或许会是一次很精彩的大学统计课程的实验室演练,但是和我们之前讨论的话题没有多少关系……除非,我们能够看到这个模式同样适用于其他的有机体。
宾夕法尼亚州立大学人类学家亨利·哈本丁(Henry Harpending)和他的同事对人类线粒体DNA序列上的基因差异的分布规律进行了严谨细致的分析,发现存在着一个令人兴奋的模式。首先,这些差异的分布——错配分布(mismatch distribution),清楚表明了人类群体就像刚才说的细菌一样增长迅速。这是因为在这里我们数据所展示出的曲线像个倒扣的大钟,这意味着人类群体过去曾经有过高速扩张期。在那些规模相对稳定,或是规模缩减的人群中,分布曲线会发生改变,随着时间流逝,这条曲线会变得参差不齐。这是遗传漂变或者说是自然选择带来的基因谱系的不均衡流失造成的。这样的话,就存在着一个清楚的基因信号,表明人类曾经有过快速扩张。当哈本丁教授估算出这个扩张的开始期时,一个让人欣喜若狂的结论出现了:差不多就在5万年前,和我们对现代人走出非洲的时间的估计大致相当,基本上就是在上旧石器时代的开端。
图5 线粒体DNA(mtDNA)在两个群体中的错配分布。群体扩张的历史越久,其序列差异的平均数就越高
哈本丁教授和他的同事们检测了从全球25个不同群体中收集来的mtDNA数据,除了2个群体之外,所有这些数据都显示出过去5万年来人类呈现几何级增长的证据。而近来有证据表明,那2个有着锯齿状分布曲线的群体曾大幅度萎缩。这样的话,我们在分析时就很容易区分出这两种不同种类。甚至更进一步,这些不同群体看上去各自扩张的步调都不太一致。非洲人最早在6万年前开始扩张,继之是亚洲人(5万年前),最后才是欧洲人(3万年前)。这是一个很让人目瞪口呆的结论。mtDNA的研究结果和上旧石器时代技术进步的考古学数据高度吻合,先是在非洲,然后在亚洲,最后在欧洲,甚至连时间都一致。看上去,这次“大跃进”在我们的DNA里留下了可以追溯“杀手级应用”全球扩张进程的遗传学印迹。它也暗示了另外的一条路线,但是有关这条路线的细节内容不得不等亚当的儿子们来展示。