第四版的《群体遗传学原理》提供了针对最新的群体遗传学的介绍。它适合相关领域(如人类遗传学)的所有学生如本科生和研究生,以及相关领域的新人。本书在理论与观察之间取得了平衡,并旨在优化其作为教辅工具的使用。我们强调了在真实数据上的批判性和分析性思考。因此,我们在章节中穿插了大量问题,以鼓励学生在学习过程中停下来思考一小会儿,想一想刚刚学习了什么,如何将所学应用到实际。
现代的群体遗传学经历了三次不同但相关的思想和技术革命,并因此得到了改造和振兴。一次革命是 概念性(conceptual) 的,它颠覆了群体遗传学理论。另一个革命是 实证性(empirical) 的,它为群体遗传学家提供了大量数据用于分析。而第三次革命是 计算性(computational) 的,它使概念的进步和新的数据结合在一起。
概念性的革命起源于溯祖理论(theory of coalescence),该理论建立了一个从进化史角度思考种群和基因的框架。这种看似简单的视角变化非常重要。因为存在于现有群体中的每个等位基因都来自于过去存在的等位基因,这意味着不论任何时候,从一个群体中提取得到的等位基因样本都包含了与等位基因进化历史有关的重要信息,也因此包含了与群体历史有关的信息。
实证性的革命源自基因组学,它以三种不同但至关重要的方式改变了群体遗传学。首先,是对多个基因组的完整DNA序列的确定,这包括人类基因组、关键模式生物基因组和许多近缘物种的基因组。其次,是使用DNA测序技术发现了整个基因组中的单核苷酸多态性(single-nucleotide polymorphisms,简称SNPs,读音作“snips”)。这种多态性非常重要,因为群体遗传学的目标之一就是理解遗传变异的进化与生物学意义。再次,是高通量、低成本的基因分型方法的开发,这些方法可以在成百上千的个体中对成百上千个SNP进行基因分型。这项技术为群体遗传学家在人和其他物种中鉴定影响复杂性状的基因奠定基础。这些复杂性状包括疾病的遗传风险因素、影响人类寄生虫或农业上重要的动植物的多基因性状的基因,以及成为自然选择目标的基因,包括那些影响身心发育,从而让我们区别于其他灵长类,成为一个“人”的遗传基因。
第三次革命是计算性的革命,这不仅包括数据处理能力的巨大提高,还包括互联网的爆炸式发展,而后者已经成为了许多研究人员之间交流的媒介,并为海量数据资源的存储提供了巨大方便。计算能力的提高导致了马尔可夫链蒙特卡罗模拟等方法的广泛应用,这使得最大似然法和贝叶斯方法能够在巨大的数据集上进行统计推断,不久前这样的计算规模是难以想象的。正如一位有见地的高中生所描述的统计数据,“所有未经处理的数据本身都是混乱的,而统计数据是一组方法的集合,通过这些方法,我们可以至少以一种有用且有意义的方式巧妙地组合和理解这种混乱。”为了最大化利用互联网上的数据资源,本文引用了许多重要的网络资源,这些资源将材料与现代群体遗传学的最新进展联系起来。
在整本书中,我们特别注意解释了理论模型背后的生物动机,以使模型不会凭空出现,并用简单的英语解释了结果的含义。在可能的情况下,我们使用实际数据,通过数值示例说明了许多概念。特殊的主题和例子通常作为问题框从文本中引出,其解决方案将逐步解释。每一章的结尾都有大约20个问题,按难易程度分级,并在文末给出了完整的解析。