基因中的人类简史-DNA碎片
首页 上一章 目录 下一章 书架
    温故而知新。

    ——孔子

    1999年的冬天,凌晨两点钟,斯科特·伍德沃德家里的电话铃响了,他立刻跳起来去接电话,打电话的是一个老人,他问:“这是斯科特·伍德沃德的家吗?”接着又问:“你了解DNA吗?”斯科特·伍德沃德是杨百翰大学分子遗传学的教授,家住犹他州,四个儿子都十几岁了。那个打电话的人说他名叫詹姆斯·莱沃伊·索伦森,犹他州人,曾经去挪威探寻祖先,想了解一下他同自己的家族史有什么关联,但是进展不大。他打电话的目的是想知道伍德沃德能否把挪威所有人的DNA检测并分析一下,如果可能,需要多少费用。

    伍德沃德是一个比较悠闲的人,他说他得考虑一下,过几个星期再给索伦森打电话。伍德沃德回到实验室,费了很大劲才找来几个同办公室的人,告诉了他们索伦森的事,并且问道:“你们说这家伙是认真的吗?”这几个人回答说:“听说他净干荒唐事。”据了解,这个索伦森是犹他州的首富,也是世界富豪榜上的常客。他开了32家不同行业的公司,持有60项个人专利,他这一辈子挣了十亿多美元。人们普遍认为索伦森的项目往往涉及耗资巨大的发明,有时候还能赚取很大利润。其中一个是他在20世纪50年代发明的一次性外科手术用口罩。

    于是,伍德沃德开始考虑索伦森的请求。检测挪威每个人的DNA需要多少费用呢?挪威有多少人口?怎样才能收集到每个人的血样?这得需要多少血样?这些都是非常要紧的问题,但是对此事考虑得是否周全,伍德沃德心里还是没底。花费几百万美元去分析整个国家的DNA是一回事,确定这件事值不值得做又是另一回事。花费这么多时间,雇用这么多人力,索伦森提供的经费是不是发挥了最大的效用?这个工程除了满足索伦森的请求以外,还能达到别的目的吗?

    当然了,所有的专业科学家都必须重视预算问题,因为用于科研的经费是有额度的。为了能够有效地使用经费,他们必须证明自己能够用经费取得最佳成果。即使科学家们对于经费资源不进行竞争,但是从本质上讲,他们也必须小心谨慎地对待经费来源。从根本上讲,所有成功的研究项目都必须少做实验,多得成果。伍德沃德还没有想清楚,获得多少研究成果才能证明这样大的项目是值得做的。

    在伍德沃德估计项目费用的同时,他还要思考是否能达到他的第二个目的,这就是花费如此巨额的经费,除了要给这个性格古怪的亿万富翁一个满意的结果外,还要为遗传学做出超值的贡献。然而,他认为这个工程还没有万事俱备,这样大的研究项目所需的经费简直就是天文数字。

    两个星期以后,伍德沃德来到索伦森的办公室,索伦森问他给挪威人的基因进行遗传分类需要多少钱,伍德沃德说:“这个,所需费用可能相当大,恐怕你负担不起。”

    “哦,是吗?”索伦森说,“到底多少钱?”

    “五亿美元。”

    索伦森耸了耸肩说:“我可以给。”

    哇!伍德沃德想,我把价码定得太低了!

    近年来,有很多人意识到了DNA不寻常的潜力,科学家们致力于研究通过Y染色体来追寻去世多年的人的活动,并且越来越清楚地认识到,如果你能够确切地解读Y染色体,那么任何群体的DNA都能开启通往模糊不清的人类历史的通道,让人们更清楚地认识历史。对于像索伦森那样异常精明的人来说,DNA的微粒无处不在,就像是这个星球上的旅游者一路旅行时洒下的面包屑。

    更使人震惊的是,通过DNA认祖归宗还有一个根本性的作用,那就是通过DNA,你不但能够走进久远的世界历史,还可以探寻你的DNA是从哪里来的,出自哪些祖先。遗传学不仅仅能够使你纵览历史重大事件和知名人士的生活,还能给你个人绘制一幅家族历史的画面。

    伍德沃德说,就索伦森的项目而言,分析每个挪威人基因组的成果是很有限的。项目可以让人们更多地了解到挪威历史,并且告诉索伦森他自己在历史中的位置。但是同样用这五亿美元,他们不但能解答索伦森个人的问题,同时还能解答许多其他的问题。

    因此,伍德沃德对项目提出了不同的建议:首先从全世界五百个不同的人口群体中各挑选两百人进行基因组分析。这十万人的基因组就构成了整个人类基因库的缩影。这些DNA不但代表所有活着的人,还能代表已经离世的,特别是生活在几百年前的人的大部分DNA。伍德沃德说,这项研究不仅仅是为了分析并且匹配很多人的DNA,而且还能追寻到每个家谱中的四代人。这是把历史进行个性化的科学,但要达到这一目的,他们首先要让十万人贡献出自己的血样。

    不完全是出于巧合,犹他州是世界上开展如此大规模研究的最佳地点,因为那里有非常巨大的遗传学数据库。因此,研究小组首先从杨百翰大学这个触手可及的目标开始着手,伍德沃德把几个学生也派进了项目组,他说:“目前每个犹他州人的祖先160年前都不在这里,因为在美国,除了原住民之外,其他人都是外来移民。因此,当你把家谱信息同搜寻到的DNA信息相比对时,就相当于迅速地进入到其他很多地方采集了血样。”这个小组用了两个星期就收集了3000份血样,用一年的时间收集了10000份血样,每份血样都含有200年到300年历史的宗谱和地理信息。这个项目很见成效。

    在伍德沃德接到索伦森凌晨打给他的那个电话12年以后,我在伍德沃德的盐湖城实验室里拜访了他。我问他是如何说服人们参加这个项目,如何让项目延伸到了盐湖城以外的地区。他说,当犹他州的人口群体多样性被采集殆尽之后,项目组又充分利用了遍布世界各地的耶稣基督后期圣徒教会(LDS)的家族历史中心,并且与很多家谱协会进行了接洽。

    伍德沃德的小组请人们将献出自己的DNA当作慈善行为。尽管这个研究项目独立于耶稣基督后期圣徒教会(LDS),但LDS的确帮到了项目组,因为教会早已经有了基于家谱的完善的慈善活动模式了。实际上,索伦森到挪威的最初目的是为他的祖先进行洗礼,让他们加入LDS。

    虽然LDS家族历史中心的网络很大,但是还不能囊括全世界的数据。因此,伍德沃德小组一旦将LDS教会网络提供的数据挖掘殆尽之后,就必须寻找那些不但对这个研究项目非常感兴趣、愿意参与的群体,而且其自身的历史很有说服力的群体。于是,他们奔赴非洲收集了10000份血样,之后又到了亚洲,来到吉尔吉斯斯坦以及其他许多国家。他们最先去的国家之一是丝绸之路的主要途经国——蒙古,在那里收集了3000份血样。

    伍德沃德还以索伦森为名,设立了“索伦森分子遗传学基金会(SMGF)”,这是最早的遗传家谱公司之一。这个机构最终从全世界收集到了100000份血样,并分析了它们的Y染色体和线粒体DNA。在那个时代,这是个耗资巨大的研究项目,简直让人难以置信。但是,随着遗传学的飞速发展,他们当时所取得的成就同现在我们掌握的信息资源相比,就很有限了。2012年,索伦森分子遗传学基金会被世界最大的家谱公司Ancestry.com收购,自那以后,调查挪威人DNA的项目就完成了,而且研究成果超出了那位摩门教亿万富翁索伦森的预想。现在,伍德沃德领导的团队可以将几百万个有文件记载的家谱和70万个基因位点联系在一起,这些基因包括常染色体DNA、Y-DNA和线粒体DNA。

    遗传和基因组的相关知识从发现到让公众接受,其速度之快是史无前例的。到2014年为止,除了美国《国家地理》杂志的基因图谱项目以外,还有Family Tree DNA公司、23andMe公司和AncestryDNA.com公司都可以为公众提供DNA检测和家谱查询服务。这一切取决于你购买了哪种服务,你可以对Y染色体中的111个片段进行检测(如果你是男性),还可以检测线粒体DNA,或者22个无性染色体。(23andMe公司还可以检测人体的健康和特质,详见第十四章。)一旦你掌握了这些基因组数据,还可以把它们用于DIY网站或非商业性网站,如SNPedia、Interpretome以及Dodecad 来进行解读。这些遗传家谱公司经常调查的基因组部位远比几年前学术界所考虑的部位要多。当涉及个人遗传研究时,有很多个人可以付出许多研究人员无法承担的高额费用,也就是说,Family Tree DNA公司等机构拥有的基因库实际上属于众筹的极具价值的数据库。世界最大的Y染色体和线粒体DNA数据库不是由研究机构建成的,而是由Family Tree DNA公司创建的。

    那么,这些非比寻常的公司到底是什么样子的呢?毕竟,基因组是一个信息宝库,信息量是美国国会图书馆的好多倍,也超过了早已消失的古埃及亚历山大图书馆。我真想亲眼看看这座宝库,于是我访问了Family Tree DNA公司。这家公司是1999年在得克萨斯州休斯敦成立的,是第一家遗传家谱公司。那天,天气极其炎热,我从休斯敦机场开车,穿过杂乱无章的市区,来到了一幢不太起眼的办公楼。接待我的是贝内特·格林斯潘,一个留着醒目胡须、带有得克萨斯州口音、善于表现的人。

    格林斯潘坐下来准备跟我谈话,但是当我问他是否可以看看检测DNA的实验室时,他却说:“看那些地方没意思。”我急忙说:“哪能没意思?我还从来没见过DNA实验室呢,一定非常有意思。”他把我领到套房后边的房间,顾客送来的DNA血样在这里开封。这间房与休斯敦远郊的办公用房没什么两样。房间很小,配有家具,也有窗户。在房间的一角,有一台机器正在运转,发着轻微的声响。格林斯潘说,只要你用对了机器,你就不需要很大的空间,也不需要那些闪闪发光的整套设备。这话说得没错。

    格林斯潘给我看了看接受检测的人送来的样本,通常是唾液或者口腔黏膜涂片。他们首先把样本送进机器,把DNA分离出来。再把DNA放进PCR(聚合酶链式反应机)里,俗称“摇摆烘烤机”。格林斯潘说,这个机器“给DNA加热,然后降温,再加热,再降温。通过温度的升降,产生的DNA就越来越多。其主要目的就是扩大DNA的量,一开始好比从草堆里找针,逐渐地找到的针就越来越多了”。这个步骤完成以后,把DNA放进冰柜,这可是“世界上最昂贵的冰柜”了,每个冰柜可以在零下29摄氏度的温度下储存八万个样本。冷冻的样本由机器人进行分析,这样可以杜绝人为差错。样本分析是在一台装有荧光磁珠的机器中进行的,如果在样本里有他们要找的DNA成分,这些成分就会附着在磁珠上。

    公司一般以图解的方式显示被检测的染色体,如果是同一家庭的成员来检测基因组,他们可以把各自的照片叠加在一起,这样就能够看出他们的DNA确切重叠之处了。譬如,你之前很清楚自己眼睛的形状和姐姐的一模一样,但是现在还可以清楚地看到你的3号染色体(或其他染色体)的某个部分与姐姐的一模一样,你们俩的全部基因组真的出自同一种原材料。

    所有公司都会对你的基因组揭示出的祖先信息给出解释。譬如,你的Y染色体可能通常只会出现在非洲、欧洲、印度或蒙古男性体内。你可能会发现体内常染色体的某个特定基因序列,属于芬兰或韩国祖先遗传基因的典型特征。就在几年以前,科研人员从人类的DNA中发现了远古时代两个非人类的穴居物种——尼安德特人和丹尼索瓦人的基因。这一发现震惊了整个科学界。如今,仅仅花费一点点费用,有些公司就能分析出你的基因组有多少来自于尼安德特人。(关于这两个物种的更多信息,详见第十二章。)

    格林斯潘常常亲自帮助客户弄清对过去的疑问。譬如,有一位女士给他写信,说据她所知,她的家族里根本没有犹太祖先,但是她祖父的名字是赫谢尔,而且她父亲和叔父的中间名也是赫谢尔。几年前,她发现她祖父有一张画的背后印着几个用古希伯来文写的美术字“L'Shana Tova”,是手写的新年贺词,标明的日期是1891年。Family Tree DNA公司对她的DNA进行了检测,结果显示她极有可能就是犹太人。

    还有一位女士,从小在西班牙长大,信奉天主教,而家族世代相传的口述历史显示她家在20代之前有犹太祖先。通过检测,格林斯潘发现这个女士的线粒体DNA与来自西班牙、希腊、阿尔及利亚、保加利亚和土耳其等地的西班牙裔犹太人的线粒体DNA相同。她请求格林斯潘给她写一封证明信,她要把信送到犹太人的法院,来领取一张回归证书,正式确认她是犹太人。

    格里斯潘对我说:“我差一点就把她的事扔在一边不管了,因为这几乎是无法验证的,很难想象根据口头相传,就能确认一个家族属于这么一个少数群体长达20代之久,这太令人难以置信了。每逢我们在没有DNA数据的情况下处理口述历史时,我都非常担心,因为研究事实靠的是多方面的证据,而讲故事恰恰缺少证据。”

    经过不到15年的经营,私人遗传公司已经建立起了一个以遗传学为基础的社会关系网,与这个关系网相比,21世纪初的关系网络简直就是小儿科了。23andMe公司、Family Tree DNA公司和AncestryDNA公司的顾客能够发现一大群有遗传关联的表亲,他们不但能追寻家人,还能追踪他们基因组中的特定片段。把几百万人的档案记录和他们的DNA分析结合起来,用户可以建立一份贯穿几百年甚至更长时间的人类关系网的拷贝,并在其中找到自己所处的位置。

    当客户有一个或一个以上的DNA片段与另一位客户相同时,公司会提醒这位客户。遗传学家说这些片段具有“血统遗传的特征”,意思是它们出自同一个人,也就是说遗传给这两个人的DNA出自一个祖先。公司把这种DNA相匹配的人叫作“亲戚”或者“表亲”。从根本上讲,你同某人的关系越近,你们所共有的DNA片段就越多,并且延续时间也越长。

    据说,常染色体DNA起码可以把你带回五代人之前的历史,通过常染色体DNA来确定第三代远房表亲的可能性是90%,第四代的可能性是50%,第五代的是10%。格林斯潘说,他听说有人用常染色体DNA确定了第八代远房表亲。随着科学的发展,找到更为久远的表亲的可能性还会增加。

    如果某位祖先的后代足够多,那么甚至可以借助这些后代重构出这位祖先的基因组。每个在世的人的基因组就如同是虚拟拼图中的一块,可以拼出这个群体共有的祖先基因组。这些祖先没有留下有文字记载的历史记录,但是从理论上讲,他们的基因组可以重现,虽然还没有人真正实践过。伍德沃德说:“只要有足够的人体信息,你就可以重现过去,譬如,再造1850年英国西兰开夏郡利克镇的人口状况。”

    几年前,一位学过分子生物学的知识产权律师布莱恩·贝廷格,开始搜寻他曾祖母的DNA。她生于1889年,活得很长。贝廷格今年38岁,他还记得他小时候曾祖母的模样。由于他的曾祖母是被收养的,因此,对于她的家族血统,贝廷格一无所知。然而,她是个“影响力很大的极其强壮的女人”,贝廷格把他家族里的一些特征叫作“涟漪式特征”,这些特征好像都来自于这位曾祖母。为了探寻曾祖母的来历和她对于这个家族的影响,贝廷格开始收集她后代的DNA,以便从他们那里分离出遗传自曾祖母的基因。

    在曾祖母的两个孙子的帮助下,贝廷格确定有35个DNA片段出现在她和她丈夫遗传下来的染色体中。下一步,他要分别去寻找与这些DNA片段对应的亲戚,以便把出自这位曾祖母的DNA片段与出自她丈夫的DNA片段区分开来。在说服他的家人参加这项研究的同时,贝廷格还运用表亲匹配的办法寻找到了更多具有上述DNA片段的人。

    对于那些之前很少想过自己的基因的人来说,解读个人基因组分析报告是件很恼人的事。贝廷格第一次检测DNA是在2003年,当时的检测公司可以解读常染色体上的175个标记;而现在他们可以检测100万个标记。结果,贝廷格成了遗传家谱学领域的领军人物,并成为一个精英团队中的一员,这个团队致力于帮助人们了解表亲关系网络和解读自身的DNA信息。贝廷格主要通过自己广受欢迎的博客网站TheGeneticGenealogist.com来帮助人们。

    塞西·穆尔是一位遗传学家兼知名博主(YourGeneticGenealogist.com)。当她的一个侄女要结婚时,穆尔打算帮助侄女合并一份家谱,从那时起她就开始对这个主题感兴趣了。她说:“对于写家谱,我知道的并不多,但这非常容易使人上瘾。”穆尔曾经是个电视节目制作人,现在是遗传家谱学顾问,与小亨利·路易斯·盖茨合作,专为电视节目《寻根》和《家谱学巡演》出谋划策。她已经创建了一个全新的职业,这个职业不仅仅要解释和阐明DNA的方方面面,还要当遗传方面的侦探,帮助委托人寻找丢失的信息。现在她的日常生活里充斥着DNA,她每时每刻都离不开DNA,甚至夜里睡觉都在想着DNA。

    穆尔还是Family Tree DNA公司“被收养人DNA项目”的管理人员,越来越多曾被收养的人请她帮助寻找原来的家人。她说:“我每天都收到人们发来的邮件,这些人发现自己从遗传学上讲并不是原来的自己了。有时候,人们突然发现父亲并不是亲生父亲,还有人说他们可能出生时在医院里被人调换了。”还有一次,有人请穆尔帮助查询自己的父母,说自己是在1916年被人放在这家人的门口外面的,还有人说自己是从垃圾箱里被人捡到的。在过去的一年里,就有六个人代表曾经被人遗弃的婴儿找她帮忙。

    有的时候,人们没有追寻到预想的祖先,譬如,有人以为自己是爱尔兰人,但是检测结果却显示他们更有可能是俄罗斯犹太人。穆尔说:“这只是我的个人经验,人们之所以打算检测一下自己的DNA,是因为他们总觉得自己在这个家里不太对劲儿,或者脑子里老是有疑问。这样的人可太多了。”

    通过从遗传家谱数据库中探寻人们在染色体中所共有的DNA片段,穆尔帮人找到了失联的兄弟姐妹,甚至父母。她先顺着表亲家族家谱找到他们共有的祖先,然后再顺着这位祖先向下追寻,直到他们的父母。她说:“你先顺着家族树向上追寻,然后再自上而下地追寻。譬如,如果预测的二代表亲和一个寻找生身父母的人(也许是高曾祖,如果他们共有的DNA 不太多的话)共有一个曾祖,我们就可以顺着家族树向下追寻,找到年代、地点、性别都能对得上的人,问题就解决了。”有的时候,穆尔直接找到了相对应的人,因为从DNA中发现两人在很多染色体中都有共同之处,这说明他们是兄弟姐妹关系,或者是父母与子女的关系。穆尔建议她的委托人把自己的样本送到23andMe公司、Family Tree DNA公司和AncestryDNA公司,因为这三家公司共同管理着藏有一百多万个常染色体的数据库。穆尔说:“你必须在这三个池塘里钓鱼,才能确保取得可信的调查结果。”有时候,她只找到了一个大致的祖先群体,譬如,最近一个委托人发现自己原来是墨西哥人,仅此而已。

    在遗传家谱学的帮助下,很多人的谜团得以揭开。如果我们把查寻的中心转向不同的人类群体,共有的常染色体DNA就可以把我们带到八代人以前的时代。

    现代文明很善于保存近期的一般信息,自从发明了考古学和古人类学之后,我们也可以恢复一些远古时代的信息了。然而,要想了解关于古人的更多信息,我们就必须付出更多的努力才行。我们或许对于19世纪和18世纪的人物,甚至生活在1000年前的皮克特人,以及生活在2000年前的古罗马人有种亲近感,但是对于生活在2000多年前的绝大多数人,我们几乎已经感觉不到与他们有任何联系了。从他们留下的遗迹中,我们可以适当地了解到当时的一些信息,但是几乎感觉不到他们在现代社会中得到了某种传承,不像近500年来涌现的大人物,从列奥纳多·达·芬奇到莱特兄弟,我们能够清楚地说出他们的发明创造,以及留给我们的各种文化遗产。

    我们现在仍处在深度解密世界历史的高峰期,因为除了商业型的遗传家谱公司以外,还有很多科研团队正在研究不同的方法来探寻更为久远的历史。他们希望不仅按照年代顺序和情感因素来解读遥远的历史,还想弄清楚我们和那些时代一直在通过什么方式联系着。当英国的研究团队构思出一种独到的方法来揭示英国不同地区的基因融合时,来自南加州大学的生物学教授彼得·拉尔夫和来自加州大学戴维斯分校的格雷·姆库珀,共同研究出了另一种利用DNA来探寻欧洲历史的方法。他们检测了2257个欧洲人的基因组,并把这些基因组划分为40个不同的人口群体,分辨出任意两个人从同一个祖先那里继承的所有DNA微小片段。他们的目的是要弄清现代欧洲人相互关联的方式,进而了解人际关系网如何随着时间的推移而变化。

    拉尔夫和库珀发现,在比邻的欧洲人口群体中,任意两个现代人就共有2个到12个生活在1500年前的祖先。这些国外的表亲关系证明了所有人之间最基本的联系,也证明了我们最终是怎样变得形同陌路的:1500年以后,住在另一个国家的12位表亲都不足以让家族再次重聚。还有一个类似的研究发现,在一个有5000个欧洲人的样本中,有几万对第二代到第九代的表亲。根据拉尔夫和库珀的研究,任何一对个人都可能共有100个甚至更多个生活在1500年到2500年前的祖先,也就是说,他们携带着80代之前的先祖传下来的同一个DNA片段,这位先祖可能是一位古罗马军团成员、一个葡萄牙水手,或是一个希腊牧羊人。在欧洲,人们生活的距离越远,他们共有祖先的可能性就越小,但是,拉尔夫和库珀说,他们仍然可能共有几位祖先。

    基因组在代代相传的过程中被切割、分离,然后打乱次序,这个过程对于现在的基因组结构具有相当重要的影响。我问拉尔夫,DNA的片段是怎样分解的,然后又是怎样重组的呢?拉尔夫建议我制作一个家谱模型。于是我就回到家里,坐在厨房的餐桌旁开始制作这个模型。我先用纸做了一个基因组:红色的一条代表母亲传给我的DNA,绿色的一条代表父亲传给我的DNA。我打算顺着我的一半DNA回溯几代。我把绿色纸条先放在一边,只留下我从母亲那边得到的基因组。

    我把红色纸条切成23个小块,来代表由我母亲传给我的染色体,之后,我把这些纸块放在桌子上方,就好像是我母亲在家族树的位置。为了再现我母亲的基因组原来的形状,我在红纸块堆里又加上了23个橘黄色纸块,以象征着母亲没有遗传给我的DNA。

    在我面前的这套染色体看起来像是我母亲的全部基因材料了,实际情况并非如此。她遗传给我的染色体,在传递之前经历了一个重组过程,在每一对DNA中,有的部位互换了位置。她的总体染色体先是解体,然后重组,平均一个基因组重组了32次。

    为了这个程序,我把红色和橘黄色的46个纸块切碎,然后每一对纸块进行交换,以象征她的总染色体的解体和32次重组。这意味着46个纸块大致可分为23对,每一对几乎都是由一片红色和一片橘黄色纸片组成的。这23对马赛克纸片代表着我母亲的实际染色体。

    由于我想顺着我的DNA再往前追寻一代人,到我外祖母那一代,因此我把这个程序又走了一遍。我从每一对染色体中抽出一个来,剩下的那23个染色体就是我外祖母遗传给我母亲的染色体。我把这一组纸块又推到桌子的上方,象征着我的外祖母在家族树上所处的位置。然后我又在我外祖母遗传给我母亲的染色体中加进去23个蓝色纸块,以便与原来的23个纸块配对,代表着我外祖母所有的但从未遗传给我母亲的染色体。为了把那23对染色体拆分开,然后再重组成为我外祖母的染色体原有的状态,我把这些纸片切碎,然后小心翼翼地把细小的纸片推入纸条之间,使之与别的纸条和为一体。

    这些代表着我外祖母原有染色体的纸条有四种不同的片段,分别用三种颜色表示。这三种颜色分别代表哪些片段是遗传给了我的,哪些是遗传给了我母亲但没传给我的,还有哪些根本就没有遗传。如果我按照这个程序继续追寻,直到100代,我个人的基因组碎片会顺着我的家族树越来越往上散去,并且会越来越少。

    然而,当我在几代人的时间跨度中把基因块散开,然后重新组合时,我所看到的不仅仅是不同的颜色,长度也略微有些不同。在一开始,很容易就能把基因组分割开,并且可以往前推送几代人。但是没过多久,这些基因块就小得不能再分了,它们只能原封不动地从一代人传给下一代。这就是拉尔夫想让我看到的结果。这些DNA的片段常常是完整地传给下一代的,然后还能完整地传给再下一代。也许要经过很多代以后,才有可能再次被分割。

    对于DNA传承方式存在着一个常见的误解,人们常常认为,当DNA传给下一代时,其中某个部分被一分为二。其实,DNA的传承过程会有例外,基因组也不是由大小相等的颗粒异常均匀地组合在一起的,并且分解重组的方式也不同。因为Y-DNA和线粒体DNA是不与其他的DNA重新组合的,通过这些DNA,你可以了解在你的家族树上生活于一万年、五万年甚至十万年前的人的一些情况。从某个角度讲,那个人依然存在于你的身体里,他存在的方式与你其他祖先存在的方式是完全不相称的。X染色体也是不一样的,因为它在几代人中间传承时,是以一种不平均的方式重新组合的。

    尽管我们已经知道了Y染色体、X染色体和线粒体DNA有此特性,但仍然认为基因组的其余部分还是遵循一分为二的模式传承的。如我们所知,反对家谱学最为激烈的人喜欢引用的一个原则是:如果你追溯到10代人以前,那么就有1024个祖先,也就是说,这个祖先群体中的每个人遗传给你的基因只占你整个基因组的1024分之一,这个量太小了,简直毫无意义。也就是说,你是一碗基因做的汤,想从汤里找出关联模式来是不可能的。这可能是一个非常有影响力的观点,但是我一直想知道,这个观点的影响力是来自数学运算呢,还是漫画式的绝对主义论。

    事实上,根据拉尔夫和库珀的研究,许多常染色体的DNA片段都是原封不动地、没有任何改变地一代一代遗传下来的。一个基因组的复制并不是一个平稳的、分解为更小片段的过程,其中经常出现不均衡。当拉尔夫和库珀还是学生时,他们学习到的标准观点是:DNA在传给下一代时,要一分为二,这就是说,你的祖父和祖母分别只传给你四分之一的DNA,曾祖父和曾祖母分别只传给你八分之一的DNA,依此类推,越往上追溯遗传给你的DNA就会越少。后来,他们认识到事实并非如此。拉尔夫对我说:“过了一段时间,我们才习惯了正确的观点,因为我们曾经习惯于一分为二的思考方式,这是由于一开始DNA中的一切都一分为二了。但如果你取出DNA的一个片段,把它切成两半,然后把这两半分别放进两个袋子里。下次你再把它们切为两半,过不了多久,你手中的这些DNA碎片就小得不能再分了。因此,整个DNA碎片就被放入一个袋子里了。”

    如果每一个DNA碎片在传给下一代时都要分为两半,结果就会是一个等比例逐渐缩小的画面,这与不断散开的表亲数量相匹配。然而,在代代相传的过程中,DNA的切割和重组不是一个稳定平均的过程,比较大的DNA碎片在传承的过程中没有发生多少变化,这就出现一些有意思的事情。例如,假设你同第5代表亲或第20代表亲共有一些从同一个祖先那里遗传下来的DNA基因碎片,那这些基因碎片的大小可能是相同的。拉尔夫的意思是,人们相互关联的时间跨度大约是500年,这就意味着如果你同某个人共有一个特定长度的基因碎片,你们就可能在500年中存在共同的祖先,小一些的基因碎片可能出自生活在500年至1000年间的祖先,更小的基因碎片就可能是从一个生活在1000年至1500年前的共同祖先那里遗传下来的。

    这对于Family Tree DNA和23andMe这类公司的基因数据库来说具有一定的意义。用户可以基于共有DNA的多少来找到第1代、第2代或第3代的远房表亲。他们也许还能找到更为久远的更大的表亲群体。拉尔夫说,根据你们共有的DNA,这些久远的表亲可能是第5代,也可能是第15代,可能比你想象的要久远得多。其实,当你思考任何一个家谱时,很快都会发现得不到新的基因碎片了。每一代人的基因组都是全新的,但是它们来源于一块一块的碎片,而不是一堆粉末。

    DNA在许多代中的不规则遗传还有很多其他的方式,这些方式也会产生很大的影响。例如,女人的DNA重组率比男人高。你的祖先所在群体的人口数量和这个群体的稳定状况也会影响到哪些DNA得以传承。请记住,32只是染色体在每一代解体并重组的平均次数,这个次数是会发生变化的。遗传学家还会谈论染色体的“热点”,即倾向于不断重组的部位。

    如果你考虑到了所有这些因素,就可以运用来自共同祖先的一模一样的DNA片段,发现3000年前到4000年前古人之间的联系了。

    奇怪的是,尽管有一些过世很久的亲戚在我们的基因组中得到了明显的体现,超出了我们的想象(相对而言),但是更多的亲戚简直就如同蒸发了一样,消失了。这是因为我们的个人遗传树并不等同于我们的家谱树,也就是说,并不是每一个直系祖先都对我们的基因组作出过贡献。

    如果你往前探寻10代人,与你有血缘关系的每一个人实质上也是你家族家谱树中的一员,他们婚配生子,成为你的祖先,这是实际存在的、不变的事实。当你刚开始追溯世系时,你的个人遗传树和家族家谱树当然是完全相同的,你的以家谱而论的父母就是你的生物学意义上的父母,其他亲戚也是如此。但是,存在一个历史的节点,从那一节点往上,你同很多代之前的大多数祖先的基因关联都消失了,尽管你的家谱树仍在不断增长。

    遗传学家都认为,顺着你的家谱往前数8代到10代,其中有很多人都为你的家族贡献了DNA,到你这一代的时候,其中的很多DNA丢失了。如果你能够追溯身体中的每一片DNA,那它将会呈现在家谱的分支上,但是越往上追溯,它经过的分支就会越少,你的遗传树要比你的家谱树小多了,这说明你与很多血亲在生物学意义上没有关系了,这使得你在家谱中处于一个奇怪的境地。

    对于遗传树上消失人数的预估是不一样的。如果回溯10代,那么至少有一个或者多个祖辈的遗传特征可能会完全消失。如果回溯16代,你就会拥有65336位祖先(不包括可能出现的重复,因为有些祖先可能出现在多条家谱路径上)。据布洛德研究所的尼克·帕特森说,这个数字远远大于这一代祖先遗传给你的基因碎片数量;其实大约只有1000个基因碎片是你的第16代祖先贡献的。因此从遗传学的角度说,其他大多数祖先对你没有贡献。假如说,你能乘坐一个时间机器穿越时空,来到400年前,而且你不知不觉和一位16代祖母产生了浪漫关系,你可以完全放心地生几个孩子。虽然从道德上讲,这有点怪诞,但从遗传学上说是没有问题的。

    但是且慢,这是不是就意味着那些反家谱学人士的观点就是对的呢?是不是等于说人类的基因组在几代中很快就化为毫无意义的尘土了呢?当然,我们很多人的基因组最终会逐渐消失,但是消失的过程也是有规律的,而且它留下的痕迹也是有意义的。如果有些人从我们的基因组中消失,而有些人则继续存在,那么这只是历史塑造的又一个结果。

    如果你随便找来两个欧洲人,无论他们离得有多远,他们都很有可能在过去的1000年中共有几百万个家族家谱意义上(不是遗传意义上)的祖先。然而,虽然你的家谱树要比你的遗传树大得多,但它也不会永远呈扇形展开。因为家谱树中上一代祖先的数量都是下一代的两倍,任何人的祖先数量都会呈指数式增长,并且很快增加到比当时世界总人口还多的程度。

    比如说,遗传学家和历史学家在多少年为一代的问题上有不同的观点,有的说是20年,也有的说是30年,我们假定是25年,还要假定现在世界上只有一个人,比如说你。那么,在大约750年前,地球上一定生活着10亿多人,经过一代一代的繁衍,才有了今天的你。或者换言之,大约在30代以前,要有20亿人生活在这世界上,他们的子孙后代相识、结婚、生子,直到有一天,你出生了。但事实上在750年前,世界上只有4亿人口。这就意味着沿着一条家谱路径追溯到的第30代祖先,也许还能沿着其他很多家谱路径追溯到。家谱学家称之为“家谱崩溃”。

    回溯到19世纪或更早的时期,“家谱崩溃”在家谱树中是很普遍的现象。在很多文化中,表亲之间通婚不是特例,而是约定俗成的事。(更多有关人口学和表亲之间通婚的问题详见第十四章。)有些科学家(比如拉尔夫和库珀)认为,在2000年到3000年前,生活在世界上的每一个人在家谱学意义上都是所有现代人的祖先。这个观点纯粹是通过数学运算得出的结论,理论基础是:在理论上你的家谱树在2000年到3000年前是很庞大的(超过12万兆个祖先),肯定包括当时生活在这个世界上的全部人口(5000万到1亿7000万人)。我遇到的许多人口遗传学家都认为这是个完全没有争议的理论。各个国家的人类关系网络会由于一两个来自远方的旅行者而改变,全世界的人口群体会被逐步联系起来,这个过程用不了太久。其他从事历史事件研究的人发现这个理论站不住脚:虽然从技术层面来讲,这种联系事件完全有可能发生过,但他们认为世界上不同的人口群体之间完全相互隔绝的时间会更长。

    如果人与人之间的高度关联是真实存在的,那么就意味着当今世界上的每一个人——你、你的邻居、弗拉基米尔·普京,还有日本天皇——都可以把同一个埃及法老或生活在那个时代的任何一个人,算作自己遥远的祖先了。有多个在家谱学意义上的共同祖先,当然并不意味着现代人没有遗传方面的差异(这些差异在很多实验中都可以观察到,譬如,上一章讲到的那些探索英国遗传结构的实验)。但是,这也不是说假如你回溯3000年,每个人的家族历史在这期间都是相同的。即便你和日本天皇的家谱树中都有同一个埃及法老,这个法老出现在你的家谱树中的次数也可能远比出现在日本天皇家谱树中的次数多。假如在几千年前,每个人的家谱树都一模一样,那就没有遗传史了。如果你能想象出一个从现在追溯到过去的巨大的祖先网络,在这个网络上的每个人都是一个节点,那么,所有生活在3000年前并留有后代的人都是重要的节点,因为生活在今天的每一个人都可以通过一条家谱路径追溯到他们——但追溯的路径不同。有些人可以沿着几千条路径追溯到同一个节点,而其他人的追溯路径会少得多。

    奇怪的是,我们经常会听到有人说“我们都是孔子、布迪卡或红发埃里克的亲戚”,言外之意是这段历史毫无差别,如果你追溯得足够久远,那么所有人在那个时候的祖先都是一样的,因此,探讨一个人或者一群人同过去的祖先有什么关联就变得没什么意思了。事实并非如此。人类关系网的拓扑图(我们每个人都是上面的一个节点)相当复杂。虽然有些节点是相同的(也许我们都能与3000年前在世的每一个人至少产生一个关联),但是这些共性并不代表我们追溯共有祖先的其他路径就不重要了。如果你开始追踪携带某个基因组片段的祖先(譬如Y染色体和线粒体DNA),那么共有祖先的情景又会变得复杂得多。全部路径展示出的模式可能会告诉我们一些从来不曾了解的历史。

    还记得在英国进行的遗传学研究项目吧?康沃尔郡、德文郡和其他地区的居民都带有当地特定历史时期遗留下来的印记。他们具有康沃尔郡人或德文郡人的特征并不代表他们没有来自苏格兰或法国的祖先,也不代表他们的家谱中没有天主教徒、北欧海盗,甚至中国古代的哲人。从遗传学角度来讲,他们不再单一,家谱也不再单一。他们遗传下来的好像是一种经过稀释的东西,但是还足以追踪到某一时期、某个地点的祖先们。无论我们往回追寻1000年还是5000年,事实都是如此。

    除了欧洲人亲缘关系的一般规律以外,拉尔夫和库珀还找到了一些有趣的差异。例如,欧洲东南部地区的人在遗传学意义上共有祖先的数量,比欧洲其他地区都要多。他们共有大量祖先的年代可以追溯到大约1500年前,那时正是斯拉夫人和匈奴人的扩张时期。

    与欧洲其他地方截然相反,意大利人共有祖先中的大多数生活在大约2500年前,古罗马帝国之前的古罗马共和国时期。现代意大利人在最近的2500年间也存在共有祖先,但是数量却少多了。实际上,来自不同地区的意大利人之间共有祖先的数量,基本上等同于他们和其他国家的人之间共有祖先的数量。从遗传上讲,其他欧洲国家好像更为一致,而意大利仿佛是由很多小国组成的。我们对此该作何解释呢?

    要想理解这一点,我们不仅要知道家庭中生命的传承方式,还要了解家庭形成的社会背景。尽管DNA是通过所有常规的复制方式在意大利散播的,但其散播的过程深受当时的文化和地理环境的影响。单凭基因学本身是无法给出欧洲历史全貌的。

    有很多史实可以解释意大利人共有祖先的特定模式。拉尔夫和库珀认为,过去2000年来在欧洲其他地区发生的人口扩张,对这一地区的影响很小。拉尔夫说,为了验证有关当时社会背景的猜测,他们不得不查看人口、语言和其他历史方面的模式特点。很多因素都要考虑进来,例如,已经在意大利定居几百年之久的人,共有祖先的情况是否存在差异(从而证实这种差异并不仅仅是因为500年前有一个全新的人口群体从外国移居到意大利而导致的)。

    除了意大利人2500年前的共有祖先群体更大以外,还有一点引起了我的兴趣。其他有关意大利的遗传分析显示,这个国家有很多不同的小遗传群体由北向南形成了一个渐次变化的梯度,它们以这样的方式联系在了一起。意大利经济学家吉多·塔贝里尼曾经量化过意大利南北之间在社会资本方面的差异,我问他为什么在近2500年中一些群体之间共有祖先的数量变少了呢?他说,在19世纪中叶以前,统治意大利南北方的政治实体之间是隔绝的,这种分治减少了国家作为一个整体在社会经济上的融合。另外,南北方的统治方式也是不一样的,“北部意大利政府更独立、更开明,而南部意大利政府一直受到外来势力的左右”。

    塔贝里尼还说:“第二重要的差异是家庭的作用,这一点还没有得到充分的研究。如果你审视意大利的家庭传统,就会发现它们之间的差别非常大,在对待女人的态度方面也同样如此。你也可以从这些不同的家庭传统中找到原因,来解释人们对于家庭以外的人持有的态度。”

    塔贝里尼所描述的社会潮流可能有助于解释意大利人共有祖先的独特模式,也可能存在完全不同的故事来解释这种独特的模式。为了找到最合理的解释,遗传学家、历史学家和其他研究人员必须通力合作。

    尽管遗传历史是一个存在无限可能的研究领域,然而有些第一代遗传家谱学家的研究动机不是揭开那些消失的历史真相。詹姆斯·莱沃伊·索伦森在2008年去世,当我问伍德沃德为什么他与索伦森要做那个研究项目时,他往椅背上靠了靠,在空中打了个引号的手势,告诉我其中一大目标是“与‘美国小姐’类似的目标——世界和平这类的目标”。

    伍德沃德说,他们曾经梦想着一旦有一天完成了整个项目,就能够从全世界随便找两个人,然后找到两个人共有的一个DNA片段,对他们说:“这就是你们俩共有的那位祖先。”

    伍德沃德回忆道,当他和索伦森来往时,他们曾经想过“如果人们了解并知道了互相之间的联系有多么紧密,也许他们相处的方式就会有所不同,希望可以变得更融洽”。

聚合中文网 阅读好时光 www.juhezwn.com

小提示:漏章、缺章、错字过多试试导航栏右上角的源
首页 上一章 目录 下一章 书架