《科技创新与品牌》杂志社创世·纪

“混血”人群的现代发现

  徐书华,中科院上海生命科学院计算生物学研究所研究员、研究组长、博士生导师。近5年在混合人群的遗传结构、环境适应和基因定位策略研究方面取得了连续性的研究成果。他系统研究了混合人群的遗传结构和连锁不平衡,构建了首张欧亚混合人群的基因定位图谱,并在全基因组水平量化分析了汉族人群的遗传结构及其对关联分析的影响,系统研究了单基因疾病和复杂疾病基因的特征;在人群混合与环境适应性方面,建立了检测混合人群自然选择的新策略,从全基因组水平揭示了美国黑人及藏族的环境适应性;在遗传混合与人群历史研究方面,从基因组水平揭示了亚洲人群的精细遗传结构和混合模式,是迄今为止最全面的研究;他发展了利用遗传混合和重组信息研究人群历史的方法,首次从遗传学角度估计了亚太地区人群的基因交流和扩张时间。
  中国人口最多的民族汉族,本身就是一个最大的“混血”人群,在汉族人群的基因组中可以鉴别出不同程度的周围少数民族的遗传成分。
  混血儿常常给人留下深刻印象,如高尔夫球星泰格•伍兹、F1赛车手刘易斯•汉密尔顿、美国总统贝拉克•奥巴马、奥斯卡奖得主哈里•贝瑞等。曾经一项有趣的调查研究发现,混血面孔在“极具魅力脸孔”打分中占据垄断地位。另一方面,大多数人都认为混血儿似乎只是个体行为,即使中国到了今天这么开放的时代,若是谁家女儿嫁给了外国人生了一个混血儿,依然是一件很希奇的事情。而实际上,现代人类在其漫长的历史长河中,曾发生过不同规模的群体性“混血”事件,留下了如今各地广泛存在的“混血”人群,典型的如大家熟识的美国黑人、拉丁美洲人群、中东和东南亚人群以及我国新疆的维吾尔族、哈萨克族等。徐书华就是钟情于这类人群遗传学研究的一位青年科学家。
  位于上海市岳阳路320号的中国科学院上海生命科学研究院,有一个由中科院和德国马普学会共同建立的计算生物学研究所。徐书华是该所的研究员、博士生导师和研究组长。想要了解他,就得先认识他的研究领域—群体基因组学。据徐书华介绍,群体基因组学是从基因组水平揭示群体的遗传结构和多样性特征并进而研究基因组微观进化机制的一门学科,也可以简单地理解为是群体遗传学在基因组时代的延续和扩展。徐书华的主要兴趣就是研究“混血”人群(也叫混合人群)的群体基因组学。

2011年6月徐书华(左)访问德国期间拜访计算生物所前所长Andreas Dress教授


  徐书华与“混血”人群结缘是偶然的,他对“混血”人群的研究可以追溯到其博士研究生阶段。他的博士论文是利用高密度的常染色体单核苷酸多态性数据研究现代人群的遗传结构,在分析数据的过程中,徐书华注意到了美国黑人的特殊遗传结构,尤其对“混血”人群的连锁不平衡形成机制产生了兴趣,于是对其做了一系列专门分析并写成英文手稿。“当我把论文手稿拿给金力老师看时,得到了他的高度赞赏”。徐书华至今回忆那段经历时仍然感到自豪。关于美国黑人的研究是他第一次与“混血”人群结缘,完成此次研究后,他很快意识到亚洲的“混血”人群基因组研究尚未受到关注,于是便一鼓作气对新疆维吾尔族进行了系统的研究,这也是关于欧亚“混血”人群的第一项群体基因组学研究。最终,关于“混血”人群的研究成为他博士论文的重要组成部分,其中有三章内容是研究美国黑人和新疆维吾尔族的“混血”遗传结构特征和连锁不平衡产生机制。相关研究结果最终分别发表在分子进化领域最具影响力的学术期刊《分子生物学与进化》和人类遗传学领域最具影响力期刊《美国人类遗传学杂志》上。随后他的博士论文也入选复旦大学、上海市优秀博士论文以及全国百篇优秀博士论文。

发现现代人群“混血”普遍性

  2006年,徐书华进入中国科学院上海生命科学研究院工作,继续致力于“混血”人群研究。在金力老师的引荐下,他作为课题组长参与了10个国家共同发起的国际合作计划—“泛亚SNP计划”,在研究设计和科学问题的探讨方面作出重要贡献,并独立承担了几乎全部的数据分析任务和研究报告撰写。2009年相关研究结果最终发表在美国著名综合学术杂志《科学》上。这项研究被《科学》同期配发的新闻评论文章认为是“迄今关于东亚和东南亚人群遗传多样性最全面的研究”。

2011年3月应聘德国马普青年学会和中科院共同支持的青年科学家小组组长


  对徐书华来说,研究中最大的收获是发现了亚洲人群间普遍存在的基因交流,即“混血”的普遍性。这意味着“混血”不是只出现在某些少数人群中的一个特例,而是现代人类群体的常态。为此,尽管《科学》杂志对论文摘要的字数有严格限制,徐书华还是特地在其中强调了该发现,也得到了其他共同作者的支持。虽然在这篇主题为亚洲人群迁移历史的文章中,“混血”的发现似乎被人们忽略,但却更加坚定了徐书华投身“混血”人群研究的决心。
  实际上,徐书华在其博士论文中就已经注意到中国人口最多的民族汉族,本身就是一个最大的“混血”人群,在汉族人群的基因组中可以鉴别出不同程度的周围少数民族的遗传成分,徐书华后续的一系列研究工作正是建立在这一理解上。同年,徐书华与金力教授在《美国人类遗传学杂志》发表了关于汉族人群遗传结构的研究结果,该研究被列为杂志当期“亮点文章”得到编辑的专门点评。

研究“混血”人群的环境适应

  “从基因组多样性和遗传结构的角度,你完全可以把‘混血’人群看成是一个新的人群。”徐书华解释道,“混血人群一般是由彼此隔离分化的祖先人群在近期大规模基因交流产生的。隔离分化几万年的人群,从原世居地迁移到数千里之隔的新地域,他们以及后代必然面临新环境的压力,经受自然选择,也就是混血人群必然要有一个适应环境的过程。”
  实际上,新建立的人群如美国黑人,在遗传结构上显著不同于其祖先人群,并且在新居住地新的环境中经历了上十个世代的适应性演变,成为研究现代人类适应新环境可遇而不可求的天然素材。徐书华正是意识到了混血人群的这一特点,与他指导的博士研究生一起,建立了一种检测自然选择的新方法,利用合作者提供的全基因组数据,首先对典型的近期混合人群美国黑人进行了研究,发现像美国黑人这样的混血人群在混血前后都受到了明显的自然选择。徐书华课题组的研究不但检测到自然选择信号更为可靠,并很好地解释了美国黑人经历的历史和自然环境的变迁。他们发现,很多受自然选择的基因与美国黑人的高发疾病相关,推测这些高发性疾病可能和美国黑人的非洲祖先最近经历的巨大环境变化有关。

2011年10月徐书华(前排右二)在新加坡与HUGO主席Edison Liu(前排左三)及
“泛亚SNP计划”部分合作者留影


  另外,该研究还发现,很多抵抗疟疾的等位基因频率在美国黑人中明显降低,这反映了北美和非洲的不同病原体在人类基因组中留下了显著的但不同的烙印,同时也提示人类生存环境中的微生物群落和体内的病原体可能是自然选择发生的重要推动力之一。相关结果作为方法性论文于2012年3月正式发表在国际著名学术期刊《基因组研究》上。

利用“混血”人群遗传结构特征估计人群迁移和扩张时间

  徐书华近期的代表作之一,便是利用混血人群的遗传结构特征和基因组重组信息,首次从遗传学角度估计了亚太地区分布最广的人群—南岛人群的扩张时间。
  南岛人群是一个根据语言学角度界定的人群,其使用的语言都属于南岛语系。他们在地球上分布极为广阔,东达南美洲西部的复活节岛,西到东非外海的马达加斯加,南抵新西兰,北至我国台湾省。
  从生物学的角度说,与南岛人群相关的科学研究都会牵涉整个亚太地区现代人类的起源和进化,以及现存人群遗传多样性和表型多样性的形成机制等一系列关键且错综复杂的问题。因此,这个庞大人群的起源和迁移,一直以来都是众多考古学家、语言学家、遗传学家关注的焦点。
  早在2009年,徐书华与合作者就在发表于《科学》杂志上的论文中,揭示了南岛人群在遗传学上的共同属性。所谓共同属性,就是指南岛人群共享一种特有的遗传组分,并且相较于外部人群,南岛人群内部的遗传亲缘关系更为紧密。
  但徐书华告诉记者,在生物进化和人类起源及迁移历史研究的首要任务—时间的确定上,有关南岛人群扩张的时间数据和证据,都来自考古和语言学界,尽管遗传学家也进行了大量的遗传学研究,却鲜有强有力的声音。
  徐书华说:“这主要是因为人类在广袤地域上的多方位、多次反复迁移和基因交流,使得根据基于单一遗传座位(如Y染色体和线粒体DNA研究)明确估计人群扩张的时间变得很难。而常染色体由于重组,增加了估计基于突变数据信息时间的难度。人群之间基因的交流和基因组的交换重组,也给人群历史的研究设置了重重障碍。”

2012年1月在印度新德里基因组大会上作学术报告


  不过,徐书华课题组利用人群迁移过程中,由于基因交流而产生的特殊遗传结构,通过计算生物学的手段,推断基因组中的重组信息,巧妙地利用这些“障碍”,首次从遗传学的角度确定了南岛人群在东南亚一带的扩张时间,大约为4000年前。为确保结果可信,徐书华的德国合作者又使用另一套独立数据和不同方法对进行了进一步验证,与考古学和语言学的研究结果吻合。相关研究成果于2012年3月正式发表于《美国科学院院报》上。

新视角,新机遇,新挑战

  “你可能难以想象,我国的藏族也是一个混血人群”。徐书华兴致勃勃地讲起了关于西藏人群研究的故事。“从Y染色体的研究结果来看,藏族人群中至少存在两种主要的Y染色体单倍群,我们用D和O代表。这两个单倍群起源于不同祖先人群,且时间上相差几万年。如果在性染色体上有这么明显的混合迹象,完全有理由相信整个基因组都是混血的。因此,可以肯定藏族是一个典型的混血人群。”徐书华试图更透彻地解释这其中的逻辑推理,“其实汉族这么大一个人群,也是一个混血人群,我在博士论文研究时就已经发现并指出。因此,可以看出混血是多么的普遍,但是这一点往往被人忽视。对于这些我们以为熟知的人群,实际上还有太多我们未知的东西,从不同角度看待他们,就会发现新的问题。从混血的角度探索这些人群的起源、遗传多样性形成和微观进化机制,有深远的进化生物学和医学意义。但一旦决定从新的角度看待和试图解决问题时,将有更多新的挑战等待你。”徐书华补充道。
  我国拥有研究“混血”人群遗传的资源优势,除了考虑到这个思路在国内外仍属空白之外,徐书华更看中的是研究所带来的重大科学意义和价值。未来,他将在总结自身学术背景、研究兴趣和前期工作的基础上,把“混血”人群的环境适应和基因相互作用作为今后5年着重的研究方向,并向国家自然科学基金委和科技部提交了申请。徐书华主要是通过计算分析的手段进行研究,虽然他的研究组已经有十几位成员,但都只从事“干性”(计算和理论分析)研究,他近5年还没有建立“湿性”实验室(实验观测和产生数据等)的计划。他希望先以“干性”研究为主,再通过国内外同行合作,最后做到“干湿”结合,从而系统地研究和解决感兴趣的问题。
  “在计算生物学研究所的框架下,很难像其他‘湿性’实验科学那样争取到足够研究经费来收集样本和产生自己的数据,人们总是认为计算生物学研究只要有计算机就够了。”徐书华显得有些无奈,“在这方面,我的导师金力教授一直给予我很大支持,我很感谢他。但他自己也有一个庞大的研究组需要维持,团队中那么多年轻人都需要发展空间,大家的研究兴趣和方向不一样,关注的问题和侧重点也不一样,我不能期望都按照我的思路来设计实验和产生我需要的数据。目前,我的研究组主要依靠马普学会提供的经费在运转。今后,一方面我会争取更大的国家和地方项目支持,另一方面,我也会寻求更广泛的国际国内合作。”
对于未来,徐书华显得踌躇满志:“我现在已经开始受益于之前国际合作项目建立的网络关系,目前许多研究课题的样本和数据都是国外如德国、印度、马来西亚和韩国等国家的合作者提供的,这种合作关系和范围在不久的将来应该会进一步扩大,也一定会显示出其影响力和优越性。”

2009年10月徐书华(右)在夏威夷参加美国人类遗传学会年会

积跬步,至千里

  从2006年进入中科院工作至今,徐书华在“混血”人群的遗传学研究道路上,已经跋涉了近6个年头,如今他不仅建立了自己的研究团队,还被德国马普学会和中科院选中,成为迄今唯一一位没有海外留学经历的“马普青年科学家小组”组长。德国马普学会是国际知名的从事基础研究的机构,通过与中国科学院30年的合作,德国马普学会已成为中科院对外合作的一个重要伙伴。“马普青年科学家小组”组长的遴选遵循公开、公平、公正的原则,这种人才选拔机制为引进海外优秀留学人员以及促进中科院科研体制改革发挥了重要作用,也为各相关研究所培养了一批青年学术带头人,现任同济大学校长的裴钢院士就是第一位“马普青年科学家小组”组长。
  “一个‘土鳖’博士,在自己的祖国拿着德国人提供的薪水和研究经费进行独立的科研工作,自由探索感兴趣的问题,对我个人来讲是一种荣誉。”徐书华半开玩笑地说,“希望多年以后我的经历,也能成为一个励志故事,得到社会的关注,激励更多的年轻人留在国内工作,同时希望政府在吸引‘海龟’的同时,也给于我们这些‘土鳖’们更多支持。”
  徐书华年仅34岁,却已经是上海市遗传学会理事、多家外国研究机构的学术顾问、教育部自然科学奖一等奖的获得者。他担任过中科院、上海市、国家自然科学基金委等多个项目的负责人,以及国际合作项目“泛亚SNP计划中”的课题组长,完成了一批有影响力的科学研究课题,为他的研究生涯写上了重要的一笔。他的研究成果以第一或通讯作者发表在美国《科学》、《美国科学院院报》、《基因组研究》、《人类分子遗传学》等国际著名专业期刊上,受到国际同行的关注。
  徐书华多次受邀到韩国、新加坡、德国、意大利等多个国家的国际会议作学术报告,他获得过诸多针对青年人才的学术奖励和荣誉,包括中国科学院卢嘉锡青年人才、日本明治乳业生命科学奖、法国赛诺菲—安万特优秀青年人才、上海市青年科技启明星、中科院上海分院杰出青年科技创新人才、2012年度中科院“青年科学家奖”等。这些荣誉对徐书华来讲,是一种肯定,也是一种激励。
  荀子说,不积跬步,无以至千里。累累硕果和光环的背后,没有人知道徐书华为此做过多少次尝试、熬过多少夜、投入了多少时间和精力、又经历过多少次失败。人们总看到你最终的成果和光环,却往往忽视你背后付出的努力和遭遇的挫折。这句话用来形容徐书华,最好不过。