X

王超龙团队重构东南亚土生华人与马来人的混合历史

大家看过电视剧《小娘惹》吗?

峇峇娘惹(Baba-Nyonya),又称土生华人(Peranakan Chinese)或海峡华人(Straits Chinese),是指 15-17 世纪期间由中国移民至马六甲海峡一带的华人后代。有别于 19 世纪末至 20 世纪初下南洋的华人,峇峇娘惹在文化上既保留了中国传统习俗,又深度融合了东南亚特有风俗(图1),并接受大量欧洲西式教育,在东南亚具有举足轻重的政治经济影响力。新加坡开国总理李光耀等众多东南亚政商名流都来自于这个群体。《小娘惹》讲述的,就是这样一个群体。

图1. 东南亚的峇峇娘惹文化: 娘惹菜、传统服饰Sarong Kebaya、传统建筑Baba House的外观及内部。(图片来自互联网)

如今,峇峇娘惹文化已成为东南亚的重要文化标志。东南亚的公众,特别是各华人社群,也越发希望深入了解峇峇娘惹文化的起源。因为欠缺可靠的相关文字记录,土生华人社群对其自身的群体演变一直有不同意见,特别是在其祖先是否曾与东南亚马来人混血这个问题上,尚未达成共识

追溯土生华人的起源,最为人所熟知的传说是,15 世纪时,马六甲苏丹国国王迎娶明朝的汉丽宝(Hang Li Po)公主,而公主的随行人员也一并定居,并与当地人通婚,繁衍生息,成为了今天土生华人的祖先。然而,有关汉丽宝公主的记载仅存于马来史书,而未见于中国史书。更可信的假说是,明朝郑和下西洋之后,随着中国和马来半岛诸国恢复贸易往来,东南沿海的商人南下经商,在马来半岛定居并建立家庭,衍生了土生华人社群。

每个人身上携带了从祖先代代相传下来的大量遗传变异。这些变异在不同人群中的频率存在差异,不仅影响了不同人群中个体的性状差异和罹患疾病的风险,还为反向推断人群的迁徙和混合历史提供了可能性。

2021 年 6 月 21 日,华中科技大学公卫学院王超龙教授团队联合新加坡基因组研究所等多家单位,在新加坡土生华人协会的支持下,合作在Molecular Biology and Evolution发表了题为 Genetic admixture in the culturally unique Peranakan Chinese population in Southeast Asia 的研究论文,首次基于全基因组测序数据重构了东南亚土生华人与马来人的遗传混合历史。

该研究收集并完成了对新加坡土生族群的 177 个样本的全基因组测序(15X),结合团队于2019年在Cell上面发表的新加坡华人、马来人、和印度人的全基因组测序数据【1】(详见BioArt报道:Cell | 王超龙/刘建军合作发表对新加坡三大亚洲人群的全基因组测序研究)以及国际千人基因组数据【2】进行分析,推断其是否有马来血统,比例多大,发生混合的时间以及祖先人群性别构成等。

作者首先进行了群体遗传结构分析。主成分分析PCA)结果显示,虽然土生华人在 PCA 中与华人相近,但其主成分的分布提示了微弱的马来祖源信号(见图 2)。于是,作者进一步用 RFMix方法【3】,量化土生华人的马来祖源比例,并与其他三个华人群体(新加坡华人、中国南方和北方汉人)比较,发现土生华人的常染色体平均含有 5.62%(95%置信区间 4.76-6.49%)的马来血统,显著多于其他三个华人群体(图 3)。这两个结果显示,土生华人确实有显著的马来血统。

图 2. PCA结果显示在排除了离群样本(A)之后,土生华人相比于新加坡普通华人、南方以及北方汉人等具有微弱但是统计学显著的偏向于马来人群的趋势(B, C, D),提示土生华人具有马来祖源。

图3. RFMix分析对比四个华人人群在常染色体(上排)和X染色体(下排)的马来祖源比例(每条竖线代表一个个体,不同颜色代表不同祖源成分)。

其次,由于不同的人群在 Y 染色体和线粒体单倍群(haplogroup)的频率分布上可能有显著差别;且Y染色体只从父系遗传,线粒体只从母系遗传,人们可以依据一个人群的单倍群分布推断出该人群的父系和母系祖源成分。该研究利用全基因组测序产生的Y 染色体和线粒体数据,推断了每个样本的 Y 染色体和线粒体所属的单倍群,并与参考人群进行对比分析。

线粒体单倍群分析结果显示,土生华人的线粒体中同时含有东南亚人群特有的 E 单倍群和在华人中常见但在马来人中罕见的 D 单倍群,可见华人女性和马来人女性均对土生华人有显著的遗传学贡献。作者以此为基础并结合常染色体信息,设计统计方法推断土生华人的女性祖先中有12%(95%置信区间 8-17%,P<0.001)是马来女性,其余来自华人女性。

作者对 Y 染色体单倍群进行类似分析推断土生华人男性祖先的来源。结果显示,马来男性的占比只有 5%(0-9%)且不具有统计学意义(P=0.087),而其余贡献均来自华人男性。因此,在土生华人群体形成的过程中,马来人的遗传贡献绝大部分来自于马来女性。

最后,作者使用GLOBETROTTER方法 【4】 对土生华人基因组进行了深入分析,根据不同祖源成分在基因组上的分布特征推断群体混合历史。结果显示,在土生华人中至少可推断出两次混合事件,其中,新近的混和事件发生在约 190(159-213)年前,参与的祖先人群有两个,约90%来自于一个与现代南方汉人密切相关的祖先人群,另外10%则来自于一个与现代马来人密切相关的祖先人群。这一混和事件反映了土生华人祖先在东南亚与当地马来人通婚的历史。

而另一混和事件则推断发生在1662(1287-1986)年前,约75%的遗传贡献来自于一个与现代南方汉人高度相似的的祖先人群,另外25%则来自于另外一个祖先人群,其遗传特征则与现代马来人、越南京族人和南方汉人关系密切。作为比较,作者对新加坡的普通华人也进行了相同分析,发现普通华人只经历了一个早期混和事件,其发生时间和参与的祖先人群均与在土生华人中推断出的早期混和事件高度一致。

作者认为,在土生华人和新加坡华人中推断出的早期混和事件,反映的是同一事件:由于朝代更迭,自东汉至唐朝期间中原汉人大规模南迁,并与当时生活在中国南部的部落族群融合。值得注意的是,公元 686 年,唐朝中央政府于福建漳州首次建立管治机构。由于该混和事件的祖先人群的遗传特征主要出现在现代马来人、越南京族人和南方汉人中,作者推测这些生活在中国南方沿海的原住民可能属于南岛语系人群(Austronesians)。该人群与大约4000年前从台湾开始逐步向东南亚扩张,最终广泛分布于太平洋和印度洋上的众多岛屿(即著名的南岛扩张事件,Austronesian expansion)。

结合团队前期对马来人的遗传混和历史研究结果 【1】,作者推测,现代南方汉人是中原汉人与早期南岛人群在大约 1612(1345-1923)年前在中国南方发生混和的后代,而现代马来人则是早期马来人与早期南岛人群在大约 1696(1469-1890)年前在马来半岛发生混和的后代。而土生华人的中国祖先来自南方汉人,大约在190(159-213)年前与当地马来人发生混和,但马来血统的占比不超过10%,且绝大部分来自于马来女性(图 4)

图 4. 群体遗传学分析重构土生华人、南方汉人及马来人的混和历史。

该项研究利用全基因组数据和最新的群体遗传学分析方法,重构了东南亚土生华人以及南方汉人的混和历史,揭示了土生华人群体中的马来祖源成分大小,从群体遗传学的独特角度补充并丰富了相关的历史研究。这对于了解东南亚华人的迁徙发展史以及与东南亚原住民的历史互动与交流具有重大参考价值。

华中科技大学公共卫生学院王超龙教授和新加坡基因组研究所的 Roger Foo 教授为论文的共同通讯作者,王超龙课题组博士后巫德刚为第一作者。

原文链接:

https://doi.org/10.1093/molbev/msab187

制版人:十一

转载须知

【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。