作者:陈莫伊
编者按
我们的寿命多大程度是由基因决定的?相信很多人都对这个话题感兴趣。最近,科学家们给出了一个新的估计:答案是,只有16%。
最新刊登在Science上的一项研究发表了可能是有史以来最大的家谱:这一里程碑式的数据集关联了有血缘或婚姻关系的1300万人,平均跨越11代。而正是基于这一庞大的家谱,科学家们得出了以上结论。
在这篇题为“Quantitative analysis of population-scale family trees with millions of relatives”的论文中,哥伦比亚大学的计算生物学家Yaniv Erlich及其同事分析了这一家谱上的人的出生和死亡日期,并评估了如果他们是近亲,是否更有可能死于相似的年龄。
结果显示,遗传只解释了这些人寿命差异的不到五分之一。大部分的差异都归结于其他因素,如,人们的居住地和生活方式。同时,研究还表明,影响长寿的基因是独立起作用,而不是相互作用。
Erlich说:“‘好的’基因可能会使一个人的寿命平均延长5年,但一些环境因素对长寿的影响更大,例如,吸烟能够减去10年寿命。”
尽管先前科学家们已经怀疑,环境对人类寿命的影响要大于基因(2001年的一项研究曾估计,基因决定了人类寿命变化的约四分之一),但这项新成果表明,基因的作用可能比研究人员想象得更少。对于致力于寻找长寿基因的科学家们来说,这意味着,实现他们的目标或许要加困难了。
庞大数据
事实上,遗传学家们利用家谱来研究遗传特征如何影响性状(如,疾病风险)已经有很长时间了。但是,要形成包含大量人口的家庭记录数据集,成本很高,且难度很大。目前,有很多科学家小组正在开展相关研究,其中,一些已经鉴定出了与癌症和阿尔茨海默症等疾病相关的基因。
Erlich的研究使用的是来自在线家谱工具Geni.com(全球最大的合作家谱网站之一,用户在Geni上分享他们的家谱)的数据。他现在是Geni母公司MyHeritage的首席科学官。
Erlich关于这一研究的最初想法要追溯到7年前。当时,他通过Geni.com从一个远房亲戚那里收到了一封电子邮件,然后联系了该公司的首席技术官,获得了下载该网站上数千万公开资料的权利。这些资料包括用户的姓名、性别、出生日期和地点、死亡日期以及直系亲属,但没有DNA信息。最终,他们分析了来自约8600万人的数据。
加州大学旧金山分校的计算基因组学专家Atul Butte说:“这种级别的参与者数量是疯狂的。科学家们也只能通过众包(crowdsourcing)获得这样的数据集。这真是太令人印象深刻了。”
其他发现
除了调查基因和环境对寿命的影响,Erlich团队还利用这些数据分析了人们移民和结婚的模式。结果发现,在1750年之前,数据集中的大多数美国人和欧洲人,都与“居住在离他们出生地最多10公里处的人”结婚。到1950年,大多数美国人和欧洲人都要到离家至少100公里的地方去寻找配偶。
Erlich说:“所有这些都有助于我们理解基因是如何在一个地理区域内传播的。”他还表示,目前的这些发现仅仅触及了这一庞大家谱潜在用途的表面。现在,他的团队已经开始利用一个叫DNA.Land的网站来进一步研究这一家谱。在DNA.Land上,用户会分享他们的DNA基因分型数据(这些数据来自一些公司提供的消费者DNA测试服务,如23andMe、MyHeritage),并填写健康调查。
意义重大
未参与该研究的昆士兰大学遗传学家Peter Visscher说:“这项研究非常聪明地利用众包数据来解决许多有趣的科学问题。如果能够它能够与健康信息联系起来,探究基因在疾病中的作用,那么将带来更大的意义。”
犹他大学的遗传学家Lisa Cannon-Albright则表示:“Erlich等的发现证明了极大家谱的力量。这类资源将是未来遗传学研究一个强有力的部分。”
此外,牛津大学的人口统计学家Melinda Mills认为,对于公众科学(citizen science)来说,这是一个激动人心的时刻。该研究很好地展示了数以百万计的普通人如何对科学产生影响。
原标题:Science重大成果:我们的寿命多大程度由基因决定?只有16%!
参考资料:
World's largest family tree reveals environment’s influence on lifespan
Thirteen million degrees of Kevin Bacon: World’s largest family tree shines light on life span, who marries whom
Crowdsourced family tree yields new insights about humanity