人类的祖先来自哪里?现代人类的祖先在最近100万年内是如何进化的?这些“解码过去”的研究,中国科学院上海营养与健康研究所研究员李海鹏一做就是快30年。
就在一年前的9月,李海鹏研究组与华东师范大学脑功能基因组学研究所潘逸萱研究组合作的研究成果在线发表于《科学》(Science),论文的结论是在90万年前左右,人类祖先的群体数目下降到1000多人,这个群体瓶颈维持了至少10万年。
这一研究首次精确解析了百万年内人类远古群体数量变化历史,为实现重大慢病防治的“关口前移”奠定了理论基础。
近日接受第一财经专访时,李海鹏表示,由于进化基因组学涉及生物进化的两大核心概念——遗传变异和自然选择,因此,不仅可以通过与数学、计算机多学科交叉的方式“解码过去”,同时还能通过“编码”在一定程度上预测未来。
“接下来我们工作的一个重点,就是合作研究远古群体瓶颈导致的现代人群整体2型糖尿病患病风险,并通过精准溯祖计算合作揭示肿瘤的演化,从而进一步抢占科技制高点。”他告诉记者。
研究成果用于糖尿病防治
走进李海鹏的办公室,就像进入了一个微缩版的小森林。入口是繁茂的爬山虎,窗外伫立着毫不惧人每天定点来他这儿进食的小松鼠,办公桌前各式各样的动物摆件,和鱼缸里几尾鱼儿相映成趣。
“我从小就特别喜欢生物,所以念大学专业就选了生物。”进入大学后,他又发现相对于幼年曾经痴迷过的Apple II,计算机有了巨大的变化,从而又赶紧学起了计算机。这样的经历也让他自然而然从事了如今的工作——从数学和计算的视角解析与基础研究、社会生活相关的重要生物学问题。
去年9月1日,李海鹏研究组与潘逸萱研究组合作的研究成果上线《科学》(Science)(点击可看文章),创建了快速极小时间溯祖(FitCoal)新理论和方法,并通过分析公开基因组数据,首次发现了人类祖先由于气候变化等原因曾经历严重的群体瓶颈,近乎灭绝。
这项研究揭示的群体瓶颈代表了所有现代人类的祖先,在一个很短的时间内快速丧失了98.7%的成员个体,在此后长达11.7万年的时间里,人类祖先平均成年个体数仅为约1280。
这一发现,也解释了非洲人类祖先化石的缺失环节,并与非洲直立人化石的消失、新的古人类物种的形成、两条古人类2号染色体的融合阶段相对应,表明了该群体瓶颈对人类进化具有极其关键的影响。
谈及他十年前为什么要启动这个项目,李海鹏解释道,人类群体数量的变化,其实反映了远古生态环境或者说近期经济活动的变化,是一个非常重要的科学问题。
“100多万年前人类祖先的进化,对于我们现代人的形成是非常重要的,这个时间段决定了如何从直立人一步一步形成现代人类,即智人。”他说,从遗传学方面入手的人类进化已经做了40多年了,包括帕博教授被授予诺贝尔奖的古DNA工作,这些工作都集中研究最近十万年之内的人类进化,而现代人是20万~30万年前形成的,所以这些工作均不涉及任何的物种形成。尽管把研究的时间尺度放大到10万~200万年前是极其重要的,但这对数学模型和计算精度提出了相当高的要求,“科学意义很重要,同时这个方向又没有人去研究,也没有人能够做到”。
更重要的是,“解码过去”的同时还能“编码未来”,以他们团队正研究远古群体瓶颈导致的现代人群整体2型糖尿病患病风险为例,就和远古人类的基因突变息息相关。
他解释道,93万年前人类祖先经历的严重群体瓶颈期,很可能是因为彼时的人类祖先经历了严重的饥荒,很可能节俭基因的适应性进化曾帮助人类祖先度过了危机时刻。“现在的人类作为这一小群体的后代,都携带了这些基因突变,让人类可以非常高效地吸收和储存能量,同时也带来了糖尿病的整体致病风险。”
所谓现代人群整体2型糖尿病患病风险,是指在同样的生活条件下,因为所有的人都携带同样的节俭基因突变型,所以都有一定的概率会患上糖尿病,“这个时候通过关口前移来预防糖尿病,就会对糖尿病的防治起到一个非常高效的促进作用”。他对第一财经透露,目前正在和华东师范大学合作,尝试形成理论—机制—临床再到理论的研究闭环,更好地帮助整个社会进行糖尿病的预防和治疗。
由于研究需要分析大量的数据,李海鹏强调了计算机和数学的关键作用,以及人工智能技术在项目中的运用。
“从我2007年回国的时候,就开始运用AI了,主要用于解决群体遗传学的重要问题。比如说我们一个研究项目是开发估计遗传重组率的新方法,牛津大学曾经开发了一个被普遍使用的分析方法,但他们的分析方法比我们慢至少30万倍。基于普通单核计算,常见大小样本的分析很可能要等一年半的时间,但基于我们AI的分析新方法,倒杯咖啡的时间就计算出来了,而且计算结果同样精准。”李海鹏说。
对科研人员的资助面要广
虽然FitCoal新理论和方法如今已经应用到生命健康领域的问题解决中,但是这项从2013年起开展的研究也曾在中途遭遇了极大的低谷,甚至有夭折的风险。在李海鹏看来,兴趣爱好是支撑他坚持下来的一个重要动力。
“从我自身来说,是把科研作为一个兴趣爱好来做的,我喜欢解决别人从来没有想到,或者解决不了的难题。平时我除了锻炼、接送孩子和带他出去玩,基本都在办公室,因为这就是我最喜欢的事情。”李海鹏说。
在从读书时一路获得多项资助的李海鹏看来,如今的科研环境相比几十年前已经进步了很多,但同时,年轻人的压力也变得更大。
日前,国家自然基金委公布了关于2024年国家自然科学基金集中接收申请项目评审结果的通告。
结合前几年的资助数据来看,2024年面上项目的资助率,由2023年的16.99%跌至今年的11.66%。青年科学基金项目的资助率也在去年的基础上有所下滑,由去年的17.04%跌至今年的15.54%。申请量逐年升高的背景下,基金申请的难度仍在加大。
李海鹏说:“拿基金委的面上项目资助来说,假设15万科研人员每人每年平均花一个月去准备项目申请,那么面上资助率每下跌5个百分点,就意味着7500个月(每年)的科研时间就额外损失了。”
他告诉记者,这些年基金委整个资助总额在不断增长,也代表了国家愈加重视在科技方面的投入。但在他看来,当经费总额度不变的情况下,还应该增加额度不太大的项目资助数,减少重量级金额的项目投入数。“大笔经费的重大项目当然也很重要,但是如果项目数太多,在不增加资助总额的时候,就会挤占其他项目的经费,会影响到科研活动和布局。”
他举例道,一个1亿元的大项目经费,就可以分成多个50万的“面上项目”。“因为创新的科研活动具有不可预测性,如果能预测到科研产出,严格意义来说不叫创新。”
李海鹏认为,如果增加这些较小额度的项目,从概率上讲,有可能让某一个团队在产生了新思想的时候,在这个小额的资助力度下把事情的雏形做出来。
“如果一个科研人员是因为自己的兴趣爱好来投入到科研工作中,他不会看项目经费的多少来决定自己的投入。就好比一个爱钓鱼的人,不会因为自己手里的鱼竿设备不好就放弃钓鱼,即使他拿着竹竿,他钓鱼的兴致也不会减少。通过这种自发的喜欢去做的科研活动,结合国家需求,能够做出来真正意义上的创新。”李海鹏说。