▲毛琛在授课中
每天傍晚,如果没有特别紧要的事,毛琛都会绕着校园散步1个小时,步数基本保持在七八千步。这个时间和步数是经过他日常观察分析得出来的。
就像医学知识融入他的生活一样,作为南方医科大学公共卫生学院二级教授、流行病学系主任、教育部“青年长江学者”(健康医疗大数据岗),毛琛也将基于健康医疗大数据的流行病学研究成果融入大众的生活。
看电视或听广播可以降低我国高龄老人死亡风险,坚持有氧运动对老年衰弱的预防作用在高遗传风险人群中更强,日常补充鱼油有助于降低心血管疾病发生及死亡风险……通过研究,解决与人们日常生活息息相关的各种疑问,这是毛琛和团队正在做的事。
在毛琛看来,可能就是这些“接地气”的研究打动了树兰医学奖的评委。去年底,他摘取了第九届“树兰医学青年奖”桂冠。
“树兰医学奖锁定的是医药医学前沿以及对原始性突破性创新成果进行培养和奖励的理念,这对我是一个很大的鼓励,让我更加明确,贴近普通公众生活的研究方向没有走错。”毛琛说。
关注日常生活 回应热点疑虑
2月8日,是南方医科大学结束寒假、正式开学的第一天,毛琛早早来到办公室。
今年40岁的他穿一件双排扣格子西服,利落的短发油亮服帖,一副无框眼镜架在挺拔的鼻梁上。他安排分管的科室人员做好清洁卫生,检查实验室安全,尤其重视健康医疗大数据超算平台设备的运行保障。
“这个超算平台混合精度算力达1104.3Tflops、存储容量达1200TB ,将来大有可为。”毛琛介绍,团队在队列研究方面已取得不少成果,他们的科研目标很明确,一是对日常生活有指导,二是回应社会热点疑虑。
“我们的队列研究多是真实世界的数据,有些暴露因素是人们的生活习惯。去年有一篇关于喝咖啡的论文,没想到成了‘网红文章’。刚一发表,就接到很多媒体的电话。”毛琛说,许多研究表明咖啡可降低死亡风险,然而并不清楚在咖啡中添加糖和人工甜味剂是否会减少这种潜在的好处。
对此,毛琛团队依托国家卫健委国家健康医疗大数据研究院和南方医科大学健康医疗大数据超算平台,基于50万人群的超大规模队列开展此项前瞻性研究。他们分析了英国生物样本库(UK Biobank)中171616名没有心血管疾病或癌症的参与者,通过健康行为问卷的数据来分析消费加糖咖啡、加人工甜味剂咖啡和不加糖咖啡与全因死亡风险、癌症和心血管疾病相关死亡风险间的关联。在7年的随访期间,共记录3177例死亡,其中包括1725例癌症死亡和628例心血管疾病死亡。
该项研究成果于2022年5月31日在国际权威医学期刊《内科学年鉴》(Annals of Internal Medicine)在线发表。明确每天喝2.5-3.5杯(每杯约250毫升)无糖咖啡可降低全因死亡风险29%;每天喝1.5-2.5杯加糖咖啡可降低全因死亡风险31%。
毛琛说:“我们的研究证据链完善、研究对象样本量大、代表性好,结果比较中肯。喜欢喝咖啡的人看了我们的文章,说是有了个定心丸。”
在研究新冠病毒传播风险中,毛琛团队同样将其追求的科研目标贯穿始终。2020年3月,新冠疫情进入平稳期,广东着手准备复工复学工作,但无症状感染者和境外输入病例有增多之势。上班上学乘坐公共交通会不会被感染?无症状感染者会不会引起疫情的暴发?引起大家疑虑。
毛琛带领团队与病毒和时间赛跑,迅速完成深圳某科技集团18万名员工和广东省4所高校5万余名学生的线上流行病学调查和调研报告撰写,实时收集粤港疫情监测资料,撰写研判报告5期。
在与广州市疾控中心合作的研究中,他们发现,2020年1月13日到3月6日期间,广州市追踪到的3410例密接者,接触场景不同,传播风险有差异。家庭接触是最常见的传播方式,传播风险最大,二代续发率最高(10.3%);而医疗机构暴露(1.0%)和公共交通工具暴露(0.1%)的传播风险较小,为复工复学提供数据支持及政策制定依据。
该研究评估COVID-19病例疾病不同严重程度的传播风险,发现疾病越严重,有发烧、咳嗽的病例传播风险越大,该结果支持了世界卫生组织的观点,即无症状感染者不是疫情动态的主要驱动因素,这为全球抗疫贡献了中国证据。
“作为一名流行病学专家,建议被采纳,为疫情防控出了力,挺有成就感。”毛琛说,这是从事流行病学研究以来让他感到最有价值的一件事。
▲毛琛(左一)为学生解疑释惑
深耕数据 寻找中国证据
“思维严谨,坐得住。”是毛琛的博士生导师、南方医科大学教授陈清对他的评价。毛琛对着电脑进行数据分析,可以从早坐到晚,不挪窝。
出于对数据的敏感,毛琛的才华很早就显露出来。2010年,读博二的他,成功拿到香港中文大学公共卫生及基层医疗学院研究助理的职位。
“在那边看了很多英文专著,拓展国际视野,也加深了对流行病学知识的认识。”毛琛说,对他而言,最难的是英语口语。因为要英文授课,毛琛逼着自己开口练习。聘请一位英国人当外教,每个周末一对一练习;天天晚上找学生练听说。大概一两年后,他就可以比较自信地登上讲台。
毛琛的能力提升很快,到香港的第三年,不到30岁的他,就成为研究助理教授、博士生导师。
“流行病专业研究需要大型人群队列,广东的资源更丰富。”2017年,毛琛全职引进至南方医科大学。也是从那时开始,他的研究路径从循证医学向健康医疗大数据分析延续、拓宽。
健康医疗大数据研究面对的分析数据体量非常大,对复杂因果推断具有较好的论证强度和检验效能,但同时也让研究使用者面临更多挑战。
在对“鱼油补充剂的使用与心血管疾病及全因死亡结局的关系”研究中,毛琛团队就遇到数据维数高、变量筛选难等问题。构建新的数据处理模式成为他们破解“卡点”问题的利刃。最终,研究成果在《英国医学杂志》(The British Medical Journal)发表,给出“日常补充鱼油有助于降低全因死亡、心血管死亡和心血管事件发生风险”的答案。
凭借着对选题价值的准确认识、过硬的数据分析和解读能力,以及逻辑严密的医学因果推断,毛琛的很多研究在顶级国际期刊发表,受到业界认可。
“健康医疗大数据是在公共卫生、临床诊疗、生物医药研发等健康医疗领域形成的多维度、大体量、高价值的数据,探索潜力巨大。”毛琛认为,随着健康医疗大数据的种类不断扩增,需要设计不同的研究方案来处理结构相异的数据。由于系统偏倚、信息偏倚以及混杂偏倚的存在,研究人员更应重视研究设计、因果关系判断的基本要素,实现数据收集与处理的规范化,以确保结论的可靠性。
毛琛深知,要在健康医疗大数据领域深耕,必须寻找中国证据。
近年,他作为主要申请者,依托南方医科大学建设国家健康医疗大数据研究院和人才培训示范基地;主导和参与建设多个大型人群队列,并与国内外研究团队合作,整合包括中国老年健康调查在内的9个队列资源,建成聚焦慢性病的全球大数据集成平台,有序推动平台资源集成与数据创新应用。
科研有成有败 更享受探索过程
毛琛的博士生陈沛良记得,第一次见到毛老师是在2018年初的一个讲座上。讲台上的毛琛看上去非常年轻,说话亲切,总是一脸笑容,讲座内容新鲜有趣,包含大量实例,很吸引人。
加入毛琛科研团队后,陈沛良逐渐发现,毛老师非常严格,做事雷厉风行。新冠疫情初期,在毛琛的指导下,团队用一周的时间完成“不同场景下新冠肺炎密切接触者的感染风险、无症状感染者的传播风险”论文撰写,投稿到《内科学年鉴》,修回了4次,对审稿人问题的回复达几十乃至上百页。
“老师很看重研究的质量,不断地提问,让我们思考如何去做质量控制。”陈沛良说,在参与中国老年健康调查的过程中,他们发现,之前调查的部分数据没有办法实现随访,如电话错误、地址搬迁,无法再找回被调查的对象。为了避免再次出现此类问题,他们在调研前编制质控手册、开展调查员培训,录入数据时两人核对,后期抽查复核。这一系列做法牢牢把控了数据的真实性和准确性。
在数据分析中,学生经常容易对因果关系产生错误的理解。
一次一位学生很兴奋地跟毛琛说,他发现老年人不能戒烟戒酒,戒烟戒酒会增加其死亡风险,而不是降低死亡风险。毛琛仔细观察数据后,认为学生没有控制好干扰因素,这些老人是因患有比较严重的疾病而戒烟戒酒的,不是戒烟戒酒导致老人死亡,而是比较严重的基础疾病导致死亡。这时,学生才明白,自己得出的关联是一种虚假关联。
“同样是数据分析,学医的和学数学的不一样,咱们要从医学背景进行因果推断。”毛琛用鸡叫和天明的关系打比方跟学生解释,“阻止鸡叫,不能延迟天明。不是所有数据都有因果关系。”
数据分析、医学因果推断、沟通能力……在陈沛良看来,跟老师学到的东西很多,而最让他佩服的是,老师在科研过程中的“平常心”。
今年春节前,毛琛团队积极申报一个多维信息采集和分析技术相关项目。大年二十六,团队成员还在修改精心制作的汇报PPT,一直奋战到凌晨3时。大年二十八,毛琛出现在北京的答辩现场,对评审老师的问题都予以了翔实的回答。但是项目最后没有通过。
“这是很正常的事,不会对我们打击非常大。科研有成有败,不断探索才能发现其中的乐趣。”毛琛说。
未来5到10年,毛琛团队最重要的工作是基于深圳1700万人的超大规模数据队列研究。“这个数据可以回答很多问题,比如深圳的基层公共卫生服务做得好不好,高血压、糖尿病的控制率高不高,薄弱点在哪。深圳卫健委可以根据调研报告对各区做出有针对性的指导,提高对高血压、糖尿病患者的管理效率、达标率。这是我一直想做的事。”
通过深圳的队列研究,毛琛还将打造大数据研究院的全国样板,为解决全球重大科研争议提供中国方案。
阶段性目标、长远规划,毛琛一步一个脚印,扎实向前。正如他对学生所说:“要有追求、有目标,想要成为什么样的人,是对自己的一个整体规划。对人对事的态度,会决定一生的成败。”
人物名片:
毛琛,1983年生,流行病学专家。生于安徽省砀山县。2011年博士毕业于南方医科大学流行病与卫生统计学专业。现任南方医科大学公共卫生学院副院长、流行病学系主任、二级教授;教育部“青年长江学者”、广东省珠江学者特聘教授,国家卫健委国家健康医疗大数据研究院和人才培训示范基地主要负责人,国家自然科学基金委会评专家。获第九届“树兰医学青年奖”、第二十四届“广东青年五四奖章”。担任中华预防医学会流行病学专委会委员及青委会副主任委员、《中华流行病学杂志》编委、《中华疾病控制杂志》副主编等。长期致力于开发改进复杂高维、多组学数据挖掘和多源异构大数据融合方法,系统开展基于健康医疗大数据的重大慢性病和传染病流行病学研究。以通讯/第一作者在BMJ、Ann Intern Med、中华医学杂志等发表中英文论文90余篇,2篇ESI高被引,3篇获F1000推荐;主持国家级项目5项。