该方向旨在针对健康人群、高危人群或临床患者人群等关键场景,建立串联、加值、对标国际、长期追踪、且包含多维度信息的大型前瞻性人群队列,涵盖流行病学数据、临床数据等数据库和组织样本库,以重大平台突破重点、带动整体。实验室自成立以来,陆续开展了与健康浙江百万人群队列建设相关的一系列关键工作,制定了覆盖项目全链条的标准化操作规程和质量控制手册;建设了基于体检数据的百万级健康医疗大数据平台,开展了一系列数据安全存储、隐私保护、高效管理以及质量控制等方面的研究,并开展了初步的数据分析工作;建设了标准化、智能化、高质量的生物样本库,配备了48台超低温冰箱(共288万样本量)、样本库管理系统等;初步组建了社区健康人群、高危人群和临床患者人群等示范队列;对如何与各省市和地区的相关部门合作以高效获取人群随访数据以及建立队列随访系统做了广泛而又深入的探索。
1.健康医疗大数据平台建设
基于浙大附属医院的历史性体检数据库,实验室搭建了健康体检大数据平台(2008年至今),已开展数据安全存储、隐私保护、高效管理以及质量控制等方面的筹备工作,并制定了一系列操作规程和质量控制手册。
2.标准化高质量的生物样本库建设
实验室建设了标准化、智能化、高质量的生物样本库,现已配备48台超低温冰箱(共288万样本量)、样本库管理系统等,并正在建设自动化样本库。目前为止,实验室已在内部服务器上完成了BMP样本库管理系统的安装部署,根据实际工作需要进一步完善项目、储存容器、样本类别的各项配置。实验室也组建了生物信息数据(特别是基因测序数据)存储及管理系统,高通量信息数据传输专线,以及三组数据分析计算专用高性能服务器集群。此外,实验室还建立了生物样本库信息化平台运行管理和质量控制体系,依据不同的生物样本类型,建立完善的生物样本质量管理体系,推动临床生物样本库,从以存储样本为中心的实体型建设转化为存储样本与数据并行的新型信息化生物样本库,该体系将作为健康浙江百万人群队列的重要基础构成。
3.以场景为主线的人群队列建设
(1)社区健康人群队列
实验室在杭州和兰溪等地区设立了队列研究试点并成功开展了自然人群队列(体检人群及社区人群等)的招募工作,这些基于社区人群状态的队列研究将有助于全面的跟踪、探索人群健康状态的转变和疾病的转归。其中,兰溪多维队列已纳入近4.8万人,并从多个维度采集医疗健康大数据,进行多尺度分析与研究。该队列的主要研究目标是通过建立大型多场景人群队列,以大数据为基础、循证医学为证据、人工智能为工具,做好精准预测、预防、诊断和治疗慢性病,建立提升全域全民全生命周期的健康管理平台,科学分析影响兰溪市城乡居民健康的关键因素,发现可改变的慢性疾病的危险因素,为在人群中开展更加精准的防控策略措施提供依据,降低社会卫生经济负担。
(2)高危人群队列建设
实验室综合国内与国际权威的慢性病风险预测模型,基于上述健康体检大数据平台,以癌症和代谢综合征为切入点,开展了高危人群的筛选工作。实验室目前已开展了代谢综合征以及三个癌症(肝癌、肺癌和胃癌)的高危人群队列研究,收集生物样本并进行详细的流行病学问卷调查,采用现场与电话随访相结合的方式对纳入人群进行定期随访。随后,实验室研究团队采用流行病学研究、多组学研究等多种方法从多个维度探索癌症发生发展的相关因素,助力癌症的早期预防、早期诊断和个性化治疗,最终达到降低癌症发病率和死亡率的目的。
(3)临床患者队列建设
实验室目前已成功建立了肺癌、肝癌、肾癌、骨癌四个癌症的专病队列以及代谢综合征慢病专病队列,并基于此类癌症和慢性病人群队列,开展定期随访、生物样本采集、流行病学问卷调查等工作,并结合其临床病历资料对病理特征、治疗方式及预后信息进行数据的整理及分析。实验室研究团队从流行病学研究、多组学研究等多个维度探索癌症及常见慢性病(如糖尿病、心血管疾病等)发生发展的相关因素,助力癌症及慢性病的早期预防、早期诊断、个性化治疗和预后改善,最终达到降低发病率和死亡率的目的。
(4)高效、可推广的队列随访系统
实验室以美兆健康人群队列为参考,并进一步结合队列基础、人群特点、区域信息化水平及可用的数据开发平台,通过多种途径规范化高效获取队列人群的死亡、发病、预后以及环境暴露、人口迁移和失访等健康医疗大数据,正在研究构建高效、可推广的人群队列随访系统。目前,实验室团队已开展了与省公安厅、省大数据局、省医疗保障局以及多个地市相关政府机构的合作,获取队列参与者的各项信息。未来将争取与包括肿瘤登记、慢性病监测、死因监测平台等在内的多级数据库对接,并与各级医保数据库、居民健康档案数据库等高效互联。此外,团队积极开展了通过公开数据库等途径获取队列参与者相关暴露信息的研究。