近年来,众多临床公共数据库相继被挖掘,激发了大量研究的发表,总有人抱怨「能做的选题都被别人拿去发了,现在根本发不了高分」。
在 UK Biobank 数据库面前,这句话可不成立!光 2024 一年 UKB 数据库就发表了 400 多篇 10 分以上的高分文章呢。
小编粗略浏览了一下 30 分以上的高分文献,挑出了几个 UKB 数据库专属的【高分指标】,今天先为大家分享最贴合现代人运动习惯的——可穿戴设备测量的剧烈运动(VILPA/VPA)。
3 篇高分文献分别发在 58.7 分的 《Nature medicine》、22.5 分的《JAMA oncology》和 25.4 分的《Lancet Public Health》上,让我们来快速学习一下吧!
1. 共同暴露因素:
可穿戴设备测量的剧烈运动(VILPA/VPA):所有研究都关注了通过可穿戴设备测量的剧烈间歇性生活方式体力活动(VILPA)或剧烈运动(VPA)。这些活动通常是在日常生活中进行的短暂(例如 1~2 分钟)高强度活动,如快速步行或爬楼梯。
2. 结局指标:
《Nature medicine》(IF 58.7):全因死亡率、心血管疾病(CVD)死亡率和癌症死亡率。
《JAMA oncology》(IF 22.5):癌症发病率,特别是与体力活动水平低相关的13种癌症部位的复合结果。
《Lancet Public Health》(IF 25.4):全因死亡率和主要不良心血管事件(MACE),包括心肌梗死、中风、心力衰竭等。
3. 可穿戴设备检测的数据处理
加速度计数据:所有研究都使用了腕部加速度计收集的数据,这些设备连续记录高分辨率的活动模式。
活动强度分类:使用随机森林「Random Forest」机器学习算法对活动强度进行分类,将活动分为不同类别「如久坐、站立、步行、跑步/高能量活动」。
活动持续时间标准化:对于持续时间不超过 1 分钟或 2 分钟的活动,研究者将原始活动持续时间标准化为 1 分钟或 2 分钟的分析单位,以便于分析。
4. 研究方法
均使用 Cox 比例风险模型估计全因死亡率的风险比(HR),使用 Fine-Gray 亚分布风险模型分析 MACE,考虑非心血管死亡作为竞争风险。在分析中调整了年龄、性别、体力活动强度、吸烟、饮酒、睡眠持续时间、教育水平、家族病史等多种混杂因素。
剂量-反应分析:评估 VILPA/VPA 的日平均持续时间和频率与结局指标之间的剂量-反应关系。
5. 研究结论
《Nature medicine》(IF 58.7):即使是少量的 VILPA 也与显著降低的全因、心血管疾病和癌症死亡率相关。VILPA 的样本中位数频率和持续时间与降低死亡率风险相关。
《JAMA oncology》(IF 22.5):少量的 VILPA 与降低的癌症发病率相关,尤其是与体力活动水平低相关的癌症部位。每天 VILPA 的中位数持续时间与降低癌症风险相关。
《Lancet Public Health》(IF 25.4):VILPA 与降低的全因死亡率和 MACE 相关。特别是 1~5 分钟的 MV-ILPA 与 5~10 分钟的 MV-ILPA 相比,风险降低幅度相似,且优于少于 1 分钟的MV-ILPA。
不难看出这几篇高分文献所用的分析方法和得出的结论都大同小异,但还是可以发高分,归根结底还是因为暴露因素太「能打」。毕竟对于普通临床医生来说,想追踪「可穿戴设备测量的剧烈运动」这样的数据可不简单,尤其这个样本量还能数以万计!
要想获得这类高端健康跟踪数据,估计只有 UKB 数据库能够满足。除了 VILPA 这样的数据,UKB 数据库的变量丰富程度真的令人咋舌(小编内心:英国佬还是很舍得花钱啊!)。
国内各大机构开始布局
目前,国内已有超过 400 个团队成功购买了 UK Biobank 数据库的使用权。这些团队不仅包括了 985 和 211 工程中的顶尖高校和大三甲医院,还有许多具有敏锐科研洞察力的普通高校和地方医疗机构。例如,扬州大学、宁波大学、嘉兴学院、遵义医科大学和浙江中医药大学等均已成功申请并购买数据。
更有前瞻性的医疗机构,如吉林大学第一医院,已经以医院研究部的名义购买数据,并鼓励院内所有医生积极参与数据挖掘,共同推动科研创新。
想知道自己的单位有无 PI,且对应 PI 已发表文献,可参考下列操作,立马查询:
UK Biobank 数据库收集了 50 万英国参与者的生物遗传和健康信息,包括但不限于:精神健康、脑部 MRI、认知测试、颈部超声、心肺功能检测、心脏 MRI、身体活动记录、血液样本中的基因、 生化指标、蛋白质等数据;另外还有关联的疾病诊断、入院登记、癌症或者死亡登记的等。变量十分丰富,几乎可以覆盖临床全科室挖掘。
除了其庞大的规模和深入的参与者信息,长期的跟踪随访让这个数据库的含金量不断攀升,定期会有新的调研项目加入,并公布最新结果。
例如,2014 年加入了「24 小时饮食回忆的营养数据」,2016 年引入了「佩戴穿戴设备后的身体活动数据」,2017 年新增了「腹部 MRI 数据」,2019 年更新了「基于算法得出的多种疾病健康结果」,2020 年新增了「COVID-19 测试数据和原始颈动脉超声数据」,2022 年又更新了「SARS-CoV-2 血清学数据」等。
从样本体量、队列的持续追踪、检查指标的全面性、项目的创新性以及数据收集的规范性等多个维度来看,UK Biobank 无疑具有显著的优势。作为当前顶尖的公共数据库之一,使用其高质量数据进行科研,自然更有可能获得显著的研究成果。
编辑:ifhealth 来源:丁香园