本文是专业学术论文解读,不做医疗建议。
近日,美国斯坦福大学James Zou教授团队和 Emmanuel Mignot 教授团队所打造的 SleepFM AI 模型只需用户一个晚上的睡眠监测数据,就能预测多种疾病风险。
Emmanuel Mignot 教授是睡眠医学领域的世界级专家,James Zou 在 AI 和生命科学领域深耕已久。
(来源:资料图)
他们所打造的这款模型基于大约 6.5 万人、58.5 万小时的睡眠记录训练而来,可以评估全因死亡、痴呆、心梗以及包含部分癌症在内的大约 130 种疾病,预测性能C 指数多数在 75% 以上,是睡眠医学与 AI 结合的重要突破。(注:C 指数(C Index)是衡量模型能在多大程度上准确判断谁比谁更早生病或死亡的指标。)
举几个数字:预测全新死亡率,准确率达到 84%;预测痴呆症,准确率达到 85%;预测心肌梗死,准确率达到 81%。这些数字在医学预测领域属于相当高的水准。
如前所述,SleepFM 接受了超过 58.5 万小时睡眠数据的训练,涵盖了 6.5 万名不同年龄、不同健康状况的参与者,等于它见过各种各样的人的睡眠质量,也等于知道了这些人后来都生了什么病。
简单的一个睡觉为何可以看出这么东西?睡眠不是简单的休息,是一个极其复杂的生理过程。你的大脑、心脏、呼吸系统、肌肉,在睡眠中会展现出丰富的活动模式。这些模式就像指纹一样,藏着大量关于健康状况的信息。
(来源:https://www.nature.com/articles/s41591-025-04133-4)
SleepFM 同时分析了四个维度的信号:脑电波(EEG)、心电图(ECG)、肌电图(EMG)和呼吸信号。它不仅看某一个单一的指标,也把所有这些信号融合在一起,从整体上去理解一个人的睡眠状态。
此前医疗机构已有不少睡眠监测设备,但是有的通道多,有的通道少,有的测这个,有的不测那个。SleepFM 则采用了一种通道无关的设计,不管你有几个信号通道、顺序如何排列,它都能处理。
在具体任务上:
SleepFM 能够把整晚睡眠分为清醒期、浅睡期、深睡期和快速眼动期,F1 得分在 70%到 78%之间,和当前最专业的睡眠分期模型 U Sleep 不相上下。(注:F1 得分是衡量模型分类准确性的综合指标,兼顾了模型判断得全不全和准不准。)
(来源:https://www.nature.com/articles/s41591-025-04133-4)
对于睡眠呼吸暂停的情况,SleepFM 在判断有无中度到重度呼吸暂停的准确率上达到 87%。
这些能够固然重要,但让人眼前更加一亮的是疾病预测。研究人员把 SleepFM 的预测结果和两种基线模型做了对比。
第一种基线只用了年龄、性别、体重指数和种族这些基本信息。第二种基线直接拿原始睡眠信号去训练,完全没有经过预训练。结果 SleepFM 在所有疾病类别上都胜出了,AUROC 平均高出 5% 到 17%。(注:AUROC 衡量的是模型区分正负样本比如生病和不生病的能力,数值越高说明模型越能够正确地将两类人分开。)
在预测老年痴呆症上,SleepFM 的 C Index 达到 99%,而只用人口学信息的模型只有 87%。预测帕金森病,SleepFM 是 93%,基线模型是 79%。预测糖尿病伴随循环系统并发症,SleepFM 是 89%,基线模型是 79%。
(来源:https://www.nature.com/articles/s41591-025-04133-4)
即使不看年龄和性别,只凭 SleepFM 从睡眠信号里学到的特征,它的预测效果依然优于只靠人口学信息的模型,这说明睡眠信号本身蕴含的信息量远超人类的想象。
SleepFM 还有一个很实用的特点,那就是迁移学习能力强。研究人员在一个名为 SHHS 的独立数据集上对其进行测试。这个数据集完全没有参与过预训练,这意味着 SleepFM 需要适应新的医院、新的设备和新的患者群体。
结果 SleepFM 依然表现稳健,预测中风的 C Index 达到 81%,预测充血性心衰达到 85%,预测心血管疾病死亡达到 86%。换句话说,SleepFM 不仅能在自己的舒适区里工作,换到一个新地方它也能够很快上手。
另外,以往类似的睡眠研究,样本量大多在几千到一万多之间。SleepFM 的预训练数据量是前者的 5 到 25 倍。规模大了,模型能够学习到的东西就更全面,泛化能力也更强。
(来源:https://www.nature.com/articles/s41591-025-04133-4)
当然,这项研究也有局限性。比如,数据主要来自“因怀疑自己有睡眠问题而去医院做检查”的人群,并不是来自完全健康的普通人。SleepFM 在时间跨度上的预测准确性也会有所下降,因为医疗实践和患者特征也在不断变化。不过,这些都不影响本次研究的核心结论,那就是睡眠真的是一个被严重低估的健康信息宝库。
未来,这项技术还有可能走进寻常百姓家。事实上,很多智能手表和智能手环已经能够检测心率、呼吸和睡眠分歧。如果能够将 SleepFM 这样的模型压缩到可穿戴设备上,我们每天醒来就能看到自己的健康风险评估,也能寻求医生帮助来提前介入,更好地防患于未然。
参考资料:
相关论文 https://www.nature.com/articles/s41591-025-04133-4
代码:https://github.com/zou-group/sleepfm-clinical
https://med.stanford.edu/news/all-news/2026/01/ai-sleep-disease.html
运营/排版:何晨龙
本文是专业学术论文解读,不做医疗建议。