PNAS:基于大规模睡眠分析的16个成人睡眠模式的分类
近年来,由于生活方式的多样化,世界各地对自己的睡眠感到不满或焦虑的人数不断增加。简单的睡眠测量和对个体睡眠模式的定量理解不仅在保健领域非常重要,而且从医学角度来说也非常重要,例如在睡眠障碍的诊断中。
东京大学的一个研究小组,由Hiroki Ueda教授(也是理研小组的组长)和Machiko Katori以及助理教授Shoi Shi(理研)领导,使用了ACCEL(1),这是他们研究实验室开发的一种原始的机器学习算法,根据手臂加速度确定睡眠和清醒状态,并将英国生物库(2)中约10万人的加速度数据转换为睡眠数据,然后进行详细分析。他们发现这10万人的睡眠模式可以分为16种不同的类型。
该研究小组首先关注的是英国生物库中约10万人的手臂加速度数据。这些数据来自于30至60岁的男性和女性,主要来自英国,他们使用腕带式加速计进行了长达7天的测量。利用他们在2022年开发的一种算法(ACCEL),该研究小组根据加速度数据生成了大约10万人的睡眠数据。将获得的睡眠数据转化为21个睡眠指标,然后采用降维(4)和聚类(5)方法将睡眠模式分为8个不同的聚类。这些包括与“社会时差”有关的簇,以中发性觉醒为特征的簇,被认为是失眠,从而能够提取出与生活方式和睡眠障碍有关的簇。接下来,为了更详细地检查与睡眠障碍相关的睡眠模式,研究小组关注了21个睡眠指标中的6个,包括睡眠持续时间和中间醒着的时间,这些都被认为与睡眠障碍密切相关。通过对一个指标明显偏离一般睡眠的数据(总体分布中位于2.28百分位或以上的数据,或位于2.28百分位或以下的数据(6))进行相同的分析,他们能够将数据分为8组。这些包括与早起型和晚睡型有关的群。他们还确定了几个与失眠相关的聚类,并能够通过使用整个数据集进行聚类,将与失眠相关的7种睡眠模式分类。
因此,通过大规模分析睡眠,他们揭示了人类睡眠表型的景观。这项研究已经成为可能定量分类集群相关的生活方式,如“社会时差”和早上/晚上类型,通常很难确定短期pSG测量(7),此外,离群值的详细分析和分类相关的睡眠模式显示7集群失眠。这些聚类是根据不同于传统方法的新指标进行分类的,有望对构建新的失眠诊断方法和提出治疗方法有所帮助。
这些结果是通过日本科学技术厅(JST)资助的“上田生物定时项目”ERATO计划获得的。在这个项目中,JST开发了“有助于理解人类的系统生物学”,使用睡眠-觉醒节律作为一个模型系统,并旨在理解人类睡眠-觉醒行为中的“生物时间”信息,从分子延伸到生活在社会中的个人。
(1) ACCEL:研究团队独创的睡眠判断算法。详细内容请参考下面的文章。“一种基于抽动的ACCEL算法用于从手臂加速度中精确分类睡眠-觉醒状态”DOI: 10.1016/j.isci.2021.103727
(2)英国生物库:一个大型研究数据库,包含约50万名英国参与者的遗传和健康信息。这项研究使用了大约10万人的加速数据以及相关的性别和年龄数据。
(3)睡眠数据:以30秒为间隔的时间序列数据,标记为睡眠或清醒状态。pSG测量使用由专业技术人员测量的各种数据来创建睡眠数据。在本研究中,睡眠数据是通过在加速度计上应用ACCEL获得的。
(4)降维方法:一种减少数据维数的方法。这使得从数据中提取重要信息和捕获数据的特征成为可能。在本研究中,我们使用了UMAp (Uniform Manifold Approximation and projection)。
(5)聚类方法:一种根据数据之间的相似性将数据分类成簇的方法。有两种聚类方法:有监督聚类,它使用正确的数据进行聚类;无监督聚类,它不使用正确的数据进行聚类。本研究采用无监督聚类方法DBSCAN(基于密度的噪声应用空间聚类)。
(6)上百分比和下百分比:在任何给定百分比中,当数值按降序排列时,称为上百分比。相反,任何给定百分比中的值,如果按升序排列,则称为较低百分比。例如,在正态分布中,上2.28个百分点以上或下2.28个百分点以下的数据是指数据与平均值的偏差超过标准偏差的两倍(2SD)。
(7)多导睡眠描记术(polysomnography, pSG):多导睡眠描记术是将多个电极和传感器连接在被测者身上,测量脑电波、眼动、呼吸状态和心电图状态。这是目前用来确定人类睡眠模式的最精确的测量方法。它也被用来诊断睡眠障碍。