机器学习从眼科影像中提取视网膜色素评分显示种族并非生物学差异

【编者按】

视网膜色素评分(RPS)作为一项突破性指标,首次实现了通过眼底影像量化人群表型多样性。该研究不仅揭示了遗传因素对色素沉着的深层影响,更打破了传统种族分类的局限性——不同种族群体在RPS分布上存在显著重叠,印证了人类生物特征的连续性本质。这项成果为医疗AI算法的公平性评估提供了重要标尺,将推动包容性医疗模型的创新发展。

figure 2
摘要

目前很少有指标能够描述眼科影像数据集中的表型多样性,研究人员通常使用种族作为生物学变异性的替代标记。我们推导出一个连续的测量指标——视网膜色素评分(RPS),该指标通过眼部彩色眼底照片量化色素沉着程度。RPS使用两个具有人口统计学和遗传数据的大型流行病学研究(英国生物样本库和EPIC-诺福克研究)进行了验证,并在坦桑尼亚、澳大利亚和中国数据集中得到了复现。

“对英国生物样本库RPS进行的全基因组关联研究(GWAS)确定了20个与皮肤、虹膜和头发色素沉着已知关联的位点,其中8个在EPIC-诺福克队列中得到了复制。”

RPS与种族之间存在强烈关联,然而,每个种族与其相应的RPS评分分布之间存在显著重叠。RPS将传统的人口统计学变量与临床影像特征分离开来。RPS可能作为一个有用的指标,用于量化AI算法开发中使用的训练、验证和测试数据集的多样性,以确保模型的充分包容性和可解释性,这对于评估所有当前部署的AI模型至关重要。

引言

视网膜疾病是全球视力丧失的重要原因,但并非所有人群都受到同等影响。2020年,估计全球有1.031亿成年人患有糖尿病视网膜病变(DR),1.96亿人患有年龄相关性黄斑变性(AMD)。研究发现DR患病率在非洲最高(35.90%),其次是北美和加勒比地区(33.30%)。相比之下,AMD在欧洲裔人群中的患病率显著高于亚洲或非洲裔人群。

为应对巨大的全球疾病负担,许多人工智能(AI)算法被开发出来以实现更高效的医疗服务提供。这些AI算法已被广泛发表,其中一些已进入临床实践,用于提供DR、AMD和青光眼等疾病的自动诊断。

“眼科AI算法的成功部分归功于从常规临床实践中收集的大型影像数据集的可用性。描述这些用于训练的大型数据集的人口统计学特征对于理解算法的泛化性、局限性和整体性能至关重要。”

尽管有此需求,但不到20%的公开视网膜影像数据集包含患者特征,如年龄、性别或种族。由于方法学限制和未标记数据,比较不同人群模型性能的研究有限,使得偏差评估具有挑战性。

先前评估通用AI算法偏差的研究发现,基于图像的算法性能在皮肤色素沉着程度较高的人群中通常较差,例如在皮肤癌分类、面部识别和物体检测中。在这些研究中,图像像素值被测量并通过人工标记者或算法转换为分类色素沉着量表。然后这些类别被用于估计算法在色素沉着亚类别中的相对性能,无论是否存在额外的人口统计学数据。此外,这些量表允许将种族/民族与皮肤色素沉着的生物学差异分离开来。

在眼睛中,黑色素存在于葡萄膜(虹膜、视网膜和脉络膜)中,负责蓝色或棕色虹膜颜色和视网膜色素沉着。

figure 1
查看全文: 点击查看原文 |
⏰ 发布时间: 2025年01月02日