推动公平学习与身份归一化的视网膜神经疾病数据集

人工智能咨询培训老师叶梓 转载标明出处

在机器学习领域,公平性(也称为公正性或平等性)是一个日益受到关注的话题,它对于社会的福祉至关重要。然而,目前缺乏专门用于公平学习且包含成像数据的公共医学数据集,这限制了该领域的进展。为了解决这一问题,哈佛医学院眼科AI实验室的研究团队提出了哈佛青光眼公平性(Harvard Glaucoma Fairness,简称Harvard-GF)数据集,这是一个包含3300名受试者的视网膜神经疾病数据集,涵盖了2D和3D成像数据,并针对青光病检测进行了种族群体的平衡。

公平性数据集

数据集涵盖了2010年至2021年间来自大型学术眼科医院的3300名受试者,包括了光学相干断层扫描(OCT)图像、患者人口统计学特征以及基于视野测试的青光眼诊断。数据质量进行了严格控制,例如,排除了信号强度低于6的OCT扫描图像(信号强度10表示最佳成像质量)。

Harvard-GF数据集包含3300个样本,其中1748个样本为青光眼患者。数据被分为训练集(2100个样本)、验证集(300个样本)和测试集(900个样本)。每个受试者选择了最后一次就诊的数据,并随机选择了一只眼睛。

图3展示了样本在青光眼类别、种族、性别、民族和年龄等不同因素下的分布情况。数据显示,亚洲人、黑人和白人分别占样本的33.3%,女性占54.9%。此外,91.7%的样本为非西班牙裔,平均年龄为59.13岁,中位数为61.41岁。

研究团队提出了公平身份归一化(Fair Identity Normalization, FIN)方法,以增强具有相同身份样本的区分性特征。这种方法考虑了个体身份的统计特性,以期产生更公平的预测结果。

图5展示了所提出的公平身份归一化方法的框架,该方法通过考虑个体身份的统计特性来增强样本的区分性特征。方法将模型视为两个组件:生成区分性特征的骨干网络和将特征映射到逻辑值的最终线性模块。FIN方法通过考虑身份a,输入特征z和身份a,产生估计统计量,并进行归一化处理。

  1. 骨干网络(Backbone Network):这部分负责从输入数据中提取区分性特征 z。骨干网络是深度学习模型中用于特征提取的基础架构,它可以是卷积神经网络(CNN)或其他类型的神经网络,具体取决于数据的类型和任务的需求。

  2. 最终线性模块(Final Linear Module):这个组件的作用是将从骨干网络得到的特征 z 映射到逻辑值z′,这些逻辑值通常用于后续的分类或回归任务。

在这两个组件之间,引入了公平身份归一化(FIN)方法:

  • 公平身份归一化(FIN):该方法的核心在于考虑每个样本的身份信息 a,并将这些身份信息与特征 z 结合起来,进行归一化处理。归一化处理的目的是调整特征,使得不同身份群体的特征分布更加均衡,从而减少模型在预测时的偏见。

  • 归一化处理:通过计算每个身份群体的统计量(如均值和标准差),将特征z 进行调整。具体来说,特征 z 会被减去对应身份群体的均值,并除以标准差,以实现归一化。这一步骤的数学表达式为 ,其中 分别是对应身份群体的均值和标准差。

  • 可学习的统计量:在FIN方法中,均值 和标准差 是可学习的参数,这意味着它们可以通过训练过程进行优化,以更好地适应数据和任务的需求。

研究团队还引入了一种公平性缩放机制,考虑了身份依赖的公平性对性能指标(如准确性和AUC)的影响。这种机制通过衡量整体与身份群体之间的性能差异,提出了一种新的公平性缩放度量方法。

为了解决传统公平性度量(如DDP和DEOdds)无法捕捉公平性与效率之间权衡的问题,研究团队提出了一种新的度量方法。这种方法不仅考虑了公平性,还考虑了效率,以确保模型在所有身份群体中不仅公平而且准确有效。

通过这些创新的方法和度量,哈佛医学院眼科AI实验室的研究团队为医学影像分析中的公平学习提供了有力的支持和工具,推动了该领域的发展。

想要掌握如何将大模型的力量发挥到极致吗?叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具。9月22日晚,实战专家1小时讲解让您轻松上手,学习如何使用 Llama Factory 微调模型。

加下方微信或评论留言,即可参加线上直播分享,叶老师亲自指导,互动沟通,全面掌握Llama Factory。关注享粉丝福利,限时免费录播讲解。

LLaMA Factory 支持多种预训练模型和微调算法。它提供灵活的运算精度和优化算法选择,以及丰富的实验监控工具。开源特性和社区支持使其易于使用,适合各类用户快速提升模型性能。

实验

研究使用了2100个视网膜神经纤维层厚度图(RNFLT maps)或OCT B扫描图像进行训练,另外900个用于评估。样本不仅包含青光眼/非青光眼的标签,还包括种族(亚洲、黑人、白人)和性别(男性、女性)这两种社会身份信息。验证集包含100个亚洲样本、100个黑人样本和100个白人样本,而测试集则用于最终评估模型性能。

研究采用了EfficientNet-B1作为处理RNFLT地图的基线模型,而3D ResNet-18用于处理3D OCT B扫描图像。除了没有归一化的基线模型(No Norm),还在最终线性层之前插入了批量归一化(Batch Normalization, BN)、可学习的批量归一化(Learnable Batch Normalization, L-BN)以及提出的公平身份归一化(Fair Identity Normalization, FIN,其中动量m设置为0.3)进行综合比较。

研究使用了准确率(Accuracy)、接收者操作特征曲线下面积(AUC)、群体间差异(DPD)和等机会差异(DEOdds)等多种评估指标来全面理解效率和公平性之间的平衡。DPD衡量由敏感属性定义的群体之间选择率的最大差异,而DEOdds则关注不同群体间假阳性率(FPR)和真阳性率(TPR)的相似性。

模型使用AdamW优化器进行训练,并在NVIDIA RTX A6000图形卡上进行。对于RNFLT地图的实验,使用了5e-5的学习率和(0, 0.1)的beta值。对于OCT B扫描图像,使用了1e-5的学习率和相同的beta值。对比学习基线训练遵循SimCLR和FSCL的方法,应用数据增强技术。

表II展示了在考虑种族身份的RNFLT地图测试集上的实验结果。结果显示,黑人组的AUC一致低于白人组,而白人组的AUC通常低于亚洲组。这表明在黑人群体中,使用深度学习进行自动化青光眼检测尤其具有挑战性。与基线模型(No Norm)相比,提出的FIN在黑人组的青光眼检测性能提高了2.69%(p值=0.002)。此外,FIN在ESAcc、Acc、ESAUC和AUC等指标上优于其他方法。

表III和表IV分别展示了在考虑性别身份和种族身份的RNFLT地图和OCT B扫描图像测试集上的实验结果。这些结果进一步证实了FIN在提高模型公平性和效率方面的有效性。

消融研究探讨了动量m在公平身份归一化(FIN)中的作用,m的值从0到1变化。图6展示了动量m与AUC/ESAUC以及DPD/DEOdds之间的关系。结果表明,对于种族身份,m=0.3时在AUC和ESAUC上表现最佳;对于性别身份,m=0.2时表现最佳。

为了检验提出的FIN对学习过程的影响,研究可视化了基线模型、带有BN的基线模型、带有L-BN的基线模型和带有FIN的基线模型生成的预测结果中的真正例(TPs)、假正例(FPs)、真负例(TNs)和假负例(FNs)。图7显示,提出的FIN将TPs和TNs分别向右和左移动,这是因为FIN根据其身份特定的特征增强了特征。

高度近视被认为是导致原发性开角型青光眼风险增加的重要因素。图8展示了使用球面等效(SE)属性进行特征归一化的FIN与基线No Norm的性能比较。结果表明,通过SE属性进行特征归一化可以提高整体AUC和ESAUC,这与已知的近视与青光眼之间的关联一致。

通过这些详细的实验和分析,研究团队展示了他们提出的FIN方法在提高医学影像分析中模型的公平性和效率方面的潜力。

论文链接:2306.09264 (arxiv.org)

数据集和代码可通过以下链接公开获取:Harvard-GF 数据集

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1537979.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

分苹果 - 华为OD统一考试(E卷)

2024华为OD机试(E卷+D卷+C卷)最新题库【超值优惠】Java/Python/C++合集 题目描述 A 和 B 两个人要分苹果。A 希望按照他的计算规则得到平均分配的苹果,而 B 希望在满足 A 的条件下获得尽可能多的苹果量。 A 的计算规则是按照二进制加法进行,并不计算进位。例如,12 + 5 =…

CAT1 DTU软硬件设计开源资料分析(TCP协议版本 )

一、CAT1 DTU方案简介: 远程终端单元DTU,一种针对通信距离较长和工业现场环境恶劣而设计的具有模块化结构的、特殊的计算机测控单元,它将末端检测仪表和执行机构与远程控制中心相连接。 奇迹TCP DTU版本DTU,用于将远程现场的传感…

VoIP协议

VoIP协议是VoIP业务的规范标准。我们都知道VoIP业务有着压倒性的优势。随着网络应用的多元化和低成本化发展,VoIP业务直接冲击着传统通信市场,那么目前VoIP协议目前常用的协议,如H.323、SIP、MEGACO和MGCP。 H.248 H.248是定义网关控制协议的ITU建议书…

分布式光伏发电站数据采集设备管理硬件解决方案

随着全球能源结构的转型和可再生能源的快速发展,光伏发电作为重要的清洁能源之一,在能源市场中占据了越来越重要的位置。AcrelCoud-1200分布式光伏运维云平台通过监测光伏站点的逆变器设备,气象设备以及摄像头设备,帮助用户管理分…

【Linux系统编程】第二十弹---进程优先级 命令行参数 环境变量

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】【C详解】【Linux系统编程】 目录 1、进程优先级 2.1、什么是优先级 2.2、优先级的描述 2.3、优先级与权限的关系 2.4、为什么要有优先级 2.5、Linux优先级的…

某oa命令执行漏洞挖掘思路

《网安面试指南》http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247484339&idx1&sn356300f169de74e7a778b04bfbbbd0ab&chksmc0e47aeff793f3f9a5f7abcfa57695e8944e52bca2de2c7a3eb1aecb3c1e6b9cb6abe509d51f&scene21#wechat_redirect 《Java代码审…

图像修复(Inpainting)技术的前沿模型与数据集资源汇总

图像修复(Image Inpainting)是一种计算机视觉技术,旨在填补图像中的缺失区域或去除图像中的不需要部分,使其看起来自然且无明显痕迹。其目标是根据图像的上下文信息和周围像素来推断和重建缺失区域的内容,以生成逼真且…

《机器学习》周志华-CH7(贝叶斯分类)

7.1贝叶斯决策论 对分类任务而言,在所有相关概率已知的理想情形下,贝叶斯决策论考虑如何基于这些概率核误判损失来选择最优的类别标记。 R ( x i ∣ x ) ∑ j 1 N λ i j P ( c j ∣ x ) \begin{equation} R(x_{i}|x)\sum_{j1}^{N}\lambda_{ij}P(c_{j}…

DTMF2str集成工具

DTMF2str 项目地址: baicaiyihao/DTMF2str: DTMF解码并转换为字符串 (github.com) 用于CTF中misc DTMF题中,方便ctfer解题。 注:工具根据现有的一些题型进行编写的,如果有无法解出的题型可以提issus后续进行完善。 工具功能&a…

C++独立开发开源大数计算库 CBigNum

项目简介&项目地址 CBigNum 是本人独立开发开源的一款大数计算库,支持任意位数整数带任意位数小数的浮点运算。您可以通过本库执行非常大的数据运算或非常高精度的除法运算(您可以随意指定除法的小数保留到第几位)。 项目地址:https://github.com/…

MATLAB路径规划如何采用矢量法让他们尽量在一个方向??

🏆本文收录于《CSDN问答解惑-专业版》专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收…

HTML | 外部引入 CSS 的2种方式:link和@import有什么区别?

外部引入 CSS 有2种方式,link 和 import。就结论而言,强烈建议使用 link ,慎用 import 方式。 两者都是外部引用 CSS 的方式,但是存在一定的区别: (1)从属关系区别 link是HTML / XHTML标签&a…

误删分区后的数据救赎恢复实战解析

在数字化时代,数据不仅是信息的载体,更是个人记忆与企业资产的宝贵财富。然而,误删分区这一操作失误,却如同暗流涌动,悄无声息地吞噬着用户的重要数据。本文将深入探讨误删分区的现象、影响,并详细介绍一种…

Linux运维培训班靠谱吗?如何判断一个培训班的教学质量?

当我们下定决心打算系统培训Linux运维时,哪家机构比较好成为了我们面临的最大难题。之前分享过很多培训机构的个人感受,但授人以鱼不如授人以渔,说到底那些都是我个人的看法,因此今天打算帮助大家学会如何判断一个培训班的好坏。 …

C# 修改项目类型 应用程序程序改类库

初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github:codetoys,所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C的,可以在任何平台上使用。 源码指引:github源…

72、Python之函数式编程:纯函数与lambda表达式

引言 今天聊点简单的,也就是“纯函数”。任何一个函数只要满足纯函数的两个特性,就是纯函数。纯函数与lambda表达式,其实没有必然的联系。只是由于lmbada表达式比较简洁,很多时候可以作为纯函数的一种实现方式。 本文的主要内容…

PointNet++改进策略目录

后续我将如何使用文章中创新点加入的PointNet中代码实现部分进行更新 题目原理解析代码改进PointNet改进策略 :模块改进 | LFA | RandLA-Net,通过随机采样与局部特征聚合提升大规模3D点云处理效率✔️❌PointNet改进策略 :模块改进 | Residua…

【网络】详解HTTP协议的CGI机制和CGI进程

目录 引言 CGI机制模型 伪代码示例 个人主页:东洛的克莱斯韦克-CSDN博客 引言 CGI机制是HTTP协议提供的偏底层的一套机制,也是非常重要的机制——它让大量的业务进程和HTPP协议解耦。而CGI进程是业务层的,用来处理各种数据,比…

1分钟解锁AI绘本财富密码:从0到10万粉,她只用了三步!

在这个信息爆炸的时代,我们每天都在为生活奔波,赚钱似乎变得越来越难。记得小时候,我们总是梦想着能有一种魔法,让书本里的金币自动飞入脑中,但现实却是残酷的我们只能眼睁睁地看着那些遥不可及的梦想。然而&#xff0…

Selenium with Python学习笔记整理(网课+网站)

本篇是根据学习网站和网课结合自己做的学习笔记,后续会一边学习一边补齐和整理笔记 官方学习网站在这获取: https://selenium-python.readthedocs.io/getting-started.html#simple-usage WEB UI自动化环境配置 (推荐靠谱的博客文章来进行环境配置,具…