用于体积医学图像分割的跨视角差异依赖网络|文献速递--基于多模态-半监督深度学习的病理学诊断与病灶分割

Title

题目

Cross-view discrepancy-dependency network for volumetric medical image segmentation

用于体积医学图像分割的跨视角差异依赖网络

01

文献速递介绍

医学图像分割的目标是通过为每个像素分配语义类别,从原始图像中描绘出受试者的解剖结构(例如,器官和肿瘤),这在许多临床应用中起着至关重要的作用,例如器官建模、疾病诊断和治疗规划(Shamshad et al., 2023)。对于三维图像,临床医生需要逐层手动描绘感兴趣体积(VOI),这需要大量的劳动和专业知识(Qureshi et al., 2023)。计算机辅助诊断(CAD)系统的目标是帮助临床医生迅速描绘VOI(Shi et al., 2022)。然而,这一工作在稳健性和准确性方面仍面临挑战。为了满足CAD系统需求的快速增长,开发稳健且准确的三维医学图像分割算法变得愈加迫切。

在过去十年中,深度卷积神经网络(DCNNs)引起了越来越多的关注,并推动了三维医学图像分割的发展(Xu et al., 2023;Liu et al., 2023)。通常,构建稳健的DCNNs需要大量的数据。但在许多实际场景中,这些模型经常面临数据稀缺的挑战,主要由于某些疾病的低发病率或获取大规模三维医学图像数据集的高成本(Huang et al., 2023;Jiao et al., 2023)。为了解决这一问题,许多方法尝试通过基于块的策略处理三维图像(Çiçek et al., 2016;Milletari et al., 2016;Isensee et al., 2021)。尽管这种策略能够捕捉局部空间信息,但有限的接受域使得提取长距离上下文信息变得困难。另一方面,一些研究提出利用来自三维图像的多个连续切片来训练网络(Alom et al., 2018;McHugh et al., 2021)。这些方法将切片图像视为独立样本,仅使用单视角切片图像(即轴向平面),这不可避免地忽略了来自其他两个视角(即冠状面和矢状面)的空间信息以及切片间的连续性(Dong et al., 2022)。因此,更可取的方法是基于多视角切片图像开发分割模型,从而通过同时考虑多个正交平面来保留全面的空间信息。

为此,许多多视角学习方法已应用于三维医学图像分割(Peiris et al., 2023;Lahoti et al., 2021;Ding et al., 2021;Yang et al., 2022)。在这些方法中,一种简单的方法是沿正交平面将体积分割为多视角切片图像。然后将这些切片单独输入到视角特定的分割网络中,随后融合多视角的分割结果。然而,此类方法通常涉及构建多个并行网络。因此,一些研究(Li et al., 2021;Gou et al., 2022;Mei et al., 2021)尝试使用统一网络通过一组不对称卷积核同时提取多视角表示。尽管展示了良好的性能,这些方法却忽视了切片间的空间连续性。为此,最近的研究尝试采用新视角充分利用多视角学习和基于块的策略的优点,通过将多视角信息以串行(Xia et al., 2018;Wei et al., 2019;Calisto和Lai Yuen, 2020;Zhang et al., 2022;Mlynarski et al., 2019)或并行方式(Zhou et al., 2019;Luo et al., 2020;Yang et al., 2022;Dong et al., 2022)纳入基于块的模型,以增强体积表示学习。然而,许多研究集中在结果级组合上,往往忽视了不同视角之间的差异和依赖,从而限制了多视角先验的全部潜力。

在本研究中,我们提出了一种新颖的框架,利用多视角切片先验进行体积医学图像分割。具体而言,我们的方法通过多视角切片先验辅助强化体积表示学习。我们的模型引入视角差异,以学习视角特定的表示,并在整合切片的先验知识后探索视角依赖,以聚合多视角信息。总之,本研究的主要贡献包括:(1)我们提出了一种跨视角差异依赖网络(CvDd-Net),用于体积医学图像分割。该模型能够有效利用多视角切片先验,辅助体积表示学习并提升性能。(2)我们设计了一个差异感知形态增强(DaMR)模块,以通过增强的形态信息(即对象的边界和位置)学习视角特定的表示。(3)为有效利用多视角切片先验,设计了一个依赖感知信息聚合(DaIA)模块,以增强体积的个体视角表示,并基于跨视角依赖整合增强特征。(4)我们在四个公共数据集(即甲状腺、宫颈、胰腺和胶质瘤)上进行了广泛实验,实验结果表明我们提出的模型在完全监督和半监督任务中均优于其他最新方法。

本文的其余部分安排如下。在第二节中,我们简要回顾相关工作。在第三节中详细介绍我们的具体方法。第四节呈现实验设置和结果。第五节和第六节分别给出讨论和结论。

Abatract

摘要

The limited data poses a crucial challenge for deep learning-based volumetric medical image segmentation, andmany methods have tried to represent the volume by its subvolumes (i.e., multi-view slices) for alleviating thisissue. However, such methods generally sacrifice inter-slice spatial continuity. Currently, a promising avenueinvolves incorporating multi-view information into the network to enhance volume representation learning, butmost existing studies tend to overlook the discrepancy and dependency across different views, ultimately limiting the potential of multi-view representations. To this end, we propose a cross-view discrepancy-dependencynetwork (CvDd-Net) to task with volumetric medical image segmentation, which exploits multi-view slice priorto assist volume representation learning and explore view discrepancy and view dependency for performanceimprovement. Specifically, we develop a discrepancy-aware morphology reinforcement (DaMR) module toeffectively learn view-specific representation by mining morphological information (i.e., boundary and positionof object). Besides, we design a dependency-aware information aggregation (DaIA) module to adequatelyharness the multi-view slice prior, enhancing individual view representations of the volume and integratingthem based on cross-view dependency. Extensive experiments on four medical image datasets (i.e., Thyroid,Cervix, Pancreas, and Glioma) demonstrate the efficacy of the proposed method on both fully-supervised andsemi-supervised tasks.

有限的数据对基于深度学习的体积医学图像分割提出了关键挑战,许多方法尝试通过其子体积(即多视角切片)来表示体积,以缓解这一问题。然而,此类方法通常牺牲了切片间的空间连续性。目前,一个有前景的方向是将多视角信息纳入网络中,以增强体积表示学习,但大多数现有研究往往忽视了不同视角之间的差异和依赖关系,最终限制了多视角表示的潜力。为此,我们提出了一种跨视角差异依赖网络(CvDd-Net),用于体积医学图像分割,该网络利用多视角切片先验来辅助体积表示学习,并探索视角差异和视角依赖以提升性能。具体而言,我们开发了一个差异感知形态增强(DaMR)模块,以有效学习视角特定的表示,通过挖掘形态信息(即对象的边界和位置)。此外,我们设计了一个依赖感知信息聚合(DaIA)模块,以充分利用多视角切片先验,增强体积的个体视角表示,并基于跨视角依赖进行整合。在四个医学图像数据集(即甲状腺、宫颈、胰腺和胶质瘤)上进行的广泛实验证明了该方法在完全监督和半监督任务上的有效性。

Method

方法

In this section, we provide the details of our method, includingmulti-view slice representation learning and network architecture. Forclearer clarity and easier understanding, we provide a table of notationsto summary all symbols and their corresponding descriptions, as shownin Table 1.

在本节中,我们提供了我们方法的详细信息,包括多视角切片表示学习和网络架构。为了更清晰和易于理解,我们提供了一个符号表,总结了所有符号及其对应的描述,如表1所示。

Conclusion

结论

Fig. 11. Complexity analysis of different models on four datasets. The horizontal and vertical axis represent the number of model’s parameters and Dice similarity coefficient, and the size of circle represents the FLOPs of model.

图11. 四个数据集上不同模型的复杂性分析。横轴和纵轴分别表示模型参数的数量和Dice相似系数,圆圈的大小表示模型的浮点运算次数(FLOPs)。

Figure

图片

Fig. 1. The flowchart of CvDd-Net. It consists of an encoder and a decoder (color in blue) for feature extraction and prediction map generation. Besides, it also comprises: (a) aslice-based encoder (color in green) for multi-view slice representation learning, (b) a discrepancy-aware morphology reinforcement (DaMR) module for view-specific representationlearning, and (c) a dependency-aware information aggregation (DaIA) module for multi-view representation fusion.

图1. CvDd-Net的流程图。它由一个编码器和一个解码器(蓝色部分)组成,用于特征提取和预测图生成。此外,它还包括:(a)用于多视角切片表示学习的切片编码器(绿色部分),(b)用于视角特定表示学习的差异感知形态增强(DaMR)模块,以及(c)用于多视角表示融合的依赖感知信息聚合(DaIA)模块。

图片

Fig. 2. Illustration of discrepancy-aware morphology reinforcement module. RCM:residual context mapping; CA: coordinate attention.

图2. 差异感知形态增强模块的示意图。RCM:残差上下文映射;CA:坐标注意力。

图片

Fig. 3. Illustration of dependency-aware information aggregation module. CdDR:cross-dimension dependency-aware relation; CvDR: cross-view dependency-awarerelation.

图3. 依赖感知信息聚合模块的示意图。CdDR:跨维度依赖感知关系;CvDR:跨视角依赖感知关系。

图片

Fig. 4. Visualization results of all competing methods on some representative cases from Thyroid (top) and Cervix (bottom) datasets. The blue and orange lines in the first andthird rows represent the boundary of prediction map and ground-truth. The final column named as GT denotes the original image and its ground-truth.

图4. 来自甲状腺(顶部)和宫颈(底部)数据集中一些代表性案例的所有竞争方法的可视化结果。第一行和第三行中的蓝色和橙色线条分别表示预测图和真实标注的边界。最后一列标记为GT,表示原始图像及其真实标注。

图片

Fig. 5. Visualization results of all competing methods on some representative cases from Pancreas (top) and Glioma (bottom) datasets. The blue and orange lines in the first and third rows represent the boundary of prediction map and ground-truth. The final column named as GT denotes the original image and its ground-truth.

图5. 来自胰腺(顶部)和胶质瘤(底部)数据集中一些代表性案例的所有竞争方法的可视化结果。第一行和第三行中的蓝色和橙色线条分别表示预测图和真实标注的边界。最后一列标记为GT,表示原始图像及其真实标注。

图片

Fig. 6. Qualitative comparison of all semi-supervised methods on some representative cases from Thyroid, Cervix, Pancreas, and Glioma (from top to bottom) datasets. Thesegmentation results are from the models trained with 50% data. The blue and orange lines represent the boundary of predication and ground-truth. The final column named asGT denotes the original image and its ground-truth.

图6. 在甲状腺、宫颈、胰腺和胶质瘤(从上到下)数据集上的所有半监督方法的定性比较。分割结果来自使用50%数据训练的模型。蓝色和橙色线分别表示预测边界和真实标签。最后一列命名为GT,表示原始图像及其真实标签。

图片

Fig. 7. Visualization of t-SNE from four datasets for validating the representation learning intuition of CvDd-Net.

图7. 四个数据集的t-SNE可视化,用于验证CvDd-Net的表示学习直觉。

图片

Fig. 8. Visualization of feature maps from intermediate layer of CvDd-Net. From leftto right are (a) original image with GT, feature maps (b) after encoder (before RCM),(c) after RCM (before CA), (d) after CA (before CdDR), (e) after CdDR (before CvDR),and (f) after CvDR (before decoder), respectively.

图8. CvDd-Net中间层特征图的可视化。从左到右分别为 (a) 带有真实标签的原始图像,特征图 (b) 编码器后(在RCM之前),(c) RCM后(在CA之前),(d) CA后(在CdDR之前),(e) CdDR后(在CvDR之前),以及 (f) CvDR后(在解码器之前)。

图片

Fig. 9. Qualitative results of adaptive weights (w1 and w2 in CdDR, and w3 , w4 , and w5 in CvDR) on different datasets.

图9. 在不同数据集上自适应权重(CdDR中的w1和w2,以及CvDR中的w3、w4和w5)的定性结果。

图片

Fig. 10. Visualization of feature maps from intermediate layer of CvDd-Net that trainedwith 25% data. From left to right are (a) Image with GT, Representations from (b) axialview, (c) sagittal view, and (d) coronal view, respectively. Specifically, features shownthree columns from different views (from left to right) are: (1) slice representation, (2)feature map after CA (before CdDR), and (3) feature map after CdDR (before CvDR),respectively.

图10. 使用25%数据训练的CvDd-Net中间层特征图的可视化。从左到右分别为 (a) 带有真实标签的图像, (b) 轴向视图的表示, (c) 矢状视图,和 (d) 冠状视图。具体而言,三个列中显示的特征(从左到右)为:(1) 切片表示,(2) CA后(在CdDR之前)的特征图,以及 (3) CdDR后(在CvDR之前)的特征图。

图片

Fig. 11. Complexity analysis of different models on four datasets. The horizontal and vertical axis represent the number of model’s parameters and Dice similarity coefficient, and the size of circle represents the FLOPs of model.

图11. 四个数据集上不同模型的复杂性分析。横轴和纵轴分别表示模型参数的数量和Dice相似系数,圆圈的大小表示模型的浮点运算次数(FLOPs)。

Table

图片

Table 1The list of symbols and their corresponding descriptions.

表1 符号列表及其对应描述。

图片

Table 2Segmentation performance of all competing methods on four datasets.

表2 四个数据集上所有竞争方法的分割性能。

图片

Table 3Comparison between our method and others.

表3 我们的方法与其他方法的比较。

图片

Table 4Segmentation performance of CvDd-Net with different settings, including RCM, CA,CdDR and CvDR. BB denotes backbone.

表4CvDd-Net在不同设置下的分割性能,包括RCM、CA、CdDR和CvDR。BB表示主干网络。

图片

Table 5Segmentation performance of CvDd-Net with different multi-view slice representationon two datasets. ‘A’, ‘C’, and ‘S’ denote axial, coronal, and sagittal views, respectively.

表5CvDd-Net在两个数据集上使用不同多视角切片表示的分割性能。“A”、“C”和“S”分别表示轴向、冠状和矢状视图。

图片

Table 6Segmentation performance of CvDd-Net with different cross-view dependency relationon two datasets. ‘C→S’ and ‘S→C’ represent the two cross-view relations to computeview dependency weights.

表6CvDd-Net在两个数据集上使用不同交叉视角依赖关系的分割性能。“C→S”和“S→C”表示计算视角依赖权重的两种交叉视角关系。

图片

Table 7Segmentation performance of CvDd-Net with different backbones on two datasets.

表7CvDd-Net在两个数据集上使用不同主干网络的分割性能。

图片

Table 8Segmentation performance of all semi-supervised methods on four datasets.Percentage 75% 50% 2

表8在四个数据集上所有半监督方法的分割性能。百分比:75%、50%。

图片

Table 9Segmentation performance of CvDd-Net with different adaptive weights (w1 and w2 inCdDR, and w3 , w4 , and w5 in CvDR) on two datasets.

表9CvDd-Net在两个数据集上使用不同自适应权重(CdDR中的w1和w2,以及CvDR中的w3、w4和w5)时的分割性能。

图片

Table 10Segmentation performance of representative fully-supervised and semi-supervisedmethods on external Cervix dataset.

表10在外部宫颈数据集上,代表性全监督和半监督方法的分割性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1544501.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Activiti7《第九式:破气式》——流畅驱动工作流进程。面试题大全

冲冲冲!开干 这篇文章将分为九个篇章,带你逐步掌握工作流的核心知识。“破气式”,代表着工作流中的 无形之力,它是贯穿整个流程的 关键驱动 不知不觉已经到了独孤九剑最后一式了,我相信到这里之后各位都已经出神入化…

华为HarmonyOS灵活高效的消息推送服务(Push Kit) -- 10 推送实况窗消息

场景介绍 实况窗是一种帮助用户聚焦正在进行的任务,方便快速查看和即时处理的通知形态。有关实况窗简介、权限申请、开放场景、设计规范等说明,请参见Live View Kit简介。 通过Push Kit发送的实况窗消息支持三种操作类型,分别是&#xff1a…

云手机推荐:五款热门云手机测评!

在云手机市场中,各个品牌层出不穷,让人难以选择。为了帮助你更好地找到适合的云手机应用,我们整理了五款最受欢迎的云手机进行测评。2024年,哪款云手机是你的不二之选?且慢下结论,看看这五款云手机的真实表…

分享一个非常好用的图片压缩的免费网址,及使用方式

一、图片压缩网址: TinyPNG – Compress WebP, PNG and JPEG images intelligently 二、使用方式(压缩后的图片在1M以内) 1、上传图片 二,下载压缩图片 备注:只能免费压缩5M以内的图片!

Codigger SIDE:Nvim扩展,重新定义编程体验

在当今快速发展的科技时代,软件开发的核心工具之一——代码编辑器,正变得越来越强大和多样化。Codigger,作为新一代的软件开发平台,不断推动着编程工具的创新。其中,Codigger Super IDE(SIDE)的…

超详细超实用!!!AI编程之cursor编写设计模式里氏替换原则实例(五)

云风网 云风笔记 云风知识库 一、设计模式里氏替换原则定义 里氏替换原则是面向对象设计的基本原则之一。 里氏替换原则中说,任何基类可以出现的地方,子类一定可以出现。LSP 是继承复用的基石,只有当派生类可以替换掉基类,且软件…

企业如何通过加密软件保护敏感信息和客户数据?

1、数据加密:采用先进的加密算法,如AES-256,对敏感信息和客户数据进行加密处理。这样,即使数据被非法获取,未授权人员也无法解密和访问数据内容。 访问控制:设置严格的访问控制策略,确保只有授…

电网绝缘子损坏识别检测数据集

电网绝缘子损坏识别检测数据集 yolo数据集 1600张 电网绝缘子损坏识别检测数据集(Power Grid Insulator Damage Detection Dataset) 数据集概述 该数据集专为电网绝缘子损坏的自动检测任务设计,旨在帮助电力部门和相关研究机构通过图像识别技…

代码随想录算法day39 | 动态规划算法part12 | 115.不同的子序列,583. 两个字符串的删除操作,72. 编辑距离

115.不同的子序列 相对于 392.判断子序列,本题有难度了,感受一下本题和 392.判断子序列 的区别。 力扣题目链接(opens new window) 给定一个字符串 s 和一个字符串 t ,计算在 s 的子序列中 t 出现的个数。 字符串的一个 子序列 是指&#xff…

电路 - 笔记2

1 555 芯片 2 类比 - pU*I 与 Fm*a 是不是可以与牛顿定律类比 - Fm*a 人的力量(F)有限。 当推大箱子(m)时,加速度(a)就不会很大 当推小箱子(m)时,加速度…

十大开放式耳机排名?强烈推荐这五大高性能款式!

目前市场上的开放式蓝牙耳机种类繁多,如何挑选适合自己的开放式蓝牙耳机?作为一名数码评测员,从去年在现在,也体验了许多款开放式蓝牙耳机,结合我的体验和产品配置参数,为大家整理了一份开放式耳机排行榜&a…

PostgreSQL 一张表多个字段关联另一张表

event_catalog 表 event 表 sql SELECT event.event_uuid, event.event_case_id, event.event_status, event.event_catalog_1, event.event_catalog_2, event.event_catalog_3, event.event_title, event.event_content, event.event_source, event.event_purpose, event.eve…

Hi3516CV610-20S 芯片及开发板

总体介绍 Hi3516CV610 是一颗应用在安防市场的 IPC 处理器内核 SoC。在开放操作系统、新一代视频编解码标 准、网络安全和隐私保护、人工智能方面引领行业发展,主要面向室内外场景下的枪机、球机、半球机、海 螺机、枪球一体机、双目长短焦机等产品形态,…

全球视角下的知识产权管理

跨国企业作为全球经济的重要参与者,其知识产权的管理不仅关乎企业自身利益,更影响到其在全球市场的布局与竞争力。然而,跨国企业在进行全球知识产权管理时,往往面临诸多挑战。在全球知识产权管理的过程中,专业管理系统…

【Linux】安装配置nginx

文章目录 一、替换镜像源1.对系统本身的yum源进行备份2.下载阿里云 CentOS 7 镜像源配置文件3.删除所有的自带的源,只保留阿里的,和备份源4.清除旧的 YUM 缓存5.创建新的 YUM 缓存 二、配置环境1.安装依赖2.创建nginx安装目录3.下载nginx4.安装nginx5.查…

Electron 更换窗口图标、exe执行文件图标

首先在项目根目录下准备好图标: 配置窗口图标: 配置打包后 exe执行文件 的图标: 效果展示:

动物关键点数据集-yolov8 pose动物关键点识别-动物姿态估计-keypoints(代码+数据集)

跨域适应于动物姿态估计 概览 本文介绍了一个专门用于动物姿态估计的数据集,该数据集包含了五个不同种类的动物:狗、猫、牛、马和羊。整个数据集中共包含超过6000个实例,分布在4000多张图像上。此外,数据集还为另外七种动物提供…

《十年国庆游,洞察中国旅游新趋势》

作者:侯炯 一、十年国庆旅游数据总览 过去十年,中国国庆旅游市场呈现出丰富的变化和强劲的发展态势。从接待游客人次来看,2014 年接待国内游客 4.75 亿人次,到 2019 年已增长至 7.82 亿人次,2023 年国内旅游出游人数更…

K8s安装部署(v1.28)--超详细(cri-docker作为运行时)

1、准备环境 ip角色系统主机名cpumem192.168.40.129mastercentos7.9k8smaster48192.168.40.130node1centos7.9k8snode148192.168.40.131node2centos7.9k8snode248192.168.40.132node3centos7.9k8snode348 2、系统配置(所有节点) 重要:首先…

关于ShuffleNetV1中的channel shuffle操作【代码分析】

1. 官方给出的代码 旷视科技在自己的开源GitHub上给出的channel shuffle相关代码如下图所示: 分析上图中的代码,旷视科技将channel shuffle这个操作视为一个函数,函数传入的参数是输入张量x,x的shape为(batchsize, num_ch…