【论文阅读笔记】LeSAM: Adapt Segment Anything Model for medical lesion segmentation

1.论文介绍

LeSAM: Adapt Segment Anything Model for medical lesion segmentation
LeSAM:适用于医学病变分割的任意分割模型
2024年发表于 JBHI
Paper 无code

2.摘要

Segment Anything Model,SAM是自然图像分割领域的一个基础性模型,取得了令人印象深刻的成果。然而,对于医学图像分割,它的性能仍然是次优的,特别是在描绘不规则形状和低对比度的病变时。这可以归因于医学图像和自然图像之间的显著域差距,而SAM最初是在自然图像上进行训练的。本文提出了一种专门为病变分割量身定做的SAM算法,称为LeSAM。LeSAM首先通过一个高效的自适应模块学习医学特定领域的知识,并将其与从预先训练的SAM获得的一般知识相结合。随后,我们利用这些合并的知识,使用作为轻量级U型网络设计实现的改进的掩模解码器来生成病变掩模。这种修改可以更好地描绘病变边界,同时便于培训。

Keywords:SAM, U型解码器,自适应编码器模块

3.Introduction

病变分割在医学图像分析中起着至关重要的作用,有助于精确定位和量化病变区域,以便及早发现和治疗疾病。然而,由于医学图像的复杂性和多样性,准确的病变分割仍然具有很大的挑战性。在本文中,通过简单而有效的策略提出了一种通用的病变分割模型–LeSAM。首先,在原始SAM编码器的每个转换模块中使用两个适配器模块来顺序地合并和提炼特定于任务的知识。此外,我们采用渐进式学习方法来促进适配器模块的训练,而不依赖于大规模的注释医疗数据。其次,受U型网络通过渐进上采样和捷径操作集成多分辨率特征的成功启发,我们将原有的掩码解码器修改为U型模块,并从头开始训练。

4.模型结构详解

在这里插入图片描述
如图所示,LeSAM包括三个模块:修改的图像编码器、提示编码器和修改的掩码解码器。为了能够提取潜在的医学特定特征,可调适配器模块被结合到原始图像编码器的每个变换器块中;提示编码器以框模式保持其原始结构,其中提供边界框以指示目标在每个输入图像中的位置;掩模解码器被修改为U形结构,以增强模糊和不规则病变边界的描绘。此外,冻结了原始图像编码器的参数,同时保持提示编码器和掩码解码器都是可调的。

医用专用图像编码器

由于自然图像和医学图像之间存在领域鸿沟,原始图像编码者很难获取潜在的医学特定知识。因此,在原始图像编码器的每个变换器块中都加入了适配器模块,以有效地弥合这一差距。改装的transformer块的具体架构如图所示,每个transformer块中都集成了两个适配器,其中每个适配器依次包括下投影线性层、Gelu激活层和上投影线性层。第一个适配器位于变压器块的开始处,以引入医学特定知识,然后将其与预先训练的SAM学习的一般知识相结合。另一个适配器被放置在块的末尾,以优化集成的跨域知识和提炼图像特征。

在image-encoder的每一个transformer块中有两个adapter,一个在开头,接收传入的特征;一个在块结尾,融合中间特征和最终特征再处理。每个adapter包含一个特征降维的线性层,GeLU激活层和一个特征扩展的线性层。

在这里插入图片描述
特定于任务的掩码解码器

由于病变典型的不规则形状和与周围组织的低对比度,原始的SAM掩模解码器在准确描绘病变边界方面的性能不佳。因此开发了一种特定于任务的掩码解码器来增强边缘描绘能力,以实现精确的病变分割。如模型图所示,将特定任务的掩码解码器设计为U型结构。保留了自注意块双向交叉注意块(提示到图像嵌入,反之亦然)来生成掩码嵌入(带有提示信息的图像嵌入)和IOU分数。随后,没有对掩码嵌入进行上采样来生成输出掩码,而是通过改进的U型解码器来传播它们。

考虑到图像编码器的图像嵌入具有64×64(如果image size是1024×1024则是64)的分辨率,对这三个中间图像嵌入分别使用“卷积”和“上卷积”,以获得不同分辨率和通道的新图像嵌入。具体地说,如下图所示,“卷积”包括卷积和用于重新编码图像嵌入的短连接,“上卷积”通过在两个“卷积”块之间加入一个或两个反卷积层而建立在“卷积”之上。每个反卷积层执行图像嵌入的两倍上采样。随后,从掩模嵌入和等维图像嵌入开始,逐步融合和传播这些级联表示,直到它们的分辨率与输入图像的分辨率匹配。如下图所示,融合过程依次由反卷积操作和随后的“卷积”块组成。反卷积被用来提高级联嵌入的分辨率,而卷积用于对它们进行进一步编码。最后,利用嵌入来生成预测掩码。在模型图底部直观地展示了掩码解码器的中间特征图。前三个特征图以从左到右的方式描述不同级别的特征,从低级特征(如边缘和局部特征)到高级特征(如形状和全局特征)。最后三个映射表示解码的特征,第一个解码的特征映射展示了提示信息的并入,将模型的注意力引导到感兴趣的区域,促进了语义知识的获取。这种获得的语义知识随后通过两个融合阶段进行提炼,最终产生预测的掩码。重要的是要注意,功能映射具有不同的分辨率。

原来的decoder输出在自注意力和交叉注意力的时候就停止,不膨胀了输入U型decoder中。本文取了image-encoder的三个中间张量,先用卷积,再反卷积上采样,最后卷积。与原decoder的输出cat,与Unet解码器相同,使用反卷积上采样再卷积融合,再cat再处理(就是模型图下方的操作)。对于卷积操作:本文采用了卷积和短连接。
短连接是残差连接,就是一个卷积激活再卷积,一个直接一个卷积后与那个加和,再relu激活。

在这里插入图片描述在这里插入图片描述
渐进式训练策略

本文还通过t-SNE算法对比了自然图像和医学图像的特征,发现两者之间虽然有一些共享特征,但总体上差异显著。这提示在直接训练模型进行医学图像分割时可能会遇到困难,因此需要考虑专门的训练策略来应对这些挑战。

本文采用渐进式学习策略,将模型从自然图像分割逐步训练到医学病变分割。整个训练过程包括自我监督预训阶段和监督学习阶段。为了实现从自然图像到医学图像的领域自适应,首先使用廉价的无标签医学数据进行适配器模块的初步训练。这些数据通过MAE(Masked Autoencoder)方法进行自监督学习。在这个阶段,解码器是MAE的解码器,使用均方误差(MSE)来重建部分掩盖的图像嵌入:
在这里插入图片描述
其中𝑦𝑖和𝑦̂𝑖分别表示原始图像和重建图像。在MAE之后,丢弃简单的解码器,并且使用特定于任务的数据集来使用骰子损失和交叉熵损失之和来训练适配器和其他可调组件,其公式如下:
在这里插入图片描述

说明

这个模型的创新在于:

  • 基于SAM,image-encoder增加adapter;
  • decoder保留一部分,从encoder里抽取三层特征,做一个u型结构,使用卷积和反卷积处理;
  • 训练采用渐进式,包括自监督和全监督,后者采用模型结构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1451725.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

通过元学习优化增益模型的性能:基础到高级应用总结

在当今数据驱动的决策过程中,因果推断和增益模型扮演了至关重要的角色。因果推断帮助我们理解不同变量间的因果关系,而增益模型则专注于评估干预措施对个体的影响,从而优化策略和行动。然而,要提高这些模型的精确度和适应性&#…

计算机网络实验(15):基于Socket的网络编程(附JAVA源码.txt)

一、实验名称 UDP客户服务器即时通信程序 二、实验目的: 掌握基于SOCKET的网络编程方法。 基于JAVA语言,编写一个SOCKET的即时通信小程序 三、实验内容和要求 实验内容: 基于JAVA语言,编写一个SOCKET的即时通信小程序 实…

文章分享 | Ribo-seq与RNA-seq联合分析揭示uAUG-ds翻译调控机制

技术简介 RNA-seq主要从转录组水平分析基因的表达调控机制,检测用于核糖体翻译的RNA序列及二级结构。Ribo-seq主要用于检测核糖体翻译的起始位置、翻译富集区和翻译终止位置。RNA-seq与Ribo-seq联合分析可以准确检测mRNA上游5’UTR区的uORFs翻译调控结构&#xff0…

雪球产品学习,大雪球vs小雪球

part1 大雪球 一、 雪球产品的要素 1.1 定义:固收期权的结合 具备敲入,敲出的Barrier put (看跌认沽) 期权的买方:产品发行方 期权的卖方:雪球产品购买者 1.2 七要素 挂钩标的,锁定期&…

电脑屏幕监控软件有哪些?2025年监控软件排行榜

电脑屏幕监控软件有哪些?2025年监控软件排行榜 虽然现在还是2024年,但是有一些被广泛讨论和推荐的电脑屏幕监控软件,它们将在2025年异军突起,成为行业的引领者。 1.安企神软件: 功能全面的电脑屏幕监控软件&#xf…

Sentence Transformers x SwanLab:可视化Embedding训练

Sentence Transformers(又名SBERT)是访问、使用和训练文本和图像嵌入(Embedding)模型的Python库。 你可以使用Sentence Transformers快速进行模型训练,同时使用SwanLab进行实验跟踪与可视化。 1. 引入SwanLabCallback from swanlab.integra…

【Android】打开需要NDK的项目的一些报错的问题解决

文章简述 在打开一个新的项目的时候,遇到了一些问题,记录一下问题的解决步骤。 问题1 FAILURE: Build failed with an exception.* What went wrong: A problem occurred configuring project :app. > NDK not configured. Download it with SDK m…

Pyskl动捕

一、环境搭建 详见Pytorch-gpu安装 二、下载代码 https://github.com/kennymckormick/pyskl 三、环境安装 conda create -n pyskl python=3.8 conda activate pyskl 先看下requirements.txt中需要安装的包 有些包是需要单独安装的如pytorch,这个根据自己cuda版本对应安装…

JVM之标记算法的详细解析

三色标记 标记算法 三色标记法把遍历对象图过程中遇到的对象,标记成以下三种颜色: 白色:尚未访问过 灰色:本对象已访问过,但是本对象引用到的其他对象尚未全部访问 黑色:本对象已访问过,而且…

DiffusionDet:用于物体检测的扩散模型

论文标题:DiffusionDet: Diffusion Model for Object Detection 论文地址:https://arxiv.org/pdf/2211.09788 DiffusionDet:用于物体检测的扩散模型 检测模型发展物体检测 DiffusionDet方法预备知识DiffusionDet前向扩散过程DiffusionDet反向…

【gtest】 C++ 的测试框架之使用 gtest 编写单元测试

目录 🌊前言 🌊使用 cmake 启动并运行 gtest 🌍1. 设置项目 🌍2. 创建并运行二进制文件 🌊1. gtest 入门 🌍1.1 断言(assertions) 🌍1.2 简单测试 🌍…

最新(2024年)安装gdal库方法

方法一:直接 conda install gdal 方法二:https://github.com/cgohlke/geospatial-wheels/releases/tag/v2024.2.18 这个链接里下载whl文件

Day51 代码随想录打卡|二叉树篇---二叉搜索树的最小绝对差

题目(leecode T530): 给你一个二叉搜索树的根节点 root ,返回 树中任意两不同节点值之间的最小差值 。 差值是一个正数,其数值等于两值之差的绝对值。 方法:本题计算二叉搜索树的最小绝对差,涉…

快慢指针在字符串中的应用-443. 压缩字符串

题目链接及描述 443. 压缩字符串 - 力扣(LeetCode) 题目分析 这个题目总体不算太难,如果之前接触过双指针(快慢指针)的话,比较好做。题目可以理解为计算数组中对应各个连续字符出现的次数,并将…

测试基础13:测试用例设计方法-错误推断、因果图判定表

课程大纲 1、错误推测法 靠主观经验和直觉来推测可能容易出现问题的功能或场景,设计相关测试用例进行验证。 2、因果图&判定表 2.1定义 因果图和判定表是分析和表达多逻辑条件下,执行不同操作的情况的工具。 (因果图和判定表配合使用&a…

生产运作管理--第六版陈荣秋

第一章: 生产运作的分类有哪些? 答:可以分为两大类: 产品生产: 产品生产是通过物理或者化学作用将有形输入转化为有形输出的过程。 按照工艺过程的特点,可以分为: 连续性生产:物料均匀、连续的按…

TCP/IP协议,三次握手,四次挥手

IP - 网际协议 IP 负责计算机之间的通信。 IP 负责在因特网上发送和接收数据包。 HTTP - 超文本传输协议 HTTP 负责 web 服务器与 web 浏览器之间的通信。 HTTP 用于从 web 客户端(浏览器)向 web 服务器发送请求,并从 web 服务器向 web …

TCP三次握手和四次挥手过程简介(抓包分析,简单易懂,小白)

接上篇 传输层部分 链路层、网络层、传输层和应用层协议详解分析-CSDN博客文章浏览阅读689次,点赞10次,收藏15次。wireshark抓包分析-CSDN博客wireshark是网络包分析工具网络包分析工具的主要作用是尝试捕获网络包,并尝试显示包的尽可能详细…

6年前端社招一个月上岸20K经历,附简历

面经哥只做互联网社招面试经历分享,关注我,每日推送精选面经,面试前,先找面经哥 本人普通本科6年前端经历,从年前开始准备跳槽,一开始感觉自己履历算不上突出,经历过迷茫和沮丧的时候&#xff0…

【计算机毕业设计】基于Springboot的B2B平台医疗病历交互系统【源码+lw+部署文档】

包含论文源码的压缩包较大,请私信或者加我的绿色小软件获取 免责声明:资料部分来源于合法的互联网渠道收集和整理,部分自己学习积累成果,供大家学习参考与交流。收取的费用仅用于收集和整理资料耗费时间的酬劳。 本人尊重原创作者…