《Tyche: Stochastic In-Context Learning for Medical Image Segmentation》CVPR2024

摘要

这篇论文介绍了一个名为Tyche的模型,它用于医学图像分割任务。Tyche通过使用上下文集来为以前未见过的任务生成随机预测,无需重新训练。该模型解决了两个主要问题:1) 对于大多数新的分割任务,需要重新训练或微调新模型,这需要大量资源和机器学习专业知识;2) 大多数现有分割方法为给定图像产生单一确定性分割掩码,但在实践中,正确的分割往往存在很大的不确定性。Tyche通过引入一种新的卷积块架构和上下文测试时增强机制,预测一组可能的多样化分割候选,而无需重新训练。

概述

拟解决的问题:

  1. 医学图像分割任务通常需要为每个新模态和生物医学领域训练新模型,这在资源和专业知识有限的生物医学研究和临床环境中是不切实际的。
  2. 现有模型通常只提供一个分割解决方案,而实际上目标图像可能包含模糊区域,并没有单一正确的分割。

动机:

  1. 顶部展示了人类注释者如何处理多种任务,并且不同的注释者通常会对同一图像产生不同的分割结果
  2. 中部展示了现有的自动化方法,这些方法通常是针对特定任务的,并且只为每个图像提供一个分割结果
  3. 底部展示了Tyche框架,它能够捕捉到不同注释者在多种模态和解剖结构上的分歧,而无需重新训练或微调。

总的来说,Tyche能用于不同的任务而无需重新训练,并且生成了更符合人类分割(不确定性)的多中分割结果。

创新之处:

  1. 引入了一种新的卷积块架构,使得不同预测之间的内部表示能够相互交互。
  2. 引入了上下文测试时增强机制,为预测的随机性提供新的机制。
  3. Tyche是第一个用于上下文学习的随机分割框架,能够为新或未见过的医学图像和分割任务预测一组可能的分割候选,而无需重新训练。

Tyche模型实现迁移学习的关键在于其能够利用上下文集(Context Set)来适应新的或未见过的医学图像分割任务,而无需针对新任务进行完整的训练。

方法

Tyche包括两种变体,Tyche-TS(训练时随机性)和Tyche-IS(推理时随机性)。Tyche-TS在训练时就设计为产生多个候选分割,而Tyche-IS则是在测试时通过对预训练的确定性上下文模型应用增强来实现随机预测。Tyche的网络架构基于UNet结构,但使用了新的SetBlock来促进上下文集和目标分割候选之间的交互。Tyche-TS通过最佳候选损失函数来优化模型,只对最佳预测进行反向传播,以鼓励产生多样化的解决方案。

参数说明:x^{t}_{j} 、y^{t}_{j}表示原图和分割图,z_{k}噪声

将 Tyche 设计为上下文学习 (ICL) 模型,对所有任务使用单一函数:

这个具有全局参数θ的函数捕获了标签图y^{t}_{k}的分布,给定目标x^{t},上下文集合S^{t}=\left \{ x_{j}^{t},y_{j}^{t} \right \}_{j=1}^{S}定义任务t和噪声z_{k}\sim ~N\left ( 0,1 \right )。我们以两种方式使用这种建模策略:我们要么显式训练一个网络来近似Tyche-TS中的模型f_{\theta }\left ( \cdot \right ),要么在Tyche-IS中设计一个测试时策略来近似f_{\theta }\left ( \cdot \right )。 

3.1 Tyche-TS (Train-time Stochasticity)

Tyche-TS是一个在训练时就设计为产生多个候选分割的系统。该网络在给定相同的图像输入x^{t}但不同的噪声通道z_{k}的情况下做出不同的预测。(看不懂图可以直接看公式

SetBlock机制。SetBlock 支持来自上下文集的特征集和预测候选的特征集之间的交互。它输出两组特征,一个用于上下文,一个用于预测候选。

Tyche-TS 将目标x^{t}、一组 K 个高斯噪声通道z_{k}和一个上下文集S^{t}作为输入。 

SetBlock是Tyche-TS中新引入的操作,它允许候选分割表征(U)上下文表示(V)之间的交互。SetBlock使用CrossBlock作为构建块,CrossBlock涉及单个特征与一组特征之间的交互,并输出新的特征。

CrossBlock机制。CrossBlock涉及单个特征和一组特征之间的交互,并为每个特征输出目标和新功能的新特征。

公式如下:

传统的损失函数计算单个预测相对于单个目标的损失,但Tyche-TS产生多个预测,并有一个或多个对应的标签图。Tyche-TS优化的是所有候选中最佳预测的平均损失。

L_{seg}是在所有候选预测中找到与真实标签y的Dice损失最小的那个,L_{Dice}是软Dice损失和分类交叉熵的加权和。

3.2 Tyche-IS (Inference-time Stochasticity)

Tyche-IS是一个测试时解决方案,它利用预训练的确定性上下文模型。通过在测试时对目标和上下文集应用增强来提供随机预测。这涉及到对输入图像和上下文集应用不同的变换,然后对增强后的图像进行预测。

Tyche-IS 只应用基于强度的变换,以避免需要反转分割回变换的需求。常用的增强包括高斯噪声、模糊和像素强度反转。

总结来说,Tyche-IS 通过在测试时对输入图像和上下文集应用增强变换,生成多个随机的分割预测,从而在不重新训练模型的情况下,为新的或未见过的医学图像分割任务提供解决方案。

写这篇博文的我的理解是:训练的过程中训练模型能够通过上下文集合生成一系列的分割图,训练的是模型的参照能力,能利用上下文集合参照来进行分割的能力,故在测试的时候,遇到没有见过的任务或图片,可以通过这种能力来进行分割。(一点拙见,毕竟深度学习的解释性有点差,这篇论文也没有提到怎么进行迁移的。)

结论

Tyche是第一个用于随机上下文分割的框架。它能够为任何(新的)分割任务直接产生多样化的分割候选,从中实践者可以选择最合适的一个,并更好地理解底层的不确定性。Tyche能够泛化到训练时未见过的图像,并在性能上超越了上下文和交互基准。此外,Tyche通常能够与专门为这些任务训练的随机模型相匹配。Tyche有两种变体,一种旨在优化最佳分割候选,具有快速的推理时间;另一种是测试时增强变体,可以与现有的上下文学习方法结合使用。作者对进一步研究Tyche-TS和Tyche-IS捕获的不同类型不确定性感到兴奋,并计划通过更复杂的支持集(包括可变的注释者和多个图像模态)来扩展Tyche的能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/33678.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

47 基于单片机的书库环境监测

目录 一、主要功能 二、硬件资源 三、程序编程 四、实现现象 一、主要功能 基于51单片机,采用DHT11湿度传感器检测湿度,DS18B20温度传感器检测温度, 采用滑动变阻器连接数模转换器模拟二氧化碳和氧气浓度检测,各项数值通过lc…

NAND闪存行业全面且深入的分析

根据QYResearch调研团队的最新报告“全球NAND闪存市场报告2023-2029”,预计2029年全球NAND闪存市场规模将达到1263亿美元,未来几年年复合增长率(CAGR)为10.0%。这一预测揭示了NAND闪存市场的强劲增长潜力。 一、市场研究与发展趋…

html-两个div,让一个div跟随另外一个div的高度

在开发的过程中遇到有些场景事这样的,两个div的高度不一致,而且都是动态高度,有的时候div1高,有的时候div2高,如果设置flex的话,那么就会把较矮的元素撑大,但是我想始终都以div1的高度作为基准&…

函数方法不占额外存储空间(内存分区)?

上篇博客说到扩展是不会增加存储空间的,且扩展不能扩展存储属性。既然这样,那我们就能理所应当推断出方法是不占存储空间的,为什么呢? 首先,我们要先了解内存的五大分区:栈,堆,静态…

IDEA注释格式、匹配补全调整

1.注释格式调整 目前重新捡起一部分Java,写代码时候发现注释快捷键总是放在第一列,看起来很难受,故寻找方法如下: 分别点击 编辑器-代码样式-Java 修改注释代码选项如下 2.大小写匹配补全问题 还发现在写代码过程中&#xff0c…

抖音矩阵系统快速部署指南/抖音矩阵系统源码分发,短视频矩阵账号管理系统开发部署—

抖音矩阵系统的源码分发与短视频账号管理平台的开发部署,要求通过对接官方API来实现功能的拓展。当前开发的账号矩阵管理系统专注于提供一键式管理多个账户的能力,支持定时发布内容、自动化关键词生成以实现搜索引擎优化(SEO)和霸…

算法笔记:力扣49.字母异位词分组

思路:排序哈希表映射 关键API: char [] arr str.toCharArray(); 将字符串转为字符数组返回。 Arrays.sort(arr); 对数组进行排序; Map.getOrDefault(Object key, V defaultValue): 要查找的键和默认值。如果键存在&#xf…

医疗服务高质量发展项目会议在杭州成功举办

2024年11月30日,医疗服务高质量发展项目会议在杭州成功举办,此次会议旨在探讨医疗服务领域的最新进展和未来趋势,推动医疗服务的高质量发展。来自全国各地的医院管理者、专家学者齐聚一堂,共同分享智慧医疗、绩效考核、精细化管理…

k近邻法基本知识简记

一、原理与概念 1、样本 k近邻法使用的样本数据集合,称作训练样本集,并且样本集中每个数据都存在标签,即样本集中每个数据与所属分类的对应关系已知。 2、原理 输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的…

开源C代码之路:一、Gitee

开源c代码之路:一,Gitee 前言1、开源项目2、从哪里找?3、举个例子4、总结: 本系列回顾清单开源代码示例 前言 从开源开发的角度,由浅入深,一步步初探C语言编程的入门之路。 本篇讲解:Gitee 1…

极化定标未知数,反射对称条件下

把观测到的协方差矩阵都看作方程,则观测方程有16个,对角线四个实数,非对角线六个复数。 未知数有18个 f1 f2 d1 d2 d3 d4是12个 绝对幅度A 1个和绝对相位 θ在协方差中被消去了 协方差矩阵(反射对称性下)有5个未知数…

基于STM32的Wi-Fi无人机项目

引言 随着无人机技术的快速发展,基于微控制器的DIY无人机变得越来越流行。本项目将介绍如何使用STM32微控制器制作一架简单的Wi-Fi无人机。通过本项目,您将了解到无人机的基本组成部分,如何进行硬件连接,代码编写,以及…

【附源码】基于环信鸿蒙IM SDK实现一个聊天Demo

项目背景 本项目基于环信IM 鸿蒙SDK 打造的鸿蒙IM Demo,完全适配HarmonyOS NEXT系统,实现了发送消息,添加好友等基础功能。代码开源,功能简洁,如果您有类似开发需求可以参考。 源码地址:https://github.c…

MicroSIP软电话使用

MicroSIP - 基于 PJSIP 协议栈的开源便携式 SIP 软电话 适用于 Windows 操作系统。 它允许进行高质量的 VoIP 通话(个人对个人或在线 普通电话)。来自 SIP 提供商的云 您可以选择最适合您的,注册帐户并在 MicroSIP 中使用它。 您将获得免费的…

突破空间限制!从2D到3D:北大等开源Lift3D,助力精准具身智能操作!

文章链接:https://arxiv.org/pdf/2411.18623 项目链接:https://lift3d-web.github.io/ 亮点直击 提出了Lift3D,通过系统地提升隐式和显式的3D机器人表示,提升2D基础模型,构建一个3D操作策略。 对于隐式3D机器人表示&a…

【C++笔记】二叉搜索树

前言 各位读者朋友们大家好!上期我们讲完了面向对象编程三大属性之一的多态,这一期我们再次开始数据结构二叉搜索树的讲解。 目录 前言一. 二叉搜索树的概念二. 二叉搜索树的性能分析三. 二叉搜索树的插入四. 二叉搜索树的查找五. 二叉搜索树的删除六.…

使用历史索引监控 Elasticsearch 索引生命周期管理

作者:来自 Elastic Stef Nestor 大家好!在之前的一篇博客中,我们概述了常见的索引生命周期管理 (index lifecycle management - ILM) 问题及其解决方案。此后,我们已将这些常见场景添加到我们的 Elasticsearch 文档中,…

使用伪装IP地址和MAC地址进行Nmap扫描

使用伪装IP地址和MAC地址进行Nmap扫描 在某些网络设置中,攻击者可以使用伪装的IP地址甚至伪装的MAC地址进行系统扫描。这种扫描方式只有在可以保证捕获响应的情况下才有意义。如果从某个随机的网络尝试使用伪装的IP地址进行扫描,很可能无法接收到任何响…

Java基础之GUI:探索图形化界面编程的魅力

一、引言 Java 的图形用户界面(GUI)编程为开发者提供了丰富的工具和组件,使得创建直观、交互性强的应用程序变得更加容易。本文将深入介绍 Java 基础中的 GUI,包括其概念、组件、布局管理器以及事件处理等方面的知识。 Java 的图…

Svn如何切换删除账号

记录Svn清除切换账号 1.首先打开小乌龟的设置如下图 打开设置后单击已保存数据,然后选择清除 接上图选择清除后,就可以打勾选择清除已保存的账号,我们再次检出的就可以切换账号了 👉总结 本次记录Svn清除切换账号 如能帮助到你…